给车装一个＂脑内模拟器＂：小米汽车发布世界模型全新框架

纯重建的问题则是，它能告诉你棋盘上现在有什么棋子，但不会推演对手下一步会怎么走。

小米的解法：先用重建保证"棋盘规则准"，再用生成实现"推演变化灵活"。

这不是小米一家的技术路线选择。从行业信号来看，"几何一致性 + 因果正确"正在成为自动驾驶世界模型的一个共识方向--只不过小米是第一个把重建和生成深度耦合后拿出 SOTA 成绩的。

落地场景和理性看待

目前这个框架已经落地了三个场景：合成数据生成、仿真测试和驾驶学堂。

但也要说清楚一件事：从世界模型到真正的量产智驾，还有距离。

SOTA 是学术 benchmark 上的成绩，量产要考虑的是另一套问题--inference 延迟够不够低，车上算力能不能跑得动，遇到没见过的 corner case 会不会崩。

这三关，每一关都不好过。

不过方向对了比跑得快更重要。用"几何一致性优先法"的视角来看，当世界模型的设计思路从"怎么生成更逼真的画面"转向"怎么构建更准确的物理世界表征"，这本身就是一个值得注意的信号。

好的世界模型不是画得好看，是想得准确。

这个号会持续更新这种把科技趋势拆开来讲的内容，希望能陪你一起把复杂的事看明白。

给车装一个＂脑内模拟器＂：小米汽车发布世界模型全新框架(3)