给车装一个"脑内模拟器":小米汽车发布世界模型全新框架(3)

2026-05-26 15:51  头条

纯重建的问题则是,它能告诉你棋盘上现在有什么棋子,但不会推演对手下一步会怎么走。

小米的解法:先用重建保证"棋盘规则准",再用生成实现"推演变化灵活"。

这不是小米一家的技术路线选择。从行业信号来看,"几何一致性 + 因果正确"正在成为自动驾驶世界模型的一个共识方向--只不过小米是第一个把重建和生成深度耦合后拿出 SOTA 成绩的。


落地场景和理性看待

目前这个框架已经落地了三个场景:合成数据生成、仿真测试和驾驶学堂。

但也要说清楚一件事:从世界模型到真正的量产智驾,还有距离。

SOTA 是学术 benchmark 上的成绩,量产要考虑的是另一套问题--inference 延迟够不够低,车上算力能不能跑得动,遇到没见过的 corner case 会不会崩。

这三关,每一关都不好过。

不过方向对了比跑得快更重要。用"几何一致性优先法"的视角来看,当世界模型的设计思路从"怎么生成更逼真的画面"转向"怎么构建更准确的物理世界表征",这本身就是一个值得注意的信号。

好的世界模型不是画得好看,是想得准确。

这个号会持续更新这种把科技趋势拆开来讲的内容,希望能陪你一起把复杂的事看明白。