罗福莉首次站台小米演讲，揭秘MiMo大模型和背后团队(5)

2025-12-17 17:22 头条

MiMo-V2-Flash的推理效率是其突出优势，在全球大致相同水位的顶尖模型速度和成本象限里，MiMo-V2-Flash实现了低成本和高速度优势。

具体来看，小米围绕极致推理效率来设计模型结构，采用了Hybrid SWA架构，固定KV Cache，增强长文推理，此外，团队采用3层MTP推理加速并行Token验证，实现推理速度2-2.6倍的提升。

在全新后训练范式方面，团队采用了Dense&Token-Level的强化学习。

上一页 1...3 4 5 6 7 下一页

频道热点

更多

今日关注

更多

焦点资讯速下中华网软件联系我们

© 中华网京ICP备18035944号-2