据介绍,MiMo-V2-Pro为旗舰基座模型,总参数量超1T(42B激活参数),支持1M超长上下文,采用创新混合注意力架构,已开放API服务;MiMo-V2-Omni为全模态感知模型,支持图像、视频、音频与文本跨模态理解;MiMo-V2-TTS则基于自研Audio Tokenizer,实现多风格、高表现力的语音合成。
目前,MiMo-V2-Pro与MiMo-V2-Omni均已开放API,前者在256K上下文内输入定价1美元/百万tokens、输出3美元,后者输入0.4美元、输出2美元。小米还联合OpenClaw等五大Agent框架团队,提供为期一周的限时免费接口支持,加速开发者生态渗透。










