机构:国盛证券
研究员:夏君
该模型是由MiMo 团队和TileRT 联合研发,首次在万亿参数的旗舰模型上实现每秒输出速度超1000 tokens。相较于MiMo-V2.5-Pro,UltraSpeed 的定价是其三倍,而输出速度得到约10 倍的提升。
1000tps 不仅是速度的体现,更是对AI 应用的底层颠覆。高并发推理使模型得以并行执行多条路径验证,更快的速度衍生出思考的深度,提升输出质量;同时打破编程Agent 交互的效率瓶颈,并具备接入高频交易、实时风控等毫秒级决策闭环的条件,在医疗影像等关键场景中压缩临床决策时间。我们认为,推理效率的提升不仅是模型能力的升级,更是推动AI 从辅助工具向核心基础设施演进、打开各类场景商业化空间的重要催化剂。
速度的背后,是模型与系统的极致Codesign。模型侧,针对通用硬件的带宽瓶颈,对MoE Expert 进行
模型体积并减少访存开销;同时采用D
提升单次验证的Token 接受长度。系统侧,TileRT 通过引入常驻内核引擎和异构流水线协作,从底层避免了算子边界的执行间隙。在标准8 卡通用GPU 节点上,1T 参数模型可实现每秒1000 tokens 的输出速度。
MiMoCode 开源强化生态,记忆系统与框架协同提升开发者粘性。
MiMoCode 基于OpenCode 开发,并以MIT 协议开源,通过独立subagent驱动的持久记忆系统与专属Harness+Compose 模式,实现模型能力与Agent 框架深度协同的同时,系统性解决长程遗忘并支持全流程开发。
MiMoCode 还内置/dream 命令,每7 天由独立Agent 自动执行历史记忆的合并、去重、验证与压缩,将分散信息收敛为全局知识库并在后续会话中调用,带来“ 越用越顺手”的个性化使用体验。在面向编程场景的SWEBench和Terminal Bench 的测试中,在使用相同MiMo 模型的条件下,MiMoCode 表现优于Claude Code。
重申 “ 买入”评级。看好我小们米集团的 AI探索、以及对人车家全生态的赋能潜力。我们预计小2米02集6-团2028 年收入为 4731/5393/ 6057 亿元,non-GAAP 归母净利约293/351/407 亿元。我们基于公司消费电子主业20x 2027e P/E,汽车及AI 创新业务2.5x 2027e P/S,给予小米集团目标价51 港币,重申 买入”评级。
风险提示:手机竞争超预期,存储成本上升超预期,IoT 进展不及预期,智能车竞争超预期,模型商业化不及预期。
下载格隆汇APP
下载诊股宝App
下载汇路演APP

社区
会员
