小米集团(1810.HK)2025“人车家全生态”合作伙伴大会点评:MIMO-V2-FLASH大模型发布 小米AI战略是耐力赛而非单点冲刺
机构:光大证券 研究员:付天姿/黄铮 事件: 12 月17 日,小米集团举办2025 年"人车家全生态"合作伙伴大会,核心亮点集中于大模型技术突 破、全生态协同深化与开放生态扩容。 Mimo-V2-Flash 大模型:速度+成本双优,期待未来的硬件融合与商业化进展。小米发布新一代基座大 模型Mimo-V2-Flash,1)性能上,该模型以"309B 总参数 + 15B 激活参数" 的轻量化设计,在代码能力与 Agent 能力的全球开源模型评测中位列 Top2,核心评测指标超越参数量23 倍的DeepSeek V3.2 与Kimi K2-Thinking,技术实力行业领先。2)技术架构上,Mimo-V2-Flash 采用5:1 比例的Hybrid SWA(滑动窗 口注意力+全注意力)架构,固定KV Cache 适配主流推理框架,并搭配3 层MTP 推理优化,实现 2.02.6 倍推理提速,单机吞吐量5000-15000 token/秒,单请求吞吐量115-150 token/秒。3)推理效率上, Mimo-V2-Flash 成本与速度优势显著,其推理速度是推理成本相似的DeepSeek V3.2 的3 倍, ...