MiniMax发布混合架构开源推理模型M1 推动AI规模化应用
新华网财经·2025-06-18 08:57
技术报告显示,M1模型在处理百万级Token的长文本上实现突破;其RL(强化训练)成本下降一个量 级,成本仅53万美金;在工具使用场景(TAU-bench)中MiniMax-M1-40k同样领跑。 (开源技术报告截图) 重塑性价比 在人工智能竞赛进入"下半场"的今天,模型性能的比拼已不再是唯一焦点,高效、低成本、强推理能力 正成为定义下一代AI核心竞争力的关键。6月17日,总部位于上海的AI企业MiniMax在开源社区正式发 布其自主研发的MiniMax-M1系列模型。 M1被定义为"开源的大规模混合架构推理模型",它不仅在多个核心生产力场景中展现出顶尖模型的实 力,同时,更具成本效益,为AI的规模化应用和未来发展路径打开了新的想象空间。 线性注意力混合构架与CISPO算法 MiniMax-M1的卓越性能,根植于其独特的架构设计和算法创新。其中,两大核心技术——线性注意力 机制(Lightning Attention)混合构架和更快的强化学习算法CISPO,构成了其高效能、低成本的基石。 分析人士认为,MiniMax不仅为开发者和企业提供了一个高性能、低门槛的新选择,也用事实证明了通 过技术创新可以有效打破" ...