AI独角兽MiniMax发布混合架构开源模型M1:训练成本仅380万,长文本处理超GPT-4o
Xin Lang Ke Ji·2025-06-19 00:47
长文本(MRCR):依托百万级上下文窗口,M1系列在此项任务中不仅全面超越了所有开源对手,甚 至击败了OpenAI的GPT-4o和Anthropic的Claude 3 Opus,在全球范围内仅以微弱差距落后于谷歌的 Gemini 2.5 Pro,位列全球第二。 新浪科技讯 6月17日下午消息,AI独角兽企业MiniMax发布其自主研发的MiniMax-M1系列模型。据 悉,M1模型在处理百万级Token的长文本上实现了重大突破,成为上下文最长的推理模型;其RL(强 化训练)成本下降一个量级,成本仅53万美金(约380万元),推理效率则数倍于竞争对手。 目前,MiniMax-M1已宣布开源。在工具使用场景(TAU-bench)中MiniMax-M1-40k同样领跑所有开源 权重模型,超过Gemini-2.5 Pro。 据悉,前两个档位的定价均低于DeepSeek-R1,而第三个超长文本档位则是DeepSeek模型目前尚未覆盖 的领域。此外,MiniMax宣布,在其自有的App和Web端,M1模型将保持不限量免费使用,这无疑将极 大地推动其技术的普及和应用。 在性能上,MiniMax在业内公认的17个主流评测集上 ...