MiniMax发布推理模型对标DeepSeek,算力成本仅约53万美元
官方直接对标DeepSeek喊话"性价比更高"。 6月17日,沉寂已久的六小龙之一MiniMax酝酿了一个大动作,宣布将连续五天发布重要更新。今天第一弹是开源首个推理模型MiniMax-M1。 根据官方的报告,MiniMax-M1多项基准测试比肩DeepSeek-R1、Qwen3等开源模型,接近海外的最领先模型。 官方博客还提到,基于两大技术创新,MiniMax-M1训练过程高效得"超出预期",只用了3周时间、512块H800 GPU就完成强化学习训练阶段,算力租赁成本 仅53.47万美元。这比一开始的预期少了一个数量级。 多位开发者已经第一时间展开测评。前illasoft技术总监@karminski在社交平台发布了自己对MiniMax-M1的测评,认可其是"开源MoE第一梯队"。 @karminski着重测试了MiniMax-M1-80K的写代码能力,用"拆烟囱"这一编程案例实测发现,MiniMax-M1-80K在提示词下一次过,他提到DeepSeek-R1-0528 甚至 Gemini-2.5-Pro 都没能一次通过,这可能得益于其"训练材料足够新"和"思考时多次反刍成功避坑"的能力。 缺点是,从生成的前 ...