DeepSeek之后首个!进击的MiniMax
历经两年多的狂飙突进,国内大模型行业正在快速收拢。随着DeepSeek的横空出世,竞争格局也发生 了改变,国产大模型六小虎中多家进行战略调整、放弃模型预训练,互联网大厂也在发挥资源优势进 击、转向布局自己更擅长的领域。 在这个过程中,是否要拥抱DeepSeek来增强自己的基模实力,是横亘在所有模型厂商面前的一道选择 题。6月17日起,大模型六小虎之一Minimax开启连续5天的新品发布,首日就推出了用不同于字节、 DeepSeek的强化学习方法训练的全球首个开源混合架构推理模型MiniMax-M1。由此开始,Minimax也 陆续交出了自己在DeepSeek大火这几个月来筹备的新品,包括能生成AI视频行业目前最高难度运动场 景的新视频生成模型Hailuo 02和MiniMax Agent、视频Agent等产品。 据悉,输入长度的提升也主要得益于MiniMax独创的以闪电注意力机制为主的混合架构,从而在计算长 的上下文输入以及深度推理的时候显著高效。例如,在用8万Token深度推理的时候,只需要使用 DeepSeek R1约30%的算力。这个特性使得在训练和推理的时候都有很大的算力效率优势。 MiniMax-M ...