Workflow
MiniMax M1
icon
Search documents
全球媒体聚焦|美媒:中国AI“弯道超车” 美国领先优势“告急”
Sou Hu Cai Jing· 2025-07-03 10:09
《华尔街日报》近日的一篇报道认为,中国人工智能企业正在削弱美国在全球人工智能领域的主导地位,挑战 美国的领先优势。 | #1: Google Gemini 2.5 Pro (U.S.) | | | --- | --- | | | 1,477 | | #2: OpenAl ChatGPT 4o (U.S.) | | | | 1,428 | | Tied #3: DeepSeek R1-0528 (China) | | | | 1,424 | | Tied #3: xAl Grok 3 Preview (U.S.) | | | | 1,422 | | Tied #9: Alibaba Qwen 3 (China) | | | | 1,388 | | Tied #11: Tencent Hunyuan (China) | | | | 1,376 | | Tied #11: MiniMax M1 (China) | | | | 1.373 | | Tied #13: Anthropic Opus 4 (U.S.) | | | | 1.373 | | Tied #13: Mistral Medium 3 (Europe ...
MiniMax 进化论:一群「偏执者」的破浪前行
3 6 Ke· 2025-07-01 14:00
如果一个技术用3年时间,从默默无闻到改变世界,我们称其为第N次工业革命; 如果这个技术从论文到落地的过程中,头部玩家如走马灯更迭,百亿流量砸下去只听一声响就陷入沉寂,我们称其为资本绞肉机; 如果这个技术集齐了以上所有特质,还能以常规技术乘十的速度进化,让互联网时代的生态护城河、资金壁垒、规模效应全部失效,创业公司也能站在世 界舞台中心,那么,它是大模型。 而这一趋势,自今年年初DeepSeek"掀桌"以来,变得尤为明显。时至今日,在大模型行业,能留在桌子上的企业唯一的生存法则就是——创新至上。 那么,如何理解大模型行业的创新至上?为什么传统互联网的玩法在大模型时代会彻底失效?为什么大模型的淘汰,能以季度为单位发生? 刚刚结束的MiniMax Week,或许正是我们审视这些问题的最佳切入点。 以此为切口,你会看见一个创新行业的创业公司如何挣脱巨头的射程;可以看到大模型从技术创新到改变世界之间的桥梁如何搭建;以及,一群"偏执"的 人,如何在这个一切被按下加速键的行业中破浪前行。 一只跳水猫咪,如何让世界Aha 一开始,MiniMax Week的关注度,还局限在大模型行业内的讨论:这次MiniMax会拿到多少SOT ...
MiniMax进化论:一群「偏执者」的破浪前行
36氪· 2025-07-01 13:54
Core Viewpoint - The article discusses the transformative impact of large models in the tech industry, emphasizing that innovation is the key survival strategy for companies in this space, especially in light of the rapid evolution and competition among startups and tech giants [2][3][14]. Group 1: Industry Trends - The large model industry is experiencing a significant shift towards innovation, with traditional internet business models becoming obsolete [3][4]. - The recent "Aha Moment" in the industry, exemplified by viral videos of animals performing complex actions, highlights the advancements in video AI technology and its potential [7][8]. - The MiniMax Week event serves as a critical point for examining how startups can thrive amidst competition from larger firms [4][6]. Group 2: Technological Innovations - MiniMax's Hailuo 02 model has seen a threefold increase in parameters compared to its predecessor, achieving native 1080P resolution and generating 10 seconds of high-definition content [9][10]. - The model's innovative NCR architecture allows for efficient resource allocation, significantly reducing memory read/write by over 70% and improving training and inference efficiency by 2.5 times [12][23]. - MiniMax's M1 model, with 456 billion parameters, supports the longest context length in the industry, enhancing its performance in complex tasks [16][18]. Group 3: Competitive Landscape - Despite the initial dominance of tech giants in the large model space, startups like MiniMax have captured significant market share and achieved top rankings in performance benchmarks [15][16]. - The article notes that the rapid evolution of large models requires companies to continuously innovate to maintain a competitive edge, as capital alone is insufficient for success [14][15]. - MiniMax's innovative approaches, such as the use of mixed attention mechanisms and the CISPO training method, have allowed it to outperform competitors while reducing costs [20][21][23]. Group 4: Agent Applications - The emergence of agent applications, such as MiniMax Agent, represents a new frontier in AI, enabling more complex task execution and planning capabilities [30][32]. - MiniMax Agent has been integrated into daily operations, demonstrating its effectiveness in various tasks, including programming and content creation [31][32]. - The synergy between large model innovations and agent applications is expected to drive further growth and development in the AI ecosystem [32][34].
MiniMax追着DeepSeek打
Jing Ji Guan Cha Wang· 2025-06-18 11:32
2025年2月,DeepSeek火爆出圈,除了免费和好用之外,还因其仅以500万至600万美元的GPU成本,就 训练出了与OpenAI o1能力不相上下的DeepSeek R1模型,引起行业震撼,不过这一成本数据也引发了广 泛争议。 MiniMax称,M1模型的整个强化学习阶段仅使用了512块英伟达H800 GPU,耗时三周,成本仅为53.5万 美元,这一成本"比最初的预期少了一个数量级"。 MiniMax解释,MiniMax M1的强文本处理能力和更低成本,背后是两大核心技术作为支撑,一是线性 注意力机制(Lightning Attention)混合构架和强化学习算法CISPO。例如,CISPO算法通过裁剪重要性 采样权重,而非传统算法中调整Token的更新方式,来提升强化学习的效率和稳定性。 经济观察报 记者 陈月芹 6月17日,MiniMax(稀宇科技)宣布其自主研发的MiniMax M1模型开源,并计划在未来5天内每天发 布一项新产品或新技术。而这款MiniMax M1模型,在关键技术规格、架构设计、上下文处理能力、训 练成本等维度全面对标DeepSeek R1,甚至是谷歌Gemini 2.5 Pro ...
MiniMax的好日子来了?
Hu Xiu· 2025-06-18 09:41
MiniMax 四处突围,终于撞上了自己的"好日子"。 昨天凌晨,MiniMax正式开源它们的第一个推理模型M1,这款模型虽然在各项基准测试中表现"相貌平平",却拥有业界最长的上下文能力: 100万token输入,8万token输出。除了高调开源M1,另一个消息正在各大AI社区传播:MiniMax正在邀请用户测试它们的通用Agent。 在错失推理模型先发优势后,这家曾被认为是AI六小龙中最稳健的公司,想在下一程赢回来。 现在,它们终于等到了一个正在急剧缩短的时间窗口——Agent爆火的2025年。 那么,MiniMax这回推出的M1以及正在内测的Agent到底实力如何?是否还能在明星AI初创公司和大厂的强敌环伺下"正面突围"? "直面AI"实际上手体验了下,并深度解读了这次的技术报告,"挖出了些"背后的东西。 一、上下文 + Agent能力是新模型的核心 接下来,我们实地测试下MiniMax M1推理模型和MiniMax Agent。 先来说下M1推理模型,它给我的第一个感受就是推理链很长,这其实与最近国产开源的几个前沿大模型的表现很相似,像是前段时间的Qwen 系列以及DeepSeek的最新小版本。它们透露 ...
MiniMax深夜开源首个推理模型M1,这次是真的卷到DeepSeek了。
数字生命卡兹克· 2025-06-17 00:23
不知道还有多少人记得,AI行业的六小虎。 行业内都在说,他们已经寂静好久了。 在AIME 2024逻辑数学题目上(偏奥数思维)和 LiveCodeBench编程题上、还有 SWE-bench Verified(真实世界代码补全+修改) ,MiniMax M1的表现只 能说中规中矩,有弱的、有强的。 而TAU-bench(需要理解任务目标、推理动机的场景) ,M1 准确率62.8%,开始媲美开源模型。 但是,最离谱的来了,最后一个,MRCR(4-needle)。 这个直接,屠榜了,真的就一瞬间,一柱擎天,直接跟Gemini2.5Pro肩并肩,我相信用过Gemini 2.5 pro的伙伴,都知道,这玩意的上下文有多离谱,而 现在,MiniMax M1作为一个开源的大模型,首次,在这个评测集上,能跟Gemini 2.5 Pro并驾齐驱了。 上一次相关的项目发布,还是前一段时间我写的MiniMax声音模型的更新, Speech-02。 而昨晚凌晨将近12点的时候,又是MiniMax,居然在X上,预告了他们一整周的发布计划。 给我整不会了,不是,为什么总是选择这么阴间的时间点发布啊。。。 而第一天(也就是昨天),发布了 ...