Workflow
460万美元训练出顶级大模型? 月之暗面杨植麟亲自回应
Guan Cha Zhe Wang·2025-11-11 10:31

(文/陈济深 编辑/张广凯) 11月6日,月之暗面发布最新模型Kimi K2 Thinking,在Humanity's Last Exam、TAU-Bench等重要基准测 试中,超越GPT-5、Claude 4.5等全球最强开源乃至闭源模型。 在Kimi发布更新的同一天,英伟达CEO黄仁勋关于"中国将赢下人工智能全球竞赛"的最新言论更是让这 个中国大模型吸引了全世界的关注。 K2 Thinking在几个关键领域实现了重大突破:首先是采用了"超稀疏MoE"架构,用极高的效率获得了 万亿级模型的强大知识;其次是实现了"原生INT4量化",在训练中就解决了精度与效率的矛盾,大幅 提升了推理速度并降低了硬件门槛;最关键的是,它在"智能体"(Agent)工具调用能力上实现了质的 飞跃,在衡量"AI数字员工"能力的TAU-Bench测试中登顶。 在发布后仅仅48小时不到,Kimi K2 Thinking下载量已超过5万,成为人工智能全球最大开源社区 Hugging Face最热门的开源模型。 "这是另一个DeepSeek时刻吗?"Hugging Face联合创始人Thomas Wolf在个人社交账号上敲下评论。海 外的开 ...