Workflow
Kimi K2官方技术报告出炉:采用384个专家,训练不靠刷题靠“用自己的话再讲一遍”
量子位·2025-07-22 06:39

一水 发自 凹非寺 量子位 | 公众号 QbitAI Kimi K2称霸全球开源模型的秘籍公开了! 没错,就是 整整32页的Kimi K2官方技术报告 。业内人士第一波repo已火速出炉: 这篇论文中有很多令人印象深刻的内容。 nice!它分享了很多关于Kimi (以及中国实验室) 对这些模型的看法 (他们关注/优化的内容) 。 Kimi K2,作为Kimi最新MoE基础模型,总参数1T,激活参数32B,能力领先性尤其展现在代码、Agent、数学推理任务上。 上线仅一周,它就在竞技场千人盲评中击败DeepSeek, 登顶全球最强开源模型 ,而且能媲美Grok 4、GPT 4.5等顶尖闭源模型。 那它是咋做到的呢? 别急,这篇最新论文来给答案了—— 一次性大公开Kimi K2的训练过程及"秘密配方" 。 包括但不限于大家已经热议的:MuonClip优化器、大规模Agentic Tool Use数据合成、通用强化学习等等。 下面详细来看。 都有哪些技术亮点 首先,Kimi团队认为,现如今大语言模型正从静态模仿学习向Agentic Intelligence转型。 这意味着,模型需要具备在复杂动态环境中自主感知、规划 ...