Workflow
错误修复机制
icon
Search documents
Kimi新模型数学反超DeepSeek!北大校友刘征瀛等领衔
量子位· 2025-07-11 07:20
白交 发自 凹非寺 量子位 | 公众号 QbitAI Kimi新模型数学超越DeepSeek了! 在定理证明这块,即便模型参数72B也能超越DeepSeek-Prover-V2的671B版本,实现SOTA。 这一新模型来自Numina组织和Kimi团队联合打造,前者曾在AI-MO竞赛中荣获进步一等奖,陶哲轩亲自为他们颁奖。 有意思的是,这俩AGI团队不是第一次交手。 两个月前DeepSeek刚发布了DeepSeek-Prover V2版本,然后直接在普特南测试上将记录刷新到 49道 。 当时第一名正好是Kimina-Prover,而它只能做出10道题。 | | | | # | Model | num- solved | | | --- | --- | --- | --- | | | | | compute | | 1 | Kimina-Prover-7B-Distilly | 10 | pass@192 | | 2 | Self-play Theorem Prover® | 8 | pass@3200 | | 3 | Goedel-Prover-SFT | 7 | pass@512 | | 4 | ABEL ...