网页编程众测排名:DeepSeek-R1超越Claude 4加冕全球第一
量子位·2025-06-17 07:41
一水 发自 凹非寺 量子位 | 公众号 QbitAI 它在LiveCodeBench上几乎与OpenAI o3-high相当,乃至一众网友猜测其为传说中的R2。 编程王者Claude地位不稳了?? 大模型竞技场最新战报出炉, DeepSeek新版R1拿下网页编程第一,小胜Claude Opus 4 。 要知道Claude Opus 4可是公认的"全球最强编码模型"。 so,能在编程上战胜 Claude Opus 4 ,DeepSeek-R1-0528到底啥来头? 看名字你可能以为是个小版本更新,但实际上—— | | | | 10/1/2024 | | 5/1/2025 | | --- | --- | --- | --- | --- | --- | | Rank | Model | Pass ... ↓ | | Easy… Medium… | I Hard ... | | 1 | 04-Mini (High) | 79.5 | 98.8 | 86.7 | 63.8 | | 2 | 03 (High) | 75.4 | 98.8 | 81.9 | 57.9 | | | | | 9 | | | | 4 | Deep ...