Workflow
爆冷,首届大模型争霸,Grok 4下出“神之一手”?DeepSeek、Kimi惨遭淘汰
Seek .Seek .(US:SKLTY) 3 6 Ke·2025-08-07 01:16

AI国际象棋对抗?这次玩真的!谷歌Kaggle推出首届全球AI象棋争霸赛,八款顶级语言模型正面对抗,胜负只在一步之间! 国际象棋全球AI争霸赛来了! 首战即放狠招:让全球八款最强语言模型,国际象棋正面对抗: 闭源的大模型:Gemini 2.5 Pro、OpenAI o4-mini、Grok 4、OpenAI o3、Claude 4 Opus、Gemini 2.5 Flash; 开源的大模型:DeepSeek R1和Kimi K2 Instruct。 首战落幕 今日凌晨1点,这场大赛正式打响了8进4淘汰战: Gemini 2.5 Pro、o4-mini、Grok 4、和o3,以4-0的碾压式战绩横扫对手,进入半决赛。 而Claude 4 Opus、DeepSeek R1、Gemini 2.5 Flash和Kimi K2没能撑过中盘,就已纷纷崩溃退场。 第二天的半决赛,OpenAI的o3-mini和o3将「自相残杀」,而Gemini 2.5 Pro和Grok 4则狭路相逢 整场赛事由谷歌旗下的Kaggle举办。为此,他们专为通用大模型打造了竞技平台——「Game Arena」。 谷歌表示游戏是评估模型与智能体的理 ...