您猜怎么着?Grok 4进决赛,大模型对抗赛Gemini全军覆没,马斯克「装」起来了
马斯克昨天点评比赛结果的话术,今天依旧有用:「国际象棋太过简单,对 Grok 来说,只是副作用,我们没花多少力气放在象棋优化上。」 今天 Grok 4 闯入总决赛,不知马斯克是不是更看不上这场比赛了。 谁也没想到,谷歌攒的 Kaggle AI Chess 比赛(即大模型国际象棋对抗赛),在半决赛中,Grok 4 击败 Gemini 2.5 Pro,进入总决赛! 在昨天的比赛中,Gemini 2.5 Pro、o4-mini、Grok 4 和 o3 均以 4-0 的战绩分别击败 Claude 4 Opus、DeepSeek R1、Gemini 2.5 Flash 和 Kimi k2,晋级半决 赛。 今天的战况依旧让人猜不着走向,Gemini 2.5 Pro 败了。 明天是比赛的最后一天。届时,将迎来本次 AI 象棋巅峰对决的冠军之战,X 对战 OpenAI。 对战表 o4-mini 对阵 o3 :0-4 在初赛中,o4-mini 和 o3 均以 4-0 的全胜战绩淘汰了 DeepSeek-R1 以及 Kimi k2,同样出身 OpenAI 的两大模型在半决赛中正面对决。 比赛的结果基本在预料之中,o3 以 4 比 ...