OpenAI o3封王,4比0横扫马斯克Grok 4,全球大模型对抗赛完美收官
在Kaggle AI国际象棋锦标赛中,OpenAI o3以摧枯拉朽之势横扫大热门Grok 4,勇夺首届AI国际象棋表演赛冠军! 这不仅是一场代码与算法的较量,更被视为科技巨头OpenAI与xAI之间的一场「代理人战争」。 稍早的季军战中,Gemini 2.5 Pro击败o4-mini,将铜牌收入囊中。 全球顶尖的生成式AI模型,通过国际象棋,展开了一场关乎战略与推理核心能力的巅峰对决。 本次大赛由谷歌旗下平台Kaggle主办,目的是摆脱传统基准测试的束缚,在真实、复杂的游戏环境中,检验大模型的批判性思维、战略规划和临场应变能 力。 参赛的AI棋手阵容堪称豪华: OpenAI:o3, o4 mini xAI:Grok 4 Google:Gemini 2.5 Pro, Flash Anthropic:Claude 4 DeepSeek:R1 Moonshot:Kimi K2 比赛规则极具挑战性,旨在模拟更接近人类的思考方式: 禁止使用专业象棋引擎:所有决策必须源于模型自身的通用推理能力。 君子动口不动手:模型必须以完整的自然语言句子来下达指令,而非直接操作棋盘。 时间限制:每步棋有60分钟的思考时间。 防错机制: ...