马斯克带领xAI团队发布Grok 4,“全球最强模型”含金量如何?
Di Yi Cai Jing·2025-07-10 08:19
此次发布比原定时间推迟了约一小时,马斯克略显憔悴。 7月10日中午12点,经历了前一代模型的延期和此次直播推迟,埃隆·马斯克终于现身Grok 4发布会进行开场,画面中的他略显憔悴,一周前提及"和xAI团队 通宵打磨模型",看起来为这次发布准备已久。 在帖子中,官方称此次发布的Grok 4是 "全球最强大的AI模型",马斯克则在直播中表示,"Grok 4几乎在所有学科上都比人类研究生更聪明" ,具体含金量如 何? 数据显示,Grok 4的多项基准测试很能"打",实现了对现有顶尖模型的超越。在AIME25数学竞赛上,Grok 4拿下了满分,在"人类最后的考试"(HLE)测试 中,不用工具的情况下拿下了26.9%的高分,该测试包含 2500 个专家级问题,涵盖上百个学科。 测评机构Artificial Analysis获得早期访问权限并在发布会后公布了 Grok 4 基准测试,官方提到,Grok 4的人工智能分析指数达到73,"是我们的智能指数首次 将 xAI 列为第一名"。从数据来看,Grok 4领先于 OpenAI o3(70)、谷歌Gemini 2.5 Pro(70)、Anthropic的 Claude 4 ...