马斯克发布 Grok 4 模型：推理能力较前代提升 10 倍，各学科测试接近满分

据介绍，Grok 4 的推理能力相较于前代提升了 10 倍，在 SAT 和 GRE 各学科等高难度考试中取得了接近满分的成绩。马斯克在发布会上称，「这是世界上最好的 AI」。以下文章来源于机器之心，作者关注大模型的机器之心 . 专业的人工智能媒体和产业服务平台刚刚，xAI 发布了新一代大模型 Grok 4，包括 Grok 4 和 Grok 4 Heavy 两个型号。「数字生命卡兹克」快速总结了 Grok 4 发布会上的一些关键信息：这次发了两个模型，Grok 4 和 Grok 4 Heavy。训练量是 Grok 2 的 100 倍，在强化学习上的计算量是现有任何模型的 10 倍。在人类最后的考试（Humanity's Last Exam， HLE）中，Grok 4 在 HLE 上拿到 38.6%；Grok 4 Heavy 借助多智能体进一步拉到 44.4%，刷新了最高纪录。官方同时公布 GPQA、AIME25、HMMT25、USAMO25 等学科赛题，Grok 4 Heavy 在其中 4 项夺冠，尤其在 AIME25 与 HMMT25 获得 100% / 96.7% 的近满分表现。全 ...