Workflow
马斯克发布 Grok 4 模型:推理能力较前代提升 10 倍,各学科测试接近满分
Founder Park·2025-07-10 07:59

据介绍,Grok 4 的推理能力相较于前代提升了 10 倍,在 SAT 和 GRE 各学科等高难度考试中取得了接 近满分的成绩。 马斯克在发布会上称,「这是世界上最好的 AI」。 以下文章来源于机器之心 ,作者关注大模型的 机器之心 . 专业的人工智能媒体和产业服务平台 刚刚,xAI 发布了新一代大模型 Grok 4,包括 Grok 4 和 Grok 4 Heavy 两个型号。 「数字生命卡兹克」快速总结了 Grok 4 发布会上的一些关键信息: 这次发了两个模型,Grok 4 和 Grok 4 Heavy。 训练量是 Grok 2 的 100 倍,在强化学习上的计算量是现有任何模型的 10 倍。 在人类最后的考试(Humanity's Last Exam, HLE)中,Grok 4 在 HLE 上拿到 38.6%;Grok 4 Heavy 借助多智能体进一步拉到 44.4%,刷新了最高纪录。 官方同时公布 GPQA、AIME25、HMMT25、USAMO25 等学科赛题,Grok 4 Heavy 在其中 4 项夺 冠,尤其在 AIME25 与 HMMT25 获得 100% / 96.7% 的近满分表现。 全 ...