Grok 4号称“全球最强AI”？其实是马斯克的自吹自擂

「这是世界上最聪明的人工智能。」尽管比原定发布会时间推迟了近一个小时，但在今天中午（北京时间 9 月 10 日），xAI 创始人马斯克还是发布了新一代大模型 Grok 4。纸面上，Grok 4 已经全面超越了所有竞争对手，包括 OpenAI o3、Gemini 2.5 Pro 以及 Claude 4 等当前的顶级大模型，不管是传统的基准测试，还是 SAT 考试（美国高考）以及各个学科的 GRE 水平测试。但比起这些已经有点乏味的传统基准测试，更有意思的是，Grok 4 还跑了被成为「人类最后一场闭卷考试」的 Humanity's Last Exam（简称 HLE 测试），并超越此前一众模型，实现了最高 44.4% 的准确率。图/ xAI 马斯克在直播中也指出，Grok 4 比几乎所有学科的所有研究生都更聪明，而至少在学术问题上，也优于所有学科的博士水平，「没有例外。」这还不是 Grok 4 全部潜力。按照马斯克的说法，Grok 4 基础模型的第七版将在本月完成，然后将进行后训练 RL（强化学习）等，最终也会拥有出色的视频理解能力和工具调用能力。按照路线图，接下来几个月 xAI 还会推出代码模型 ...