马斯克推最强Grok 4!人类终极测试干翻OpenAI,包月费超2千元
Sou Hu Cai Jing·2025-07-10 07:56
在"人类的最后考试"(Humanity's Last Exam)中,Grok 4在无需"工具"的情况下取得了25.4%的准确率,超过了谷歌Gemini 2.5 Pro的21.6%和OpenAI o3 (高版本)的21%。 xAI还推出了迄今为止最昂贵的AI订阅计划——每月300美元的Super Grok Heavy。订阅者可以抢先体验Grok 4 Heavy,并抢先体验新功能。这些新功能包括 但不限于:将于8月推出的AI编码模型,9月推出的多模态智能体,以及10月推出的视频生成模型。 ▲Grok 4在Humanity's Last Exam测评中取得第一 "就学术问题而言,Grok 4在各个学科上都比博士水平高,无一例外。"马斯克在直播中说,"有时,它可能缺乏常识,而且它还没有发明新技术或发现新的 物理学说,但这只是时间问题。" ▲埃隆·马斯克在直播中发言 配备"工具"的Grok 4 Heavy获得44.4%的得分,优于配备工具的Gemini 2.5 Pro的26.9%。 ▲每月300美元的Super Grok Heavy正式推出 直播结束后,马斯克在X上发文称:"你可以将整个源代码文件剪切并粘贴到Grok上 ...