Grok 4

Search documents
Gemini灵魂人物加盟xAI,马斯克亲自夹道欢迎!
量子位· 2025-09-26 09:12
大佬叫 Dustin Tran ,他是 Gemini DeepThink 的共同创造 者 , 该模型一经发布便展现出SOTA级别的推理能力, 在过去两个月内连斩 IMO和ICPC金牌 。 不仅如此, 可以说是Tran一手成就了Gemini ,帮助谷歌在后GPT失速时刻重新追回了AI的风口。 不过,谁能想到,Grok-4-fast的背后居然也有Tran的影子。 是的,就在Grok新模型发布当天,Tran便在X上发长文官宣已经加入xAI。 Jay 发自 凹非寺 量子位 | 公众号 QbitAI 前谷歌DeepMind资深研究员,现在是马斯克的人了。 文章里,Tran回顾了自己8年来在谷歌的经历,还顺带给xAI和新老板点了个大大的赞。 目前,这篇小作文阅读量达13w,就 连马斯克本人也亲自转发 ,表示热烈欢迎。 谷歌IMO和ICPC背后的大神 要知道,老马一向以极其严苛的高要求著称,能让他亲自夹道欢迎的人可没几个。 可以说,正是Tran所在的团队,在谷歌被OpenAI打得晕头转向时帮助公司重新找回了方向,一举扭转了悲观的市场预期。 那Tran,究竟是什么来头? 实际上,Tran身上贴满了「里程碑」级别的标签,他可以 ...
谁是最强“打工AI”?OpenAI亲自测试,结果第一不是自己
量子位· 2025-09-26 04:56
西风 发自 凹非寺 量子位 | 公众号 QbitAI OpenAI发布最新研究,却在里面夸了一波Claude。 他们 提出名为 G D Pv al 的新基 准 ,用来衡量AI模型在真实世界具有经济价值的任务上的表现。 最后OpenAI还 开源了包含220项任务的优质子集 ,并提供公开的自动评分服务。 具体来说,GDPval覆盖了 对美国GDP贡献最大的9个行业中的44种职业 ,这些职业年均创收合计达3万亿美元。任务基于平均拥有14年经验 的行业专家的代表性工作设计而成。 专业评分人员将主流模型的输出结果与人类专家的成果进行了对比。 最终测试下来, Claude Opus 4.1成为表现最佳的模型,47.6%的产出被评定媲美人类专家成果 。 GPT-5 38.8%的成绩和Claude还是有些差距,位居第二;GPT-4o与人类相比只有12.4%获胜或平局。 没能成为最优,OpenAI也给自己找补了:不同模型各有优势,Claude Opus 4.1主要是在美学方面突出,而 G P T-5在准 确 性 上更优 。 OpenAI还表示,同样值得注意的是模型的进步速度,其前沿模型在短短一年内,胜率几乎实现了翻倍。 网友看 ...
关系回暖?外媒:特朗普与马斯克“再联手”,为美联邦机构推出“政府版Grok”
Huan Qiu Wang· 2025-09-26 02:22
【环球网报道 记者 张倩】据美国福克斯新闻网、英国《独立报》等媒体报道,美国总务管理局25日宣布将与美国知名企业家马斯克旗下人工智能 公司xAI合作,使美国联邦机构能够以迄今最低价格和最长期限使用该公司的人工智能(AI)模型Grok。《独立报》就此事评论称,美国总统特朗 普与马斯克的关系似乎正在回暖,二人又再度联手。 报道称,特朗普和马斯克之间的敌意似乎已逐渐成为过去。马斯克25日在给福克斯新闻网的声明中表示,"感谢特朗普总统及其政府,xAI的前沿人 工智能如今向所有联邦机构开放。""我们期待继续与特朗普总统及其团队合作,加速在政府各部门部署人工智能,造福国家。" 特朗普与马斯克自今年6月以来曾爆发激烈冲突,距今不到4个月。据了解,双方曾围绕"大而美"税收和支出法案等问题产生严重分歧,大打"口水 仗"。不过,特朗普9月初在播客节目中评价马斯克"是个好人","我过去欣赏他……现在依然如此"。9月21日,在美国知名保守派活动人士、特朗普 政治盟友查理·柯克的追悼会上,特朗普与马斯克曾被拍到握手,马斯克当天还在社交平台上分享了自己与特朗普"同框"的画面。 《独立报》称,美国总务管理局当天在一份新闻稿中宣布,与马斯克 ...
X @xAI
xAI· 2025-09-25 16:02
Announcing an expansion to xAI For Government – making industry leading Frontier AI accessible to United States Federal Government users.1) All federal agencies and departments will get access to our Frontier AI models (Grok 4, Grok 4 Fast) for $0.42 per department for a period of 18 months starting today.2) We are committing a team of Grok Engineers to help the government harness our AI to its fullest potentialWe’re also growing our team and are hiring mission driven engineers who want to join the cause. ...
X @Elon Musk
Elon Musk· 2025-09-25 07:53
ProgressX Freeze (@amXFreeze):Grok 4 Fast is now #1 on LiveCodeBench (Coding)Grok 4 secures the #2 spot right after Grok 4 Fast https://t.co/0gSO0towfG ...
Nvidia砸千亿美元助力OpenAI,马斯克狂飙造全球最大AI集群 | Jinqiu Select
锦秋集· 2025-09-23 04:44
当基础能力持续进步时,创业的关键在于找到新的应用场景和差异化路径。也许是某个高频的行业环节,也许是某种全新的交互方式,也可能是模型与硬件、人与人 的结合。初创公司同样需要在自己的条件下,找到独特而极致的打法。 今天,AI领域迎来一桩惊天动地的消息:Nvidia 宣布将向 OpenAI 投入高达 1000 亿美元 的战略投资,携手打造至少 10 吉瓦(gigawatts)的数据中心基础设施,用于 支撑下一代模型的训练与部署。 这一动作,标志着模型层玩家的AI 战争从算法、产品层面,真正迈入了"基础设施+算力"的硬核较量阶段。 与此同时,另一边的 Elon Musk 正以一种近乎"超现实"的速度布局算力版图:xAI 正在孟菲斯、密西西比等地加速建设 Colossus 系列 AI 集群,目标是在最短时间内实 现数百兆瓦甚至接近吉瓦级别的集群能力。电站、涡轮机、跨州供电 ──这些支撑算力的根基,都在高强度投入中被快速铺设。 模型层大玩家依然在坚定地押注模型,资本、算力、速度也成为顶级玩家已经形成了难以撼动的护城河。 对大量非模型层的AI创业者来说,这无疑都是好消息。 无论是OpenAI的超大规模训练,还是xAI的集群 ...
X @Elon Musk
Elon Musk· 2025-09-21 17:23
RT Wes Roth (@WesRothMoney)Grok 4 Fast feels like it should be impossible 🤯better than Gemini 2.5 Pro47x cheaper than Grok 4it's obvious @elonmusk's big bet on scaling RL and post-training is about to start paying off...🧵 https://t.co/OyhUgXwmcG ...
X @Elon Musk
Elon Musk· 2025-09-21 16:27
RT X Freeze (@amXFreeze)xAI has vending machine in the office that actually makes money - It is powered by Grok 4Grok 4 sits at the very top of the Vending-Bench leaderboard https://t.co/Ngpe3qTEEu ...
马斯克新模型性价比拉满:1折价格实现Gemini 2.5性能,支持2M上下文
量子位· 2025-09-21 13:29
时令 发自 凹非寺 量子位 | 公众号 QbitAI 马斯克xAI又出手了! 这次闪亮登场的是 Grok 4 Fast —— 不仅实现1折价格追平Gemini 2.5,还支持 2M 上下文窗口。 帮我找一篇今年的X帖子,其中mkbhd分别拿着书本式折叠手机和翻盖式折叠手机。 Grok 4 Fast不仅详细描述了帖子内容,提供了准确链接,甚至还贴心地附上了相关的YouTube视频网址。 除此之外,这个全新的多模态推理模型还可与X实现无缝衔接。 例如,给它输入以下提示词: 下面具体来看。 以最低的成本实现最高的性能 可以说,Grok 4 Fast这一波在性价比这件事上树立了新标杆。 在推理基准测试中,它不仅 全面超越Grok 3 Mini ,还大幅降低了Token成本。 与Grok 4相比,Grok 4 Fast在保持与前者性能差不多的同时,平均使用的思考Token数量减少了40%。 根据Artificial Analysis的独立评测验证,在"人工分析智能指数"榜单中,Grok 4 Fast与其它公开可用模型相比,呈现出业界领先的"价格-智 能"比。 除此之外,Grok 4 Fast还在LMArena上进行了对 ...
谷歌Gemini IMO和ICPC夺金功臣之一被xAI挖走,马斯克直呼:起飞
机器之心· 2025-09-21 05:26
机器之心报道 机器之心编辑部 大厂之间不是「你挖我」,就是「我挖你」。 那边特斯拉 Optimus AI 团队负责人 Ashish Kumar 被挖去 Meta,这边谷歌 DeepMind 资深研究科学家被 xAI 挖走了。 马斯克发推祝贺,并用火箭符号喊话:「起飞啦」! 此次, 被挖去 xAI 的是一名在谷歌 DeepMind 工作近 9 年的大神级人物 ——Dustin Tran,离职前担任资深首席研究员 。 他是谷歌 Gemini-0801 的共同创造者,这是谷歌首个在 LMSYS 上登顶的模型。同时是 Gemini 2.5 系列模型的评测专家,这些模型在 WebDev Arena 和 HLE 等榜单 上取得了第一名。他还是谷歌 Gemini 1、1.5、2 和 2.5 的核心贡献者之一,其工作涵盖了强化学习、评测与数据等基础环节,并共同主导了相关论文与成果发布。 他在 X 上发表了一篇公开离职信,全文如下: 我在谷歌 DeepMind 工作 8 年多后选择了离开。这里留下了许多美好的回忆,最初在 Google Brain 参与早期奠基性的论文,与 Noam Shazeer、Ashish Vaswani ...