OpenAI

Search documents
Kimi新功能Deep Researcher海外引发热议 还被马斯克直播点名
Sou Hu Cai Jing· 2025-07-10 10:15
是Kimi上月发布的首款Agent产品,在HLE测试中超过了Gemini2.5Pro,略高于OpenAI Deep Research,并与Gemini-Pro的Deep Research Agent打平,是目 前已知的最高水平之一。 当地时间9日晚,马斯克旗下公司xAI举办直播发布会,正式发布其最新旗舰模型Grok 4。 直播中提到HLE(Humanities Last Exam,人类最后的考试)进行对比时,分别介绍了OpenAI、谷歌旗下Gemini以及月之暗面Kimi三家公司,而 DeepResearcher正 资料显示,Kimi DeepResearcher功能在执行每个研究任务时,会平均进行23次推理,由模型判断并筛选出信息质量最高的内容后,剔除冗余及低质信息, 自动生成分析结论,拥有文献的严谨性,可有效告别模型幻觉。 在海外社交媒体上,AI从业者纷纷表达着对这款来自中国AI产品的喜爱,有网友表示,Kimi Deep Researcher可能是用过的最好的深度研究模型,视觉效 果出色。也有博主表示,对深度研究的能力和准确性印象深刻。 | February 3. | OpenAl Deep | A ma ...
OpenAI即将推出AI浏览器 直接挑战谷歌Chrome霸主地位
硬AI· 2025-07-10 08:30
据报道,OpenAI的浏览器有望在未来数周内上线,集成聊天界面和AI代理功能。若能获得其4亿每周活跃ChatGPT用户 的拥护,OpenAI或将对谷歌广告生态、Web数据流和搜索流量产生实质冲击。 硬·AI 作者 | 鲍奕龙 编辑 | 硬 AI OpenAI即将推出AI浏览器,旨在利用人工智能技术从根本上改变消费者的网络浏览方式,直接挑战占据 市场主导地位的谷歌Chrome。 7月9日据媒体报道,OpenAI的浏览器有望在未来数周内上线,集成聊天界面和AI代理功能。 若能获得其 4亿每周活跃ChatGPT用户的拥护,OpenAI或将对谷歌广告生态、Web数据流和搜索流量产生实质冲 击。 谷歌Chrome长期作为Alphabet广告业务的支柱,为广告精准投放和流量导向自有搜索引擎提供基础 数据。 01 AI驱动浏览器: 重新定义互联网入口 报道指出,OpenAI浏览器最大特色,是让用户在ChatGPT式本地界面完成部分交互,减少传统跳转网站 的行为。同时,浏览器将深度整合AI"代理人"(agent),可代表用户完成如预订、表单填写等操作。此举 旨在推动AI服务更深入个人与工作场景,加快AI与用户日常行为的天然融 ...
马斯克带领xAI团队发布Grok 4,“全球最强模型”含金量如何?
Di Yi Cai Jing· 2025-07-10 08:19
此次发布比原定时间推迟了约一小时,马斯克略显憔悴。 7月10日中午12点,经历了前一代模型的延期和此次直播推迟,埃隆·马斯克终于现身Grok 4发布会进行开场,画面中的他略显憔悴,一周前提及"和xAI团队 通宵打磨模型",看起来为这次发布准备已久。 在帖子中,官方称此次发布的Grok 4是 "全球最强大的AI模型",马斯克则在直播中表示,"Grok 4几乎在所有学科上都比人类研究生更聪明" ,具体含金量如 何? 数据显示,Grok 4的多项基准测试很能"打",实现了对现有顶尖模型的超越。在AIME25数学竞赛上,Grok 4拿下了满分,在"人类最后的考试"(HLE)测试 中,不用工具的情况下拿下了26.9%的高分,该测试包含 2500 个专家级问题,涵盖上百个学科。 测评机构Artificial Analysis获得早期访问权限并在发布会后公布了 Grok 4 基准测试,官方提到,Grok 4的人工智能分析指数达到73,"是我们的智能指数首次 将 xAI 列为第一名"。从数据来看,Grok 4领先于 OpenAI o3(70)、谷歌Gemini 2.5 Pro(70)、Anthropic的 Claude 4 ...
国王与幽灵:蒂姆·库克的苹果AI灵魂保卫战
3 6 Ke· 2025-07-10 08:08
Core Insights - The annual Worldwide Developers Conference (WWDC) in 2025 revealed a tense atmosphere surrounding Apple, contrasting with its historically confident presentations [2][4] - Apple's stock price fell by 1.5% during the event, marking a nearly 20% decline since the beginning of the year, resulting in a loss of over $750 billion in market capitalization [4] - Tim Cook, Apple's CEO for 14 years, faces scrutiny as the company struggles to adapt to the rapidly evolving AI landscape, raising questions about its innovative spirit [5][7] Group 1: Company Performance and Market Position - Apple's stock has dropped nearly 20% since the start of 2025, leading to a market capitalization loss exceeding $750 billion [4] - The company has fallen to third place in market capitalization, behind Microsoft and Nvidia, highlighting a significant shift in its competitive position [4] - The WWDC event was met with disappointment from developers and tech commentators, who described the announcements as lackluster and indicative of a company struggling to keep pace with innovation [4][8] Group 2: Leadership and Strategic Challenges - Tim Cook's leadership style, characterized by operational excellence, is now being challenged by the chaotic nature of AI development, which contrasts with his established culture of predictability [7][14] - The failure of Project Titan, Apple's ambitious car project, exemplifies the difficulties the company faces in executing disruptive innovations under Cook's management philosophy [15][18] - The internal conflict between different teams regarding AI strategy has led to a fragmented approach, hindering Apple's ability to respond effectively to the AI revolution [34][36] Group 3: AI Strategy and Future Directions - The emergence of ChatGPT has intensified pressure on Apple to enhance its AI capabilities, prompting a reevaluation of its approach to AI development [25][29] - Apple's decision to partner with OpenAI to integrate ChatGPT into its ecosystem represents a strategic pivot, allowing the company to leverage external expertise while maintaining control over user interactions [49][52] - This partnership is seen as a pragmatic response to the competitive landscape, enabling Apple to enhance its AI offerings without compromising its core principles of user privacy and data security [54][56] Group 4: Internal Dynamics and Talent Management - The collaboration with OpenAI has led to internal discontent among engineers who had been focused on developing Apple's own AI models, resulting in a wave of talent departures [56][59] - The departure of key personnel, such as Ruoming Pang, highlights the challenges Apple faces in retaining talent amid strategic shifts and internal conflicts [57][59] - The internal power dynamics have shifted, with Craig Federighi's practical approach gaining prominence over John Giannandrea's idealistic vision for AI development [64]
MuJoCo实战教程即将开课啦!从0基础到强化学习,再到sim2real
具身智能之心· 2025-07-10 08:05
为什么 MuJoCo 是具身智能的关键技术? MuJoCo ( Multi-Joint dynamics with Contact )不仅仅是⼀个物理仿真引擎,它更是连接虚拟世界与 现实世界的重要桥梁。在具身智能的技术⽣态中, MuJoCo 扮演着⾄关重要的角色,它为机器⼈学 习提供了⼀个⾼保真、⾼效率的训练环境。 当我们谈论机器⼈学习时,⼀个核⼼问题是:如何让机器人在不损坏昂贵硬件的情况下,快速掌握 复杂的运动技能?传统的⽅法是在真实机器人上进行大量试错,但这种方式不仅成本高昂,而且效 率低下,甚至可能存在安全风险。MuJoCo的出现彻底改变了这⼀现状。 通过 MuJoCo ,研究者可以构建⾼度逼真的虚拟机器人和环境,让 AI 系统在仿真中进⾏数百万次的 试验 和学习。这种方法的优势是显而易见的:首先,仿真速度可以比现实时间快数百倍,大大加速 了学习 过程;其次,在虚拟环境中,机器人可以尝试各种极端情况⽽不⽤担⼼硬件损坏;最重要的 是,通过精⼼设计的域随机化技术,在仿真中训练的策略可以成功迁移到真实世界中。 MuJoCo 的技术优势体现在多个方面。它采用了先进的接触动⼒学算法,能够精确模拟机器⼈与环境 的复 ...
他一人撑起谷歌90%的AI宣传,劈柴真是挖到鬼才了
量子位· 2025-07-10 08:00
Core Viewpoint - Logan Kilpatrick, a key figure in Google's AI marketing efforts, is responsible for 90% of the company's AI promotional work, having transitioned from OpenAI to Google [3][22]. Group 1: Logan Kilpatrick's Role and Background - Logan Kilpatrick is recognized as Google's AI "promotional expert," actively engaging with the developer community on platforms like X [2][3]. - At just 27 years old, Kilpatrick has a background that includes working at NASA and Apple before joining OpenAI as the Developer Relations Lead [7][8]. - His experience at OpenAI helped him understand ecosystem building and developer engagement, earning him the nickname "LoganGPT" among developers [10][11]. Group 2: Transition to Google and Responsibilities - Kilpatrick joined Google in 2024, where he was tasked with developing the AI Studio platform and integrating it into Google Cloud [12][14]. - Following a significant talent migration within Google, his team was moved under DeepMind, enhancing collaboration between research and development [19][20]. - He has been instrumental in promoting Google's Gemini series models, which have over 400 million monthly active users, although they still lag behind ChatGPT's 500 million weekly active users [23]. Group 3: Marketing Challenges and Strategies - Google faces challenges in marketing due to its diverse product offerings, which can confuse developers and users [24][25]. - Kilpatrick acknowledges that Google needs to improve its marketing efforts to better communicate ongoing innovations [26][27]. - His approach involves direct engagement with developers, which has been well-received and contrasts with traditional marketing channels [28][36]. Group 4: Investment Activities - In addition to his role at Google, Kilpatrick has invested in over 50 startups, indicating his active involvement in the tech ecosystem [39].
马斯克推最强Grok 4!人类终极测试干翻OpenAI,包月费超2千元
Sou Hu Cai Jing· 2025-07-10 07:56
在"人类的最后考试"(Humanity's Last Exam)中,Grok 4在无需"工具"的情况下取得了25.4%的准确率,超过了谷歌Gemini 2.5 Pro的21.6%和OpenAI o3 (高版本)的21%。 xAI还推出了迄今为止最昂贵的AI订阅计划——每月300美元的Super Grok Heavy。订阅者可以抢先体验Grok 4 Heavy,并抢先体验新功能。这些新功能包括 但不限于:将于8月推出的AI编码模型,9月推出的多模态智能体,以及10月推出的视频生成模型。 ▲Grok 4在Humanity's Last Exam测评中取得第一 "就学术问题而言,Grok 4在各个学科上都比博士水平高,无一例外。"马斯克在直播中说,"有时,它可能缺乏常识,而且它还没有发明新技术或发现新的 物理学说,但这只是时间问题。" ▲埃隆·马斯克在直播中发言 配备"工具"的Grok 4 Heavy获得44.4%的得分,优于配备工具的Gemini 2.5 Pro的26.9%。 ▲每月300美元的Super Grok Heavy正式推出 直播结束后,马斯克在X上发文称:"你可以将整个源代码文件剪切并粘贴到Grok上 ...
Cursor 搭 MCP,一句话就能让数据库裸奔!?不是代码bug,是MCP 天生架构设计缺陷
AI前线· 2025-07-10 07:41
编译 | Tina 安全研究团队 General Analysis 日前警告称,如果你使用了 Cursor 搭配 MCP,有可能在毫不知情 的情况下,把你的整个 SQL 数据库泄露出去——而攻击者仅靠一条"看起来没什么问题"的用户信息 就能做到这一点。 这是"致命三连"攻击模式的典型体现:提示注入、敏感数据访问,以及信息回传全部集中在一个 MCP 中实现。随着 MCP 被越来越多的 Agent 接入,这类看似边缘的配置问题,正在迅速演变为 AI 应用中的核心安全挑战。 一句话,就能让你的私有数据库裸奔 英伟达 CEO 黄仁勋曾描绘过一个令人震撼的未来:企业将由 5 万名人类员工管理 1 亿个 AI 助理。 这个听起来像科幻小说的场景,其实正迅速成为现实。 一切始于 2024 年底,MCP 悄然发布,最初并未引发太多关注。然而,仅仅几个月后,局势便急剧 升温。到了 2025 年初,已有超过 1,000 个 MCP 服务器上线,GitHub 上相关项目迅速蹿红,斩获 33,000 多颗星、数千次分叉。谷歌、OpenAI、微软等科技巨头迅速将 MCP 纳入生态体系,Claude Desktop、Claude Cod ...
Cursor终结者?Grok 4正式登顶!马斯克扬言编程碾压,20万N卡年赚47亿美金!
AI前线· 2025-07-10 07:41
作者| 华卫 、冬梅 时隔 5 个月,Grok 终于再次"更新换代"。 这次,xAI 不仅直接跳过了 Grok 3.5,而且并非只发布一款模型。今天刚发布的是通用模型 Grok 4,能够处理常规任务并进行对话。接下来的三个月时间里,xAI 将陆续发布专为编码任务设计的 Coding Model、多模态代理 Multi-modal Agent 和视频生成模型 Video Generation Model。 目前,Grok 4 已上线,提供三个订阅版本,包括免费的基础版、每月 30 美元的 Supergrok 和每月 300 美元的 Supergrok Heavy。SuperGrok Heavy 订阅用户可提前体验 xAI 计划在未来几个月推出 的一些新产品。 "在所有学科领域,Grok 4 的智能水平都超过了博士生"。发布会上,马斯克吹嘘道, "我们已经没有 测试题可问了,现实是终极的推理测试",他补充说: "有时,它可能缺乏常识,而且它还没有发明 新技术或发现新的物理学,但这只是时间问题。" 直播现场,马斯克身着皮夹克,在 xAI 团队成员的陪同下,详细演示了这款新模型。值得注意的是, 距离产品发布仅数小时前 ...
反犹争议后xAI闪电发布Grok4聊天机器人,月烧10亿美元角逐AI巨头
Zhi Tong Cai Jing· 2025-07-10 07:12
埃隆.马斯克旗下的人工智能初创公司xAI在其前一代产品发布仅数月后,便推出了Grok4,这一举措凸 显了人工智能领域白热化的发展速度。 Grok4的发布正值xAI的转型期——该公司已于今年3月与X完成合并。合并后的新公司整合了部分工程 资源和其他技术,旨在更好地开发Grok并向X的用户群体推广。而就在Grok4直播演示的数小时前,X 首席执行官琳达.亚卡里诺宣布辞职,这为这家社交平台的管理层留下了一个空缺。 目前,马斯克正为xAI筹集巨额资金。该公司正与谷歌母公司Alphabet、OpenAI、Meta等科技巨头展开 竞争,角逐尖端聊天机器人的研发高地。此前报道称,xAI每月的资金消耗高达10亿美元,这一数字足 以彰显该公司在人工智能领域的雄心背后,是何等高昂的成本。 Grok4发布的前一天,xAI刚被迫从社交平台X上删除了Grok发布的不当内容,其中包括反犹言论以及对 用户的不当回复。该公司声明称:"自发现相关内容后,xAI已采取措施,在Grok在X平台发布内容前拦 截仇恨言论。" 周三,马斯克仅表示"我们必须确保人工智能是向善的",却未提及Grok3的不当言论及相关争议。 同日早些时候,土耳其政府一名部长 ...