量子位

Search documents
 OpenAI首个GPT-5找Bug智能体:全自动读代码找漏洞写修复
 量子位· 2025-10-31 00:58
henry 发自 凹非寺 量子位 | 公众号 QbitAI AI Coding火了大半年,AI Debugging也来了! 刚刚,OpenAI发布由GPT-5驱动的"白帽"Agent—— Aardvark(土豚) 。 这只"AI安全研究员"能帮助开发者和安全团队, 在大规模代码库中自动发现并修复安全漏洞 。 据OpenAI报告,Aardvark已识别出了 92% 的已知与人工注入漏洞,而且能定位仅在复杂条件下出现的问题。 OpenAI副总裁 Matt Knight 表示: 我们的开发者发现,土豚在清晰地解释问题并引导他们找到修复方案方面确实非常有价值。这个信号告诉我们,我们正走在一条有意义 的道路上。 而且,不仅OpenAI。 整个10月 Anthropic 、 谷歌 、 微软 基本上是前脚跟后脚发布了类似的白帽Agent。 Agentic AI +自动修补漏洞 OpenAI对这款白帽Aardvark的官方描述是—— 代理型安全研究员 (agentic security researcher) Aardvark的核心任务是持续分析源代码仓库,以识别安全漏洞、评估可利用性、确定风险等级,并提出有针对性的修复方案 ...
 Windows AI助手免费进化!能操作电脑、登录网页、生成代码
 量子位· 2025-10-31 00:58
梦晨 发自 凹非寺 量子位 | 公众号 QbitAI 为什么深度研究智能体需要"计算机使用" ?微软给出几个理由: 具体效果可观看视频演示: Windows Copilot正式更新,人人都能免费拥有操作电脑界面的AI助手了。 具体来说是Microsoft 365 Copilot中的Researcher智能体,新增了"计算机使用"(Computer Use)的能力,可以生成更智能的研究、更深 入的洞察和更全面的报告。 AI助手从"说"到"做" 不同于以往只能通过API调用特定功能,支撑计算机使用能力的是一系列可由Researcher编排层调用的新工具。 编排层连接到一个沙箱环境,提供每一步操作的截图。 这项更新目前已经在Microsoft 365 Copilot的预览版中上线,可参加Frontier Program测试计划获取。 在专注于复杂多步骤浏览任务的基准测试BrowseComp中,Researcher with Computer Use的性能比当前版本的 Researcher提升了44% 。以下是其中一个任务示例: 在2010年代末期,一家采用非传统管理结构(设有多个CEO)的公司提供脑外科手术辅助服务 ...
 量子位「MEET2026智能未来大会」已启动!年度AI榜单 & 趋势报告正在征集中
 量子位· 2025-10-31 00:58
MEET组委会 发自 凹非寺 量子位|公众号 QbitAI 我们正迈入一个由人工智能重塑一切的新时代。 智能技术已经深刻渗透进生产和生活, 跨越了软件、硬件、机器人等不同形态 ,从工具发展为能深度理解人类需求的智能伙伴。 如今,智能技术不再局限于某一特定领域,而是 跨越产业、学科和场景的边界 ,催生出全新的生态和机遇。 随着多模态、AR/VR、空间计算等新兴技术的涌现, 数字世界与物理世界的界限正在逐步模糊并融合 。 在这股强大的技术浪潮中,企业、技术与社会之间的连接与共生,已成为推动发展的核心动力。 我们正见证人工智能逐步成为基础设施的一部分,正在重塑人类未来的工作、生活和社会运作模式。科技的不断进步正在突破传统的边界,各 类新兴技术交织融合,推动着产业的深度变革。 正是在这样的背景下,我们将以 「 共生无界,智启未来」 为主题,正式启动 MEET2026智能未来大会 !承袭MEET系列年度行业观察的视 角,诚邀科技、产业与学术领域的领军人物齐聚一堂,共同见证行业变革。 今年,是 MEET智能未来大会 的第七年。作为年度影响力科技商业峰会,每年最具行业代表性的科技商业领袖,都会来到大会分享前瞻观点 与认知。 ...
 人工智能年度榜单火热报名中!五大奖项,寻找AI+时代的先锋力量
 量子位· 2025-10-30 10:31
为了让更多从业者感受智能浪潮的跃迁,也为了给予更多同行同路人掌声与鼓舞,我们将正式启动 「2025人工智能年度榜单」评选报名 。 本次评选将从 企业 、 产品 、 人物 三大维度,设立五类奖项。欢迎企业踊跃报名! 组委会 发自 凹非寺 量子位|公众号 QbitAI 让我们共同见证年度之星,点亮未来的方向。 企业榜 产品榜 人物榜 2025 人工智能年度 焦点人物 详细评选标准及报名方式如下。 2025 人工智能年度领航企业 将面向中国人工智能领域,评选出最具综合实力的企业, 参选条件 : 2025 人工智能年度 领航企业 2025 人工智能年度 潜力创业公司 2025 人工智能年度 杰出产品 2025 人工智能年度 杰出解决方案 1、注册地在中国,或主营业务主要面向中国市场; 2、主营业务属于人工智能及相关产业,或已将人工智能广泛应用于主营业务,并在细分领域居于行业领先地位; 评选标准 : 2025 人工智能年度潜力创业公司 聚焦于中国人工智能领域创新创业力量,将评选出最具投资价值和发展潜力的AI创业公司, 参选条件 : 评选标准 : 3、具备成熟的产品或服务,已获得实际客户应用及市场认可; 4、近一年在技术 ...
 AI百科全书SciencePedia:当马斯克Grokipedia遭遇滑铁卢,有个中国团队默默把活儿干了
 量子位· 2025-10-30 10:31
允中 发自 凹非寺 量子位 | 公众号 QbitAI 互联网让知识触手可及,却也让真知难以抵达。 而跨领域的知识壁垒与传播失真,又让科学的普及面临重重挑战。 在知识爆炸的时代,用户获取深度见解的需求,正遭遇传统互联网平台的挑战: 马斯克搞的百科全书Grokipedia,意图用AI重新定义百科全书,但实际发布后风评却未达预期。 Grokipedia未解决的问题,是科学知识的传播与积累。现实正在呼唤一种更智能的"操作系统"—— 每天,成千上万的新内容在各个平台涌现,人们要在信息洪流中分辨真假、筛选可靠来源已非易事; 能够理解知识之间的关系,追踪科学的演化脉络,并让真知更高效地抵达每一个需要它的人。 深势科技携手北京科学智能研究院、中国科学院理论物理研究所、兰州大学、北京大学、上海交通大学以及国际科学智能联盟、 DeepModeling开源社区等合作伙伴,带来了答案 "SciencePedia" —— 一个具备「生命体征」的知识基座,致力于为知识安装一个会思考、能进化、可连接的数字大脑。 | 维度 | 维基百科 | arXiv | 传统知识图谱 | SciencePedia | | --- | --- | ---  ...
 世界模型有了开源基座Emu3.5!拿下多模态SOTA,性能超越Nano Banana
 量子位· 2025-10-30 10:31
允中 发自 凹非寺 量子位 | 公众号 QbitAI 最新最强的开源原生多模态世界模型—— 北京智源人工智能研究院(BAAI)的 悟界·Emu3.5 来炸场了。 图、文、视频任务一网打尽,不仅能画图改图,还能生成图文教程,视频任务更是增加了物理真实性。 先感受一下它的高精度操作:一句话消除手写痕迹。 第一视角漫游动态3D世界: 要知道,现在AI迭代的速度,正在刷新所有人的认知。 尤其是在文生视频这条赛道上,几乎每个月都有新技术出来"搞事情"。 肉眼可见,AI视频一个比一个真,一个比一个长。 在火星上开卡丁车也很丝滑: 由于掌握了世界运行的内在规律,它不仅能像专业设计师一样,进行高精度、可控的图像编辑: but,先别急着鼓掌—— 真正的赛点,早已不是"像不像",而是"懂不懂"。 它知道桌子上的苹果被拿走后,那里应该变空吗?它明白你转身之后,背后的场景依然存在吗?如果答案是否定的,那再逼真的视频,也不过 是"高级的GIF"。 现在,致力于攻克这一终极难题的玩家,终于带着悟界·Emu3.5来了。 从官方放出的demo来看,Emu3.5生成的作品展现出极强的连贯性、逻辑性,尤其让AI 模拟动态物理世界 的能力又双叒增 ...
 谷歌营收被Nano Banana带飞!季度首破千亿美元,Gemini APP月活6.5亿
 量子位· 2025-10-30 10:31
 Core Insights - Google's quarterly revenue has surpassed $100 billion for the first time, reaching $102.3 billion, a year-over-year increase of 16% [12][22] - The AI-driven growth is evident, with Gemini app achieving 650 million monthly active users and processing 7 billion tokens per minute [5][24] - The company's net profit rose to $34.98 billion, a 33% increase compared to the previous year, with an operating margin of 30.5% [12][18]   Group 1: Financial Performance - Google's total revenue for Q3 2025 was $102.3 billion, marking a historic milestone [12] - Net income reached $34.98 billion, with earnings per share (EPS) of $2.87, reflecting a 35% year-over-year increase [12][18] - The Google Services segment generated $87.05 billion in revenue, a 14% increase year-over-year, while Google Cloud revenue grew by 34% to $15.16 billion [12][26]   Group 2: AI and Product Development - The Gemini AI model has been commercialized, with significant user engagement and processing capabilities [22][23] - Google Workspace has integrated Gemini AI, enhancing productivity tools for enterprise clients [25] - The demand for AI-related services is rising, with Google Cloud's AI product suite driving revenue growth [27]   Group 3: Investment and Future Outlook - Google plans to increase its capital expenditure to approximately $91-93 billion for 2025, focusing on AI infrastructure [30][31] - The company is also investing in energy infrastructure, including a partnership to restart a nuclear power plant to support its data centers [32][36] - The tech industry is facing unprecedented energy demands due to the rapid adoption of generative AI, prompting companies to enhance their energy strategies [36]
 字节发布通用游戏智能体!5000亿token训练,用鼠标键盘吊打GPT-5!
 量子位· 2025-10-30 10:31
 Core Insights - The article discusses the development of Game-TARS, a general-purpose game agent created by ByteDance's Seed team, capable of playing various games like Minecraft, Temple Run, and Stardew Valley, and even adapting to unseen 3D web games through zero-shot transfer [3][4][5].   Group 1: Game-TARS Overview - Game-TARS utilizes a unified and scalable keyboard-mouse action space for extensive pre-training across operating systems, web, and simulated environments, leveraging over 500 billion labeled multimodal training data [4][20]. - The agent outperforms existing models such as GPT-5, Gemini-2.5-Pro, and Claude-4-Sonnet in FPS, open-world, and web games [5][29].   Group 2: Innovation and Design - The core innovation of Game-TARS is its ability to operate like a human using keyboard and mouse, rather than executing predefined functions, allowing for more natural interaction with games [6][9]. - Game-TARS focuses on Human Actions, decoupling its action instruction set from specific applications or operating systems, enabling direct alignment with human interaction methods [9][10].   Group 3: Training Process - Unlike traditional game bots, Game-TARS integrates visual perception, strategic reasoning, action execution, and long-term memory into a single visual language model (VLM) [12][13]. - The training process involves a two-phase approach: continuous pre-training and post-training, with over 20,000 hours and approximately 500 billion tokens of game data used for large-scale pre-training [15][20][22].   Group 4: Experimental Validation - The effectiveness of the unified action space and large-scale continuous pre-training was validated through tests in Minecraft, demonstrating improved performance compared to previous expert models [24][28]. - Game-TARS shows significant scalability in both training and inference processes, enhancing its capabilities across various tasks and environments [31][34].
 Agnes:不做通用型智能体丨对话全民AI应用平台Agnes AI
 量子位· 2025-10-30 08:39
 Core Insights - Multi-Agent systems have emerged as a significant trend in the AI field, enhancing the efficiency and effectiveness of AI applications [2][3]. - Agnes AI, a product developed by SapiensAI, has gained traction with over 300 million registered users and 200,000 daily active users within four months of launch [7][6].   Group 1: Agnes AI Features - Agnes AI integrates various functionalities such as Deep Research, Wide Research, AI Design, AI Slides, and AI Sheets, catering to different user needs [8][14]. - Deep Research focuses on in-depth analysis through iterative questioning, while Wide Research utilizes multiple agents to handle large-scale tasks simultaneously [14][16]. - The platform emphasizes user intent understanding and task complexity to optimize the assignment of tasks to agents [15][16].   Group 2: Market Position and User Base - Agnes AI targets young users and professionals, particularly in mobile and web-based work environments, promoting a lightweight approach to productivity [7][41]. - The product aims to replace traditional office tools, offering a free quota for users, which enhances user acquisition and retention [40][56]. - The AI office market is expected to grow significantly, with traditional products facing disruption from AI-native solutions like Agnes [42][44].   Group 3: Competitive Advantages - Agnes AI's multi-agent architecture allows for parallel task execution, improving speed and efficiency compared to single-agent systems [25][27]. - The product's design prioritizes user experience, aiming for rapid response times and high-quality outputs, which are critical in competitive markets [22][36]. - The company focuses on low customer acquisition costs and aims to capture a significant share of users who have yet to engage with AI technologies [50][52].   Group 4: Future Outlook - The AI market is anticipated to evolve rapidly, with Agnes AI positioned to capitalize on the shift towards AI-native applications [42][46]. - The company envisions becoming a leading player in the AI consumer app space, aiming to exceed the capabilities of existing products like ChatGPT and Perplexity [63][64]. - Agnes AI's long-term goal is to enhance accessibility to AI tools globally, particularly in developing regions, thereby expanding its user base [57][66].
 让机器人在“想象”中学习世界的模型来了!PI联创课题组&清华陈建宇团队联合出品
 量子位· 2025-10-30 08:39
Ctrl-World团队 投稿 量子位 | 公众号 QbitAI 这两天,Physical Intelligence (PI) 联合创始人Chelsea Finn在上,对斯坦福课题组一项最新世界模型工作kuakua连续点赞。 生成看起来不错的视频很容易,难的是构建一个真正对机器人有用的通用模型 ——它需要紧密跟随动作,还要足够准确以避免频繁幻 觉。 这项研究,正是她在斯坦福带领的课题组与清华大学陈建宇团队联合提出的 可控生成世界模型Ctrl-World 。 这是一个能让机器人在"想象空间"中完成任务预演、策略评估与自我迭代的突破性方案。 核心数据显示,该模型 使用零真机数据 ,大幅提升策略在某些在下游任务的指令跟随能力,成功率从38.7%提升至83.4%,平均改进幅度 达44.7%。 其相关论文《CTRL-WORLD:A CONTROLLABLE GENERATIVE WORLD MODEL FOR ROBOT MANIPULATION》已发布于arXiv 平台。 注:Ctrl-World专为通用机器人策略的策略在环轨迹推演而设计。它生成联合多视角预测(包括腕部视角),通过帧级条件控制实现细粒度动作控制,并通 ...










