AI前线
Search documents
GPT-5.2全力出击!碾压44类专业工作,实测编程同价位无对手、深度推理封神,但速度太拉胯了
AI前线· 2025-12-12 00:40
整理|华卫 刚刚,GPT-5.2来了。 一共三个版本: OpenAI称,这是迄今为止功能最强大的专业知识工作模型系列。在涵盖44个职业、任务定义明确的知识型工作中,它的表现超越了行业专业人 士。 总体而言,GPT-5.2 在通用智能、长上下文理解、智能体工具调用及视觉能力方面实现了大幅升级,相较以往任何一款模型,它在端到端执行复 杂的现实任务时表现更为出色。在制作电子表格、搭建演示文稿、编写代码、图像识别、长文本理解、工具调用以及处理复杂多步骤项目等方 面,该模型的能力均有提升。 "这是一个非常智能的模型,自 GPT-5.1 以来,我们已经取得了长足的进步。"OpenAI的CEO Sam Altman在社交平台激动地表示。微软CEO Satya Nadella亲自祝贺,并表示"GPT-5.2已上线到Copilot",还引入到 Microsoft Foundry 和 Copilot Studio。 今日起,GPT-5.2 的即时版、思考版与专业版将在 ChatGPT 平台中启动推送,优先面向付费套餐用户开放。在编程接口端,上述版本现已向所 有开发者开放。GPT-5.1将作为旧版模型,继续向付费用户开放三个月,之 ...
28岁外来人“手撕”近 20 年元老?Meta全面内战:算力争夺、“开源”祭旗,每周工作70小时,亚历山大王真“压力山大”
AI前线· 2025-12-11 09:00
Core Insights - Meta is undergoing significant changes in its AI strategy, led by Alexandr Wang, who has been tasked with building a top-tier AI team to compete with rivals like OpenAI and Google [2][4] - Internal conflicts have emerged between the new AI team and long-standing Meta executives regarding priorities and development approaches [3][9] Group 1: Leadership and Team Dynamics - Alexandr Wang, a 28-year-old entrepreneur, has been appointed to lead Meta's new AI team, TBD Lab, which aims to attract top talent from competitors [2] - Tensions have surfaced between Wang and veteran executives, particularly regarding the focus on product optimization versus advancing AI model development [3][4] - Wang faces immense pressure to deliver a competitive AI model, especially after the disappointing launch of Llama 4, leading to a shift in focus towards a new model codenamed "Behemoth" [4][5] Group 2: Resource Allocation and Strategic Focus - Meta has committed to investing $600 billion in data centers to support AI operations, but there are disputes over how resources should be allocated between AI development and existing social media algorithms [6][8] - The new AI team believes that the focus should be on developing advanced AI capabilities rather than optimizing existing products, which has led to a divide in priorities within the company [7][8] Group 3: Development Methodologies - The introduction of modern AI development practices by Wang's team contrasts sharply with Meta's traditional multi-step development processes, which have been seen as slow and cumbersome [9][10] - There is a push for faster iteration and prototyping, with calls to reduce documentation in favor of rapid development cycles [10][11] Group 4: Strategic Shift in AI Models - Meta is reportedly moving towards a closed-source model for its upcoming AI project, codenamed "Avocado," marking a significant departure from its previous open-source strategy [12][13] - This shift reflects a broader trend in the industry, as Meta seeks to leverage proprietary technology to maintain competitiveness against rivals [12][14]
硅谷认证!Meta新模型暗含Qwen血统,周靖人带飞团队成阿里新晋合伙人
AI前线· 2025-12-11 07:28
作者 | 木子、高允毅 阿里巴巴的合伙人团队名单里,又增加了一个熟悉的名字。 阿里云 CTO、通义实验室负责人周靖人 正式成为 阿里巴巴合伙人 。 合伙人团队是阿里的最高集体决策机构,在今年 6 月大幅收缩后(从之前的 26 人降至上市以来最低 的 17 人),这个团队现在终于迎来了第一次增补。 这并不是一次简单人事变动,此决定发生在关键的技术换挡窗口:大模型从"能用"走向"要落地",云 厂商从"拼算力"转向"拼体系化 AI"。 据晚点消息,周靖人之所以成为阿里合伙人今年的首位新增成员,是因为他负责的 通义实验室 过去 一年努力 保证了 千问(Qwen)的模型领先地位 ,阿里管理层高度对此成绩给出高度评价。 下面来具体说说, 阿里为什么在此刻要把技术人推向最高决策层? 十年,从首席科学家到合伙人 2025 年,阿里巴巴将 AI 战略 从"技术叙事"升级为"生死线" 。 今年 2 月,阿里集团官宣, 未来三年将投入至少 3800 亿元,用于云计算与 AI 基础设施建设 ,该 金额 超过公司过去十年在相关领域的投入总和,为 C 端业务落地奠定基础 。 马云亲自督战,开始频繁点名周靖人,要求他持续汇报 Qwen3 ...
OpenAI 盲测新模型不如 Nano Banana Pro?曝 Altman 要暂停 Sora,死磕 ChatGPT
AI前线· 2025-12-11 07:28
作者 | 褚杏娟 近日,有网友发现 Notion 可能正在内部测试 GPT-5.2,代号为"olive-oil-cake"。此前,有网友表示 GPT-5.2 最新发布日期是当地时间周四。 此外,x 上还曝出,OpenAI 已悄悄已在 Design Arena 与 LM Arena 平台开启盲测新的图像生成模 型,新模型名称:"Chestnut"和"Hazelnut",结果接近 Nano Banana Pro。 根据网友的说法,新模型具有与 Nano Banana Pro 类似的全球知识、可以生成与 Nano Banana Pro 质量非常相似的名人自拍照,并且能够很好地在图像中编写代码。 不过,上面流出来的生成图并没有获得网友的好评。"在我看来,图像质量仍然不如 Nano Banana Pro。它们看起来塑料感很强。我希望它不是基于 4o 版本,但它比 GPT Image 1 好多了。"有网友 称。 爆料博主也认为它仍然基于 4o 版本。"不过,相比 GPT-Image-1,这仍然是一个巨大的飞跃。我同 意它目前还达不到 Nano Banana Pro 的水平。但我们需要等待正式版发布才能了解所有设置和功 能 ...
“人人都是程序员”的梦该醒了!AI 编程“大逃杀”:Cursor 或成创业公司唯一“幸存者”,“60 分开发者”撑起最后防线
AI前线· 2025-12-10 08:27
编辑 | Tina 本文为《2025 年度盘点与趋势洞察》系列内容之一,由 InfoQ 技术编辑组策划。本系列覆盖大模型、Agent、具身智能、AI Native 开发范式、AI 工具链与 开发、AI+ 传统行业等方向,通过长期跟踪、与业内专家深度访谈等方式,对重点领域进行关键技术进展、核心事件和产业趋势的洞察盘点。 本系列力求以体系化视角帮助读者理解年度技术演化的底层逻辑、创新方向与落地价值,并为新一年决策提供参考。内容将在 InfoQ 媒体矩阵陆续放出,欢 迎大家持续关注。 "氛围编程"可以说是今年最热最出圈的话题了。然而,从"用 LLM 快速拼装应用"爆红,到现在也不过才六个月,就明显开始"退潮"了。 最直观的体现,是全线产品的用户流量出现大幅下滑。 降幅最大的当属 Lovable,其流量在近几个月内从 3500 万掉到不足 2000 万,几乎砍半。其它几个明星产品也没好到哪里去,Bolt.new 下降了 27%, 而 Vercel v0 自 5 月以来下降了 64%,Cursor、Replit、Devin 等平台也未能独善其身,唯一例外的是仍在依靠投放驱动的 Base44。 连 Bolt.new 的 ...
模力工场 023 周 AI 应用榜:从旅行生活到 AI 基建,“Agent 时代拼图”再添新砖
AI前线· 2025-12-10 05:18
模力工场 新鲜事 模力工场新联展活动来啦!当 AI 普及率突破 35%,每 3 个中国人中就有 1 人使用生成式智 能,我们正共同站在一场技术驱动的变革起点。 2025 年 12 月 28 日,"AI 闪耀中国·吴晓波科技人文秀"将在厦门举办。作为年度 AI 生态的重要发布 场合,活动将系统揭晓本年度"AI 应用生态调研"成果,并聚集行业决策者、技术专家与优秀产品团 队,共同探讨 AI 落地与商业前景。 本次联合展台仅设 6 席 ,席位有限,采纳即止。如您希望与行业关键资源方建立连接,并推动产品 在优质场景中曝光,欢迎扫码联系运营,立即加入共创。 12 月 6 日,由模力工场与 TGO 鲲鹏会联合举办的 "Vibe Coding Sprint · AI 编程闪电黑客 松" 在阿里巴巴西溪园区激情开跑! 模力工场携手 TGO 鲲鹏会,发出了一份属于新一代 builder 的现场邀约:用 AI 写代码,用代码写公 司。活动以 3 小时极限 Vibe Coding 为核心,鼓励每位参与者围绕现场发布主题,打磨一个 Demo,在真实场景中跑通一条 AI 工作流链路。 这场高强度的编程冲刺,不仅是一次技术能力的试炼,更 ...
OpenAI、Anthropic、谷歌罕见同框:Agentic Al基金会成立,打响智能体开源标准战!
AI前线· 2025-12-10 05:18
Core Viewpoint - The Linux Foundation has launched the Agentic AI Foundation (AAIF) to serve as a neutral custodian platform for open-source projects related to AI agents, with major tech companies as members, including Anthropic, OpenAI, and Block [2][3]. Group 1: Foundation and Members - AAIF aims to establish open standards for AI agents, with initial contributions from Anthropic, Block, and OpenAI focusing on three key open-source projects [3][4]. - The foundation's member list includes major companies like Amazon Web Services, Google, Microsoft, and IBM, all collaborating to create interoperability standards for AI agents [2][3]. Group 2: Key Projects and Standards - The three main projects are the Model Context Protocol (MCP) by Anthropic, the Goose project by Block, and the AGENTS.md specification by OpenAI, which will standardize interactions between AI agents and external tools [3][4]. - MCP is described as the "USB-C interface" for AI, allowing developers to connect AI agents to various data sources without custom integration [4][5]. Group 3: Industry Adoption and Impact - A report by UiPath indicates that by mid-2025, approximately 65% of organizations will have initiated pilot or deployment of AI agent systems, with nearly 90% of executives planning to increase investments in 2026 [8]. - Multi-agent systems can significantly enhance business performance, reducing error rates by up to 60% and improving execution efficiency by 40% compared to traditional processes [8]. Group 4: Challenges and Future Outlook - The lack of industry consensus on standards could lead to fragmentation, making it difficult for systems to interoperate, similar to the early internet [9][10]. - The AAIF's mission is to prevent this fragmentation by managing key protocols and frameworks, ensuring that AI agents operate on open and interoperable standards [9][10]. Group 5: Governance and Community Involvement - The funding for AAIF comes from a "directed fund," where companies can contribute through membership fees, but control over project direction is maintained by a technical steering committee [6][12]. - The success of AAIF will depend on the adoption of its standards by global vendors and the continuous evolution of these standards based on industry feedback [12].
为什么你的 Agent 总是出故障?从算力基建到可信熔断的架构生死线 | 直播预告
AI前线· 2025-12-09 06:26
直播时间 12 月 10 日 20:00-21:30 直播主题 从 Chatbot 到 Action Agent,企业级落地最怕什么?是长程推理的显存天价成本,还是业务逻辑的"死循环"风险?如何利用 MCP 协议解决接口调用 的"信任危机"?本次直播集结值得买、商汤、明略三位技术专家拆解可信 Agent 的构建之道。 直播介绍 鲁琲 商汤科技大装置事业群 高级技术总监 王云峰 值得买科技 CTO 吴昊宇 明略科技 高级技术总监 企业 Agent 如何"可信"? 直播嘉宾 主持人: 马可薇 RBC senior application support analyst 嘉宾: 直播亮点 大模型基础设施: 攻克 KV Cache 显存危机,异构集群如何承载 Agent 长程推理? 可信 Agent 架构: 知识图谱 vs Long Context 记忆之争,设计防止死循环的业务"熔断按钮"。 MCP 协议实战: 解决接口调用"幻觉"与"误解",实现 Agent 从对话到行动的精准对齐 如何看直播? 扫描下图海报 【二维码】 或点击下方直播预约按钮,预约 AI 前线视频号直播。 可信 Agent 架构:知识图谱 vs ...
搅局者来了!智谱重磅开源AutoGLM,让“豆包手机”人人可造!官方:AI手机不该掌握在少数厂商手中
AI前线· 2025-12-09 06:26
作者 | 木子、高允毅 2023 年 4 月,在很多人刚听说"大模型"这个词的时候, 智谱团队 开始研究一个听上去不太现实的目标: 让 AI 真正学会"使用手机" ,也就是像真人一样,对智能手机等设备具有使用能力。 32 个月后,智谱把阶段性 重要成果、核心 AI Agent 模型:AutoGLM 给 完整开源 了出来,并放话:"每台手机,都可以成为 AI 手机。" 目前,AutoGLM 已支持上百个主流 APP,包括以下这些: 另外,AutoGLM 还能同时在上千台云端虚拟手机里"练功",通过强化学习等极大地扩展了 Agent 的准确性和泛化能力。而且它被严格关在虚拟设备的安 全沙箱里,既能自由试错,又不会碰到用户真实手机上的隐私数据。 智谱今天开源的是一整套可以"拿来就用"的能力,具体包括: 模型会以 MIT 开源许可证 的形式开放,而所有代码会以 Apache-2.0 开源许可证 的形式,托管在 GitHub 仓库中:github.com/zai-org/Open- AutoGLM。 为什么选择开源? "从产品的角度,AutoGLM 已经可以支撑起很多真实场景;从工程的角度,AutoGLM 的积累足够写 ...
Scaling Law 仍然成立,企业搜广推怎么做才能少踩“坑”?
AI前线· 2025-12-09 06:26
作者 | AICon 全球人工智能开发与应用大会 策划 | 罗燕珊 编辑 | 宇琪 当大模型从通用技术探索深入产业场景,搜索、广告与推荐系统作为连接用户需求与业务价值的 核心链路,正迎来全链路智能重构。那么,生成式推荐真正落地后的关键挑战是什么?又应该如 何解决? 近日 InfoQ《极客有约》X AICon 直播栏目特别邀请了 京东内容推荐架构负责人颜林 担任主持 人,和 荣耀 AI 算法专家冯晓东、京东算法总监张泽华、中科大计算机学院副教授王皓 一 起,在 AICon 全球人工智能开发与应用大会 2025 北京站 即将召开之际,共同探讨生成式推 荐的落地洞察。 部分精彩观点如下: 完整直播回放可查看: https://www.infoq.cn/video/0ViWrdqyQwNvO7TdQpyD 以下内容基于直播速记整理,经 InfoQ 删减。 行业真正做到端到端的统一 pipeline 仍有较大差距,更多工作还是在 pipeline 的单点与大模型 结合。 搜广推场景中的 scaling law 依然成立,并且仍在快速上升阶段。 低价值场景用小模型覆盖,高价值场景用大模型争取额外收益。 不应拘泥于某项技术 ...