Workflow
Scaling Law
icon
Search documents
唐杰、姚顺雨、杨植麟、林俊旸同台对话背后:5个2026年最重要的AI趋势观察
Xin Lang Cai Jing· 2026-01-11 06:47
智通财经记者 | 陆柯言 佘晓晨 智通财经编辑 | 文姝琪 1月10日,一场关于AI的顶级对话在北京中关村悄然上演。 这场对话由清华大学基础模型北京市重点实验室、智谱AI共同发起。最重要的是,它罕见地集结了中 国大模型领域最受关注的几位"顶流"人物。他们分别是: 唐杰:清华大学教授、智谱创始人,三天前刚刚带领智谱在港股敲钟,造就"中国基模第一股"。 姚顺雨:前OpenAI研究员,27岁的他现为腾讯CEO办公室首席科学家、 AI Infra 部及大语言模型部负责 人。这也是入职腾讯后的公开首秀。 林俊旸:阿里巴巴通义千问大模型负责人,阿里最年轻P10级技术专家,掌舵着全球开源生态中下载量 第一的阿里通义系列。 几位平均年龄不到35岁的年轻人,几乎握着中国AGI赛道上最贵的一批筹码。 如此规格的同台向来罕 见,不仅因为他们背后代表着大厂与创业公司的生态博弈,更因为在"Chat(对话)范式"已成存量的今 天,他们对下一代 AGI 路线图的任何一次押注,都可能决定未来十年的行业座次。 从大模型的下一个"奇点时刻",到对模型分化的观察;从AI Agent的未来,到中国AI的胜算,这场万字 交锋试图在现实算力与商业落地的 ...
对话鹿明机器人:在具身智能的“数据荒”里,做一个送水人|AI Founder 请回答
Tai Mei Ti A P P· 2026-01-11 04:52
图片来源:网络 在具身智能的激进演进中,行业正迅速撞上一面无形的墙:数据荒。 如果说 2025年是具身智能的"硬件元年",那么2026年则是彻底的"数据决战"。从OpenAI支持的模型演 进路径看,数据需求正呈指数级爆发。从 Pi0 的 1 万小时训练,到 Gen-0 的 27 万小时。业内普遍预 判,2026年头部具身大模型所需的真机训练数据将达到百万小时级别。 然而,现实是数据获取低效且昂贵 。传统的遥操作方式不仅每小时成本高达数百美金,且充斥着大量 无法复现、传感器不同步的"废数据" 。在 Scaling Law 的物理战场上,谁能率先规模化地开采出高纯度 的"物理石油",谁就拥有了定义下一代通用机器人标准的话语权 。 鹿明机器人(LUMOS)占据了一个独特的生态位,不做单纯的整机商,要做具身智能时代的"超级数据 工厂" 。这家成立仅一年的公司,不仅要做"卖水人",还要"定义水的标准"。 这份自信源于团队的硬核背景。创始人喻超毕业于清华大学,自2016年起从事机器人学习算法领域研 究,曾主导构建追觅科技具身机器人业务,并参与开发了小米CyberDog等多款消费级机器人产品。 CTO曹俊亮是上海交通大学机 ...
姚顺雨林俊旸杨植麟齐聚,锐评大模型创业与下一代技术范式
第一财经· 2026-01-10 14:21
2026.01. 10 本文字数:1458,阅读时长大约2分钟 因此,姚顺雨认为,自主学习这件事已经发生了,只是受效率等因素限制,还存在各种问题,他认为目前自主学 习的范式迭代更像是渐变,而非突变。 至于目前全球市场中哪一家企业最可能率先引领范式创新,姚顺雨表示,虽然OpenAI经历了商业化等各种变 化,创新基因被削弱,但仍是最有可能诞生新范式的地方。 林俊旸认为,目前的RL(强化学习)范式尚处早期,潜力远未被充分挖掘,全球范围内仍面临诸多共性挑战, 而下一代范式的核心在于"自主进化"与"主动性"。只是自主进化是否需要更新参数,见仁见智。 作者 | 第一财经 吕倩 当大模型陷入Scaling Law(缩放定律)的增长瓶颈,下一代技术范式将会是什么? 1月10日,在由清华大学基础模型北京市重点实验室、智谱AI发起的AGI-Next前沿峰会上,腾讯控股"CEO/总 裁办公室"首席AI科学家姚顺雨、阿里巴巴Qwen技术负责人林俊旸、Kimi创始人杨植麟、智谱创始人唐杰等人 工智能行业人士齐聚,共话大模型下一代技术范式。 对下一代范式的猜测中,自主学习(Autonomous Learning)是个热门概念,是大模型摆 ...
刚刚,唐杰、杨强、杨植麟、林俊旸和刚回国的姚顺雨坐一起都聊了啥?
机器之心· 2026-01-10 13:21
机器之心编辑部 2026 年 AI 的进化,势必会超过我们的想象。 1 月 10 日下午,在由清华大学基础模型北京市重点实验室、智谱 AI 发起的 AGI-Next 前沿峰会上,汇聚了刚刚上市两天的智谱、领跑独角兽月之暗面、全球开源 大模型顶流 Qwen 的创始人、CEO 和负责人。 智谱 AI 的唐杰、月之暗面的杨植麟、阿里云通义千问的林俊旸等正处于聚光灯下的中国大模型掌舵者,以及张钹院士、杨强等学界泰斗罕见地同台亮相。 刚刚履新腾讯 AI 首席科学家、曾以「思维树」(Tree of Thoughts)和《 AI 下半场 》闻名的姚顺雨,也在此迎来了回国后的对外首秀。 本周国内 AI 创业公司接连上市,DeepSeek 又刚刚曝出即将发布全新一代大模型,人工智能的热度还在持续升温,但另一方面,AI 技术似乎来到了一个临界点: 一边是大规模预训练 (Pre-training)、强化学习对齐(Alignment/RLHF)等范式带来的爆发期即将结束,另一方面,新的提升范式似乎还未启动。 如果说 2025 年的大模型技术以一种近乎「暴力美学」的方式撕开了 AGI 大门的一角,那么 2026 年开年这场峰会,就像是 ...
姚顺雨对着唐杰杨植麟林俊旸贴大脸开讲!基模四杰中关村论英雄
量子位· 2026-01-10 13:17
Jay 发自 凹非寺 量子位 | 公众号 QbitAI 清华攒了个局,把AI圈大半边天聚到了一块。 基模四杰全员到场: 智谱唐杰、Kimi杨植麟、阿里林俊旸, 还有…… 突然贴脸跳屏的姚顺雨。 这场由清华大学基础模型北京市重点实验室发起的 AGI-Next前沿峰会 ,相当硬核。 各位大咖的演讲简直像是在做技术报告,信息密度极高,而且用词相当犀利。 以下附上演讲原文,为提升可读性,量子位在不改变原意的前提下做了适当调整。 清华论剑 唐杰 我的题目是「让机器像人一样思考」。 唐杰:DeepSeek横空出世后,Chat已经基本结束了,下一步是走向做事。 杨植麟:做模型,本质上是在创造一种世界观。 林俊旸:中国想在AI赛道反超,很难。20%这个数字已经很乐观。 姚顺雨:toC的话,大部分人其实用不着那么强的智能。 2019年,我们在清华的支持下完成成果转化,成立了智谱。 同一时期,我们也持续推动开源,既有模型和工具层面的项目,也有面向开发者的大模型 API 体系。 我在清华待了将近二十年。 回头看,我做的事情其实很简单,主要就两件: 一是早年做AMiner;二是大模型。 有一个对我影响很深的观念,我称之为 「像喝咖啡 ...
前谷歌研究员发文:算力崇拜时代该结束了
机器之心· 2026-01-10 07:00
Core Viewpoint - The article discusses the potential end of the scaling era in AI, emphasizing that merely increasing computational power may not yield proportional improvements in model performance, and highlights the rise of smaller models outperforming larger ones [1][5][7]. Group 1: Trends in AI Development - The belief that scaling computational resources leads to better model performance is being challenged, as evidence shows that larger models do not always outperform smaller ones [8][14]. - The past decade has seen a dramatic increase in model parameters, from 23 million in Inception to 235 billion in Qwen3-235B, but the relationship between parameter count and generalization ability remains unclear [14]. - There is a growing trend of smaller models surpassing larger models in performance, indicating a shift in the relationship between model size and effectiveness [8][10]. Group 2: Efficiency and Learning - Increasing model size is becoming a costly method for learning rare features, as deep neural networks are inefficient in learning from low-frequency data [15]. - High-quality data can reduce the dependency on computational resources, suggesting that improving training datasets can compensate for smaller model sizes [16]. - Recent advancements in algorithms have allowed for significant performance improvements without the need for extensive computational resources, indicating a shift in focus from sheer size to optimization techniques [17][18]. Group 3: Limitations of Scaling Laws - Scaling laws, which attempt to predict model performance based on computational power, have shown limitations, particularly when applied to real-world tasks [20][21]. - The reliability of scaling laws varies across different domains, with some areas showing stable relationships while others remain unpredictable [21][22]. - Over-reliance on scaling laws may lead companies to underestimate the value of alternative innovative approaches in AI development [22]. Group 4: Future Directions - The future of AI innovation may not solely depend on scaling but rather on fundamentally reshaping optimization strategies and exploring new architectures [24]. - There is a noticeable shift towards enhancing performance during the inference phase rather than just during training, indicating a new approach to AI development [25]. - The focus is moving from creating stronger models to developing systems that interact more effectively with the world, highlighting the importance of user experience and system design [27][28].
中国模型差距美国7个月
是说芯语· 2026-01-10 06:45
研究机构Epoch AI一项最新的报告显示,中国AI模型平均落后美国7 个月。最小差距4个月,最大差距14个月。 图表纵轴ECI是该机构开发的一项衡量指标,综合考虑了模型在数 学推理、代码编写、语言理解等多个领域的表现,整合了全球数十 个主流AI基准测试表现后得出的数值。数值越高,代表模型综合能 力越强。 型,而中国的DeepSeek系列、Qwen系列都选择不同程度开放权重。 从图表可以看出,从2024年开始,中国大模型的追赶步伐显著提 速,从2023年的12-14个月的差距收敛至约6-8个月。其中DeepSeek- V2和DeepSeek-R1的发布都形成了阶跃式的追赶。但美国的AI进程 没有丝毫放松,仍然在引领最前沿的模型进展。 不可忽视的是,这7个月的差距背后,是全球算力版图的失衡。 Epoch AI 2025年5月的数据指出,美国控制着全球约75%的顶级 GPU集群性能,而位居第二的中国占比为15%。 同时,中美大模型的激烈竞争,也几乎是开闭源模型之间的竞争。 美国目前最前沿的模型,GPT-5、Gemini 3、Claude 4都是闭源模 可以说,目前的竞争格局是,美国的闭源模型仍然在持续定义高 度, ...
在锦秋,训练你的人生模型 | 加入锦秋第②弹
锦秋集· 2026-01-09 09:12
这是一条非典型招聘帖,也是「加入锦秋系列第 ②弹」。 锦秋是谁? 请参考「加入锦秋第①弹」: 《 Choose Your Own Adventure |加入锦秋》 在分享岗位信息之前,我们更想分享一些,如何在 AI 时代的职场里升级打怪的 " 心里话 " : 以前,大厂实习生靠熬夜整理资料、年轻人靠写精美PPT就能换取通往未来的入场券。但在 AGI 已经能秒级生成行业分析、自动化处理繁杂事务的今 天,那种"劳动力式"的勤奋几乎不可能胜过Agent。 作为 AI 领域的投资人,我们每天看着算力与数据在 Scaling Law 的铁律下,野蛮地撕碎旧世界的逻辑。 我自己 也在思考:当平庸的努力被 AGI 彻底抹平,一个"人"的价值斜率,该如何跑赢算力的指数曲线? 答案只有一个:个人的成长,也必须遵循 Scaling Law。 这不是一份普通的实工作邀请。 如果你敢像经营一家 Startup 一样经营自己,我们将赌注压在你的身上,助你实现 100% 的认知涌现。 暴力 Scaling:每周 5% 的认知复利 Paul Graham 讲过一个观点:Startup = Growth。 在锦秋,训练你自己的人生大模型 如 ...
千里智驾、吉利发布全新辅助驾驶品牌 G-ASD
Jing Ji Guan Cha Wang· 2026-01-06 07:48
在技术架构上,G-ASD采用端到端模型体系,融合多模态基座模型、视觉语言模型(VLM)、视觉语言动 作模型(VLA)、世界模型及强化学习等前沿AI技术,推动从数据系统、感知规控到评测体系的全局模型 化,逐步降低对高精地图与规则工程的依赖。 经济观察网1月6日,在2026年美国消费电子展(CES2026)上,千里智驾与吉利共同宣布,面向全球市场 发布全新辅助驾驶品牌G-ASD(Geely Afari Smart Driving,中文名"千里浩瀚")。其中,"G"代表吉 利,"ASD"代表千里智驾。G-ASD为双方联合研发的高含模量智能辅助驾驶解决方案,能力覆盖L2至 L4级别。 千里智驾方面表示,随着大模型成为智能驾驶技术演进的核心驱动力,Scaling Law在智驾领域的作用 日益显现。千里智驾提出以"含模量"作为衡量智驾系统智能化水平的重要指标,即系统中模型化覆盖的 广度与深度。含模量越高,AI模型在系统中的占比越大,智能能力上限也随之提升。 ...
国信证券:26年推理侧需求有望爆发 办公场景有望迎来更多AI产品落地
智通财经网· 2026-01-06 01:43
智通财经APP获悉,国信证券发布研报称,26年推理侧需求有望爆发,一级市场方面,编程场景、 Agent爆发为主要应用方向。从用户量和创业公司的收入估值水平来看,当前规模增长较快的行业以AI 编程、AI Agent、AI内容创作为主,聚焦生产力提升,今年以来诞生了多个爆款应用,明年办公场景有 望迎来更多产品落地。此外,该行认为随着模型能力的成熟,明年在端侧的AI手机、AI眼镜,以及协 助大模型在企业落地的分销商这些领域将看到明显的增长。 国信证券主要观点如下: 25年tokens消耗更多用于大模型企业内部以及推荐系统的重构,但26年开始预计下游应用的需求将持续 增加,AI实际上打开了软件需求的天花板,据IDC数据,预计2029年全球SaaS市场将达到近1万亿美元 规模(对比25年5800亿美元有明显增长),但该行认为其中玩家将重新洗牌。拥有数据壁垒,主要在垂类 细分场景中布局,软件定义工作流程较复杂,或对准确度要求极高的行业,被大模型替代的风险较小, 复盘美股科技巨头过去三年股价走势,AI叙事不断递进 23年OpenAI领先全球开启AI加速度,微软受益于OpenAI独家合作,估值抬升明显。24年市场低估模型 进 ...