Workflow
Scaling Law
icon
Search documents
刚刚,唐杰、杨强、杨植麟、林俊旸和刚回国的姚顺雨坐一起都聊了啥?
机器之心· 2026-01-10 13:21
机器之心编辑部 2026 年 AI 的进化,势必会超过我们的想象。 1 月 10 日下午,在由清华大学基础模型北京市重点实验室、智谱 AI 发起的 AGI-Next 前沿峰会上,汇聚了刚刚上市两天的智谱、领跑独角兽月之暗面、全球开源 大模型顶流 Qwen 的创始人、CEO 和负责人。 智谱 AI 的唐杰、月之暗面的杨植麟、阿里云通义千问的林俊旸等正处于聚光灯下的中国大模型掌舵者,以及张钹院士、杨强等学界泰斗罕见地同台亮相。 刚刚履新腾讯 AI 首席科学家、曾以「思维树」(Tree of Thoughts)和《 AI 下半场 》闻名的姚顺雨,也在此迎来了回国后的对外首秀。 本周国内 AI 创业公司接连上市,DeepSeek 又刚刚曝出即将发布全新一代大模型,人工智能的热度还在持续升温,但另一方面,AI 技术似乎来到了一个临界点: 一边是大规模预训练 (Pre-training)、强化学习对齐(Alignment/RLHF)等范式带来的爆发期即将结束,另一方面,新的提升范式似乎还未启动。 如果说 2025 年的大模型技术以一种近乎「暴力美学」的方式撕开了 AGI 大门的一角,那么 2026 年开年这场峰会,就像是 ...
前谷歌研究员发文:算力崇拜时代该结束了
机器之心· 2026-01-10 07:00
Core Viewpoint - The article discusses the potential end of the scaling era in AI, emphasizing that merely increasing computational power may not yield proportional improvements in model performance, and highlights the rise of smaller models outperforming larger ones [1][5][7]. Group 1: Trends in AI Development - The belief that scaling computational resources leads to better model performance is being challenged, as evidence shows that larger models do not always outperform smaller ones [8][14]. - The past decade has seen a dramatic increase in model parameters, from 23 million in Inception to 235 billion in Qwen3-235B, but the relationship between parameter count and generalization ability remains unclear [14]. - There is a growing trend of smaller models surpassing larger models in performance, indicating a shift in the relationship between model size and effectiveness [8][10]. Group 2: Efficiency and Learning - Increasing model size is becoming a costly method for learning rare features, as deep neural networks are inefficient in learning from low-frequency data [15]. - High-quality data can reduce the dependency on computational resources, suggesting that improving training datasets can compensate for smaller model sizes [16]. - Recent advancements in algorithms have allowed for significant performance improvements without the need for extensive computational resources, indicating a shift in focus from sheer size to optimization techniques [17][18]. Group 3: Limitations of Scaling Laws - Scaling laws, which attempt to predict model performance based on computational power, have shown limitations, particularly when applied to real-world tasks [20][21]. - The reliability of scaling laws varies across different domains, with some areas showing stable relationships while others remain unpredictable [21][22]. - Over-reliance on scaling laws may lead companies to underestimate the value of alternative innovative approaches in AI development [22]. Group 4: Future Directions - The future of AI innovation may not solely depend on scaling but rather on fundamentally reshaping optimization strategies and exploring new architectures [24]. - There is a noticeable shift towards enhancing performance during the inference phase rather than just during training, indicating a new approach to AI development [25]. - The focus is moving from creating stronger models to developing systems that interact more effectively with the world, highlighting the importance of user experience and system design [27][28].
中国模型差距美国7个月
是说芯语· 2026-01-10 06:45
研究机构Epoch AI一项最新的报告显示,中国AI模型平均落后美国7 个月。最小差距4个月,最大差距14个月。 图表纵轴ECI是该机构开发的一项衡量指标,综合考虑了模型在数 学推理、代码编写、语言理解等多个领域的表现,整合了全球数十 个主流AI基准测试表现后得出的数值。数值越高,代表模型综合能 力越强。 型,而中国的DeepSeek系列、Qwen系列都选择不同程度开放权重。 从图表可以看出,从2024年开始,中国大模型的追赶步伐显著提 速,从2023年的12-14个月的差距收敛至约6-8个月。其中DeepSeek- V2和DeepSeek-R1的发布都形成了阶跃式的追赶。但美国的AI进程 没有丝毫放松,仍然在引领最前沿的模型进展。 不可忽视的是,这7个月的差距背后,是全球算力版图的失衡。 Epoch AI 2025年5月的数据指出,美国控制着全球约75%的顶级 GPU集群性能,而位居第二的中国占比为15%。 同时,中美大模型的激烈竞争,也几乎是开闭源模型之间的竞争。 美国目前最前沿的模型,GPT-5、Gemini 3、Claude 4都是闭源模 可以说,目前的竞争格局是,美国的闭源模型仍然在持续定义高 度, ...
在锦秋,训练你的人生模型 | 加入锦秋第②弹
锦秋集· 2026-01-09 09:12
这是一条非典型招聘帖,也是「加入锦秋系列第 ②弹」。 锦秋是谁? 请参考「加入锦秋第①弹」: 《 Choose Your Own Adventure |加入锦秋》 在分享岗位信息之前,我们更想分享一些,如何在 AI 时代的职场里升级打怪的 " 心里话 " : 以前,大厂实习生靠熬夜整理资料、年轻人靠写精美PPT就能换取通往未来的入场券。但在 AGI 已经能秒级生成行业分析、自动化处理繁杂事务的今 天,那种"劳动力式"的勤奋几乎不可能胜过Agent。 作为 AI 领域的投资人,我们每天看着算力与数据在 Scaling Law 的铁律下,野蛮地撕碎旧世界的逻辑。 我自己 也在思考:当平庸的努力被 AGI 彻底抹平,一个"人"的价值斜率,该如何跑赢算力的指数曲线? 答案只有一个:个人的成长,也必须遵循 Scaling Law。 这不是一份普通的实工作邀请。 如果你敢像经营一家 Startup 一样经营自己,我们将赌注压在你的身上,助你实现 100% 的认知涌现。 暴力 Scaling:每周 5% 的认知复利 Paul Graham 讲过一个观点:Startup = Growth。 在锦秋,训练你自己的人生大模型 如 ...
千里智驾、吉利发布全新辅助驾驶品牌 G-ASD
Jing Ji Guan Cha Wang· 2026-01-06 07:48
在技术架构上,G-ASD采用端到端模型体系,融合多模态基座模型、视觉语言模型(VLM)、视觉语言动 作模型(VLA)、世界模型及强化学习等前沿AI技术,推动从数据系统、感知规控到评测体系的全局模型 化,逐步降低对高精地图与规则工程的依赖。 经济观察网1月6日,在2026年美国消费电子展(CES2026)上,千里智驾与吉利共同宣布,面向全球市场 发布全新辅助驾驶品牌G-ASD(Geely Afari Smart Driving,中文名"千里浩瀚")。其中,"G"代表吉 利,"ASD"代表千里智驾。G-ASD为双方联合研发的高含模量智能辅助驾驶解决方案,能力覆盖L2至 L4级别。 千里智驾方面表示,随着大模型成为智能驾驶技术演进的核心驱动力,Scaling Law在智驾领域的作用 日益显现。千里智驾提出以"含模量"作为衡量智驾系统智能化水平的重要指标,即系统中模型化覆盖的 广度与深度。含模量越高,AI模型在系统中的占比越大,智能能力上限也随之提升。 ...
国信证券:26年推理侧需求有望爆发 办公场景有望迎来更多AI产品落地
智通财经网· 2026-01-06 01:43
智通财经APP获悉,国信证券发布研报称,26年推理侧需求有望爆发,一级市场方面,编程场景、 Agent爆发为主要应用方向。从用户量和创业公司的收入估值水平来看,当前规模增长较快的行业以AI 编程、AI Agent、AI内容创作为主,聚焦生产力提升,今年以来诞生了多个爆款应用,明年办公场景有 望迎来更多产品落地。此外,该行认为随着模型能力的成熟,明年在端侧的AI手机、AI眼镜,以及协 助大模型在企业落地的分销商这些领域将看到明显的增长。 国信证券主要观点如下: 25年tokens消耗更多用于大模型企业内部以及推荐系统的重构,但26年开始预计下游应用的需求将持续 增加,AI实际上打开了软件需求的天花板,据IDC数据,预计2029年全球SaaS市场将达到近1万亿美元 规模(对比25年5800亿美元有明显增长),但该行认为其中玩家将重新洗牌。拥有数据壁垒,主要在垂类 细分场景中布局,软件定义工作流程较复杂,或对准确度要求极高的行业,被大模型替代的风险较小, 复盘美股科技巨头过去三年股价走势,AI叙事不断递进 23年OpenAI领先全球开启AI加速度,微软受益于OpenAI独家合作,估值抬升明显。24年市场低估模型 进 ...
国信证券晨会纪要-20260106
Guoxin Securities· 2026-01-06 01:21
证券研究报告 | 2026年01月06日 | 晨会纪要 | | --- | | 数据日期:2026-01-05 | 上证综指 | 深证成指沪深 | 300 指数 | 中小板综指 | 创业板综指 | 科创 50 | | --- | --- | --- | --- | --- | --- | --- | | 收盘指数(点) | 4023.41 | 13828.62 | 4717.74 | 14798.40 | 4017.28 | 1403.41 | | 涨跌幅度(%) | 1.37 | 2.24 | 1.89 | 1.73 | 2.70 | 4.40 | | 成交金额(亿元) | 10673.34 | 14789.37 | 6305.77 | 5236.93 | 6962.18 | 811.87 | $$\overline{{{\mathbb{M}}}}\cong\pm\overline{{{\mathbb{M}}}}$$ (4) [ (4) 384938 1 宏观与策略 固定收益专题研究:2025 年债券行情回顾-收益率总体企稳回升,信用利 差被动收窄 固 定 收 益 快 评 : 可 交 换 私 募 债 跟 踪 ...
赵何娟对话王晓刚:什么将是机器人的ChatGPT时刻|2025 T-EDGE全球对话
Tai Mei Ti A P P· 2026-01-05 18:12
2025年,具身智能行业的发展继续以"烈火烹油"的态势,向前发展。 前9个月,全球(特别是受中国市场驱动)在人形机器人领域的投资交易额达到约70亿美元(约合500亿 人民币)。这一数字相比去年同期增长了250%,太多人期待着机器人的"星辰大海"。 但在产品上来看,几乎所有的人形机器人都还停留在跳舞拳击、走路摔跤的状态,技术发展仍困在迷雾 之中。 2025年12月8日至21日(北京时间),钛媒体集团携手NextFin.AI、巴伦中国举办的2025 T-EDGE 全球 对话正式开启,以连续7日全球连线+贯穿2周N场闭门私享会的方式联动上海、深圳、硅谷、香港、新 加坡、日本、迪拜等全球化创新高地,汇集前沿创新思想,打造全球分布式创新盛会,展开一场【AI 时代的全球对话 Global Conversations for the AI Era】。 会上,「赵何娟 Talk」与商汤科技联合创始人、执行董事、大晓机器人董事长王晓刚,就"具身智能新 的ACE研究范式"展开了深度对话。 "靠读文章、看图片,机器人永远不可能理解真实的物理世界。" 王晓刚表示,AI的研究范式,要从以机器为中心转变成以人为中心,通过采集人类的真实行 ...
AI叙事不断递进,阿里巴巴、中际旭创双双涨超2%!云计算ETF汇添富(159273)大涨超3%!机构:2026拥抱“AI+”投资主线!
Sou Hu Cai Jing· 2026-01-05 09:46
今日(1.5),沪指加速上涨超1%重返4000点,算力板块再度强势,云计算ETF汇添富(159273)大幅收涨超3%,全天成交额超3000万元,环比放量33%。 云计算ETF汇添富(159273)标的指数权重股多数收红:金山办公涨超6%,中际旭创、阿里巴巴-W、中科曙光涨超2%,浪潮信息、恒生电子涨近2%,腾 讯控股微涨。 | 序号 | 代码 | 名称 | 估算权重 ▼ | 涨跌幅 | 历了不容负 | | --- | --- | --- | --- | --- | --- | | 1 | 300308 | 中标准创 | 11.14% | 2.21% | 186.59亿 | | 2 | 300502 | 新易感 | 11.02% | -0.99% | 153.60亿 | | 3 | 0700 | 腾讯控股 | 10.09% | 0.24% | 124.50亿 | | 4 | 9988 | 阿里巴巴-W | 9.52% | 2.55% | 156.82亿 | | ਦ | 603019 | 中科脂光 | 6.88% | 2.52% | 52.34Z | | 6 | 688111 | 金山办公 | 3.97% | 6 ...
2026年,AI将从炒作走向务实
Xin Lang Cai Jing· 2026-01-05 03:29
Core Insights - 2026 is anticipated to be a pivotal year for AI, transitioning from large-scale model development to practical applications that integrate AI into real-world workflows [2][34] - The focus is shifting towards deploying lightweight models and embedding intelligence into physical devices, moving away from mere demonstrations to targeted deployments [2][34] Group 1: Scaling Law and Model Development - The AI industry is nearing the limits of the Scaling Law, prompting a shift towards new architectural research and smaller, more efficient models [4][21] - Experts suggest that smaller language models (SLMs) will become the standard in AI applications by 2026 due to their cost-effectiveness and performance advantages [5][22] - The trend towards SLMs is supported by advancements in edge computing, making them more suitable for deployment on local devices [6][22] Group 2: World Models and Gaming Industry - 2026 is expected to be a key year for world models, which learn how objects interact in three-dimensional space, enhancing predictive capabilities [8][25] - The gaming industry is projected to see significant growth in the world model market, with estimates rising from $1.2 billion in 2022 to $27.6 billion by 2030 [9][25] Group 3: Agent Integration and Practical Applications - The introduction of the Model Context Protocol (MCP) is seen as a critical advancement, enabling AI agents to interact with external tools and databases, thus facilitating their integration into real-world systems [11][27] - As MCP reduces friction in connecting AI agents to practical systems, 2026 may mark the year when these agents transition from demonstration to everyday use [12][28] Group 4: Human-AI Collaboration - There is a growing belief that AI will enhance human workflows rather than replace them, with expectations of new job roles emerging in AI governance and data management [14][31] - The narrative is shifting towards how AI can assist human tasks, with predictions of a low unemployment rate as companies begin to hire for new roles related to AI [14][31] Group 5: Physical AI and Market Trends - Advances in small models, world models, and edge computing are expected to drive the adoption of physical AI applications, including robotics and wearable devices [16][34] - The market for physical AI is anticipated to grow, with wearable devices becoming a cost-effective entry point for consumers [17][34]