Workflow
世界模型
icon
Search documents
AI小登的尽头,是卖身老登?
Sou Hu Cai Jing· 2026-01-13 03:23
文|明晰野望 最近AI巨头都在释放钞能力。 英伟达以200亿美元和核心团队加盟的模式"收编"AI推理新贵Groq;谷歌豪掷47.5亿美元现金拿下清洁能源巨头Intersect Power,锁定AI数据中心的能源主 权;Meta以45亿美元重金将通用AI智能体Manus纳入版图,打通大模型到落地应用的关键链路。 闪电式的高估值交易密集出现,背后是巨头"老登"与初创公司"小登"的无奈之举——前者需要通过技术路径差异化、场景补齐来提升容错,而势单力薄的后 者,则要把先发优势尽快货币化。或许在2026年,"老登"与"小登"的双向奔赴将成为AI行业主旋律。 "老登"难,"小登"更难 面对行业的疯狂内卷,当今AI的牌桌上已无人轻松,即便是手握千亿美金、掀起全球AI竞赛的OpenAI,也深陷"烧钱黑洞"。根据OpenAI截至2025年7月的统 计,ChatGPT约有3500万的付费用户,这个数字仅占周活跃用户的5%。 行业标杆尚且在商业化的钢丝上摇摇欲坠,散落在牌桌各处的中小AI公司面临的压力更是成倍增长。 "老登"怕"小登"弯道超车、"小登"怕看不见黎明。左右为难之间,双方心照不宣地走到了一起。 另一方面,依靠技术创新起 ...
2025,AI行业发生了什么?
经济观察报· 2026-01-12 11:48
2025年的帷幕已经落下,这一年中,AI行业无疑走过了极具里程碑意义的一程。从技术范式的革 新,到商业逻辑的重构,从产业应用的落地,到全球规则的博弈,这一年既有突破,也留下诸多思 考。 以下文章来源于经济观察报观察家 ,作者经观观察家 经济观察报观察家 . 理性,建设性 AI已经进入"下半场"。技术边界不再只是把模型做得更大、更 久,而是重新定义问题、重塑评估方式、判断未来路径。越来 越多的企业意识到,AI的核心从"解决问题"转向"提出什么问 题、如何衡量进步",而这种能力往往出现在长期浸泡在一线 研究中的年轻技术派身上。 作者:陈永伟 封图:图虫创意 鉴于AI发展错综复杂,这里只能从十个侧面做一个简要回顾。 在设计原生多模态模型的过程中,很多人逐渐意识到:多模态模型的真正瓶颈,并不在于它能不能 看图、听声音,而在于能否把视觉、语言、时间与空间组织成一个可推理、可行动的统一表征。现 在的大模型在语言上已经高度成熟,却依然缺乏对三维空间、物理约束和因果关系的系统理解。因 此,下一代AI的突破重点,可能并不在于再多几个参数,而在于能否构建对真实世界的内部模型, 使其可以在脑中"预演"行动后果。在这种思路之下,"世 ...
从“地大华魔”掉队,卓驭科技在智驾平权浪潮下另觅出路
第一财经网· 2026-01-12 10:24
新的竞争格局正在被重塑。 在国内智能驾驶供应商中,"地大华魔"的说法流传甚广。但随着智驾平权的下探与成本竞争的加剧,这 四家供应商的发展规模逐渐呈现出两极分化的态势。 近日,佐思汽研公布的最新数据显示,2025年1~10月,在中国乘用车城市NOA第三方供应商中, Momenta和华为HI的市场份额合计占比超过八成,其他供应商仅能分到19.2%的市场,这其中就包括卓 驭科技(原大疆车载)。 在"地大华魔"的传统一梯队里,Momenta、华为已在智驾方案市场中占据先机,地平线则凭借其智驾芯 片能力正在快速扩张软件市场版图。而卓驭科技原本以低成本优势脱颖而出,早在2024年,该公司就已 明确要将城市领航功能下放到15万元甚至价格更低的车型,并已将自研的高快领航智驾解决方案搭载在 宝骏悦也这类10万元级别的车型上。但该公司未能乘胜追击、扩大优势,逐渐出现了明显的掉队迹象。 到了2025年,卓驭科技的主要搭载量仍然来自大众的燃油车型,城市NOA主攻纯视觉方案,多搭载在 经济型品牌上,如捷途、宝骏。 从行业层面来看,中国智驾领域的竞争还在不断加剧。交通运输部近期数据显示,当前中国智能驾驶乘 用车渗透率已超68%,以VLA ...
端到端VLA剩下的论文窗口期没多久了......
自动驾驶之心· 2026-01-12 09:20
提供的服务 点击下方 卡片 ,关注" 自动驾驶之心 "公众号 戳我-> 领取 自动驾驶近30个 方向 学习 路线 元旦后,收到不少同学的咨询,很多都是计算机、车辆、自动化和机械方向的同学。很多都想赚端到端、 VLA、世界模型这些前沿的方向。但就目前来看,这些赛道剩下的窗口期没多久了,要被大厂和头部高校卷 爆...... 很多研一和大四的同学往往无从下手,刚开始深度学习都还不懂,更别说跟进前沿的方向了。是传统动力学 还是深度学习?哪些还有发论文的需求?需要什么样的学习路线? 对于从事自动化和计算机的同学,建议搞深度学习,VLA、端到端、世界模型都是很好的方向,从入门、到 工作甚至读博都有很大空间。对于机械和车辆的同学,可以先学习传统PnC、3DGS这些方向。算力低、入手 简单。 剩下的就是一些方法论的提升了,多看论文多交流,慢慢形成自己的思考和idea。 对很多新人研究者,一个 好的idea需要踩很多次坑。如果你还是新人,不知道怎么入门,可以看看我们推出的论文辅导。 论文辅导上线了! 端到端、VLA、世界模型、强化学习、3D目标检测、多传感器融合、3DGS、BEV感知、Occupancy Network、多任务 ...
博世一篇最新的端到端世界模型工作:统一理解、规划和生成
自动驾驶之心· 2026-01-12 03:15
点击下方 卡片 ,关注" 自动驾驶之心 "公众号 戳我-> 领取 自动驾驶近30个 方向 学习 路线 >>自动驾驶前沿信息获取 → 自动驾驶之心知识星球 论文作者 | Zhexiao Xiong等 编辑 | 自动驾驶之心 博世北美研究院与博世人工智能中心最新的工作,Liu Ren参与。 提出 UniDrive-WM—— 一种基于视觉 - 语言模型(VLM)的统一世界模型 ,在单一架构中联合实现驾驶场景理解、轨迹规划与轨迹条件下的未来图像生成,解决 了传统方法中感知、预测、规划模块分离导致的信息瓶颈问题,显著提升自动驾驶的规划准确性与安全性。 在ORION上进一步改进 ,L2 轨迹误差降低 5.9%,碰撞率降低 9.2%;闭环驾驶分数(DS=79.22)、成功率(SR=56.36%),整体效果还可以。 世界模型已成为自动驾驶领域的核心,其中精准的场景理解与未来预测对于安全控制至关重要。近年来的研究已探索将视觉-语言模型(VLMs)用于规划任务,但 现有方法通常将感知、预测和规划视为独立模块。UniDrive-WM 的轨迹规划器会预测未来轨迹,该轨迹为基于视觉-语言模型的图像生成器提供条件,以生成合理 的未来帧。 ...
高德扫街榜重磅升级:全球首推飞行实景探店
Xin Lang Cai Jing· 2026-01-11 17:16
高德还宣布免费为100万烟火小店接入飞行街景,高德CEO郭宁表示:"高德扫街榜通过与物理世界持续交互,不断实现自我进化,将更好地呈现10亿用户的 真实选择,持续应用最前沿的科技服务最真实的人间烟火。" "飞行街景"是首次将世界模型用于普惠生活服务行业,在全球范围内开了先河。目前,高德自研世界模型在国际权威评测基准WorldScore上综合得分位列第 一,得到全球顶级AI学术界认可,相关论文被ICLR 2025、NeurIPS 2025等人工智能顶会收录。 文/图 顾立 1月7日,上线100天的高德扫街榜宣布三大重磅升级:依托世界模型发布全球首个"飞行街景",实现从街景一路俯瞰至店内实景;推出全球首个应季、应 时、应地的生活服务动态榜单;引入好友关系,新增好友动态和个人榜单功能。经过100天的发展,高德扫街榜已经从全国最大的美食榜单扩展至"吃喝玩 乐"全场景,成为本地生活的超级入口。 真实榜单带来真实增长。当前高德扫街榜用户规模已经突破6.6亿,根据QuestMobile的最新数据,在扫街榜带动下,高德APP单月新增4600万月活用户,月 活用户数增至9.96亿。高德扫街榜上线100天来,累计吸引86万新商家入 ...
颠覆测绘界!游戏极客改写地图史,谷歌阿里把地图变数字孪生
Sou Hu Cai Jing· 2026-01-11 14:55
大家好,我是小圆!如今我们打开手机地图,早已超越了单纯的"找路"。你会用它查看前方道路是否堵 得发紫,估算接孩子放学的精准时间,甚至搜寻深夜食堂。地图,仿佛成了现实世界的一面活体镜子。 但若把时钟拨回几十年前,人们手里攥着的是折叠起来沙沙作响的纸地图。 而真正让这张纸发生翻天覆地变化的,并非传统测绘专家,而是一群来自游戏、搜索和芯片领域的"跨 界极客"。这段历史,由英伟达、谷歌、阿里等公司共同写就,他们一步步将静态的地图,变成了能理 解、预测现实的"数字孪生"。 从"死地图"到"活地球" 在很长一段时间里,地图是专业且昂贵的东西,更新缓慢,和普通人的日常生活有种距离感。即便后来 被"电子化",早期如MapQuest或凯立德这类产品,本质也只是把纸质地图搬进了电脑,像个更新迟缓 的数据库,用户体验谈不上多好。 真正的转折点,始于一群"不务正业"的人。2001年,一个名叫约翰·汉克的团队创立了Keyhole公司。这 帮人背景很特别,他们擅长的是3D图形和游戏引擎,而不是测绘。他们萌生了一个在当时看来近乎疯 狂的想法:能不能像操控3D游戏角色一样,在数字地球上自由飞翔,流畅地缩放和旋转?这需要把海 量卫星影像、流式 ...
锦秋被投企业Manifold AI流形空间完成超亿元天使+轮融资,国产世界模型让机器人大脑超进化|Jinqiu Spotlight
锦秋集· 2026-01-10 06:13
以下文章来源于Manifold AI流形空间 ,作者Manifold AI Manifold AI流形空间 . 基于自研的世界模型构建具有通用理解和交互能力的具身智能体。 「Jinqiu Spotlight」 追踪锦秋基金与被投企业的每一个光点与动态, 为创业者传递一线行业风向。 今天, Manifold AI(流形空间 )宣布 完成超亿元天使+轮 融资, 锦秋基金 持续加注。此前, 锦秋基金曾领投 Manifold AI 天使轮融资。 本轮投资由君联资本领投,梅花创投、华为哈勃跟投,老股东 英诺 基金 、 锦秋基金 、同创伟业 持续加注 。 Manifold AI(流形空间) 半年内累计 已获得数亿元融资 , 所募资金将用于 世界 模型 的迭代 和 具身大脑的 应用落地。 Manifold AI基于世界模型的深厚积累自研了 通用 空间 世界模型 WorldScape ,具备单图生成可交互空间的能力, 在生成质量、时空一致性、实时 性等方面全面对标国外的一线世界模型 如Google Genie3、 李飞飞 World Lab s RTFM等 。 图1:基于 WorldScape 单图生成 移动 交互 世界模型 ...
“机器人一次性卖完太亏!”真机智能刘智勇:今年中国本体厂商将大淘汰,拼的是世界模型?
AI前线· 2026-01-10 05:57
作者 | 华卫 本文为《2025 年度盘点与趋势洞察》系列内容之一,由 InfoQ 技术编辑组策划。本系列覆盖大模型、Agent、具身智能、AI Native 开发范式、 AI 工具链与开发、AI+ 传统行业等方向,通过长期跟踪、与业内专家深度访谈等方式,对重点领域进行关键技术进展、核心事件和产业趋势的 洞察盘点。内容将在 InfoQ 媒体矩阵陆续放出,欢迎大家持续关注。 我们采访了真机智能董事长兼首席科学家刘智勇,听他讲述了视觉语言导航(VLN)技术的当前难题、具身智能领域在 2025 年的各类进展 以及今年在能力边界上的两个突破方向和技术决胜点。他表示,一旦世界模型的因果推理能力取得突破,无论是机器人的安全性还是行为和 推理的安全性问题,都能得到很好的解决。 "2026 年本体厂商肯定会收缩,估计中国最终只会剩下 5 到 8 家本体机器人公司。"他指出,核心是在某个单一场景实现盈利,不是毛利而 是不依赖大量售后成本的净利。但单纯的整机销售并非很好的商业模式,如果只卖硬件,后续的售后压力会非常大,用户一次性付太多钱也 承受不了。 下面是详细对话内容,以飨读者。 VLN 和世界模型上"大分" Q:世界模型被寄 ...
何小鹏为高德“飞行街景”上线点赞:将持续探索物理世界与 AI 深度耦合的更多可能
Xin Lang Cai Jing· 2026-01-10 04:59
小鹏汽车董事长、CEO何小鹏在微博发文:为高德"飞行街景"上线点赞。让每一个小商家用手机就能生 成可"飞行"的实景店铺——这不仅是一次体验的升级,更是AI深入理解并还原物理世界的重要突破。从 出行到生活,我们正共同经历物理AI带来的变化。我们认为,世界模型将成为驱动下一代汽车、机器 人、飞行汽车的核心技术底座。小鹏汽车也将持续深耕物理AI,持续探索物理世界与 AI 深度耦合的更 多可能。期待与高德地图 及同行者一起,把这条路走深走实。 ...