训练仍有巨大的Scaling空间!智源研究院王仲远:视频数据还未被充分利用 | MEET2026
量子位·2025-12-24 07:20

编辑部 整理自 MEET2026 量子位 | 公众号 QbitAI 全球互联网的文本数据已基本挖掘完毕,但视频数据还未被充分利用。 智源研究院的多模态世界模型悟界·Emu3.5,就是一个从视频中学习,而非仅依赖文本的大模型。 智源的Emu3.5与具身大脑全栈技术体系,就成为支撑这一技术演进趋势的两大基石。 MEET2026智能未来大会上,王仲远还说,要实现AI与物理世界的深度交互,需突破多模态理解与具身执行的核心技术瓶颈。 目前,悟界系列已在多模态学习范式、跨机器人本体适配等领域取得关键进展,且多项成果已开源开放,助力产业协同创新。 为了完整体现王仲远的思考,在不改变原意的基础上,量子位对演讲内容进行了编辑整理,希望能给你带来更多启发。 在量子位MEET2026智能未来大会上,北京智源人工智能研究院院长 王仲远 提到: 当前人工智能正处于第三次浪潮的关键拐点:大模型不仅推动 AI从弱智能向通用智能跨越 , 更有望 让机器人从1.0专用时代迈入2.0通 用时代 。 为此,智源研究院发布"悟界"系列大模型,锚定 AI从数字世界进入物理世界 的核心方向。 MEET2026智能未来大会是由量子位主办的行业峰会,近30 ...