Workflow
RoboOS 2.0
icon
Search documents
人工智能“出屏” 机器人“登场”
Ren Min Ri Bao· 2025-06-11 22:50
如今,人工智能正在变得越来越聪明,也越来越"接地气"。从写文章、画画到听懂人话、动手做事,AI 不再只是藏在电脑里的"工具人",而是一步步走出屏幕,变成能和现实世界互动、与人类沟通交互 的"助手"。 近日,由北京智源人工智能研究院主办的2025智源大会,成为观察AI演进路径的重要窗口。多位国际 顶尖科学家和一线创业者齐聚一堂,围绕具身智能、通用AI等前沿议题展开深入讨论。从科学研究到 产业落地,一系列新理念和新成果正在推动人工智能更好地走进现实。 从"理解"到"参与" 近年来,随着生成式人工智能快速发展,大模型成为支撑AI应用的核心技术。从写作、绘画、编程到 生成视频、编写程序,大模型广泛嵌入各类应用场景,能力边界不断拓展,持续引发着人们关于AI未 来路径的讨论。 萨顿认为,当前的大模型主要依赖互联网文本、图像等静态数据进行训练,但真正的"智能"需要从"经 验"中学习。当前,AI的发展正进入"体验的时代",未来的AI应当从与世界的交互中生成新知识,就像 人类通过经验不断学习一样。他倡导以去中心化合作替代中心化控制,通过信任、协调和市场机制引导 AI与人类共生,实现AI与人类社会的互利共赢。 北京智源人工智能研 ...
智源研究院院长王仲远:大模型技术远没有发展到尽头
当"百模大战"偃旗息鼓、"AI六小虎"渐行渐远,大模型的"大力出奇迹"和智能涌现是否已趋向枯竭? 6月6日至7日,在第七届智源大会上,智源研究院正式推出了"悟界"系列开源大模型,涵盖多模态世界 模型、脑科学多模态模型、具身大脑与大小脑协作框架、全原子微观生命模型等。与此同时,现场设置 的AI科研成果互动体验展区展示了悟界系列大模型在具身智能、脑科学、数字心脏等领域的应用场 景。 除此之外,关于AI Agent在今年密集涌现的现象,王仲远解释,当基础模型达到"可用"的水平——指既 能理解自然语言,又具有一定的逻辑,大模型就会进入"好用"的阶段,促进产业的发展。Agnet是一个 重要的产业落地形式,产业可以在基础模型之上开发出解决用户实际需求的Agent。当然,创业公司还 要考虑ROI(投入产出比),模型需要在保证相同能力的情况下越小越好,慢思考能力或推理能力在保 证推理效果的情况下越快越好。这个过程中遇到的瓶颈在未来会被逐步解决。 王仲远表示,智源研究院与香港投资管理有限公司建立战略合作框架,共建世界级跨区域合作的人工智 能生态圈,推动加速人才、技术、资本的飞轮效应。 "2025年人形机器人刚学会跑" 在大会前 ...
对话智源研究院院长王仲远:AI正加速从数字世界走向物理世界
21世纪经济报道记者孔海丽 北京报道 2025年智源大会上,人形机器人不再是吉祥物,被"围堵"的人从杨植麟变成了王兴兴。 这一年,AI进展迅猛,迭代周期甚至少于3个月,且不再局限于大语言模型,而是转化为人形机器人训 练、落地的强辅助。 "人工智能正在加速从数字世界走向物理世界。"智源研究院院长王仲远在接受包括21世纪经济报道在内 的记者采访时直言:"人工智能应该为世界做一些实实在在的事情,帮助人类摆脱繁琐的、重复的以及 简单的劳动。" AI技术路线转向世界模型 "大模型技术还远没有到发展的尽头,过往所说的'百模大战'更多是大语言模型的竞争,而大语言模型 受限于互联网数据的使用,基础模型性能虽然还在提升,但是提升速度不如以前。"在王仲远看来,大 语言模型性能提升瓶颈的解法主要包括三个方面,一是强化学习优化推理能力,二是合成高质量数据替 代人类标注,三是激活海量未充分利用的多模态数据,多模态数据的规模可达文本的"百倍乃至万倍"。 在智源研究院的判断中,大模型的技术路线会从大语言模型往多模态尤其是原生多模态世界模型的方向 发展。原生多模态世界模型本质上是为了让人工智能感知和理解物理世界,进而推进和物理世界的交 互。 ...
从预训练到世界模型,智源借具身智能重构AI进化路径
Di Yi Cai Jing· 2025-06-07 12:41
6月6日至7日,第七届智源大会在北京举行,被"众星捧月"的嘉宾从去年的月之暗面创始人杨植麟变更为今年的宇树科技CEO王兴兴。在多位与会人士看 来,一轮又一轮明星公司或创业者崛起的背后,AI(人工智能)越来越快的发展速度是核心驱动力。 参与主论坛的图灵奖得主、深度学习领域奠基人之一的蒙特利尔大学教授Yoshua Bengio称:"我们低估了AI进步的速度。"面壁智能CEO李大海也在采访中 表示,技术的发展是非线性的,大模型作为基础技术与基础设施,待未来发展到一定程度后,行业一定会更关注基础设施之上的应用,这是行业合理规律。 今年智源大会传递出的AI重点从大语言模型的预训练,更迭为世界模型的培育发展。智源研究院院长王仲远表示,AI正加速从数字世界走向物理世界,也 因此,智源研究院宣布从"悟道"时代迈入"具身智能"探索阶段。 何为世界模型 对于世界模型的精准定义,王仲远在采访中表示,目前世界范围内暂时没有共通的定义,已存在的名称包括"空间智能""时空智能"等。此次智源研究院发布 的一系列相关产品与技术,也代表了自身对世界模型的理解。 AI从数字世界跨向物理世界时必须突破数字世界的隔阂。 王仲远认为,大模型技术还远没 ...
对话智源王仲远:具身智能“小组赛”才刚刚开打,机器人需要“安卓”而非 iOS
AI科技大本营· 2025-06-07 09:42
悟道 1.0 发布时,学术界对" 大模型是通往 AGI 的技术路线 "尚未得出统一结论。 现在的具身智能,也处于这个阶段。 作者 | 王启隆 出品丨AI 科技大本营(ID:rgznai100) 大模型的热潮之下,一种微妙的瓶颈感,正成为行业共识。 "过往所说的 '百模大战',更多是大语言模型的竞争," 智源大会前夕, 智源研究院院长王仲远 在 与 CSDN 的对话中,开门见山地指出了问题的核 心,"而大语言模型受限于互联网数据的使用,性能虽然还在提升,但速度已大不如前。" 出路何在?在王仲远看来,AI 要突破天花板,就必须在"读万卷书"(互联网数据)后,去"行万里路"(物理世界)。 这并非孤立的判断。今年三月, 英伟达 CEO 黄仁勋就在 GTC 大会上为 AI 的下半场指明了方向 :打造"AI 工厂",迎接"物理 AI"时代,让 AI 走出屏 幕,与现实世 界交互。 思考趋于一致,行动便接踵而至。6 月 6 日,CSDN 在北京智源大会现场,见证了王仲远在他的主题演讲中给出的答案。如果说 2021 年的"悟道"系列 代表着对技术路径的探索(" 道 "),那么他所揭晓的全新"悟界"系列,则亮明了新的野心——用 ...
智源研究院发布“悟界”系列大模型:让AI看见并理解物理世界
Jing Ji Guan Cha Wang· 2025-06-07 02:55
经济观察报 记者 周悦 6月6日,北京智源大会开幕,吸引了包括图灵奖得主约书亚·本吉奥、强化学习之父理查德·萨顿,以及来自谷歌、Meta、华为等全球知名AI机构的顶尖学 者和从业者。 这场大会被视为"AI内行人的学术盛会",也见证了中国AI科研机构智源研究院(下称"智源")的最新动作:发布"悟界"系列大模型。 智源研究院院长王仲远认为:"大模型技术远没有到发展的尽头,但我们已经看见了大语言模型的增长天花板。"在他看来,过去一年"百模大战"的热闹, 实则是围绕大语言模型的同质化竞争。互联网数据的天花板,限制了它们性能的持续爬升。 他认为,AI要真正走向下一个阶段,关键在于突破多模态的世界模型——让AI不只是语言的拼图玩家,而是理解和适配物理世界的智能体。智源正在试 图回答一个更宏大的命题:如何让AI真正看见、理解并影响物理世界? 智源发布"悟界"四大模型 探索物理世界的交互边界 在本次智源大会上,智源正式披露了"悟界"系列的四款模型:包括原生多模态世界模型Emu3、脑科学多模态通用基础模型见微Brainμ、跨本体具身大小 脑协作框架RoboOS 2.0与具身大脑RoboBrain 2.0以及全原子微观生命模型O ...
智源发布“悟界”系列大模型,含全球首个原生多模态世界模型Emu3
Feng Huang Wang· 2025-06-06 14:32
凤凰网科技讯 6月6日,在2025北京智源大会上,继"悟道"系列大模型之后,智源研究院推出"悟界"系 列大模型。 "悟界"大模型系列,包括原生多模态世界模型Emu3、脑科学多模态通用基础模型见微Brainμ、跨本体 具身大小脑协作框架RoboOS 2.0与具身大脑RoboBrain 2.0以及全原子微观生命模型OpenComplex2。 Emu3作为原生多模态统一架构让大模型具备理解和推理世界的能力,Brainμ基于Emu3架构,引入脑信 号这一新的模态数据,实现了单一模型完成多种神经科学任务的大一统。多模态与脑科学模型未来可成 为人机交互具身场景下的基础模型。 RoboOS 2.0与RoboBrain 2.0在初代版本基础上,原有性能大幅提升,并新增多机协作规划与物理常识驱 动的空间推理能力。 作为神经科学领域跨任务、跨模态、跨个体的基础通用模型,Brainμ可同步处理多类编解码任务,兼容 多物种动物模型(包括小鼠 狨猴 猕猴)与人类数据,实现科学数据注释、交互式科学结论解读、大脑 感觉信号重建及模拟刺激信号生成。在自动化睡眠分型、感官信号重建与多种脑疾病诊断等任务中,作 为单一模型其性能显著超越现有的专有 ...
北京智源大会在京开幕,智源“悟界”系列大模型发布
6月6日,北京智源大会在京启幕。伴随多项全球前沿的人工智能成果发布,包括图灵奖获得者、明星AI企业创始人在内的数百位全球青年科学家、人工智 能顶尖学者和产业专家齐聚北京,在这场科技盛会中共同绘制人工智能产业未来"导航图"。 AI"破壁"加速进入物理世界 当一个咖啡杯放在桌子的边缘,人和AI会各自作何反应?不少AI大模型看到的可能是"白色的咖啡杯在桌上,上面有一些文字。"而更具时空预测能力的人类 则会基于现实信息进行预判——"咖啡杯在桌子的边缘,很危险",并知道需要从桌子从外向内的方向拿取杯子来避免它掉落。 "人工智能正在加速从数字世界走向物理世界,这是对大模型技术发展趋势的判断,也是'悟界'系列大模型推出的底层原因。"智源研究院院长王仲远说,AI 从数字世界跨向物理世界时必须突破两者之间的隔阂,其中最重要的隔阂和边界就是对空间和时间的感知。而此次智源发布的原生多模态世界模型Emu3, 就具备这种在物理世界中理解和推理的能力。 据悉,目前全球众多人工智能机构都在积极探索原生多模态技术。什么叫"原生"?人类与现实世界的互动,通常需要涉及语言、视觉和音频等被业界称 为"多模态"的信息。王仲远告诉记者,过去的多模态大 ...
智源研究院发布“悟界”系列大模型,推动AI迈向物理世界
Xin Jing Bao· 2025-06-06 10:43
北京智源大会6月6日开幕。全球最强的开源具身大脑大模型、助力新型治疗方案研发的全原子微观生命 模型……作为北京市人工智能领域的新型研发机构,智源研究院在开幕式上发布"悟界"系列大模型,推 动人工智能从数字世界迈向物理世界。 从"悟道"到"悟界",人工智能迈入现实物理世界 智源研究院院长王仲远表示,大模型技术还远没有到发展的尽头,过往所说的"百模大战"更多的是大语 言模型的竞争,而大语言模型受限于互联网数据的使用,基础模型性能虽然还在提升,但是提升速度不 如以前。 "大语言模型性能提升的解法有很多。"他说,一是通过强化学习,在后训练和推理上提升,例如 DeepSeek R1等,这是过去一年大模型产业界最大的进展之一。二是数据合成,目前学术界仍在突破。 互联网数据都是人类创造的,如果人工智能合成的数据、生成的数据质量能够达到人类创造的数据质 量,那意味着人工智能有可能实现自我学习和进步。三是使用多模态数据,在全世界范围内,多模态数 据是文字数据的千万倍甚至更多,这些数据远没有被有效利用。 大模型正在从大语言模型向原生多模态大模型、世界模型的方向演进。原生多模态世界模型本质上是为 了让人工智能感知和理解物理世界,进 ...