Workflow
RoboBrain 2.0
icon
Search documents
人工智能“出屏” 机器人“登场”
Ren Min Ri Bao· 2025-06-11 22:50
如今,人工智能正在变得越来越聪明,也越来越"接地气"。从写文章、画画到听懂人话、动手做事,AI 不再只是藏在电脑里的"工具人",而是一步步走出屏幕,变成能和现实世界互动、与人类沟通交互 的"助手"。 近日,由北京智源人工智能研究院主办的2025智源大会,成为观察AI演进路径的重要窗口。多位国际 顶尖科学家和一线创业者齐聚一堂,围绕具身智能、通用AI等前沿议题展开深入讨论。从科学研究到 产业落地,一系列新理念和新成果正在推动人工智能更好地走进现实。 从"理解"到"参与" 近年来,随着生成式人工智能快速发展,大模型成为支撑AI应用的核心技术。从写作、绘画、编程到 生成视频、编写程序,大模型广泛嵌入各类应用场景,能力边界不断拓展,持续引发着人们关于AI未 来路径的讨论。 萨顿认为,当前的大模型主要依赖互联网文本、图像等静态数据进行训练,但真正的"智能"需要从"经 验"中学习。当前,AI的发展正进入"体验的时代",未来的AI应当从与世界的交互中生成新知识,就像 人类通过经验不断学习一样。他倡导以去中心化合作替代中心化控制,通过信任、协调和市场机制引导 AI与人类共生,实现AI与人类社会的互利共赢。 北京智源人工智能研 ...
环球问策|智源研究院王仲远:当前正是AI产品爆发的“前夕”
Huan Qiu Wang· 2025-06-10 04:42
【环球网科技报道 记者 秦耳】年之过半,进入六月。对于AI大模型而言,随着年初GPT-o3发布,以及4月GPT-4o带动起全球热议的"吉卜力画风"。 虽然期待已久的GPT-5依然迟迟未能上线,o3与4o的能力已经让业界意识到大模型已经从单纯的文本训练,进入了真正"多模态"。 即便在当前大模型能力的推动下,宏观层面,大模型与硬件结合,通过具身智能的发展解决实际生产生活问题已经成为可能。 "大模型发展到一定程度,达到可用状态之后,Agent是产业界可以开始发力的领域。基础大模型达到可用状态时,像水、电、操作系统一样,意味着 可以基于这个操作系统开发很多相当于移动互联网的APP的Agent。"王仲远认为。 他认为,Agent是技术和产业发展趋势之一,随着基础大模型技术进一步发展以及Agent产品化不断成熟,大模型或可在Agent上出现"杀手级"应用。 在多模态大模型技术支撑下,今年市场上各类Agent产品创新也如"雨后春笋",今年年初在网络上爆火的由蝴蝶效应公司发布的Manus就是一款多用途 的Agent。在五月OpenAI收购知名硬件设计公司io进军AI硬件,以及宇树科技CEO王兴兴近期在接受采访中讲出"人形机器 ...
对话智源研究院院长王仲远:AI正加速从数字世界走向物理世界
21世纪经济报道记者孔海丽 北京报道 2025年智源大会上,人形机器人不再是吉祥物,被"围堵"的人从杨植麟变成了王兴兴。 这一年,AI进展迅猛,迭代周期甚至少于3个月,且不再局限于大语言模型,而是转化为人形机器人训 练、落地的强辅助。 "人工智能正在加速从数字世界走向物理世界。"智源研究院院长王仲远在接受包括21世纪经济报道在内 的记者采访时直言:"人工智能应该为世界做一些实实在在的事情,帮助人类摆脱繁琐的、重复的以及 简单的劳动。" AI技术路线转向世界模型 "大模型技术还远没有到发展的尽头,过往所说的'百模大战'更多是大语言模型的竞争,而大语言模型 受限于互联网数据的使用,基础模型性能虽然还在提升,但是提升速度不如以前。"在王仲远看来,大 语言模型性能提升瓶颈的解法主要包括三个方面,一是强化学习优化推理能力,二是合成高质量数据替 代人类标注,三是激活海量未充分利用的多模态数据,多模态数据的规模可达文本的"百倍乃至万倍"。 在智源研究院的判断中,大模型的技术路线会从大语言模型往多模态尤其是原生多模态世界模型的方向 发展。原生多模态世界模型本质上是为了让人工智能感知和理解物理世界,进而推进和物理世界的交 互。 ...
从预训练到世界模型,智源借具身智能重构AI进化路径
Di Yi Cai Jing· 2025-06-07 12:41
6月6日至7日,第七届智源大会在北京举行,被"众星捧月"的嘉宾从去年的月之暗面创始人杨植麟变更为今年的宇树科技CEO王兴兴。在多位与会人士看 来,一轮又一轮明星公司或创业者崛起的背后,AI(人工智能)越来越快的发展速度是核心驱动力。 参与主论坛的图灵奖得主、深度学习领域奠基人之一的蒙特利尔大学教授Yoshua Bengio称:"我们低估了AI进步的速度。"面壁智能CEO李大海也在采访中 表示,技术的发展是非线性的,大模型作为基础技术与基础设施,待未来发展到一定程度后,行业一定会更关注基础设施之上的应用,这是行业合理规律。 今年智源大会传递出的AI重点从大语言模型的预训练,更迭为世界模型的培育发展。智源研究院院长王仲远表示,AI正加速从数字世界走向物理世界,也 因此,智源研究院宣布从"悟道"时代迈入"具身智能"探索阶段。 何为世界模型 对于世界模型的精准定义,王仲远在采访中表示,目前世界范围内暂时没有共通的定义,已存在的名称包括"空间智能""时空智能"等。此次智源研究院发布 的一系列相关产品与技术,也代表了自身对世界模型的理解。 AI从数字世界跨向物理世界时必须突破数字世界的隔阂。 王仲远认为,大模型技术还远没 ...
智源研究院发布“悟界”系列大模型:让AI看见并理解物理世界
Jing Ji Guan Cha Wang· 2025-06-07 02:55
经济观察报 记者 周悦 6月6日,北京智源大会开幕,吸引了包括图灵奖得主约书亚·本吉奥、强化学习之父理查德·萨顿,以及来自谷歌、Meta、华为等全球知名AI机构的顶尖学 者和从业者。 这场大会被视为"AI内行人的学术盛会",也见证了中国AI科研机构智源研究院(下称"智源")的最新动作:发布"悟界"系列大模型。 智源研究院院长王仲远认为:"大模型技术远没有到发展的尽头,但我们已经看见了大语言模型的增长天花板。"在他看来,过去一年"百模大战"的热闹, 实则是围绕大语言模型的同质化竞争。互联网数据的天花板,限制了它们性能的持续爬升。 他认为,AI要真正走向下一个阶段,关键在于突破多模态的世界模型——让AI不只是语言的拼图玩家,而是理解和适配物理世界的智能体。智源正在试 图回答一个更宏大的命题:如何让AI真正看见、理解并影响物理世界? 智源发布"悟界"四大模型 探索物理世界的交互边界 在本次智源大会上,智源正式披露了"悟界"系列的四款模型:包括原生多模态世界模型Emu3、脑科学多模态通用基础模型见微Brainμ、跨本体具身大小 脑协作框架RoboOS 2.0与具身大脑RoboBrain 2.0以及全原子微观生命模型O ...
智源发布“悟界”系列大模型,含全球首个原生多模态世界模型Emu3
Feng Huang Wang· 2025-06-06 14:32
凤凰网科技讯 6月6日,在2025北京智源大会上,继"悟道"系列大模型之后,智源研究院推出"悟界"系 列大模型。 "悟界"大模型系列,包括原生多模态世界模型Emu3、脑科学多模态通用基础模型见微Brainμ、跨本体 具身大小脑协作框架RoboOS 2.0与具身大脑RoboBrain 2.0以及全原子微观生命模型OpenComplex2。 Emu3作为原生多模态统一架构让大模型具备理解和推理世界的能力,Brainμ基于Emu3架构,引入脑信 号这一新的模态数据,实现了单一模型完成多种神经科学任务的大一统。多模态与脑科学模型未来可成 为人机交互具身场景下的基础模型。 RoboOS 2.0与RoboBrain 2.0在初代版本基础上,原有性能大幅提升,并新增多机协作规划与物理常识驱 动的空间推理能力。 作为神经科学领域跨任务、跨模态、跨个体的基础通用模型,Brainμ可同步处理多类编解码任务,兼容 多物种动物模型(包括小鼠 狨猴 猕猴)与人类数据,实现科学数据注释、交互式科学结论解读、大脑 感觉信号重建及模拟刺激信号生成。在自动化睡眠分型、感官信号重建与多种脑疾病诊断等任务中,作 为单一模型其性能显著超越现有的专有 ...
北京智源大会在京开幕,智源“悟界”系列大模型发布
6月6日,北京智源大会在京启幕。伴随多项全球前沿的人工智能成果发布,包括图灵奖获得者、明星AI企业创始人在内的数百位全球青年科学家、人工智 能顶尖学者和产业专家齐聚北京,在这场科技盛会中共同绘制人工智能产业未来"导航图"。 AI"破壁"加速进入物理世界 当一个咖啡杯放在桌子的边缘,人和AI会各自作何反应?不少AI大模型看到的可能是"白色的咖啡杯在桌上,上面有一些文字。"而更具时空预测能力的人类 则会基于现实信息进行预判——"咖啡杯在桌子的边缘,很危险",并知道需要从桌子从外向内的方向拿取杯子来避免它掉落。 "人工智能正在加速从数字世界走向物理世界,这是对大模型技术发展趋势的判断,也是'悟界'系列大模型推出的底层原因。"智源研究院院长王仲远说,AI 从数字世界跨向物理世界时必须突破两者之间的隔阂,其中最重要的隔阂和边界就是对空间和时间的感知。而此次智源发布的原生多模态世界模型Emu3, 就具备这种在物理世界中理解和推理的能力。 据悉,目前全球众多人工智能机构都在积极探索原生多模态技术。什么叫"原生"?人类与现实世界的互动,通常需要涉及语言、视觉和音频等被业界称 为"多模态"的信息。王仲远告诉记者,过去的多模态大 ...
智源研究院发布“悟界”系列大模型,推动AI迈向物理世界
Xin Jing Bao· 2025-06-06 10:43
北京智源大会6月6日开幕。全球最强的开源具身大脑大模型、助力新型治疗方案研发的全原子微观生命 模型……作为北京市人工智能领域的新型研发机构,智源研究院在开幕式上发布"悟界"系列大模型,推 动人工智能从数字世界迈向物理世界。 从"悟道"到"悟界",人工智能迈入现实物理世界 智源研究院院长王仲远表示,大模型技术还远没有到发展的尽头,过往所说的"百模大战"更多的是大语 言模型的竞争,而大语言模型受限于互联网数据的使用,基础模型性能虽然还在提升,但是提升速度不 如以前。 "大语言模型性能提升的解法有很多。"他说,一是通过强化学习,在后训练和推理上提升,例如 DeepSeek R1等,这是过去一年大模型产业界最大的进展之一。二是数据合成,目前学术界仍在突破。 互联网数据都是人类创造的,如果人工智能合成的数据、生成的数据质量能够达到人类创造的数据质 量,那意味着人工智能有可能实现自我学习和进步。三是使用多模态数据,在全世界范围内,多模态数 据是文字数据的千万倍甚至更多,这些数据远没有被有效利用。 大模型正在从大语言模型向原生多模态大模型、世界模型的方向演进。原生多模态世界模型本质上是为 了让人工智能感知和理解物理世界,进 ...
刚刚,智源全新「悟界」系列大模型炸场!AI第一次真正「看见」宏观-微观双宇宙
机器之心· 2025-06-06 09:36
年初爆火的 DeepSeek R1 以及后续的 OpenAI o3,强化学习技术让推理模型能力强势增长;同时,智能体、世界模型、多模态大模型、具身智能与人形机器人、 AI4S 等领域也不断产出引爆社区的成果,比如最初一码难求的智能体 Manus、CES 大会上英伟达的 Cosmos 世界基础模型。 前沿 AI 技术的进步让整个 AI 圈充满了活力,并推动各个 AI 方向在当前行业最有前景的道路上狂奔。 6 月 6 日,一年一度的国内「AI 内行顶级盛会」—— 第七届智源大会 拉开了序幕!会上,Yoshua Bengio、Richard Sutton 等四位图灵奖得主、三十余位大模型企业 创始人及 CEO、一百多位青年科学家及学者集思广益,从学界和产业界的多样化视角出发,围绕上面这些 AI 课题进行了头脑风暴,并针对下一代 AI 路径等行业 前景问题贡献出了很多真知灼见。 作为主办方的智源研究院(简称智源),重磅亮相了 全新一代「悟界」系列大模型 。从命名来看,「悟界」代表了智源对于虚实边界的突破,通过深化对物理世 界的赋能向着物理 AGI 方向迈进。这预示着这家人工智能领域的前沿科研机构对大模型的探索进入到了 ...