Workflow
物理AGI
icon
Search documents
对话智源王仲远:机器人的大小脑可能会“合体”,但不是今天
AI前线· 2025-06-11 08:39
作者 | 华卫 今年的智源大会上,智源研究院推出全新的"悟界"系列大模型,其中包括原生多模态世界模型 Emu3、脑科学多模态通用基础模型见微 Brainμ、跨本体具身大小脑协作框架 RoboOS2.0 与具身大 脑 RoboBrain2.0 以及全原子微观生命模型 OpenComplex2。 据介绍,Emu3 作为原生多模态统一架构让大模型具备理解和推理世界的能力,Brainμ基于则 Emu3 架构,引入脑信号这一新的模态数据,实现了单一模型完成多种神经科学任务的大一统。在初代版本 的基础上,RoboOS2.0 与 RoboBrain2.0 的原有性能有大幅提升,并新增多机协作规划与物理常识 驱动的空间推理能力。OpenComplex2 可在原子分辨率层面捕捉分子相互作用及平衡构象,探索微 观构象波动与宏观生物功能的跨尺度关联。 "大模型技术还远没有到发展的尽头。"在大会前夕,智源研究院长王仲远向我们透露了这一系列新模 型背后的技术思考与智源当下的战略布局。 王仲远指出,去年智源就对大模型的技术路线进行了预判,会从大语言模型往多模态、尤其是原生多 模态世界模型的方向发展。当前,智源的工作布局都是围绕这一技术发 ...
对话智源研究院院长王仲远:AI正加速从数字世界走向物理世界
21世纪经济报道记者孔海丽 北京报道 2025年智源大会上,人形机器人不再是吉祥物,被"围堵"的人从杨植麟变成了王兴兴。 这一年,AI进展迅猛,迭代周期甚至少于3个月,且不再局限于大语言模型,而是转化为人形机器人训 练、落地的强辅助。 "人工智能正在加速从数字世界走向物理世界。"智源研究院院长王仲远在接受包括21世纪经济报道在内 的记者采访时直言:"人工智能应该为世界做一些实实在在的事情,帮助人类摆脱繁琐的、重复的以及 简单的劳动。" AI技术路线转向世界模型 "大模型技术还远没有到发展的尽头,过往所说的'百模大战'更多是大语言模型的竞争,而大语言模型 受限于互联网数据的使用,基础模型性能虽然还在提升,但是提升速度不如以前。"在王仲远看来,大 语言模型性能提升瓶颈的解法主要包括三个方面,一是强化学习优化推理能力,二是合成高质量数据替 代人类标注,三是激活海量未充分利用的多模态数据,多模态数据的规模可达文本的"百倍乃至万倍"。 在智源研究院的判断中,大模型的技术路线会从大语言模型往多模态尤其是原生多模态世界模型的方向 发展。原生多模态世界模型本质上是为了让人工智能感知和理解物理世界,进而推进和物理世界的交 互。 ...
世界模型有新进展,算力成本、数据质量成关键!数据ETF(516000)多空博弈激烈
Mei Ri Jing Ji Xin Wen· 2025-06-06 07:11
华泰证券认为这或将持续提升车载的芯片算力以及传感器的精度,对算法公司和主机厂技术研发能力也 提出了新的要求。亿欧智库的报告则称,世界模型通过云端训练+车端蒸馅提升泛化能力,但其规模化 落地仍受限于算力成本与数据质量。 截至6月6日14:47,中证大数据产业指数(930902)盘中震荡。成分股方面涨跌互现,石基信息涨停,科华 数据上涨2.43%,神州泰岳上涨1.91%;神州信息领跌3.04%,拓维信息下跌2.51%,税友股份下跌 1.99%。数据ETF(516000)多空胶着,最新报价0.92元。拉长时间看,截至2025年6月5日,数据ETF近1 周累计上涨1.89%,涨幅排名可比基金第一。流动性方面,数据ETF盘中交易活跃,换手6.44%,成交 2853.13万元。 消息方面, 6月6日上午,在2025北京智源大会上,北京智源人工智能研究院发布了"悟界"系列大模 型,宣布围绕物理AGI(通用人工智能)所做的大模型最新科研成果和布局。"悟界"系列大模型目前包 含:全球首个原生多模态世界模型"悟界·Emu3"、全球首个脑科学多模态通用基础模型"悟界·见微 Brainμ"、具身大脑RoboBrain 2.0、全原子 ...
智源发布“悟界”系列大模型,宣布围绕物理AGI进行布局
Xin Lang Ke Ji· 2025-06-06 02:51
新浪科技讯 6月6日上午消息,今日举办的2025北京智源大会上,北京智源人工智能研究院发布"悟 界"大模型,宣布围绕物理AGI所做的大模型最新科研成果和布局,构成"悟界"系列大模型。 据悉,此次推出的"悟界"大模型,"界"代表对虚实世界边界的突破,代表对物理世界的赋能,物理AGI 方向的迈进。"悟界"系列大模型目前包含四个模型:原生多模态世界模型Emu3、脑科学多模态通用基 础模型见微Brainμ、具身大脑RoboBrain 2.0以及全原子微观生命模型OpenComplex2。 其中,原生多模态世界模型Emu3,于2024年10月发布,基于下一个token预测范式统一多模态学习,无 需扩散模型或组合式架构的复杂性,通过研发新型视觉tokenizer将图像/视频编码为与文本同构的离散符 号序列,构建模态无关的统一表征空间,实现文本、图像、视频的任意组合理解与生成。Emu3支持多 模态输入、多模态输出的端到端映射,验证了自回归框架在多模态领域的普适性与先进性,为跨模态交 互提供了强大的技术基座。 Brainμ整合了神经科学领域多个大型公开数据集和多个合作实验室的高质量神经科学数据,完成了超过 100万单位的神经 ...