Emu3

Search documents
新华全媒头条 | 全球数字经济标杆城市怎么建?——看北京如何“点数成金”
Xin Hua She· 2025-07-02 18:04
7月2日至5日,2025全球数字经济大会在京召开,50多个国家嘉宾和世界贸易组织、金砖国家的"智囊团"汇聚一堂,搭建国际平台共议"建设数 字友好城市",为全球数字化转型贡献新方案。 数字经济建设持续"加速跑" 7月2日上午,2025全球数字经济大会开幕式上,"全球数字经济城市联盟"正式成立。城市是技术变革与政策创新核心载体,正成为推动可持续 发展与全球协作的关键力量。中外城市"心相连、手相牵",共议数字经济发展新合作。 2025年7月2日,在2025全球数字经济大会开幕式上,"全球数字经济城市联盟"成立。新华社记者张晨霖摄 会场外,在位于北京大栅栏历史文化街区的"北京坊",1∶1还原的C919模拟舱吸引大批观众体验飞行操作。6000平方米的北京数字经济体验周 展馆内,新奇体验应用梯次亮相,生动展现数字经济发展新实践。 发展数字经济,是把握新一轮科技革命和产业变革新机遇的战略选择。2024年,我国数字经济核心产业规模稳步扩大,数字经济规模稳居世界 第二。 小米工厂76秒"吐"出一辆新能源汽车,100多款"京产"AI大模型给医院、商超、农场"装大脑",5G基站人均拥有量全国最多…… 千年文脉与数字浪潮相互激荡,北 ...
活力中国调研行丨逐浪大潮!“千年古都”变身“人工智能第一城”
Xin Hua She· 2025-06-17 14:01
北京,这座有着3000多年建城史、800多年建都史的千年古都,正以更智能、更新潮的面孔刷新"北京印 象"。 北京京郊,一辆载着19名乘客的无人驾驶公交车丝滑行驶在房山区房窑路上,像有"老司机"驾驶般从容 不迫,令参加"活力中国调研行"的记者们十分惊叹。 从表面上看,这辆车与其他公交车并无差别。但在车内,坐在主驾的安全员并没有摸方向盘。一路上, 哪怕遇到狭窄道路、复杂路况,"AI司机"也能应对自如。 这辆无人公交车,出自北京自动驾驶"独角兽"驭势科技之手。 6月16日,参观者在体验北京驭势科技的一款无人驾驶巴士。新华社记者 鞠焕宗 摄 北京大力发展人工智能的浪潮中,驭势科技的"AI司机"走出国门,为6个国家和地区服务,无人驾驶里 程数高达580万公里,累计提供超过1000台无人车的规模化运营服务。卡塔尔哈马德国际机场、新加坡 樟宜机场……超20个海内外机场,如今均有它的身影。 而这,只是北京发力建设人工智能第一城的一瞥。 全球首个原生多模态世界模型"悟界・Emu3"、我国首个能深度思考的AI智能体"AutoGLM沉思"……循 着AI的演进路径,记者来到被誉为"人工智能密度最高"的区域——位于北京的成府路、知春路 ...
对话智源王仲远:机器人的大小脑可能会“合体”,但不是今天
AI前线· 2025-06-11 08:39
作者 | 华卫 今年的智源大会上,智源研究院推出全新的"悟界"系列大模型,其中包括原生多模态世界模型 Emu3、脑科学多模态通用基础模型见微 Brainμ、跨本体具身大小脑协作框架 RoboOS2.0 与具身大 脑 RoboBrain2.0 以及全原子微观生命模型 OpenComplex2。 据介绍,Emu3 作为原生多模态统一架构让大模型具备理解和推理世界的能力,Brainμ基于则 Emu3 架构,引入脑信号这一新的模态数据,实现了单一模型完成多种神经科学任务的大一统。在初代版本 的基础上,RoboOS2.0 与 RoboBrain2.0 的原有性能有大幅提升,并新增多机协作规划与物理常识 驱动的空间推理能力。OpenComplex2 可在原子分辨率层面捕捉分子相互作用及平衡构象,探索微 观构象波动与宏观生物功能的跨尺度关联。 "大模型技术还远没有到发展的尽头。"在大会前夕,智源研究院长王仲远向我们透露了这一系列新模 型背后的技术思考与智源当下的战略布局。 王仲远指出,去年智源就对大模型的技术路线进行了预判,会从大语言模型往多模态、尤其是原生多 模态世界模型的方向发展。当前,智源的工作布局都是围绕这一技术发 ...
聚焦多模态:ChatGPT时刻未到,2025大模型“变慢”了吗
Bei Jing Shang Bao· 2025-06-08 13:27
以ChatGPT为代表的语言类大模型重塑内容生成方式时,多模态模型还在等待它的"iPhone时刻"。近日召开的2025智源大会上,智源研究院(以下简称"智 源")正式发布了包括原生多模态世界模型Emu3等"悟界"大模型系列,Emu3实现了文本、图像、视频的任何组合理解与生成,通过单一模型就可以捕捉世 界的规律。 AI发展之快,每年都有新话题,2024年,价格战是大模型的关键词,2025感到风向变了,大模型应用百花齐放,反而有种大模型发展"变慢"了的体感。 事实上,市场上新旧产品同台竞技,呈现出立体、多维度的思考,多模态大模型更是如此。按照当前技术成熟度评估,视频生成等核心能力仍处于GPT-2到 GPT-3的过渡阶段,与产业预期存在显著差距。多模态模型将经历更长的技术沉淀期,这也意味着更大的想象力空间。 技术路线未收敛 大模型爆发至今,很多时候无外乎是选对了方向,又懂得流量密码,一个现象级产品就横空出世了。事实上,这种选择需要前期足够多的思考、实践和勇 气。 严格来说,Emu3是智源2024年10月发布的多模态模型,目前智源已在训练下一个版本。基于Emu3,智源还官宣了全球首个脑科学多模态通用基础模型见微 Br ...
对话智源研究院院长王仲远:AI正加速从数字世界走向物理世界
2 1 Shi Ji Jing Ji Bao Dao· 2025-06-08 11:49
21世纪经济报道记者孔海丽 北京报道 2025年智源大会上,人形机器人不再是吉祥物,被"围堵"的人从杨植麟变成了王兴兴。 这一年,AI进展迅猛,迭代周期甚至少于3个月,且不再局限于大语言模型,而是转化为人形机器人训 练、落地的强辅助。 "人工智能正在加速从数字世界走向物理世界。"智源研究院院长王仲远在接受包括21世纪经济报道在内 的记者采访时直言:"人工智能应该为世界做一些实实在在的事情,帮助人类摆脱繁琐的、重复的以及 简单的劳动。" AI技术路线转向世界模型 "大模型技术还远没有到发展的尽头,过往所说的'百模大战'更多是大语言模型的竞争,而大语言模型 受限于互联网数据的使用,基础模型性能虽然还在提升,但是提升速度不如以前。"在王仲远看来,大 语言模型性能提升瓶颈的解法主要包括三个方面,一是强化学习优化推理能力,二是合成高质量数据替 代人类标注,三是激活海量未充分利用的多模态数据,多模态数据的规模可达文本的"百倍乃至万倍"。 在智源研究院的判断中,大模型的技术路线会从大语言模型往多模态尤其是原生多模态世界模型的方向 发展。原生多模态世界模型本质上是为了让人工智能感知和理解物理世界,进而推进和物理世界的交 互。 ...
从预训练到世界模型,智源借具身智能重构AI进化路径
Di Yi Cai Jing· 2025-06-07 12:41
6月6日至7日,第七届智源大会在北京举行,被"众星捧月"的嘉宾从去年的月之暗面创始人杨植麟变更为今年的宇树科技CEO王兴兴。在多位与会人士看 来,一轮又一轮明星公司或创业者崛起的背后,AI(人工智能)越来越快的发展速度是核心驱动力。 参与主论坛的图灵奖得主、深度学习领域奠基人之一的蒙特利尔大学教授Yoshua Bengio称:"我们低估了AI进步的速度。"面壁智能CEO李大海也在采访中 表示,技术的发展是非线性的,大模型作为基础技术与基础设施,待未来发展到一定程度后,行业一定会更关注基础设施之上的应用,这是行业合理规律。 今年智源大会传递出的AI重点从大语言模型的预训练,更迭为世界模型的培育发展。智源研究院院长王仲远表示,AI正加速从数字世界走向物理世界,也 因此,智源研究院宣布从"悟道"时代迈入"具身智能"探索阶段。 何为世界模型 对于世界模型的精准定义,王仲远在采访中表示,目前世界范围内暂时没有共通的定义,已存在的名称包括"空间智能""时空智能"等。此次智源研究院发布 的一系列相关产品与技术,也代表了自身对世界模型的理解。 AI从数字世界跨向物理世界时必须突破数字世界的隔阂。 王仲远认为,大模型技术还远没 ...
智源研究院发布“悟界”系列大模型:让AI看见并理解物理世界
Jing Ji Guan Cha Wang· 2025-06-07 02:55
经济观察报 记者 周悦 6月6日,北京智源大会开幕,吸引了包括图灵奖得主约书亚·本吉奥、强化学习之父理查德·萨顿,以及来自谷歌、Meta、华为等全球知名AI机构的顶尖学 者和从业者。 这场大会被视为"AI内行人的学术盛会",也见证了中国AI科研机构智源研究院(下称"智源")的最新动作:发布"悟界"系列大模型。 智源研究院院长王仲远认为:"大模型技术远没有到发展的尽头,但我们已经看见了大语言模型的增长天花板。"在他看来,过去一年"百模大战"的热闹, 实则是围绕大语言模型的同质化竞争。互联网数据的天花板,限制了它们性能的持续爬升。 他认为,AI要真正走向下一个阶段,关键在于突破多模态的世界模型——让AI不只是语言的拼图玩家,而是理解和适配物理世界的智能体。智源正在试 图回答一个更宏大的命题:如何让AI真正看见、理解并影响物理世界? 智源发布"悟界"四大模型 探索物理世界的交互边界 在本次智源大会上,智源正式披露了"悟界"系列的四款模型:包括原生多模态世界模型Emu3、脑科学多模态通用基础模型见微Brainμ、跨本体具身大小 脑协作框架RoboOS 2.0与具身大脑RoboBrain 2.0以及全原子微观生命模型O ...
智源发布“悟界”系列大模型,含全球首个原生多模态世界模型Emu3
Feng Huang Wang· 2025-06-06 14:32
凤凰网科技讯 6月6日,在2025北京智源大会上,继"悟道"系列大模型之后,智源研究院推出"悟界"系 列大模型。 "悟界"大模型系列,包括原生多模态世界模型Emu3、脑科学多模态通用基础模型见微Brainμ、跨本体 具身大小脑协作框架RoboOS 2.0与具身大脑RoboBrain 2.0以及全原子微观生命模型OpenComplex2。 Emu3作为原生多模态统一架构让大模型具备理解和推理世界的能力,Brainμ基于Emu3架构,引入脑信 号这一新的模态数据,实现了单一模型完成多种神经科学任务的大一统。多模态与脑科学模型未来可成 为人机交互具身场景下的基础模型。 RoboOS 2.0与RoboBrain 2.0在初代版本基础上,原有性能大幅提升,并新增多机协作规划与物理常识驱 动的空间推理能力。 作为神经科学领域跨任务、跨模态、跨个体的基础通用模型,Brainμ可同步处理多类编解码任务,兼容 多物种动物模型(包括小鼠 狨猴 猕猴)与人类数据,实现科学数据注释、交互式科学结论解读、大脑 感觉信号重建及模拟刺激信号生成。在自动化睡眠分型、感官信号重建与多种脑疾病诊断等任务中,作 为单一模型其性能显著超越现有的专有 ...
4位图灵奖得主布道,2大冠军机器人登台,“AI春晚”果然又高又硬
量子位· 2025-06-06 13:45AI Processing
北京智源大会在京开幕,智源“悟界”系列大模型发布
Bei Jing Ri Bao Ke Hu Duan· 2025-06-06 13:31
6月6日,北京智源大会在京启幕。伴随多项全球前沿的人工智能成果发布,包括图灵奖获得者、明星AI企业创始人在内的数百位全球青年科学家、人工智 能顶尖学者和产业专家齐聚北京,在这场科技盛会中共同绘制人工智能产业未来"导航图"。 AI"破壁"加速进入物理世界 当一个咖啡杯放在桌子的边缘,人和AI会各自作何反应?不少AI大模型看到的可能是"白色的咖啡杯在桌上,上面有一些文字。"而更具时空预测能力的人类 则会基于现实信息进行预判——"咖啡杯在桌子的边缘,很危险",并知道需要从桌子从外向内的方向拿取杯子来避免它掉落。 "人工智能正在加速从数字世界走向物理世界,这是对大模型技术发展趋势的判断,也是'悟界'系列大模型推出的底层原因。"智源研究院院长王仲远说,AI 从数字世界跨向物理世界时必须突破两者之间的隔阂,其中最重要的隔阂和边界就是对空间和时间的感知。而此次智源发布的原生多模态世界模型Emu3, 就具备这种在物理世界中理解和推理的能力。 据悉,目前全球众多人工智能机构都在积极探索原生多模态技术。什么叫"原生"?人类与现实世界的互动,通常需要涉及语言、视觉和音频等被业界称 为"多模态"的信息。王仲远告诉记者,过去的多模态大 ...