Workflow
策略学习
icon
Search documents
策略学习助力LLM推理效率:MIT与谷歌团队提出异步并行生成新范式
机器之心· 2025-05-21 04:00
金天, 麻省理工学院(MIT)计算机科学与人工智能实验室(CSAIL)博士五年级学生,师从 Michael Carbin 和 Jonathan Ragan-Kelley。他主要研究 机器学习与编程系统的结合。此前曾在 IBM Research 主导实现深度神经网络在 IBM 主机上的推理部署。本科毕业于 Haverford College,获计算机科学 与数学双学位。 鄭鈺熹, 麻省理工学院 CSAIL 博士三年级学生,师从 Michael Carbin。她的研究方向为编程语言与机器学习的交叉领域。 大语言模型(LLM)的生成范式正在从传统的「单人书写」向「分身协作」转变。传统自回归解码按顺序生成内容,而新兴的异步生成范式通过识别语义独 立的内容块,实现并行生成。 如图所示,传统方法(下)按顺序生成所有内容,而异步生成(上)同时处理多个互不依赖的内容块。对比顺序生成,异步生成在 AlpacaEval 长度控制评 测中实现 1.21-1.93× 的几何平均提速 ,对应生成质量变化(胜率)为 +2.2% 至 -7.1%。 MIT 与谷歌研究团队在最新研究 PASTA(PArallel STructure Anno ...
智元灵犀机器人“会点拳脚功夫”了,近期将开启首轮预售
Nan Fang Du Shi Bao· 2025-05-16 08:12
当前,人形机器人行动普遍噪音偏大,灵犀X2升级了噪音控制技能,视频中轻柔步态下的灵犀X2走路 声音和按压圆珠笔的声音形成了鲜明比较,静音行走,不再"震楼"。不仅腿脚更灵便了,灵犀X2还学 会了一系列"拳脚功夫"。 智元灵犀X2由彭志辉(稚晖君)于今年3月11日在其B站账号首发,凭借其运动、交互和作业能力引发 关注。据了解,经历了两个月的研发迭代,基于硅光动语大模型,灵犀X2全面升级了主动交互能力。 比如,面对走近的稚晖君,灵犀X2主动打招呼,并向大家展示了完整的推理思考过程——在面对向他 挥手的稚晖君时,灵犀X2先是发现"他的眼镜反光让我有点看不清表情"、随后又基于"要保持交流"的思 考,催促自己"快想个话题",并开始主动交互:"你这穿搭真舒服,白色T恤就像干净的画布,蓝色裤子 就是那稳重的笔触,我最喜欢和看起来很聪明的人类一起探索科技了!" 灵犀X2还能识别物品。在视频中,面对稚晖君随手拿起的PowerFlow关节件,灵犀X2也展示了信息识 别到语音介绍的完整推理过程。目前,灵犀X2已具备了纯视觉自主感知规划能力,依靠头部搭载的 RGB和RGBD摄像头等视觉传感器获取环境信息,能通过算法实现环境感知、决策与 ...