小米的MiMo-Embodied:整合自驾和具身任务,29项SOTA!
点击下方 卡片 ,关注" 具身智能 之心 "公众号 作者丨编辑丨具身智能之心 本文只做学术分享,如有侵权,联系删文 >> 点击进入→ 具身智能之心 技术交流群 更多干货,欢迎加入国内首个具身智能全栈学习社区 : 具身智能之心知识星球 (戳我) , 这里包含所有你想要的。 昨天看到了小米的MiMo-Embodied工作,一直想好好准备下解读再对外。但今天就看到了xhs的一些评论,还有某号的解读。稍微有点偏了,作为技术出身的媒 体,xiaomi内部的技术线也比较清晰了。MiMo(xiaomi models)是小米内部对大模业务线的统一称呼,MiMo-VL和MiMo-Embodied是其中两个团队。 不过本工作的核心贡献者大多是自驾&具身团队出身,看了整篇paper,确实是基于MiMo-VL架构做的,但后续大量的工作则是由自驾和具身的同学努力突破的。这 一点,罗福莉也出来澄清了。 言归正传,看看具体工作吧!MiMo-Embodied 是小米推出的首个跨具身基础模型,成功整合自动驾驶与具身智能两大领域,在 29 项相关基准测试中取得state-of- the-art(SOTA)性能,为动态物理环境中的理解与推理提供了 ...