具身智能之心

Search documents
具身的「Imagenet 时刻」,李飞飞团队官宣全球顶级具身智能挑战赛
具身智能之心· 2025-09-25 00:04
编辑丨 机器之心 点击下方 卡片 ,关注" 具身智能之心 "公众号 >> 点击进入→ 具身 智能之心 技术交流群 更多干货,欢迎加入国内首个具身智能全栈学习社区 : 具身智能之心知识星球 (戳我) , 这里包含所有你想要的。 在计算机视觉的历史上,Imagenet 挑战赛曾被誉为 AI 发展的分水岭,引爆了深度学习的浪潮。那么,在具身智能与机器人领域,是否也会迎来类似的 "拐点时 刻"? 答案或许渐渐清晰。李飞飞团队与斯坦福 AI 实验室正式官宣:首届 BEHAVIOR 挑战赛将登陆 NeurIPS 2025。这是一个为具身智能量身定制的 "超级 benchmark",涵盖真实家庭场景下最关键的 1000 个日常任务(烹饪、清洁、整理……),并首次以 50 个完整长时段任务作为核心赛题,考验机器人能否在逼真 的虚拟环境中完成真正贴近人类生活的操作。 为什么 BEHAVIOR 值得关注? 与以往碎片化的基准不同,BEHAVIOR 首次提出:一个真正的家庭机器人,必须同时具备跨房间导航、双手精细操控、长期规划与动态适应等多项能力。 任务规模前所未有:覆盖 1000 个家庭活动,50 个完整长程挑战,平均单个任务需 ...
最近在具身领域做的一些事情,社区、硬件和求职......
具身智能之心· 2025-09-25 00:04
最近在具身领域做的一些事情,社区、硬件和求职...... 今年的国庆和中秋赶在一起了,首先提前祝大家节日快乐。也希望每个人都能好好放松下,包括峰哥自己也真 的需要relax下。做了这么久的社区运营和媒体,几乎每天都在线,随时都要处理同学们的问题。 最近在做一个什么事情呢?主要推进硬件和社区还有商务。 前面有很多同学一直向峰哥吐槽硬件贵、不好用。这块我们正在努力找合适的方案,不久就会推给大家。近期 正在推进一些具身产品的测试和开发,期望能给大家提供几个使用还不错的平台。到时候,会第一时间在我们 的具身智能之心知识星球公开。 还有就是想着完善社区,减少盲区和不完善的体系。体系大,零散,需要投入很多时间整理。所以小长假前, 还要努力一把子,节后给大家呈现更好的内容。 我们也陆续收到了很多高校在具身方向的招生需求,特别是RA、博士、博士后。感兴趣的同学也提前26年的 升学、工作做好准备,和老师熟悉起来,关注我们日常的一些招生信息。正在秋招或者社招的同学,简历也可 以随时砸给我们,第一时间帮大家内推。 所有的内容都会第一时间沉淀到我们的具身社区内,具身智能之心知识星球一致努力打造成为超大的具身与机 器人社区,期望能够在 ...
具身智能之心国庆&中秋福利来了!课程/社区/硬件/论文辅导等
具身智能之心· 2025-09-24 06:32
具身智能之心国庆和中秋优惠来啦! 知识星球、具身课程、硬件、论文辅导、超级折扣卡 等大额活动。 活动时间:9.24-10.12 1v1论文辅导,1000最多抵扣5000元 1v6 vla论文辅导,立减1000元 具身科研硬件 VLA、VLN、Diffusion Policy、强化学习、仿真等 多门课程8折优惠 。 超级折扣卡 购买超级折扣卡, 1年内所有课程7折优惠 。 论文辅导 知识星球 具身智能之心新人加入7折,老学员续费5折优惠。 具身课程 联系我们 添加小助理微信AIDriver005咨询更多(领取优惠券),或扫描海报二维码直接添加。 自驾 + 具 身 所有课程 预售课程除外 -班+八班。 ▲星球福利 / xing QIU FU LI 7折优惠,立减80 7折优惠, 立减99 节后将再次涨价 赠送7门精品课程 自动驾驶之心 具身智能之心 ▲福利专区 /FU LI ZHUAN QU 1. 大模型星球 99元一年,(技术 + 行 业 + 求职) 2. 1v1辅导辅导最高1000抵扣 5000 3. 1v6论文辅导立减 1000 4. 超级折扣卡:*299元自驾课程七折 优惠(一年期) ▲ 硬件福利 /YI ...
准备搞一个具身的吃瓜群!
具身智能之心· 2025-09-24 06:32
添加微信的时候记得备注:昵称+机构/公司+入群 思考了下,很有必要搞一个有趣的群。于是乎立刻创办了一个(因为精力只够维护1个的群,所以只有500 人的规模,满了就关闭新人加入),这个群后面不会转发任何具身智能之心的文章和直播类内容,仅做行 业交流、产品讨论、学术讨论, 当然也欢迎唠唠工作、求职和创业 。 最近峰哥收到具身智能之心的粉丝反馈,社区内有没有一个没那么正式的社群(就是不要每天发文章和学 术),可以每天聊一些行业、吃瓜、求职等topic。 如果大家比较感兴趣,可以加我微信oooops-life邀请入群。我们希望您是正在具身工业界就职的同学或正在 从事相关科研活动的大佬。 确实,我们的群都太过学术化了,可能和我们教育科技的IP有关。 ...
今日Talk来啦!具身智能新基建:从大模型到真实世界
具身智能之心· 2025-09-24 02:30
Core Viewpoint - The article discusses an upcoming event hosted by the Beijing Academy of Artificial Intelligence, focusing on embodied intelligence and its new infrastructure, highlighting the importance of this field in the AI industry [1]. Event Details - The event titled "AI 智原Talk" will take place on September 24, 2025, from 14:00 to 17:30 at the Beijing Zhiyuan Artificial Intelligence Research Institute [2]. - The event is organized by the Beijing Zhiyuan Artificial Intelligence Research Institute and supported by various organizations including Baidu PaddlePaddle and the China Internet Association's AI Committee [2]. Agenda Overview - The agenda includes a series of presentations: - Introduction by the Vice President of the Beijing Zhiyuan Artificial Intelligence Research Institute [3]. - Presentation on the innovative foundation of embodied intelligence by the head of embodied data [3]. - A session on the operational framework and construction of the embodied brain by the head of the large model [5]. - An upgrade of the Zhiyuan evaluation system, including the release of the autumn 2025 ranking [5]. - A discussion on the technical practices and value verification of FlagScale in embodied intelligence scenarios [5]. Participation Information - Attendees can register for the event via a QR code and join the WeChat group for further discussions on embodied intelligence [6].
【CEAIS 2025】全日程公布,参会早鸟报名火热进行中!
具身智能之心· 2025-09-24 00:04
以下文章来源于西安交大人工智能学院暨人机所 ,作者西交人机所 西安交大人工智能学院暨人机所 . 1986年西安交通大学在国内最早成立了人工智能专职研究机构——"人工智能与机器人研究所"(人机所),2018年12月在人机所的基础上成立"人工智能 学院"。 作者丨 西交人机所 编辑丨 西安交大人工智能学院暨人机所 点击下方 卡片 ,关注" 具身智能之心 "公众号 >> 点击进入→ 具身 智能之心 技术交流群 更多干货,欢迎加入国内首个具身智能全栈学习社区 : 具身智能之心知识星球 (戳我) , 这里包含所有你想要的。 第二届中国具身智能与系统大会(CEAIS 2025)将于2025年11月1日(星期六)在陕西西安建国饭店举办。本届大会紧扣具身智能前沿研究, 特邀十余位院士及近百位资深专家,通过4场主旨报告和15场技术分论坛,深入探讨具身智能基础模型、世界模型与具身学习、网联具身智 能、具身智能计算架构与芯片、具身智能驾驶、人形与仿生机器人、智能照护机器人、具身智能自动化实验室、具身智能标准化、情感具身智 能、机器人传感器、具身智能教育等热点议题。预计大会将吸引超过1000名与会者共探技术发展趋势,交流创新成果,展 ...
每当有人咨询具身入门的路线时,我一定会推荐这套完整的教程
具身智能之心· 2025-09-24 00:04
点击下方 卡片 ,关注" 具身智能 之心 "公众号 编辑丨具身智能之心 本文只做学术分享,如有侵权,联系删文 >> 点击进入→ 具身智能之心 技术交流群 更多干货,欢迎加入国内首个具身智能全栈学习社区 : 具身智能之心知识星球 (戳我) , 这里包含所有你想要 的。 具身大小脑构成了主要内容 具身智能领域主要围绕2个重要的部分展开:大脑和小脑,这是机器人最重要的模块,如果类比于人类,大 脑负责思考感知(主导语义理解和任务规划),小脑负责执行(高精度的运动执行)。 在细分领域又有仿真、vla、diffusion policy、vln、世界模型、强化等多个子模块。vla和世界模型目前正在 自驾和具身领域同时发力,代表2个不同的技术路线。 vla目前主要研究热点为端到端和分层2种方案,又分别基于大模型和diffusion技术作为拓展。现vla+rl方 案,也被越来越做学者作为探索的方向。 diffusion policy作为action模块,负责学习具体的动作和执行。主要有状态扩散、动作空间扩散、三维空间 扩散等多个方向。 仿真现在比较好的点是sim2real和real2sim2real,如何解决真机泛化差的问题是 ...
跨越仿真与真实数据鸿沟:Real2Sim2Real重要工作一览!
具身智能之心· 2025-09-24 00:04
点击下方 卡片 ,关注" 具身智能 之心 "公众号 编辑丨具身智能之心 所有内容出自国内首个具身智能全栈学习社区:具身智能之心知识星球。国庆优惠,欢迎和近2000名成员 一起交流具身产业与学术。 Real2Sim2Real近3年工作一览 论文题目: Incremental Few-Shot Adaptation for Non-Prehensile Object Manipulation using Parallelizable Physics Simulators 论文链接:https://arxiv.org/pdf/2409.13228? 论文时间: ICRA 2025 作者单位: 马克斯·普朗克智能系统研究所 论文题目: RL-GSBridge: 3D Gaussian Splatting Based Real2Sim2Real Method for Robotic Manipulation Learning 本文只做学术分享,如有侵权,联系删文 由于真实数据采集成本高,国内外具身领域有不少团队在研究real2sim、Real2Sim2Real 相关工作。和一些 具身公司坚定走真机采集路线不同,他们相信 ...
西湖大学发布世界模型WorldForge,让普通视频模型秒变「世界引擎」
具身智能之心· 2025-09-24 00:04
Core Viewpoint - The article discusses the advancements in AI video generation, particularly focusing on the World Forge framework developed by the West Lake University AGI Lab, which allows for precise control over video generation without sacrificing quality or requiring retraining of models [2][3][32]. Summary by Sections Introduction to AI Video Generation - Since the introduction of Sora, the realism of AI-generated videos has significantly improved, but controllability remains a challenge [2]. - Current methods either require expensive fine-tuning or lead to quality degradation due to noise and artifacts in guiding signals [2]. World Forge Framework - World Forge is a new framework that enables precise control during the video generation process without modifying model weights, effectively adding a "director's brain" to video diffusion models [3][32]. - The framework allows for the generation of 360° videos from a single image and the ability to reframe videos with complex camera movements [6][21]. Method Overview - The framework operates on a training-free guidance principle, injecting "spatiotemporal geometry" during inference [12]. - It employs a series of innovative guiding modules to ensure that the model adheres to spatial and temporal consistency while maintaining creative freedom [13]. Key Innovations 1. **Intra-step Recursive Refinement (IRR)**: This mechanism ensures that AI-generated movements strictly follow predefined camera trajectories by incrementally correcting predictions with real content [15]. 2. **Flow-Gated Latent Fusion (FLF)**: This module separates motion and appearance channels in the latent space, allowing precise control signals to be sent only to motion channels, preserving detail in appearance channels [16]. 3. **Dual-Path Self-Correction Guidance (DSG)**: This strategy balances trajectory accuracy and image quality by dynamically adjusting the guiding signals based on the differences between guided and non-guided paths [17]. Performance Highlights - World Forge excels in generating 360° panoramic views from a single image, overcoming limitations of traditional panorama methods [21]. - It allows for cinematic-level video reframing, enabling users to specify complex camera movements while maintaining stability and reducing artifacts [23]. - The framework supports video editing capabilities, such as stabilizing footage, removing unwanted objects, and seamlessly integrating new elements [29]. Advantages of World Forge - The training-free nature of World Forge significantly lowers the barrier to creating high-quality 3D/4D visual content, making it accessible for various applications in film, gaming, and digital twin technologies [32][34]. - Its flexibility allows it to be integrated into various mainstream video models without the need for targeted retraining, showcasing strong generalization capabilities across different domains [34].
VLA及其相关方向占据了顶会近一半的具身工作,特别是这几个......
具身智能之心· 2025-09-23 04:00
从今年各个机器人与AI顶会来看,VLA及其相关衍生方向,占据了近一半的具身产出。特别是长程操作、 泛化、少样本、VLA+RL、人形相关。 想象一下,如果能通过语言下达指令,并且丝滑执行任何你想要的动作,是一件多么幸福的事情!如果能 长时间连续动作完成,将会非常方便。下面给大家介绍下VLA到底是啥? VLA打破了传统方法的单任务局限,使得机器人能够在多样化的场景中自主决策,灵活应对未见过的环 境,广泛应用于制造业、物流和家庭服务等领域。此外,VLA模型已成为研究热点,推动了多个前沿项目 的发展,如pi0、RT-2、OpenVLA、QUAR-VLA和HumanVLA,这些研究促进了学术界与工业界的合作。 其适应性体现在能够应用于机械臂、四足机器人和人形机器人等多种平台,为各类智能机器人的发展提供 了广泛的潜力和实际应用价值,成为智能机器人领域的关键驱动力。 从产业角度看,国内外具身智能领域正处于蓬勃发展阶段,Unitree、智元、星海图、银河通用、逐际动力 等团队从实验室走向商业化,华为、京东、腾讯等科技巨头也积极布局,与国外Tesla、Figure AI等公司正 在一起推动这一领域的发展。 很多同学后台留言,咨 ...