马尔可夫决策过程

Search documents
港科大 | LiDAR端到端四足机器人全向避障系统 (宇树G1/Go2+PPO)
具身智能之心· 2025-06-29 09:51
以下文章来源于具身智能研究室 ,作者Yuanxq 具身智能研究室 . 分享一些深度强化学习、多/单智能体、具身智能的相关知识。有缘更新,随缘关注。希望大家互相学 习补充。 作者丨 Yuanxq 编辑丨具身智能研究室 点击下方 卡片 ,关注" 具身智能之心 "公众号 >> 点击进入→ 具身 智能之心 技术交流群 更多干货,欢迎加入国内首个具身智能全栈学习社区 : 具身智能之心知识星球 (戳我) , 这里包含所有 你想要的。 在复杂动态环境中实现四足机器人的安全高效移动,一直是机器人领域的核心挑战。传统方法 依赖深度相机或中间地图表示,难以应对三维空间中的非平面障碍、空中杂波及动态物体。香 港科技大学团队提出 Omni-Perception 框架,通过直接处理原始 LiDAR 点云数据, 实现了端到端的四足机器人全向避障能力。通过高保真 LiDAR 仿真工具和新型 PD-RiskNet 网络架构,推动了机器人在复杂三维环境中的自主导航技术。 1 、从 LiDAR 点云到全向避障的端到端设计框架 1.Omni-Perception 的核心架构解析 感知-控制一体化设计 优势: 时空信息直接利用 :避免了点 云到网格 ...
重磅!上海交大团队顶刊发文,革新轮腿星球车规划算法
机器人大讲堂· 2025-05-15 11:10
轮腿式星球车 , 具有多构型运动能力,有效继承了传统星球车轮式构型的移动速度、能量消耗、负载能力 优势 , 同时具备 腿式构型 的 地形适应性和 运动 灵活性 。 也因此, 多自由度轮腿混合式主动悬架星球 探 测车 近年来 逐渐成为各个国家和实验室的研究焦点。 然而,轮腿式星球车的高机动性在带来优势的同时,也带来了新的问题。它使得规划算法的复杂程度大幅 增加,特别是在密集障碍环境中,规划算法需要综合考虑机器人的几何特征、运动能力以及与环境交互的 特征。这对传统的路径规划方法而言,无疑是一项严峻的挑战。 ▍ 提出新思路,融合马尔可夫决策模型与 GF 集理论 针对上述难题,上海交通大学 何俊教授 研究团队 进行了深入研究,并 提出了 基于 扩展马尔可夫决策过 程的路径规划方法。 该研究创新性地融合了 GF 集理论与 构态 拓扑理论, 通过 构建离线运动规划库以 量化 不同动作特征的 能量消耗与 风险 ;引入 " 足端运动相关节点 " 描述 机器人与环境的交互关系;同 时 扩展传统 马尔可夫 模型至二阶性质, 以 解决路径转向时的碰撞 问题 。 此外, 研究 团队 还 提出信 息引导 的 值迭代算法,结合四叉树地图 ...