深度强化学习

Search documents
狄耐克:脑机交互事业部提出基于深度强化学习的主动式脑机接口共同控制方案
news flash· 2025-07-02 03:19
Core Insights - Dr. Peng Junren from Dineike's Brain-Computer Interface (BCI) division published a paper in the "Annals of the New York Academy of Sciences" discussing a new approach to shared autonomy between human electroencephalography and TD3 deep reinforcement learning [1] - The study indicates that approximately 15%-30% of users are unable to effectively operate traditional BCI systems due to physiological differences, highlighting a gap in current technology that only measures internal brain activity without considering environmental factors [1] - Dineike's BCI division proposes an active BCI co-control scheme based on deep reinforcement learning, aiming to provide a new paradigm for the universal application of BCIs through collaborative decision-making between humans and AI agents [1] - The next steps for Dineike involve focusing on breakthroughs in core technologies related to brainwave interaction and the industrialization of these technologies, moving from laboratory research to practical applications [1]
具身智能领域,全球Top50国/华人图谱(含具身智能赛道“师徒关系图”)
Robot猎场备忘录· 2025-06-30 08:09
温馨提示 : 点击下方图片,查看运营团队2025年6月最新原创报告(共235页) 说明: 欢迎 约稿、刊例和商务合作、行业人士交流 , 行业交流记得先加入 "机器人头条"知识星球 ,后添加( 微信号: lietou100w )微信; 若有侵权、改稿请联系编辑运营(微信:li_sir_2020); 正文: 随着人工智能和大模型技术发展,具身智能赛道成为如今最火赛道之一;具身智能技术领域具体会涉及到大语 言模型(LLM)、视觉多模态模型(VLM)、强化学习(Reinforcement Learning)、深度强化学习(Deep Reinforcement Learning)、模仿学习(Imitation Learning)等诸多前沿技术。 人形机器人发展多年,从最初基于 模型的控制算法(LIPM+ZMP),到动态模型控制和最优控制算法 (MPC+WBC),到如今的模拟+强化学习(IL+RL),当然现阶段也有不少人形机器人公司采用MPC方式,各类 算法没有绝对的替代关系,各有优劣;IL+RL是目前人形机器人公司最常提起的概念,基本都是高校和头部科技 大厂内研发机构在研究,也是为什么目前人形机器人初创公司以"学院派" ...
港科大 | LiDAR端到端四足机器人全向避障系统 (宇树G1/Go2+PPO)
具身智能之心· 2025-06-29 09:51
以下文章来源于具身智能研究室 ,作者Yuanxq 具身智能研究室 . 分享一些深度强化学习、多/单智能体、具身智能的相关知识。有缘更新,随缘关注。希望大家互相学 习补充。 作者丨 Yuanxq 编辑丨具身智能研究室 点击下方 卡片 ,关注" 具身智能之心 "公众号 >> 点击进入→ 具身 智能之心 技术交流群 更多干货,欢迎加入国内首个具身智能全栈学习社区 : 具身智能之心知识星球 (戳我) , 这里包含所有 你想要的。 在复杂动态环境中实现四足机器人的安全高效移动,一直是机器人领域的核心挑战。传统方法 依赖深度相机或中间地图表示,难以应对三维空间中的非平面障碍、空中杂波及动态物体。香 港科技大学团队提出 Omni-Perception 框架,通过直接处理原始 LiDAR 点云数据, 实现了端到端的四足机器人全向避障能力。通过高保真 LiDAR 仿真工具和新型 PD-RiskNet 网络架构,推动了机器人在复杂三维环境中的自主导航技术。 1 、从 LiDAR 点云到全向避障的端到端设计框架 1.Omni-Perception 的核心架构解析 感知-控制一体化设计 优势: 时空信息直接利用 :避免了点 云到网格 ...
致敬钱学森,我国学者开发AI虚拟现实运动系统——灵境,解决青少年肥胖难题,揭示VR运动的减肥及促进大脑认知作用机制
生物世界· 2025-06-24 03:56
青少年肥胖 已成为全球性的公共卫生危机,其发病率正迅速上升。青少年时期的肥胖会增加患心血管代谢疾病的风险,并导致持久的认知变化。此外,青少年的 大脑尤其容易受到肥胖相关认知障碍的影响,这可能会损害诸如工作记忆之类的执行功能。 尽管体力活动 ( Physical Activity,包括 工作、家务、体育运动、娱乐活动等导致能量消耗的身体活动 ) 是一线治疗方法,但诸如运动积极性低、不良的同伴 经历以及难以获得个性化指导等障碍限制了青少年参与体力活动的意愿和实际参与度。因此,安全且富有同理心的运动干预措施对于鼓励肥胖青少年参与体力活 动至关重要,这能带来显著的健康益处。 撰文丨王聪 编辑丨王多鱼 排版丨水成文 2025 年 6 月 23 日, 上海 交通大学医学院附属 第六人民医院 /主动健康战略与发展研究院 李华婷 教授团队 、 上海交通大学计算机学院/人工智能教育部重点 实验室 盛斌 教授团队联合 上海体育大学 王继红 教授团队 、 上海科技大学 /上海临床研究中心 曾嵘 教授团队 及新加坡国立大学 林水德 教授团队 ,在国际顶 尖医学期刊 Nature Medicine 上发表了题为: Adaptive A ...
字节跳动ByteBrain团队提出秒级推理强化学习VMR系统
news flash· 2025-06-05 06:49
6月5日,字节跳动技术团队微信公众号发文称,字节跳动ByteBrain团队主导,联合UC Merced和UC Berkeley提出了VMR L,研发了一套基于深度强化学习的VMR系统,在保持近似最优性能的同时,将 推理时间压缩至1.1秒,成功实现系统性能与工业可部署性的统一。本工作已在系统顶会EuroSys25发 表。本文两位共同一作是字节跳动ByteBrain团队的实习生,研究聚焦于长期被忽视但至关重要的虚拟 机重调度(VMR)问题。(字节跳动技术团队) ...
深度强化学习赋能城市消防优化,中科院团队提出DRL新方法破解设施配置难题
3 6 Ke· 2025-06-03 07:27
近日,中国科学院空天信息创新研究院的梁浩健博士在中国地理学会地理模型与地理信息分析专业委员会 2025 年学术年会上,以「基于分层深度强化学 习的城市应急消防设施配置优化方法研究」为题做了演讲报告。以城市消防设施布局优化为切入点,系统回顾了地理空间优化领域的经典优化方法,并详 细介绍了基于深度强化学习(DRL)优化方法的优势和潜力。本文为梁浩健博士的分享精华实录。 HyperAI超神经在不违原意的前提下,对梁浩健老师的深度分享进行了整理汇总,以下为演讲实录。 地理空间优化:数学与地理的深度融合 地理空间优化是数学组合优化与地理信息科学的结合,致力于解决空间布局、资源配置等实际问题 ,在城市建设、工业园区选址、公共服务设施选址等 众多领域都具有重要的研究意义。它可以被表示为一个最优化问题,涉及决策变量、约束条件和目标函数,其中决策变量通常为整数或 0 - 1 变量。如下 图所示。 在城市建设与发展中,地理空间优化至关重要。从工业园区选址,到公共服务设施布局,它都发挥着关键作用。但传统求解方法存在诸多局限,如今,深 度学习技术为其带来了新的转机。 近日,在中国地理学会地理模型与地理信息分析专业委员会 2025 年 ...