训练

Search documents
VLN-PE:一个具备物理真实性的VLN平台,同时支持人形、四足和轮式机器人(ICCV'25)
具身智能之心· 2025-07-21 08:42
本文只做学术分享,如有侵权,联系删文 点击下方 卡片 ,关注" 具身智能 之心 "公众号 作者丨 Liuyi Wang等 编辑丨具身智能之心 >> 点击进入→ 具身智能之心 技术交流群 更多干货,欢迎加入国内首个具身智能全栈学习社区 : 具身智能之心知识星球 (戳我) , 这里包含所有你想要 的。 写在前面&出发点 近年来,视觉-语言导航(VLN)领域的进展颇具前景,但该领域对机器人运动和控制的理想化假设,并未 反映出物理具身部署所面临的挑战。为弥合这一差距推出了VLN-PE——一个具备物理真实性的VLN平台, 可支持人形、四足和轮式机器人。首次在物理机器人环境中,通过不同技术流程,对多种以ego为中心的 VLN方法进行了系统性评估,包括用于单步离散动作预测的分类模型、用于密集路径点预测的扩散模型, 以及与路径规划相结合的无训练、基于地图的大型语言模型(LLM)。研究结果显示,由于机器人观测空 间有限、环境光照变化,以及碰撞和跌倒等物理挑战,模型性能出现了显著下降。这也暴露了足式机器人 在复杂环境中的运动限制。VLN-PE具有高度的可扩展性,能够无缝集成MP3D之外的新场景,从而实现更 全面的VLN评估。尽管 ...
手术刀式去噪突破LLM能力上限,从头预训练模型下游任务平均提高7.2% | 中科院&阿里
量子位· 2025-07-21 04:23
RefineX团队 投稿 量子位 | 公众号 QbitAI 在噪声污染严重影响预训练数据的质量时,如何能够高效且精细地精炼数据? 中科院计算所与阿里Qwen等团队联合提出 RefineX ,一个通过程序化编辑任务实现大规模、精准预训练数据精炼的新框架。 其核心优势在于: 将专家指导的高质量端到端优化结果,蒸馏为极简的基于编辑操作的删除程序 。 通过这一高精度蒸馏流程,可以训练出高效可靠的优化模型(refine model),系统地优化语料中的每个实例。 在高效精炼数据的同时,可靠地保留原始文本的多样性和自然性。 用RefineX净化后的20B token数据训练750M模型时,其在常识推理、科学问答等10项任务的平均得分达到44.7,较原始数据提升 7.2% 。 大模型的预训练数据 预训练数据的质量直接决定了模型的知识深度与推理能力上限。 当互联网成为海量训练数据的来源,噪声污染也随之而来——植入的广告、破碎的HTML标签、无意义的乱码等,不仅降低数据效用,更可能 引发模型幻觉。 然而,大规模的去除这些噪声来提升预训练数据的质量是十分困难的,因为同时要兼顾两个要素: 传统数据精炼方案主要集中于 规则过滤 和 ...
机器人的「GPT时刻」来了?丰田研究院悄悄做了一场最严谨的VLA验证实验
机器之心· 2025-07-21 04:04
机器之心报道 编辑:冷猫 提到机械臂,第一反应的关键词是「抓取」,高级些的机械臂也就做做冰淇淋和咖啡之类的小任务。 但若要机械臂 自 主完成繁 重且复杂的任务 ,如布置餐桌、组装自行车,难度便呈指数级上升。这类任务对感知、理解与动作控制的协同提出了极高要求。 近年来,随着 视觉 - 语言 - 动作(VLA) 模型的迅速发展,机器人已逐步具备整合多模态信息(如图像、指令、场景语义)并执行复杂任务的能力,朝着更智 能、更通用的方向迈进。 但是目前 VLA 的研究尚未达到里程碑式的成果,具身智能的「GPT」似乎离我们还很遥远。 直到我看到了这两段视频: 机械臂在现实世界中已经能够实现双臂写作,完成如此复杂的组合任务,并且还能够在操作过程中纠错。这相比过去的 VLA 研究成果有了非常明显的提高。 深入探索了一下这份研究,作者在 VLA 的思路基础上更进一步,在扩散模型策略的基础上,完全构建了一个针对机器人的 大型行为模型(Large Behavior Model,LBM) ,经过训练和微调,便能够实现机械臂自主执行复杂操作中如此令人惊艳的结果。 来自谷歌的研究者 Ted Xiao 说: 「如果你从事机器人技术和人工智 ...
Grok 4遥遥领先,但马斯克想要得更多
首席商业评论· 2025-07-21 03:34
这是一场停不下来的豪赌。 Grok4真的很强 近期马斯克发布了"世界上最强的AI模型",有人直言道AGI在这里已经实现了。xAI 发布了两个版本,分别 是 Grok 4 和 Grok 4 Heavy。两者都是推理模型,前者是单代理版本,Grok-4 Heavy 则是多代理版本,支持 四个代理同时工作。 "Grok 4 是在所有学科里都达到研究生水平的,甚至比大多数 PhD 都强。"直播晚点 1 小时后,马斯克首先 给 Grok 最新一代的水平如此定位。 除了在 SAT、GRE 考试中取得近乎完美的成绩,在「人类终极考试(HLE)」测试里,Grok 4 现在的得分 比 Gemini 2.5 Pro、o3 都高,Grok 4 Heavy 版本更是突破了 40%。相比Kimi(以中文处理见长),Grok4 的多语言支持更全面,尤其在英语和编码混合任务中领先。Kimi虽快,但Grok4的深度思考能力让它在科研 场景中更可靠。 在编码与软件工程方面: SWE-Bench基准:Grok4约60%以上,高于GPT-4.5的54.6%、Gemini 2.5 Pro的类似 分数。Claude 4虽达72.7%,但Grok4在代 ...
种子轮融资144亿!VC直言:投的就是她!
Sou Hu Cai Jing· 2025-07-21 00:47
文:韦亚军 摄影:Bob君 她曾参与策划了罢免Sam Altman的行动,但后来态度出现反转。 近日,AI创业公司 Thinking Machines Lab(思维机器实验室,以下简称:TML)宣布完成20亿美元 (约合144亿元人民币)种子轮融资,投后估值120亿美元,创下全球风投史上最大单笔种子轮融资纪 录。 此轮领投方为知名VC机构a16z创投,英伟达、AMD、Accel、ServiceNow、思科、简街资本(Jane Street)等知名VC和大厂跟投。 TML公司创始人就是OpenAI前CTO米拉·穆拉蒂,卷入过OpenAI内斗。她 曾参与策划了罢免Sam Altman的行动,但后来态度出现反转。这一点留在文末展开讲。 按照TML规划,此次融资款主要用于算力采购、人才招募及多模态大模型预训练。目前,TML已与 Google Cloud签订多年期GPU/TPU采购协议,合同金额未披露。 今年6月份有市场消息称,其估值还仅为100亿美元。没想到短短一个左右的时间,最终交割价格就被抬 升至120亿美元,溢价20%。 公司还是0产品, 却估值120亿美元 TML正式创立于今年2月份,公司仍处于"隐形模式", ...
人形机器人产业链展更新
2025-07-21 00:32
人形机器人产业链展更新 20250720 摘要 特斯拉可能因谐波减速机在高强度使用下的磨损问题,考虑更换为更耐 用的减速器方案,并进行硬件调整,导致第三代机器人发布推迟 4-6 个 月,预计在今年三季度末或四季度推出。 国内机器人行业涌入众多大厂,如传统汽车零部件企业、手机公司及互 联网公司,加速行业发展,并积极探索各自的落地场景,不再局限于演 示阶段,下半年将重点关注实际应用。 人形机器人底层技术主要集中在 VRA 操作、VRA 后训练及强化学习三 个方向,通过强化学习提高 VRA 操作的成功率,以实现商业化应用,类 似于大语言模型优化答案质量。 灵巧手市场出现分化,前期效果不理想导致部分公司订单减少,抓取算 法缺乏有效方法限制市场扩展,许多公司转而使用专用夹具或夹爪,算 法发展将持续影响市场规模。 零部件成熟度显著提升,尤其在谐波减速机等关节部分,但特斯拉更换 的新型减速机结构(如摆线针轮)成熟度仍需验证,可能还面临控制算 法进展受挫等内部问题。 Q&A 特斯拉在机器人方案上的最新变化是什么? 特斯拉最近对其机器人方案进行了更新,主要集中在提高机器人的寿命和抗冲 击性。原先的设计中,特斯拉使用了谐波减速机 ...
“这称得上是一场战斗”,在“锋刃”现场直击国际狙击手巅峰对决
Huan Qiu Shi Bao· 2025-07-20 22:57
【环球时报综合报道】在军事题材影视作品中,狙击手一直是最具传奇色彩的角色之一,其冷静且敏锐的人物形象令人好奇。在真实的特战场景中,狙击手 也被誉为特战力量"精锐中的精锐",其出场往往能起到"一枪定音"的效果。7月15日至19日,全球20余个国家特战队伍中的狙击精英齐聚新疆乌鲁木齐武警 部队某训练基地,竞逐"锋刃-2025"国际狙击手射击竞赛(以下简称"锋刃-2025"竞赛)。《环球时报》记者在本次比赛的现场看到,这项中国武警立足于实 战化训练以及国际军事合作的品牌赛事,在课目设置上极为贴近实战环境,参赛各国的特战精英在高度仿真的赛场中各展所长、切磋技艺。本报记者在现场 观看各国狙击手的出色表现后,深感想要培养一名优秀狙击手的不易。 综合战斗狙击部分,则以狙击小组深入敌后解救人质为战斗背景,共设置隐蔽渗透、协同接敌、定点打击、控守压制、游动反击、掩护打击、快速撤离7个 作战环节,采取综合演练的形式分段组织实施,全程贯穿组织指挥,注重战技一体运用,主要检验狙击小组在复杂环境条件下的综合战斗能力。 竞赛课目借鉴真实战例 "借鉴实战案例增强实战性,是我们此次竞赛的一大特色。"武警部队参谋部主办局的相关负责人在比赛期间 ...
游泳如何更畅快?世界冠军教你几招(健身视野·服务站)
Ren Min Ri Bao· 2025-07-20 22:12
炎炎夏日,游泳是颇受大家欢迎的运动选项。从岸上到水中,从热身准备到游泳后身体恢复,其中门道 不少。 入水前做什么准备? "安全是游泳的首要原则,既要做好环境评估,又要对自身能力水平心中有数。"浙江省温州市奥体游泳 学校教练张海强有20多年教学经验,他对游泳时的注意事项进行了介绍。 首先,要做好安全评估。 选择正规、安全的游泳场地。自然水域、公开水域情况复杂多变,除了细菌、寄生虫或污染物等隐患, 水温表层温暖、下层偏低,再加上可能有暗流,对游泳者的水平和经验要求极高,初学者务必远离。相 比之下,符合开放标准的游泳馆更安全,其对水质、照明、救生设施设备和救生员配备都有严格要求, 建议作为首选。 游泳前要评估个人身体能力。没有一定训练基础,不要贸然尝试高速、长距离游泳,避免出现体力不支 等情况。 其次,要做好热身训练。 不少人游泳时直接入水,忽略了热身环节。入水前,可在岸边做广播体操式的伸展、慢跑、模仿划水蹬 腿动作,提升肌肉温度,增加关节灵活性,为下水做好生理和心理准备。 入水后,不可马上"火力全开",应先轻轻打腿、缓慢蹬腿、滑游,让心肺系统和肌肉组织逐步适应水环 境,降低突然剧烈运动引发的抽筋等风险。 二、练习 ...
中外神枪手上演“百步穿杨”——“锋刃-2025”国际狙击手射击竞赛侧记
Xin Hua She· 2025-07-19 10:35
竞赛期间,来自白俄罗斯、哈萨克斯坦、南非、西班牙、古巴等20多个国家的50余个狙击小组齐聚新疆 乌鲁木齐,不同肤色、不同语言的狙击精英在4个类别12个实战化课目中展开角逐。 竞赛坚持技术与战术、实战与竞技相结合,紧扣国际特种作战演变趋势,在狙击距离、人装结合、技战 协同等方面进行升级,为各国反恐力量搭建了一个交流展示的竞技平台。 "锋刃-2025"国际狙击手射击竞赛19日在新疆乌鲁木齐武警部队某训练基地落下帷幕。这是中国武警部 队第四次成功举办"锋刃"系列国际狙击赛事。 此外,在上一届竞赛的基础上,这次竞赛迭代升级了智能裁评系统。这套系统具备信息录入、智能评 分、录像监控等功能,120多个靶位高清摄像机覆盖竞赛场地,实现命中效果远程可视、成绩评定系统 生成、比赛结果实时更新。 "竞赛参与国家多,只有让每名参赛选手第一时间看到自己的射击情况,才能让竞赛裁评更快、更准、 更公平公开。"裁判郑印表示,今年,武警部队还创新配备了赛事直播导播系统,能够实时直播比赛情 况。 交流共进 "暗箭刀锋"课目将中国古代传说中的神兵利刃"轩辕剑"嵌入竞赛场景,"百步穿杨"课目则将目标靶设置 成铜钱样式,呈现中国古代善射者的故事,两 ...
中国汽研申请一种基于生成式预训练架构的电池系统运行数据生成方法专利,输出大量电池系统运行数据
Jin Rong Jie· 2025-07-19 04:48
金融界2025年7月19日消息,国家知识产权局信息显示,中国汽车工程研究院股份有限公司申请一项名 为"一种基于生成式预训练架构的电池系统运行数据生成方法"的专利,公开号CN120336854A,申请日 期为2025年04月。 天眼查资料显示,中国汽车工程研究院股份有限公司,成立于2001年,位于重庆市,是一家以从事专业 技术服务业为主的企业。企业注册资本100418.0587万人民币。通过天眼查大数据分析,中国汽车工程 研究院股份有限公司共对外投资了36家企业,参与招投标项目5000次,财产线索方面有商标信息378 条,专利信息1836条,此外企业还拥有行政许可98个。 专利摘要显示,本发明涉及电池系统技术领域,具体涉及一种基于生成式预训练架构的电池系统运行数 据生成方法,包括以下步骤:收集少量的真实电池系统运行数据;对收集到的少量的真实电池系统运行 数据,基于预设的数据预处理策略,对真实电池系统运行数据进行清洗,去除异常值和噪声数据;根据 清洗后的真实电池系统运行数据,基于预设的特征提取策略,提取与电池系统运行状态和性能相关的关 键运行特征;从噪声分布向量中随机获取采样噪声向量,基于预先构建的生成式对抗网络 ...