持续学习

Search documents
中科院自动化所最新综述!VLA模型后训练与类人运动学习的共性
具身智能之心· 2025-06-29 09:51
点击下方 卡片 ,关注" 具身智能 之心 "公众号 作者丨 Tian-Yu Xiang等 编辑丨具身智能之心 本文只做学术分享,如有侵权,联系删文 >> 点击进入→ 具身智能之心 技术交流群 更多干货,欢迎加入国内首个具身智能全栈学习社区 : 具身智能之心知识星球 (戳我) , 这里包含所有你想要 的。 想象学习走路的情景:尽管祖先的经验让一些与生俱来的能力(例如:平衡感、反应)被编码到我们的 DNA中,但要真正学会走路,仍需要在真实环境中不断练习、摔倒、再爬起。经过一段时间的训练,我们 的大脑和身体会逐渐协调一致,形成与环境交互的策略。这种 由通用能力到特定技能 的转变过程在人类中 十分常见,而如今, 智能机器人 也面临着类似的挑战:即便拥有强大的预训练模型作为"大脑",在执行具 体复杂任务前,仍需要经过类似于人类学习的"后训练"阶段,才能在新环境、新任务下达到理想表现。 1. 概述 这项工作从 人类运动技能学习 的角度系统性地对总结 VLA模型(视觉-语言-动作模型) 的 后训练(post- training)策略 。其主要贡献如下: (1) 从人类运动学习视角讨论了VLA模型后训练方法 :将人类运动技能 ...
义乌商户晨练外语(经济新方位·外贸一线观察)
Ren Min Ri Bao· 2025-06-01 22:03
正在记笔记的赵璐芳说:"昨晚发货到深夜一两点,今早顶着'鸡窝头',我也要来上课。大家都在进 步,不学习,就会被落下。" 【记者手记】赵璐芳说,义乌商户最爱学习,白天在商贸城学,晚上还要报班学。曾经"鸡毛换糖"的扁 担,如今化为学习笔记;曾经走街串巷的货郎,成为驾驭数字"风帆"、搏击商海的"水手"。当商户们将 课堂搬进商铺,他们书写的不仅仅是个人的成长故事,更是一座城市发展的商业密码。勤耕好学、刚正 勇为、诚信包容,这是义乌人对义乌精神的提炼,也是他们面对未来、迎接挑战的底气所在。 (文章来源:人民日报) 今年一季度,义乌与拉丁美洲、欧盟的贸易额分别达到273.1亿元和163.6亿元,同比分别增长14.1%、 16.5%。这让商户们更加意识到掌握外语的重要性。 参加晨练的傅江燕说:"翻译软件能够救急,但还不够用。我的很多客户来自拉美,一句地道的西班牙 语问候,可以增进他们的亲近感,建立信任,促成合作。" 早晨8点40分,浙江义乌国际商贸城的不少店铺还未开门,商贸城三区60号门的大厅已热闹起来,几十 位商铺经营者正跟着老师读西班牙语:"Hola(你好)""Hasta luego(回头见)""barato(便宜的) ...
职场七年,我学会的一些事(上)
叫小宋 别叫总· 2025-05-26 00:34
我是2018年研究生毕业以后加入投资行业。不算实习,只按全职时间来算,我进入投资行业马上 满七年,我就想对我这七 年做个总结。 做这个总结的另一个原因是,开号至今,有很多朋友找我探讨过关于职业生涯,关于如何转型到 投资行业。 这篇文章大概一个月前开始写,地铁里,滴滴里,飞机高铁上,想到什么就写。一直写到今天, 写了 差不多5000 字,写不出更多了,这 7 年暂时就总结出来这5 k 字。 可能有些散,有些碎碎念,还望理解。然后因为是我个人的总结,所以一定是偏主观的,欢迎多 批评指正。 因为字太多了,我预览了多次,觉得发为两篇比较好。本篇是上篇。 (一)什么是职场 合伙人招你来,是让你创造价值。给你开 30 万年薪,是希望你给机构创造 50 万价值。然后,你 怎么在创造 50 万价值的同时,锻炼 70 万年薪对应的能力? 毕竟,当你年薪 30 万的时候,你可能会希望下一份工作是 50 万甚至 70 万年薪,对吧? 或者,假如你没有能力创造 50 万的价值,那么怎么让合伙人愿意留着你?怎么让你跳槽时候的 面试官看好你?这就需要很多技巧。 合伙人带你去见哪个大佬,不是让你去开眼界的。而是让你去和大佬的下属,打好关系 ...
LoRA中到底有多少参数冗余?新研究:砍掉95%都能保持高性能
机器之心· 2025-05-02 04:39
机器之心报道 编辑:张倩 LoRA 中到底存在多少参数冗余?这篇创新研究介绍了 LoRI 技术,它证明即使大幅减少 LoRA 的可训练参数,模型性能依然保持强劲。研究 团队在数学推理、代码生成、安全对齐以及 8 项自然语言理解任务上测试了 LoRI。发现仅训练 LoRA 参数的 5%(相当于全量微调参数的约 0.05%),LoRI 就能匹配或超越全量微调、标准 LoRA 和 DoRA 等方法的性能。 大型语言模型的部署仍然需要大量计算资源,特别是当需要微调来适应下游任务或与人类偏好保持一致时。 为了降低高昂的资源成本,研究人员开发了一系列参数高效微调(PEFT)技术。在这些技术中,LoRA 已被广泛采用。 不过,LoRA 仍然会带来显著的内存开销,尤其是在大规模模型中。因此,近期研究聚焦于通过减少可训练参数数量进一步优化 LoRA。 最近的研究表明,增量参数(微调后的参数减去预训练模型参数)存在显著冗余。受随机投影有效性和增量参数冗余性的启发,来自马里兰大学和清华大学的研 究者提出了带有降低后的干扰的 LoRA 方法—— LoRI(LoRA with Reduced Interference) 。 LoRI ...
为什么很多长期股票投资人都很长寿?
雪球· 2025-03-09 04:55
长按即可免费加入哦 风险提示:本文所提到的观点仅代表个人的意见,所涉及标的不作推荐,据此买卖,风险自负。 作者:金山投资笔记 来源:雪球 股票投资需要投资者不断学习和思考,以适应市场的变化。成功的股票投资人通常具备持续的学 习和思考能力,他们会关注市场动态、分析公司基本面、跟踪股票走势等。这种持续的学习和思 考不仅有助于他们在股市中做出明智的决策,也有助于他们的智力发展。研究表明,持续的智力 活动可以延缓大脑衰老,降低患阿尔茨海默病等症的风险。 四、丰富的业余生活 成功的股票投资人通常不会将所有精力都投入到股市中,他们还会注重培养自己的业余生活。例 如,他们可能会阅读、旅行、社交等,这些活动不仅有助于他们的身心健康,也有助于他们的社 交能力和人际关系。良好的社交关系和丰富的业余生活可以增加生活的乐趣和满足感,有助于延 长寿命。 很多长期股票投资人之所以长寿,可以从以下几个方面进行分析: 一、良好的心态 股票投资是一项高风险的活动,需要投资者具备良好的心态。成功的股票投资人往往能够克服贪 婪、恐惧等人性弱点,保持平静的心情,冷静、理智地思考。这种心态不仅有助于他们在股市中 做出明智的决策,也有助于他们的身心健康 ...