Workflow
语言
icon
Search documents
从2025意大利国际近红外光谱学术会议看技术发展新趋势
仪器信息网· 2025-07-22 03:24
导读: 中国认证认可协会检测分会联合北京信立方科技发展股份有限公司正式启动"国仪高品"认证,欢迎 有意向企业申报! 特别提示 微信机制调整,点击顶部"仪器信息网" → 右上方"…" → 设为 ★ 星标,否则很可能无法看到我 们的推送。 单位: 中 石 化 石 油 化 工 科 学 研 究 院 有 限 公 司 近红外光谱(NIRS)技术作为现代分析科学的重要工具,近年来在硬件创新、算法优化和应 用拓展等方面均取得了突破性进展。2 0 2 5年意大利国际近红外光谱学术会议集中展示了全球最 新研究成果,从微型化传感器、智能算法到跨行业应用,全面勾勒出该技术的发展脉络与未来 趋势。本次会议凸显了三大核心方向:一是仪器硬件的革新,尤其是微小型便携式设备,在食 品安全、药品检测和农业监测等领域实现了高精度现场分析;二是数据处理方法的进阶,化学 计量学与深度学习的深度融合显著提升了模型的解释性和泛化能力,而开放集识别、迁移学习 等技术进一步解决了小样本和跨设备兼容性问题;三是应用场景的多元化拓展,从传统农业、 化 工 向 环 境 监 测 、 医 疗 诊 断 及 智 能 制 造 延 伸 , 结 合 高 光 谱 成 像 、 多 ...
分析了102个VLA模型、26个数据集和12个仿真平台
自动驾驶之心· 2025-07-22 02:18
点击下方 卡片 ,关注" 具身智能 之心 "公众号 编辑丨具身智能之心 本文只做学术分享,如有侵权,联系删文 >> 点击进入→ 具身智能之心 技术交流群 更多干货,欢迎加入国内首个具身智能全栈学习社区 : 具身智能之心知识星球 (戳我) , 这里包含所有你想要 的。 出发点与工作背景 视觉 - 语言 - 动作(VLA)模型是机器人技术的变革性突破,其核心是将视觉感知、自然语言理解与具身 控制整合到单一学习框架中。本综述聚焦机器人操作与指令驱动自主性,全面梳理了 102 个 VLA 模型、26 个基础数据集和 12 个仿真平台,它们共同推动了 VLA 模型的发展与评估。模型被归为不同架构范式,体 现了视觉、语言和控制在机器人系统中整合的多样策略。对于基础数据集,基于任务复杂性、模态多样性 和规模建立新评估标准,还通过二维框架按语义丰富度和多模态对齐进行组织,揭示了数据领域的未探索 区域。仿真环境的评估围绕大规模数据生成效率、虚实迁移能力及任务多样性展开。综合学术与工业界成 果,明确了当前挑战,并指出可扩展预训练协议、模块化架构设计和稳健多模态对齐策略等发展方向。本 综述兼具技术参考价值与概念路线图意义,涵盖从数 ...
梳理了1400篇研究论文,整理了一份全面的上下文工程指南 | Jinqiu Select
锦秋集· 2025-07-21 14:03
几天前,Manus发布了一篇关于上下文工程的实践心得,分享了团队在实际开发中遇到的具体问题和教训。虽然这些一手经验极具参考价值,但正如Manus团队所 说,这些都是他们达到的"局部最优解"。对于想要深入理解上下文工程这一新兴领域的读者来说,可能还需要一个更系统的理论框架来指导实践。 恰逢其时,中国科学院计算技术研究所、加州大学默塞德分校、昆士兰大学、北京大学、清华大学等机构的学者联合发表了题为《A Survey of Context Engineering for Large Language Models》的综述文章。 这篇综述通过分析超过1400篇研究论文,首次为上下文工程建立了完整的技术体系。文章将其分解为三大基础组件(信息获取与生成、信息处理、信息管理)和四 大系统实现(RAG系统、记忆系统、工具集成推理、多智能体系统),不仅梳理了当前的技术路线图,还提出了当前存在的不足:当前模型在理解复杂上下文方面 表现出色,但在生成同等复杂度的长篇输出时却存在明显不足。 锦秋基金认为,这篇综述为上下文工程领域提供了理论框架和系统化视角,与Manus的实践经验形成了理论与实践的互补,因此也做了编译 01 Conte ...
机器人「GPT时刻」来了?丰田研究院悄悄做了一场最严谨的VLA验证
具身智能之心· 2025-07-21 08:42
>> 点击进入→ 具身 智能之心 技术交流群 更多干货,欢迎加入国内首个具身智能全栈学习社区 : 具身智能之心知识星球 (戳我) , 这里包含所有你想要的。 提到机械臂,第一反应的关键词是「抓取」,高级些的机械臂也就做做冰淇淋和咖啡之类的小任务。 但若要机械臂 自 主完成繁 重且复杂的任务 ,如布置餐桌、组装自行车,难度便呈指数级上升。这类任务对感知、理解与动作控制的协同提出了极高要求。 近年来,随着 视觉 - 语言 - 动作(VLA) 模型的迅速发展,机器人已逐步具备整合多模态信息(如图像、指令、场景语义)并执行复杂任务的能力,朝着更智 能、更通用的方向迈进。 但是目前 VLA 的研究尚未达到里程碑式的成果,具身智能的「GPT」似乎离我们还很遥远。 作者丨 机器之心 编辑丨 机器之心 点击下方 卡片 ,关注" 具身智能之心 "公众号 前英伟达学者 Jiafei Duan 表示: 直到我看到了这两段视频: 机械臂在现实世界中已经能够实现双臂写作,完成如此复杂的组合任务,并且还能够在操作过程中纠错。这相比过去的 VLA 研究成果有了非常明显的提高。 深入探索了一下这份研究,作者在 VLA 的思路基础上更进一步, ...
VLN-PE:一个具备物理真实性的VLN平台,同时支持人形、四足和轮式机器人(ICCV'25)
具身智能之心· 2025-07-21 08:42
本文只做学术分享,如有侵权,联系删文 点击下方 卡片 ,关注" 具身智能 之心 "公众号 作者丨 Liuyi Wang等 编辑丨具身智能之心 >> 点击进入→ 具身智能之心 技术交流群 更多干货,欢迎加入国内首个具身智能全栈学习社区 : 具身智能之心知识星球 (戳我) , 这里包含所有你想要 的。 写在前面&出发点 近年来,视觉-语言导航(VLN)领域的进展颇具前景,但该领域对机器人运动和控制的理想化假设,并未 反映出物理具身部署所面临的挑战。为弥合这一差距推出了VLN-PE——一个具备物理真实性的VLN平台, 可支持人形、四足和轮式机器人。首次在物理机器人环境中,通过不同技术流程,对多种以ego为中心的 VLN方法进行了系统性评估,包括用于单步离散动作预测的分类模型、用于密集路径点预测的扩散模型, 以及与路径规划相结合的无训练、基于地图的大型语言模型(LLM)。研究结果显示,由于机器人观测空 间有限、环境光照变化,以及碰撞和跌倒等物理挑战,模型性能出现了显著下降。这也暴露了足式机器人 在复杂环境中的运动限制。VLN-PE具有高度的可扩展性,能够无缝集成MP3D之外的新场景,从而实现更 全面的VLN评估。尽管 ...
“AI教父”辛顿最新访谈:没有什么是AI不能复制的,人类正失去最后的独特性
3 6 Ke· 2025-07-21 08:19
7月21日消息,被誉为"AI教父"的图灵奖得主杰弗里·辛顿与AI初创公司Cohere联合创始人尼克·弗罗斯特近日进行了一场炉边对话。作为 辛顿在多伦多Google Brain实验室的首位员工,弗罗斯特如今已成为AI创业领域的领军人物。 在这场对话中,两位顶尖专家围绕AI领域的前沿议题展开深入探讨,包括:大语言模型是否真正理解人类语言?数字智能能否真正超越 生物智能?哪些领域将成为AI最具潜力的应用场景?科技巨头对监管的真实态度又是如何?此外,他们还重点讨论了AI技术带来的双重 危险,并就如何建立有效的安全防护体系进行了交流。 以下是辛顿与弗罗斯特的核心观点: 4.当前模型无法像人类一样根据经验持续学习,只能通过两个阶段(预训练+强化学习)静态获得知识。更新知识仍需重训底层模型 5.弗罗斯特与辛顿都认为,"语言即操作系统"的时代即将到来。只通过自然语言,用户就能调动办公系统执行复杂任务。 6.辛顿强调AI带来的双重风险:短期内可能用于操纵选举、制造武器;长期则可能因超越人类智慧而"接管世界"。 7.辛顿认为,大模型通过压缩连接数量、寻找知识间深层联系展现出真正的"创造力",甚至超越大多数人类。 8.辛顿认为5年 ...
别再乱试了!Redis 之父力荐:写代码、查 bug,这 2 个大模型封神!
程序员的那些事· 2025-07-21 06:50
就在 5 月 30 日凌晨, Redis 之父 antirez 写了一篇文章,他认为「人类程序员仍比 LLM 更胜一筹」 。 7 月 20 日,他又写了一篇文章,分享了对 LLM 编程的最近看法。 一年半前,我写过一篇题为《2024 年初的 LLM 与编程》的博客。当时,我就发现 LLM 已经很有用了,但在 这一年半里,它们的进步彻底改变了整个局面。然而,要充分利用它们的能力,与 LLM 交互的人类必须具备 某些特质并遵循特定的做法。下面我们就来探讨这些内容。 多数情况下拒绝"氛围编程" 以下是原文翻译: 2025 年夏天,与 LLM 并肩编程(最新进展) 像 Gemini 2.5 PRO 这类前沿的大语言模型(LLM),不仅对众多领域有着广泛的理解,还能在几秒内掌握数 千行代码,它们能够拓展并增强程序员的能力。只要你能清晰地描述问题,并且愿意在与 LLM 协作过程中进 行必要的反复沟通,就能取得惊人的成果,例如: 1、在代码触及任何用户之前消除你引入的 bug:我在 Redis 的 Vector Sets 实现中就有这样的经历。最终我 肯定能消除所有 bug,但很多 bug 通过 Gemini/Claude ...
还不知道研究方向?别人已经在卷VLA了......
自动驾驶之心· 2025-07-21 05:18
最近有同学陆续来问我们,传统的感知、规划这块还能继续发论文吗?感觉工作都已经被做的七七 八八了,审稿人会打高分吗? 说到传统的感知、规划等任务,工业界都还在继续优化方案!但学术界基本都慢慢转向大模型与 VLA了,一个还有很多工作可以做的子领域...... 如果您真的需要选择论文研究方向,我们建议向大模型、VLA靠拢。而我们也为大家准备好了VLA 相关研究课题,如果您还没有切实的自驾研究方向,欢迎加入学习。 ⼀、VLA科研论文辅导课题来啦⭐ 关键词 :VLA自动驾驶;端到端自动驾驶;大语言模型;视觉表征学习 ⼆、课程目的⭐ 三、招生人数⭐ 6人/期(⾄多8人) 四、招生对象⭐ 五、课程收获⭐ 经典论⽂、前沿论⽂和代码实现——创新点、baseline、数据集——选题⽅法、实验⽅法、写作⽅ 法、投稿建议 端到端(End-to-End)自动驾驶旨在构建一个统一的智能模型,直接将传感器原始输入(如摄像头图 像)映射到车辆的驾驶控制指令(如转向、油门、刹车),从而替代传统的多模块、级联式架构 (感知、预测、规划、控制)。这一演进过程大致可分为以下几个阶段,而VLA模型的出现正是为 了解决前序阶段的瓶颈,标志着一个新范式的 ...
机器人的「GPT时刻」来了?丰田研究院悄悄做了一场最严谨的VLA验证实验
机器之心· 2025-07-21 04:04
机器之心报道 编辑:冷猫 提到机械臂,第一反应的关键词是「抓取」,高级些的机械臂也就做做冰淇淋和咖啡之类的小任务。 但若要机械臂 自 主完成繁 重且复杂的任务 ,如布置餐桌、组装自行车,难度便呈指数级上升。这类任务对感知、理解与动作控制的协同提出了极高要求。 近年来,随着 视觉 - 语言 - 动作(VLA) 模型的迅速发展,机器人已逐步具备整合多模态信息(如图像、指令、场景语义)并执行复杂任务的能力,朝着更智 能、更通用的方向迈进。 但是目前 VLA 的研究尚未达到里程碑式的成果,具身智能的「GPT」似乎离我们还很遥远。 直到我看到了这两段视频: 机械臂在现实世界中已经能够实现双臂写作,完成如此复杂的组合任务,并且还能够在操作过程中纠错。这相比过去的 VLA 研究成果有了非常明显的提高。 深入探索了一下这份研究,作者在 VLA 的思路基础上更进一步,在扩散模型策略的基础上,完全构建了一个针对机器人的 大型行为模型(Large Behavior Model,LBM) ,经过训练和微调,便能够实现机械臂自主执行复杂操作中如此令人惊艳的结果。 来自谷歌的研究者 Ted Xiao 说: 「如果你从事机器人技术和人工智 ...
潮玩公司TOYCITY表示下阶段拼的是更智能和拟人化
中经记者 李玉洋 上海报道 1998年,一部动画电影《玩具总动员》让孩子相信玩具也有生命;而如今,大模型的注入让玩具不再是 专属于孩童的陪伴伙伴。 "现代社会中,30+职场女性深夜无人倾诉、双职工家庭孩子无人陪伴等现象越来越普遍,我们希望通 过科技手段,让潮玩IP真正成为用户的情感寄托。"7月18日,专注于"中国原创潮流IP孵化"的TOYCITY 公司发布了全球首款情绪感知型AI陪伴玩偶——小耙AI。据介绍,其基于TOYCITY原创熊猫IP"耙老 师"打造,具有全面融入豆包大模型、生成式统一画像算法等核心技术突破。 据了解,TOYCITY诞生于有着"中国潮玩之都"称号的广东省东莞市,具体坐落于该市的石排镇,而作 为"潮玩名镇",石排是东莞潮玩产业产值最大、拥有潮玩企业及自主品牌最多的镇街,为迪士尼、漫威 以及泡泡玛特等国内外知名品牌提供代加工服务。 以石排镇为核心的东莞市,聚集了超过4000家玩具生产企业,近1500家上下游配套企业,是全国最大的 玩具出口基地。这里出产了全国超八成的潮玩相关产品、全球近三成的动漫衍生品,产品远销美国、日 本、法国等多个国家和地区。 从最初的小作坊,到后来的贴牌代工厂,经过40 ...