Workflow
学习
icon
Search documents
小米社招&校招 | 自动驾驶与机器人具身智能算法研究员 (VLA方向)
具身智能之心· 2025-07-03 13:36
职位描述 我们正在寻找一位杰出的研究员/科学家,加入我们的前沿探索团队,共同定义和构建下一代自动驾驶与机器人 的"大脑"。您将致力于突破性的具身基座模型 (Embodied Foundation Model) 的研究,该模型将深度融合视觉-语 言-行动 (VLA) 能力,并具备卓越的空间感知与空间推理能力。 核心职责包括 前沿算法研究与构建:负责设计和实现领先的具身多模态大模型。您的研究将不仅限于现有的VLA框架,更将 探索如何构建能够理解复杂三维世界、并进行长时序、多步骤任务规划的世界模型 (World Model)。 核心模型能力攻关:主导模型在以下关键能力上的突破: 多模态场景理解:融合视觉、语言、雷达等多源信息,实现对动态、开放环境的深刻理解和空间感知。 学习与适应机制:深入研究强化学习 (RL)、模仿学习 (IL) 及自监督学习方法,使模型能从海量数据和与环境的 交互中持续学习和进化。 技术愿景与路线图:主导构建可泛化、高效率的具身智能基座模型,为未来1-3年的技术演进提供核心支撑,并 探索其在自动驾驶和通用机器人领域的统一应用潜力。 复杂语义推理与决策:让模型能够理解模糊、抽象的人类指令,并结合对 ...
卡耐基梅隆大学!Human2LocoMan:通过人类预训练学习多功能四足机器人操控
具身智能之心· 2025-07-03 13:36
点击下方 卡片 ,关注" 具身智能 之心 "公众号 作者丨 Yaru Niu等 编辑丨具身智能之心 本文只做学术分享,如有侵权,联系删文 >> 点击进入→ 具身智能之心 技术交流群 更多干货,欢迎加入国内首个具身智能全栈学习社区 : 具身智能之心知识星球 (戳我) , 这里包含所有你想要 的。 出发点与工作背景 四足机器人虽在复杂环境中移动能力出色,但赋予其可扩展的自主多功能操作技能仍是重大挑战,为此本 文提出一种用于四足操作的跨实体模仿学习系统,该系统利用从人类和配备多种操作模式的四足机器人 LocoMan 收集的数据,通过开发远程操作和数据收集管道来统一并模块化人类和机器人的观察空间与动作 空间,同时提出高效模块化架构以支持不同实体间结构化模态对齐数据的联合训练和预训练,还构建了首 个涵盖单手和双手模式下各种家庭任务的 LocoMan 机器人操作数据集及相应人类数据集;实验在六个真实 世界操作任务中验证,与基线相比整体成功率平均提升 41.9%、分布外场景提升 79.7%,利用人类数据预训 练后整体成功率提升 38.6%、分布外场景提升 82.7%,且仅用一半机器人数据就能持续实现更好性能。 我们的代码、 ...
你被哪个后来知道很致命的BUG困扰过一周以上吗?
自动驾驶之心· 2025-07-03 12:41
作者 | hzwer 黄哲威 编辑 | 自动驾驶之心 原文链接: https://www.zhihu.com/question/535225379/answer/1919097852895958495 点击下方 卡片 ,关注" 自动驾驶之心 "公众号 戳我-> 领取 自动驾驶近15个 方向 学习 路线 >>自动驾驶前沿信息获取 → 自动驾驶之心知识星球 本文只做学术分享,如有侵权,联系删文 来点强化学习笑话 鼓励一个走迷宫 AI 尽量去那些没见过的场景,结果 AI 找到了一个迷宫里的电视,不用动就能不断地 见到新东西 《智能体只想看电视》 模型训练很慢,随便写点 bug 很多天以后才会观察到迹象 我入门强化学习做的项目 NIPS2017-LearningToRunACE,是在虚拟环境训练一个机器人跑步,要在规定时 间跑得最远,模型输入就是各个机器人关节的速度位置,障碍物的位置等等,然后输出肌肉的舒张收缩控 制量 当年强化学习搭好框架以后,基本上就是要设计奖励或者说学习目标 先写个速度最快的学习目标 -> 学了两天一看,模型学会了跳远然后摔倒,因为蹦出去那一下挺快的摔倒惩 罚搞高点 -> 模型学会扎马步 换个惩 ...
中美AI差距有多大,AI竞争焦点在哪?《全球人工智能科研态势报告》全球首发
Tai Mei Ti A P P· 2025-07-03 10:36
Core Insights - The report titled "Global AI Research Landscape Report (2015-2024)" analyzes the evolution of AI research over the past decade, highlighting the competitive landscape between China and the United States in AI talent and publication output [2][7]. Group 1: AI Research Trends - The report identifies four distinct phases in AI research: initial phase (2015-2016), rapid development phase (2017-2019), maturity peak phase (2020-2023), and adjustment phase (2024) [4][5]. - The number of AI papers published globally increased significantly, with a peak of 17,074 papers in 2023, representing nearly a fourfold increase from 2015 [5][6]. - The year 2024 is expected to see a decline in publication volume to 14,786 papers, indicating a shift towards more specialized and application-oriented research [6]. Group 2: Talent Distribution - China has emerged as the second-largest hub for AI talent, with a total of 52,000 researchers by 2024, growing at a compound annual growth rate of 28.7% since 2015 [8]. - The United States leads with over 63,000 AI researchers, with significant contributions from institutions like Stanford and MIT, as well as tech giants like Google and Microsoft [8][9]. - Chinese institutions such as the Chinese Academy of Sciences, Tsinghua University, and Peking University are leading in terms of publication output and talent concentration [7][9]. Group 3: Institutional and Corporate Performance - The Chinese Academy of Sciences published 4,639 top-tier papers, while Tsinghua University and Peking University followed closely, showcasing China's institutional strength in AI research [7][9]. - In contrast, U.S. companies like Google, Microsoft, and Meta have a significantly higher average publication output compared to their Chinese counterparts, reflecting a disparity in research investment and output capabilities [9][10]. - The top three U.S. companies published 5,896 papers, which is 1.8 times the output of the top three Chinese companies [9][10]. Group 4: Gender Disparity in AI Talent - The report highlights a significant gender imbalance in AI research, with women making up only 9.3% of AI talent in China compared to 20.1% in the U.S. [12][13]. - Chinese institutions like Tsinghua University and Peking University have low female representation in AI, at 7.88% and 9.18% respectively, compared to 25%-30% in top U.S. institutions [12][13]. Group 5: Future Trends in AI Research - The report indicates that "deep learning" has been the dominant focus in AI research over the past decade, but its growth rate is expected to slow down, suggesting a need for new approaches [14][15]. - Emerging technologies such as "Transformers" are gaining traction, particularly in natural language processing and multimodal AI, indicating a shift in research focus [15]. - The integration of traditional AI fields with deep learning techniques is becoming more prevalent, reflecting a trend towards collaborative and interdisciplinary research [15].
上海交通大学发表最新Nature论文
生物世界· 2025-07-03 09:38
编辑丨王多鱼 排版丨水成文 热纳米光子学 在从能源技术到信息处理等各类技术应用中实现了根本性的突破。从热辐射源到热光伏和热 伪装,精确的光谱工程一直受困于反复试验的方法。与此同时, 机器学习 ( Machine Learning ) 在纳 米光子学和超材料的设计方面展现出了强大的能力。 然而,开发一种通用的设计方法来定制具有超宽带控制和精确带选择性的高性能纳米光子辐射源仍是一项 重大挑战,因为它们受到预定义的几何形状和材料、局部优化陷阱以及传统算法的限制。 2025 年 7 月 2 日,上海交通大学 周涵 教授 、 张荻 教授 、新加坡国立大学 仇成伟 教授 、德克萨斯大 学奥斯汀分校 郑跃兵 教授作为共同通讯作者 (上海交通大学 Chengyu Xiao 为第一作者 ) 在 Nature 期 刊发表了题为: Ultrabroadband and band-selective thermal meta-emitters by machine learning 的研 究论文。 该研究提出了一种基于 机器学习 ( Machine Learning ) 的 通用框架,设计出了 多种超宽带和带选择性 的热元辐射源 ( ...
AI 编程十字路口:为什么说 Copilot 模式是创业陷阱?
机器之心· 2025-07-03 08:01
机器之心原创 作者:闻菲 当整个人工智能行业都在为「如何给程序员打造更快的马」而疯狂投入时,一支特立独行的团队选择 「直接去造汽车」。 「大模型的发展,更像一场篮球比赛才刚刚打完第一节。所有人都在用第一节的比分去判断整场比赛 的胜负,但我们认为,还有第二、三、四节要打。」蔻町智能(AIGCode)创始人兼 CEO 宿文用这 样一个比喻,为当前略显拥挤的 AI 编程赛道,提供了一个不同的观察视角。 自 2022 年底 ChatGPT 引爆全球以来,AI 编程被普遍认为是大语言模型最快、最确定能实现严肃商 业化(PMF)的一个赛道。从 GitHub Copilot 的成功,到科技大厂和创业公司纷纷推出自己的编程 助手,行业似乎已经形成一种共识:AI 是程序员的「副驾驶」,其核心价值在于提升代码编写效 率。 网络结构创新是破局关键 在许多人眼中,大模型的基座之战似乎已尘埃落定。后来者尤其是创业公司,只能在应用层寻找机 会。宿文对此的看法截然不同:「我们认为大模型技术,或者说基座模型的发展,还处于婴幼儿时 期。」 他指出,现有以 Transformer 为基础的模型架构,在学习机制和知识压缩效率上存在根本性问题。 「 ...
新时代终身学习体系构建视域下继续教育与职业教育融合发展路径探究
Yang Shi Wang· 2025-07-03 07:07
要推动继续教育与职业教育深度融合,首要任务是搭建跨部门、跨领域的统筹协调机构,该机构需以教 育行政部门为牵头单位,联合人力资源和社会保障部门、行业企业代表、职业院校及继续教育机构负责 人等多方力量共同组建,其核心职责在于全面剖析两者融合发展的现实状况与存在问题,进而制定科学 合理的融合发展战略规划。 二、整合共享教育资源,实现优势互补 在师资队伍建设上需构建共享机制。职业院校与继续教育机构可互派教师交流任教,让职业院校具备丰 富实践经验的专业教师将最新行业知识技能带入继续教育课堂,同时邀请继续教育机构理论基础扎实、 教学经验丰富的教师到职业院校担任兼职教师,促进理论与实践教学融合。此外,还可联合开展教师培 训及教研活动,共同制定培训计划、组织学术交流与专业培训,定期举办联合教研会议让教师分享经验 成果,共同开发适宜融合发展的课程与教学方法。 课程资源建设要打破双方壁垒。由职业院校教师、继续教育机构教师及行业企业专家组成课程开发团 队,深入调研行业需求与学习者特点,并结合职业教育实践性和继续教育灵活性设计针对性、实用性强 的课程体系,内容涵盖职业素养、专业知识、实践技能等多方面。同时,要将现有优质课程资源数字 ...
Meta-Think ≠ 记套路,多智能体强化学习解锁大模型元思考泛化
机器之心· 2025-07-03 03:26
本文第一作者为上海交通大学计算机科学四年级博士生万梓煜,主要研究方向为强化学习、基础模型的复杂推理,通讯作者为上海交通大学人工智能学院温颖副 教授和上海人工智能实验室胡舒悦老师。团队其他成员包括来自英属哥伦比亚大学的共同第一作者李云想、Mark Schmidt 教授,伦敦大学学院的宋研、杨林易和 汪军教授,上海交通大学的温潇雨,王翰竟和张伟楠教授。 引言 最近,关于大模型推理的测试时间扩展(Test time scaling law )的探索不断涌现出新的范式,包括① 结构化搜索结(如 MCTS),② 过程奖励模型(Process Reward Model )+ PPO,③ 可验证奖励 (Verifiable Reward)+ GRPO(DeepSeekR1)。然而,大模型何时产生 "顿悟(AhaMoment)" 的机理仍未明晰。近期多 项研究提出推理模式(reasoning pattern)对于推理能力的重要作用。类似的,本研究认为 大模型复杂推理的能力强弱本质在于元思维能力的强弱。 所谓 "元思维" (meta-thinking),即监控、评估和控制自身的推理过程,以实现更具适应性和有效性的问题解决,是智 ...
大会发布 | 世界人工智能大会青年菁英交流会学术研究成果征集通知
3 6 Ke· 2025-07-03 02:53
Group 1 - The event aims to promote academic exchange and innovation collaboration among global youth AI researchers, responding to the theme of the World Artificial Intelligence Conference [3] - The initiative seeks to provide a high-standard academic exchange platform for young scholars and technology developers, facilitating the collision of academic ideas and the transformation and dissemination of research results [3] Group 2 - The call for submissions focuses on cutting-edge explorations in the field of artificial intelligence, covering areas such as large models, generative AI, computer vision, reinforcement learning, AI ethics, and interdisciplinary applications [4][5][6][7][8] - Submissions can take the form of academic posters or preprint papers, with specific guidelines for each format, including visual presentation requirements and structural expectations for research papers [8][9] Group 3 - Selected works will be showcased at the World Artificial Intelligence Conference, with opportunities for authors to present their findings and engage with industry leaders [10] - Authors may apply for direct recommendations to top international journals, including Nature Machine Intelligence, with expedited review processes for recommended papers [10][14] Group 4 - Submission materials must include a title, author information, and either a poster design file or a full preprint paper, along with a brief research highlight summary [11] - The submission deadline is July 10, 2025, with notifications of review results by July 15, 2025, and the conference scheduled for July 27, 2025, in Shanghai [12]
学习实不实  事上见真章(大家谈·不断培土加固中央八项规定堤坝③)
Ren Min Ri Bao· 2025-07-03 00:31
范奕鸣 当前,深入贯彻中央八项规定精神学习教育正在深入开展。不少地方出台规定,进一步精简会议数量、 压缩会议时长,有的还推行"无会日"制度,让干部摆脱"会海"束缚。 "无会日"的意义,并不只是规定某一天不开会,还在于树立无事不开会,有事开短会的工作导向。过 去,有的地方和部门存在"重开会轻落实"或"以会议落实会议"的倾向,让落实"悬在半空"。精简会议, 就是为了让干部不再忙于赶场开会,而是聚焦在抓落实上,聚焦在基层治理、产业发展等民生实事上。 开展深入贯彻中央八项规定精神学习教育,既要入脑入心,更要见行见效。学习教育的成效,最终要靠 工作成效来检验。本期大家谈,我们选刊3篇,与读者一起探讨,如何在学中思、查中改、改中进。 ——编 者 "无会日"更是"有为时" 营造"放手干"的氛围 刘 昕 会议精简了,腾出来的时间和精力必须用好。一来,精简意味着会议必须开得更有效率。与会人员要在 会前做足功课,摸清情况,用更多时间做调查研究,在会上则重点讲问题、谈方法、找路径。二来,精 简也意味着党员干部有更多时间精力深入一线、服务群众,必须真抓实干,认真听意见、解难题、促发 展,把工作做到群众心坎上。从这个意义上讲,"无会日 ...