端到端

Search documents
月之暗面「调教」出最强Agent,在「人类最后一场考试」拿下最新 SOTA
机器之心· 2025-06-21 05:06
机器之心报道 编辑:杨文、泽南 昨天,月之暗面发了篇博客,介绍了一款名为 Kimi-Researcher 的自主 Agent。 这款 Agent 擅长多轮搜索和推理,平均每项任务执行 23 个推理步骤,访问超过 200 个网址。它是基于 Kimi k 系列模型的内部版本构建,并完全通过端到端智能体 强化学习进行训练,也是国内少有的基于自研模型打造的 Agent。 GitHub 链接:https://moonshotai.github.io/Kimi-Researcher/ 在「人类最后一场考试」(Humanity's Last Exam) 中,Kimi-Researcher 取得了 26.9% 的 Pass@1 成绩,创下最新的 SOTA 水平,Pass@4 准确率也达到了 40.17%。 从初始的 8.6% HLE 分数开始,Kimi-Researcher 几乎完全依靠端到端的强化学习训练将成绩提升至 26.9%,强有力地证明了端到端智能体强化学习在提升 Agent 智 能方面的巨大潜力。 Kimi-Researcher 还在多个复杂且极具挑战性的实际基准测试中表现出色。在 xbench (一款旨在将 AI ...
CVPR'25端到端冠军方案!GTRS:可泛化多模态端到端轨迹规划(英伟达&复旦)
自动驾驶之心· 2025-06-19 10:47
今天自动驾驶之心为大家分享 英伟达、复旦大学 最新的工作! GTRS:可泛化的 多模式端到端轨迹规划! 如果您有相关工作需要分享,请在文末联系我们! 自动驾驶课程学习与技术交流群事宜,也欢迎添加小助理微信AIDriver004做进一 步咨询 >>点击进入→ 自动驾驶之心 『端到端自动驾驶』技术交流群 论文作者 | Zhenxin Li等 编辑 | 自动驾驶之心 论文链接:https://arxiv.org/abs/2506.06664 Github:https://github.com/NVlabs/GTRS NVIDIA技术博客:https://blogs.nvidia.com/blog/auto-research-cvpr-2025/?ncid=so-nvsh-677066 CVPR 2025 Autonomous Grand Challenge: https://opendrivelab.com/legacy/challenge2025/index.html 点击下方 卡片 ,关注" 自动驾驶之心 "公众号 戳我-> 领取 自动驾驶近15个 方向 学习 路线 端到端自动驾驶挑战赛背景 NAVSIM v2 ...
何恺明CVPR最新讲座PPT上线:走向端到端生成建模
机器之心· 2025-06-19 09:30
机器之心报道 编辑:张倩 生成模型会重现识别模型的历史吗? 今年的 CVPR 已经在美国田纳西州纳什维尔顺利闭幕。除了交流论文、互加好友,很多参会者还参加了个非常有意思的项目 —— 追星。 这个「星」自然是学术明星。从前方发来的实况来看,MIT 副教授何恺明可能是人气最高的那一个。他的讲座全场爆满,还有很多同学晒出了与恺明大神的合 影。 其实,这次现身 CVPR 会场的何恺明有着多重身份,包括但不限于最佳论文奖委员会成员、「Visual Generative Modeling: What's After Diffusion?」workshop 演讲嘉 宾等。 这个 workshop 聚焦的主题是扩散模型之后的视觉生成建模演进方向。 近年来,扩散模型迅速超越了先前的方法,成为视觉生成建模中的主导方法,广泛应用于图像、视频、3D 物体等的生成。然而,这些模型也存在一些显著的局限 性,例如生成速度较慢、生成过程中人类干预有限,以及在模拟复杂分布(如长视频)时面临挑战。 这个 workshop 旨在探索视觉生成建模中能够超越扩散模型的方法,何恺明在活动中做了主题为「Towards End-to-End Generat ...
Transformer 在具身智能“水土不服”,大模型强≠机器人强
3 6 Ke· 2025-06-18 11:55
嘉宾 | 胡亮、王鹏伟 对话 | 唐小引 2025 年被业界称为"具身智能元年"并非偶然。 自年初以来,一系列现象级事件不断将具身智能推向公众视野:从春晚开始,宇树机器人频频登上热 搜,逐渐风靡全国并走向世界;一众技术"大佬"纷纷投身机器人创业,大批创业项目集中涌现,几乎所 有人都在下注——通用机器人的时代,仿佛触手可及。 但在热潮背后,泡沫的质疑也不绝于耳。英伟达 CEO 黄仁勋的一句"通用机器人时代已经到来",在全 球技术圈引发舆论轰动。然而,另一边知名投资人朱啸虎却宣布"正批量退出人形机器人公司",引发外 界对这个赛道可持续性的担忧。 那么,具身智能到底进展如何?在技术理想和工程现实之间,它面临着哪些关键挑战?是模型不够强、 数据不够多,还是架构不够灵活?从"整花活"到"干真活",中间到底还隔着多远的距离? 带着这些问题,由 CSDN 主办的《万有引力》栏目特别邀请到了两位深耕 AI 与机器人领域的一线专 家:同济大学计算机科学与技术学院教授、博导胡亮,智源具身智能大模型负责人、RoboBrain 与 RoboOS 负责人王鹏伟做客直播间,在 CSDN &《新程序员》执行总编、《万有引力》主理人唐小引的 ...
理想一篇论文入选近半年端到端自动驾驶推荐度最高的10篇论文
理想TOP2· 2025-06-18 11:43
以下文章来源于深蓝AI ,作者深蓝学院 深蓝AI . 专注于人工智能、机器人与自动驾驶的学习平台。 近半年端到端自动驾驶推荐度最高的10篇论文,是由深蓝AI调研了数十位自动驾驶一线研究者后得出的。 深蓝AI自己的定位是人工智能、机器人与自动驾驶的学习平台,受众是相关的技术从业人员。 原标题是" 盘点|近半年「端到端自动驾驶」推荐度最高的10篇论文 ",并没有带理想,这10篇论文本身也是去中心化排列的,不存在理想公关的 部分。 TOP2非常明显得感知到过去一年,理想在面向自动驾驶从业群体的号的存在感越来越强,甚至可以说,如果是面向母语为中文的自动驾驶从业群 体的号,在过去一年,已经不可能不多发几篇理想的内容。目前理想在面向AI从业群体的号的存在感,还不算特别强,还是有不少AI号主对理想做 AI感知不强。 额外提醒读者留意3点: 1. 李想在24Q4电话会议上比喻端到端是猴子开车,VLM是副驾的人类,给猴子一些指令,VLA是主驾就是人类在开车。即我们合情预期,VLA的 拟人感可以明显比VLM上一个台阶。 从技术架构来说,VLM是两个系统,系统1本质是通过模仿学习的方式端出轨迹,不具备任何语意理解的能力。(对应猴子 ...
还不知道发什么方向论文?别人已经投稿CCF-A了......
具身智能之心· 2025-06-18 03:03
辅导老师介绍 老师均在CVPR、ICCV、ECCV、ICLR、RSS、ICML、ICRA等顶级会议上发表论文,有较丰富的 指导经验。 学员要求 自带一份简历,学校背景:国内TOP100高校,国外QS200以内; 具身智能之心论文辅导正式推出啦!去年的成果还算不错,几个同学中了CVPR和ICRA等会议, 今年和老师们沟通过后,准备继续辅导几名同学冲下顶会,感兴趣的同学可以咨询,辅导方向如 下。 主要方向 更多咨询 多模态大模型,VLA、机器人导航、机器人抓取、具身泛化、具身合成数据、端到端具身智能 体、3DGS等方向; 详细内容欢迎添加微信:oooops-life,做进一步了解。 ...
100万片才能回本!蔚小理为啥还要扎堆造芯片?
电动车公社· 2025-06-17 16:28
关注 「电动车公社」 和我们一起重新思考汽车 2021年前后, 车端算力之争 正式拉开了序幕。 其"始作俑者",就是大名鼎鼎 的 英伟达Orin-X 芯片 :254TOPS的算力不仅吊打Mobileye Q5H芯片的24TOPS,甚至连特斯拉的HW3.0,也难以望其项 背。 英伟达卷算力的方式,也非常简单粗暴: 一颗不够上两颗,两颗不够上四颗。 于是就出现了蔚来 这种一口气装了 4 颗 Orin-X ,算力直超 1000TOPS的狠 货 。 在整整4年的时间里,主流车型的算力一直在80~1000TOPS之间徘徊。直到今年,车端算力之争 开启了 2.0 时代。 只不过,这次的主导者似乎变成了 自研芯片 的 新势力 ! 率先突破算力天花板的,是去年12月上市的旗舰轿车蔚来ET9。 根据官方说法,自研的5nm 神玑 NX9031 芯片, 单颗 算力和4颗 Orin-X的量级相当,ET9上配备了2颗,有望把车端算力推上 2000TOPS ; 2025 年 6 月 9 日,小鹏 G7 亮相,顶配版搭载了3颗小鹏自研的 图灵 AI 芯片, 有效算力 飙升至 2200TOPS ,成了量产车算力的"新王"。 无独有偶,理想早 ...
从扭秧歌到跑半马:机器人离「iPhone时刻」还有多远?
机器之心· 2025-06-17 04:50
机器之心发布 机器之心编辑部 从春晚舞台上扭秧歌、转手绢,到稳健完整跑完半程马拉松…… 过去半年,一系列炫酷的表演,把人们对 机器人的认知从想象拉进了现实。 但当 AI 圈、车圈、互联网圈大佬们纷纷跻身到具身智能时,每个人都绕不开以下几个灵魂拷问:具身智能 还有哪些技术瓶颈?到底怎么落地?应该先从哪些场景开始落地?要解决用户哪些真实需求?能够做到怎 样的量产成本…… 在行业的「iPhone 时刻」真正到来前,没有人能够精准给出上述问题的全部答案。 把创新技术转化为具有商业价值的实际产品,固然需要长期的探索实践。如何尽可能缩短这条探索路径的 周期、降低成本,反而是现在具身智能赛道玩家更加关注的话题。 去年以来,面向具身智能机器人的计算开发平台,成为国内外平台型企业争相布局的全新赛道。英伟达推 出 Jetson Thor,高通、英特尔紧随其后。在国内,脱胎于地平线的地瓜机器人,去年亮相的 RDK S100 算控 一体化开发者套件也在本月正式发布。所有企业的目标只有一个,「征服」每一个机器人开发者和厂商。 在一众产品当中,RDK S100 的 80 TOPS 算力并不算「拔尖」,但却已经覆盖了 20 + 头部具身智 ...
首个转型AI公司的新势力,在全球AI顶会展示下一代自动驾驶模型
机器之心· 2025-06-17 04:50
机器之心报道 作者:泽南 L3 级别智能驾驶的关键:大算力、大模型、大数据。 端到端智能驾驶,正在沿着大模型 Scaling Laws 的道路狂奔。 上周三,全球首款 L3 级算力「AI 汽车」小鹏 G7 正式亮相,其首发搭载的三颗自研图灵 AI 芯片,超过 2200TOPS 有效算力,本地部署的 VLA+VLM 模 型等特性引发了关注。 基于超高端侧算力,小鹏 G7 行业首发了智驾大脑 + 小脑 VLA-OL 模型,第一次给智能辅助驾驶加入了「运动型大脑」的决策判断能力。 小鹏 G7 同时首发了 VLM(视觉大模型),它可以作为车辆理解世界的 AI 大脑,将会是人与汽车交互的新一代入口。作为车辆行动的中枢,可以指导智能 辅助驾驶和智舱等整车能力,未来还可以实现本地聊天、主动服务、多语言等功能。 尽管只是在后装算力的车辆上用早期版本的模型进行测试,小鹏自动驾驶基模已经展现出令人惊叹的智能和拟人水平。 同样是在上周,美国纳什维尔举行的 全球计算机视觉顶会 CVPR 2025 上,小鹏作为唯一受邀的中国车企分享了其自动驾驶基座模型的研发进展 。 小鹏自去年 5 月就宣布了量产端到端大模型上车,并构建了从算力、算法 ...
从苹果复盘再谈理想:是智能机,而非家电
Tianfeng Securities· 2025-06-16 05:09
作者: 分析师 孙潇雅 SAC执业证书编号:S1110520080009 分析师 谢坤 SAC执业证书编号:S1110524120002 1 行业评级: 上次评级: 强于大市 强于大市 维持 ( 评级) 证券研究报告 2025年06月16日 行业报告: 行业深度研究 汽车 从苹果复盘再谈理想:是智能机,而非家电 请务必阅读正文之后的信息披露和免责申明 摘要 复盘苹果:iPhone1-4重塑智能手机标准,建立硬件+服务+生态的复合盈利体系。 iPhone1定义了智能手机,而从iPhone1到iPhone4,则通过在交互逻辑、功能集成、产品设计、软件生态四个维度均实现了根本性改变, 从产品、生态、芯片三端发力升级实现苹果护城河构建,建立硬件+服务+生态的复合盈利体系。 2024 年收入构成中,iPhone 产品占比高达 51.45%;服务收入占比 24.59%,接近iPhone产品收入一半水平,但毛利率高达 73.9%,从毛利 占比来看,服务已达约40%。 理想汽车:从增程到纯电再到All in AI,护城河逐步完善。 类似于苹果首次定义了智能手机,理想one重新定义了家用SUV。从理想ONE到热销的L系列,公司 ...