慢思考

Search documents
让机器人学会系统2慢思考,叠衣服倒咖啡等不在话下 | 上海交大&智元机器人
量子位· 2025-06-13 02:25
Hume团队 投稿 量子位 | 公众号 QbitAI 机器人也能慢思考了! 上海交通大学携手智元机器人等团队推出了Hume—— 融合系统2(System-2)慢思考的双系统VLA模型 。通过动作价值 引导的动作采样与双系统级联动作去噪,实现深度推理与实时控制的完美结合。 在涵盖长时序规划、复杂柔性物体操作等多种任务场景的广泛实验中,Hume在多种机器人平台上均展露出了惊艳表现,显 著超越当前的最先进模型。 比如像 折叠短裤 、倒咖啡等操作,Hume加持下机器人也能得心应手。在各种复杂场景中达到了91%的平均成功率。 VLA模型缺失的慢思考能力 视觉-语言-动作(VLA)模型在构建通用机器人策略方面取得了显著进展,OpenVLA、π0、GR00T等最新研究已在不同任 务中展示了较强的适应能力。 然而当前的VLA模型大多依赖于直觉反应模式,即根据当前环境"本能地"预测动作,这使得它们在解决复杂、长时序的决策 任务时表现不佳。 与之相对的是,系统2慢思考已经通过测试时计算大幅提升了大语言模型(LLM)解决复杂逻辑推理问题的能力。但将这种 思考范式应用在需要与物理世界交互的机器人上仍是一个巨大挑战。 首先, 如何让V ...
首个多模态专用慢思考框架!超GPT-o1近7个百分点,强化学习教会VLM「三思而后行」
量子位· 2025-06-06 13:45
VL-Rethinker团队 投稿 量子位 | 公众号 QbitAI 1.1 GRPO中的「优势消失」问题 (Vanishing Advantages) 在GRPO算法中,优势信号(advantage)是通过比较同一查询组内不同候选回复的奖励来计算的 。当同一个问题组内所有回答获得相同奖 励(例如,全部正确或全部错误)时,计算得到的优势信号便为零 。研究团队发现,在GRPO训练多模态模型的过程中,随着训练的推进, 出现零优势信号的样本比例显著增加,这种现象被定义为 「优势消失」 (Vanishing Advantages) 。 相比于用于更多高质量推理数据的纯文本推理,Vanishing Advantages在能力较强的多模态模型强化学习时尤其突出。 这种显著的Vanishing Advantages源于两方面原因: 在文本推理领域,以GPT-o1、DeepSeek-R1为代表的 "慢思考" 模型凭借显式反思机制,在数学和科学任务上展现出远超 "快思考" 模型 (如 GPT-4o)的优势。 然而,当战场转移至多模态推理场景时,这些「思维巨匠」却表现平平:GPT-o在MathVista、MathVerse等多模 ...
别让AI替你做判断
虎嗅APP· 2025-06-05 23:46
以下文章来源于王智远 ,作者王智远 王智远 . 商业记录者,主持人、《复利思维》《自醒》图书作者;专注于市场营销、消费心理、AI新科技、精 神生活与商业探索。 本文来自微信公众号: 王智远 (ID:Z201440) ,作者:王智远,原文标题:《别让AI替你说出那 句"我觉得"》,题图来自:AI生成 好像我们越来越倾向于, 先看AI输出的内容,再进行二次加工和优化。 我自己就是一个例子。我经常使用Notion AI,在没有AI之前和有了AI之后,我的行为发生了明显的 变化。 以前对很多信息的筛选、整理,都是我亲自搞定,现在不需要了。不用自己动手之后,我发现,自己 的注意力开始变得散漫,也不再像过去那样有强烈的思考的动力。 我现在会习惯性地先把内容丢给AI粗略过一遍,觉得有点价值,就直接导入文档。等要进一步处理 时,再继续向AI提问。 昨天凌晨,ChatGPT推出新功能,我突然冒出一个想法,过去的决策流程是:人先看内容,再做判 断,最后执行;现在则是先提出问题,AI给出建议,再确认方向,接着一步步推进下去。 AI正在重构我们对信息的处理方式,它在帮我们决定:哪些信息应该优先被看到,哪些内容更有价 值,哪些观点更值 ...
别让AI替你说出那句“我觉得”
Hu Xiu· 2025-06-05 06:41
好像我们越来越倾向于,先看AI输出的内容,再进行二次加工和优化。 昨天凌晨,ChatGPT推出新功能,我突然冒出一个想法,过去的决策流程是:人先看内容,再做判断, 最后执行;现在则是先提出问题,AI给出建议,再确认方向,接着一步步推进下去。 AI正在重构我们对信息的处理方式,它在帮我们决定:哪些信息应该优先被看到,哪些内容更有价 值,哪些观点更值得深入探讨。 这让我突然意识到一个问题:我们是否正在亲手制造一种"认知外包"的依赖? 我觉得:是。毋庸置疑,AI设计的本质是鼓励人们少思考。现在许多AI产品的底层逻辑就是"降低认知 负担",比如一键总结、自动归类、智能推荐等。 我自己就是一个例子。我经常使用Notion AI,在没有AI之前和有了AI之后,我的行为发生了明显的变 化。 以前对很多信息的筛选、整理,都是我亲自搞定,现在不需要了。不用自己动手之后,我发现,自己的 注意力开始变得散漫,也不再像过去那样有强烈的思考的动力。 我现在会习惯性地先把内容丢给AI粗略过一遍,觉得有点价值,就直接导入文档。等要进一步处理 时,再继续向AI提问。 这些功能确实提高了效率,但也在无形中引导我们放弃主动筛选和判断的过程。 这 ...
英伟达H20不让用?全国产算力深度推理模型讯飞星火X1升级,4张华为910B即可部署满血版
量子位· 2025-04-21 13:23
就在今天, 最新国产深度推理大模型升级更新 ,算力构成全国产化,在模型参数比业界同类模型小一个数量级的情况下,实现了整体效果对 标业界最高水平。 这就是讯飞星火,最新升级的推理模型X1。 一方面是通用任务效果显著提升,在通用任务效果评测中全面对标OpenAI o1和DeepSeek R1,尤其在数学、知识问答等方面表现突出。 (测试集合来源:自建测试集主要来自真实的大模型请求任务数据,来源分布包括讯飞星火APP、星火大模型API、业界主流任务数据等;公开测试集主要以数 学、答题、推理、代码等外部典型测试集为主。) 另一面值得关注的,它还 是 业界唯一一个基于全国产算力训练的推理模型。 在波云诡谲的当下,尤其算力新一波打压H20被禁之后,这样的 模型展现出来的效果和实力显得尤为受到关注。 白交 发自 凹非寺 量子位 | 公众号 QbitAI 英伟达H20也不能用了。中国大模型还能好吗? 能 。 此外,升级后的星火X1私有化部署简便,定制门槛低—— 4张910B即可部署满血版星火X1,16张910B即可完成行业定制优化 ,再次印证全栈自主可控大模型,具备登顶高水平的实力和持续创新的 潜力。 星火X1升级:长思维链 ...