深度思考模型

Search documents
具身场景新框架!Embodied-Reasoner:攻克复杂具身交互任务
具身智能之心· 2025-06-21 12:06
点击下方 卡片 ,关注" 具身智能之心 "公众号 >> 点击进入→ 具身 智能之心 技术交流群 更多干货,欢迎加入国内首个具身智能全栈学习社区 : 具身智能之心知识星球 (戳我) , 这里包含所有 你想要的。 | 作者:Wenqi | Zhang | , | Mengna | Wang | , | Gangao | Liu | , | Xu | Huixin | , | Yiwei | Jiang | , | Yongliang | Shen | , | Guiyang | Hou | , | Zhe | Zheng | , | Hang | Zhang | , | Xin | Li | , | Weiming | Lu | , | Peng | Li | , | Yueting | Zhuang | | --- | --- | --- | --- | --- | --- | --- | --- | --- | --- | --- | --- | --- | --- | --- | --- | --- | --- | --- | --- | --- | --- | --- | --- | --- | --- ...
火山总裁谭待:很多Agent的能力还停留在类似自动驾驶的L1阶段
news flash· 2025-04-17 11:17
"目前很多Agent的能力仍停留在初级水平,真正实现具备更强反思、规划与自主决策能力的Agent,是 行业发展的方向。"4月17日,在火山引擎2025FORCE LINK AI创新巡展现场杭州站上,字节跳动旗下 的火山总裁谭待在接受采访时表示。谭待认为,深度思考模型是构建Agent的基础,模型要有能力做好 思考、计划和反思,并且一定要支持多模态,就像人类具备视觉和听觉一样,Agent才能更好地处理复 杂任务。当日,豆包1.5深度思考模型正式发布。据介绍,这款模型除了在数学、编程、科学推理、创 意写作等通用任务表现突出之外,还上线了具备视觉推理能力的深度思考模型视觉版,能像人类一样对 看到的事物进行联想和思考。(智通财经) ...
从DeepSeek R1的复现看深度思考模型的未来|ML-Summit 2025
AI科技大本营· 2025-03-31 06:55
备受瞩目的 2025 全球机器学习技术大会(ML Summit 2025)将于 4 月 18-19 日在上海虹桥西郊庄园丽笙大酒店召开。本次盛会由 CSDN & Boolan 联合主办,汇聚了超 50 位来自学术界和工业界顶尖专家,共同探讨智能体、联邦学习、多模态大模型等热门 AI 技术实践。 作为全球机器学习技术大会的老朋友,新浪微博首席科学家及 AI 研发部负责人张俊林将带来《从 DeepSeek R1 的复现看深度思考模型的未来》的精 彩分享。 张俊林作为「大模型技术拆解得最通透的实战派」,在 2024 年的机器学习技术大会上,他对 Gemini 多模态架构、OpenAI o1 技术的硬核拆解,让 开发者直呼"终于有人讲透技术本质"。 系统梳理技术脉络: 回顾 DeepSeek R1 开源后的各类复现研究,涵盖 SFT 阶段的轻量适配(如 S1)与 RL 阶段的创新实践。 深度解析训练范式: 重点剖析其核心的两阶段训练模式——如何通过冷启动微调结合多领域数据优化进行 SFT,以及如何运用 GRPO 强化学习 与全场景对齐实现模型"深度思考"能力的跃迁。 探讨关键技术问题: 尝试解答一系列备受关注的核心问 ...