DeepSeek、GPT-5都在尝试的快慢思考切换,有了更智能版本,还是多模态
机器之心·2025-09-01 06:46
本研究由中科院自动化所和腾讯混元联合研发,团队成员包括 Qi Yang, Bolin Ni, Shiming Xiang, Han Hu, Houwen Peng, Jie Jiang 背景:多模态大模型的思考困境 当前,业界顶尖的大模型正竞相挑战" 过度思考 "的难题,即无论问题简单与否,它们都采用 "always-on thinking" 的详细推理模式。无论是像 DeepSeek-V3.1 这种 依赖混合推理架构提供需用户"手动"介入的快慢思考切换,还是如 GPT-5 那样通过依赖庞大而高成本的"专家路由"机制提供的自适应思考切换。它们距离真正意义 上的" 智能思考 "仍有距离。这些方案或将判断压力转移给用户,或受限于复杂的系统架构和高昂的部署成本。因此,研发一款 轻量化、支持多模态且能实现更智 能自适应思考的大模型 ,将为用户提供更加流畅的交互体验。 近期 ,由腾讯混元团队与中科 院自动化所合作的一项最新研究推出 R-4B 多模态大模型,通过 自适应思考 (auto-thinking)机制,改变了这一现状,它让 AI 能像 人类一样 "智能切换" 思维模式。简单问题直接响应,复杂问题深度推理,在最大化 ...