DeepSeek、GPT-5都在尝试的快慢思考切换，有了更智能版本，还是多模态

本研究由中科院自动化所和腾讯混元联合研发，团队成员包括 Qi Yang, Bolin Ni, Shiming Xiang, Han Hu, Houwen Peng, Jie Jiang 背景：多模态大模型的思考困境当前，业界顶尖的大模型正竞相挑战" 过度思考 "的难题，即无论问题简单与否，它们都采用 "always-on thinking" 的详细推理模式。无论是像 DeepSeek-V3.1 这种依赖混合推理架构提供需用户"手动"介入的快慢思考切换，还是如 GPT-5 那样通过依赖庞大而高成本的"专家路由"机制提供的自适应思考切换。它们距离真正意义上的" 智能思考 "仍有距离。这些方案或将判断压力转移给用户，或受限于复杂的系统架构和高昂的部署成本。因此，研发一款轻量化、支持多模态且能实现更智能自适应思考的大模型，将为用户提供更加流畅的交互体验。近期，由腾讯混元团队与中科院自动化所合作的一项最新研究推出 R-4B 多模态大模型，通过自适应思考（auto-thinking）机制，改变了这一现状，它让 AI 能像人类一样 "智能切换" 思维模式。简单问题直接响应，复杂问题深度推理，在最大化 ...