8次反复检查,美团上线开源并可体验的“重思考”模型
Xin Jing Bao·2026-01-16 13:18

新京报贝壳财经讯(记者陈维城)1月16日,美团LongCat官微消息,作为LongCat-Flash-Thinking模型的 升级版,LongCat-Flash-Thinking-2601现已开源。团队介绍,新模型在Agentic Search(智能体搜索)、 Agentic Tool Use(智能体工具调用)、TIR(工具交互推理)等核心评测基准上,达到开源模型SOTA (最先进的水平)水平。 对于新模型的技术思路,LongCat团队解释称,传统智能体往往仅在数个简单模拟环境里训练,这带来 的问题就像只在靶场训练的士兵,到了真实"战场"可能会掉链子。而基于"环境扩展+多环境强化学 习"核心技术,团队为模型打造了多样化的"高强度练兵场",构建了多套高质量训练环境,并在每套环 境中集成60余种工具形成密集依赖关系图谱与复杂联动,支撑起高度复杂的任务场景。实验也证明,训 练环境越丰富,模型在未知场景中的泛化能力越强。 此外,LongCat团队针对性扩展自研强化学习基础设施,在保留原有高效异步训练特性的基础上,实现 大规模多环境智能体的稳定并行训练,通过均衡搭配多环境任务、按难度与训练进度智能分配算力,最 大化提升 ...