Workflow
Parallel Reasoning
icon
Search documents
告别「单线程」思维:通研院提出NPR框架,让智能体进化出原生的并行推理大脑
机器之心· 2025-12-27 04:01
近年来,大语言模型在「写得长、写得顺」这件事上进步飞快。但当任务升级到真正复杂的推理场景 —— 需要兵分多路探索、需要自我反思与相互印证、需要在多条线索之间做汇总与取舍时,传统的链式思维 (Chain-of-Thought)往往就开始「吃力」:容易被早期判断带偏、发散不足、自我纠错弱,而且顺序生成 的效率天然受限。 北京通用人工智能研究院(BIGAI)语言交互实验室(NLCo)最新工作 Native Parallel Reasoner(NPR, 原生并行推理器) ,瞄准的正是这类瓶颈: 让智能体在一次思考中同时衍生并维护多条候选推理路径,并在关键节点「分支 + 聚合」,最终像拼图一 样汇总线索,合成最优解。 更重要的是,NPR 的突破点不只是「并行生成的工程技巧」,而是提出了一套「自蒸馏 + 并行强化学习」 三阶段训练范式,并配套专门的 并行推理引擎 ,目标是让并行推理从外挂变为模型的 原生认知能力 。 人们对语言智能体(Language Agent)的研究已经把关注从「单一思维链扩展」推广到了「多步深度推 理」。模型能够进行更深层次的推理令人兴奋,但未来的超级智能真正需要的,是 能更广泛地并行探索多 条可能 ...