Workflow
百度发布文心X1.1深度思考模型:多个基准测试达到SOTA,同步开源一款轻量化模型
IPO早知道·2025-09-09 10:47

在事实性、指令遵循、智能体等能力上均有显著提升。 本文为IPO早知道原创 作者| Stone Jin 微信公众号|ipozaozhidao 据IPO早知道消息,百度首席技术官、深度学习技术及应用国家工程研究中心主任王海峰于9月9日在 WAVE SUMMIT深度学习开发者大会上正式发布了文心大模型X1.1深度思考模型。同时,百度还公 布了文心和飞桨的一系列技术、产品、生态最新成果。 文心X1.1深度思考模型上线 多个基准测试达到SOTA 据王海峰现场介绍,文心大模型X1是基于文心大模型4.5训练而来的深度思考模型,升级后的X1.1 主要采用了迭代式混合强化学习训练框架,一方面通过混合强化学习,同时提升通用任务和智能体任 务的效果;另一方面通过自蒸馏数据的迭代式生产及训练,不断提升模型整体效果。相比文心X1, X1.1的事实性提升34.8%,指令遵循提升12.5%,智能体提升9.6%。 轻量化模型推理能力再升级 此外,百度正式开源最新的思考模型ERNIE-4.5-21B-A3B-Thinking。 据介绍,ERNIE-4.5-21B-A3B-Thinking采用了混合专家(MoE) 架构,总参数规模达210亿, ...