文心新出的推理大模型，给了我们信心

机器之心报道机器之心编辑部当下的大语言模型，不怕它搞不定，就怕它胡说八道：有「幻觉」存在，我们经常会下意识地不信任 AI 输出的结果。就在上周，OpenAI 的论文《Why Language Models Hallucinate》广为流传。研究人员指出，要想消除幻觉，需要修正模型训练时的评分机制并开发全新的技术。不过 AI 领域里，技术的发展速度一直比想象得快，就像是对 OpenAI 研究的呼应，今天上午 WAVE SUMMIT 深度学习开发者大会 2025 上，百度发布的新模型就把「可信度」提升了一大截，除了更准确的事实性，更有指令遵循、智能体等能力的显著提升。今天发布的是文心大模型 X1.1 深度思考模型，它是百度在 4 月份发布的旗舰模型 X1 的升级版，发布即上线，所有人都可以免费体验。同时该模型通过百度智能云千帆平台向企业客户与开发者开放使用。升级后的模型主攻事实性、指令遵循以及智能体、工具调用能力，带来了综合能力的显著提升。用一组数据说话，相较于文心 X1，X1.1 的事实性提升 34.8%，指令遵循提升 12.5%，智能体提升 9.6%。这意味着它提供信息时更加可靠、执行任务 ...