百度大模型“上新”
从性能上看,文心5.0正式版的语言与多模态理解能力超越Gemini-2.5-Pro、GPT-5-High等模型,稳居国 际第一梯队。图像与视频生成能力与垂直领域专精模型相当,整体处于全球领先水平。 "和目前业内大多采用的后期融合多模态方案不同,文心5.0的技术路线采用统一的自回归架构进行原生 全模态建模,将文本、图像、视频、音频等多源数据在同一模型框架中进行联合训练。"活动现场,百 度集团副总裁、深度学习技术及应用国家工程研究中心副主任吴甜介绍道,这一策略使得多模态特征在 统一架构下充分融合并协同优化,实现原生的全模态统一理解与生成。 得益于原生全模态建模,文心5.0在多模态理解、代码、创意写作等能力上实现显著突破。此外,文心 5.0采用超大规模混合专家结构,具备超稀疏激活参数,激活参数比低于3%,在保持模型强大能力的同 时,有效提升推理效率。同时,基于大规模工具环境,合成长程任务轨迹数据,并采用基于思维链和行 动链的端到端多轮强化学习训练,显著提升了模型的智能体和工具调用能力。 仅输入一段博主复刻"活了么"App的教程视频,在数分钟内,文心5.0便能自动拆解步骤,理解核心交互 逻辑,并直接生成可运行的前端代 ...