全模态统一建模
Search documents
模型参数达2.4万亿,百度发布文心大模型5.0
Guo Ji Jin Rong Bao· 2026-01-22 09:53
基于文心基础大模型,百度构建了矩阵模型和专精模型。矩阵模型面向产品级应用和通用场景快速落地,包括文心Lite模型、视频大模型和语音大模 型;专精模型面向行业应用和垂直场景,包括搜索闪电专精模型、电商蒸汽机模型、文心数字人大模型及行业大模型。 贾磊在现场分享了三项技术突破:基于声音 Token 的端到端合成大模型、5分钟超越真人的直播技术、实时交互数字人技术。 1月22日,百度发布并上线原生全模态大模型文心5.0正式版。该模型参数达2.4万亿,采用原生全模态统一建模技术,具备全模态理解与生成能力,支持 文本、图像、音频、视频等多种信息的输入与输出。 据百度集团副总裁、深度学习技术及应用国家工程研究中心副主任吴甜介绍,与业界多数采用"后期融合"的多模态方案不同,文心5.0的技术路线采用 统一的自回归架构进行原生全模态建模,将文本、图像、视频、音频等多源数据在同一模型框架中进行联合训练,使得多模态特征在统一架构下充分融合并 协同优化,实现原生的全模态统一理解与生成。 此外,文心5.0采用超大规模混合专家结构,具备超稀疏激活参数,激活参数比低于 3%,在保持模型强大能力的同时,有效提升推理效率。同时,基于 大规模工具 ...