阿里发布通义万相2.6系列视频生成模型,上线国内首个角色扮演功能 | 钛快讯
Tai Mei Ti A P P·2025-12-16 05:22

12月16日消息,阿里发布新一代万相2.6系列模型,该系列模型面向专业影视制作和图像创作场景进行 了全面升级,全新的万相2.6是国内首个支持角色扮演功能的视频模型。该模型同时支持音画同步、多 镜头生成及声音驱动等功能,是目前全球功能最全的视频生成模型。万相2.6已同步上线阿里云百炼、 万相官网。 今年9月,阿里率先在国内发布音画同步的视频生成模型万相2.5,极大提升视频创作的效率,在权威大 模型评测集LMArena上,万相图生视频位居国内第一。 此次发布的万相2.6进一步提升了画质、音效、指令遵循等能力,单次视频时长实现国内最高的15s,万 相2.6新增了角色扮演和分镜控制功能,不仅能一键完成单人、多人、人与物合拍的视频,还能自动实 现多镜头切换等专业任务,满足专业影视级场景需求。 万相2.6是国内首个支持角色扮演功能的模型,能参考输入视频中的角色外观和音色、实现角色扮演, 按照提示词生成单人、多人、人与物合拍的视频 据介绍,通义万相在模型结构上集成了多项创新技术,可对输入参考视频进行多模态联合建模与学习, 参考具有时序信息的主体情绪、姿态和多角度全面视觉特征,同时提取音色、语速等声学特征,在生成 阶段作为参 ...