人人皆可创作音乐!腾讯AI Lab开源音乐生成大模型SongGeneration
机器之心·2025-06-20 00:58
6 月 16 日,腾讯 AI Lab 推出并开源 SongGeneration 音乐生成大模型,专注解决音乐 AIGC 中 音质、音乐性与生成速度 这三大共性难题,基于 LLM-DiT 的融合架 构,模型在保持 生成速度 的同时,显著提升了 音质表现 ,生成歌曲的准确度相较部分商业闭源模型表现出相当甚至更优的质量,同时在 整体表现、旋律、伴 奏、音质与结构 等维度也优于现有多数开源模型。 此外,SongGeneration 模型还支持 文本控制、多轨合成 与 风格跟随 等功能,既满足面向 C 端创作者的可玩性,又兼具 B 端的稳定性与拓展性,构建出面向未来 的音乐 AI 生产力工具。 图 1 商业模型主观评测结果 图 2 开源模型主观评测结果 相较于传统基于规则或小型模型的方式,基于大模型的音乐生成模型在旋律的长程连贯性、潜在风格迁移能力以及音色建模的表达维度上,展现出更强的泛化能 力和生成潜力。AI 音乐创作正从过去的 "辅助工具" 迈向 "智能共创" 的新阶段,被广泛应用于短视频配乐、游戏音效、虚拟人演出、商业广告以及个人音乐创作 等场景。 当前主流音乐生成大模型虽已初步实现 "文本到音乐" 的生成能力, ...