豆包语音团队发布“AI多人有声剧”自动化方案
Shang Hai Zheng Quan Bao·2025-10-28 11:34
"AI多人有声剧"自动化方案支持从小说文本到完整成品有声剧的全自动生产。该方案可以自动进行角色 划分,准确率超过98%,同时,其语音大模型通过对海量文本与语音的多模态预训练,原生地将文本和 语音模态融合,引入思维链信息,具备强大的文本理解能力和语音演绎能力,多人演播效果发音自然、 情感丰富。 此外,方案中的画本预测模型在多角色演播音频基础上,实现了从小说文本到带有音效、人声特效、环 境音、配乐的画本预测,在得到画本信息之后进行音频召回并合成、智能动态调整音频参数,并结合多 角色TTS最终合成"有声剧"成品。 目前,首批通过"AI多人有声剧"方案端到端创作的作品已经在番茄小说App上线,效果超出预期,并得 到书友良好反馈,为听书行业注入全新活力。未来,"AI多人有声剧"方案仍将不断升级,覆盖更多有声 内容,小说更新即可让用户同步享受精品有声剧。 来源:上海证券报·中国证券网 上证报中国证券网讯(记者 罗茂林)近日,豆包语音团队发布"AI多人有声剧"自动化方案。方案支持 多角色、高表现力的TTS(语音合成)演播,同时,实现了全自动AI后期链路,从小说文本到高质量的 多人有声剧成品,全部由AI端到端完成。 据了解, ...