Workflow
AI语音合成
icon
Search documents
MiniMax登顶、多家创企融资,AI语音离“现实场景”还有多远?
创业邦· 2025-06-06 03:17
以下文章来源于白鲸出海 ,作者白鲸小编 白鲸出海 . 白鲸出海,泛互联网出海服务平台,白鲸专注于具备互联网属性的行业、公司、产品和服务的出海,包 括应用、游戏、电商、区块链、智能手机及硬件、旅游、网络文学、影视、动漫、教育、体育和金融 等。 来源丨 白鲸出海(ID: baijingapp ) 作者丨 张凯然 编辑丨 殷观晓 图源丨Midjourney 2 月份,我们选取了知名影视剧《甄嬛传》中的片段来测试 4 款 AI 语音合成模型在情感表达上的表 现。当时的结论是,AI 语音模型们的表现力依然不足,仍有待加强。 | Creator | | Model | Arena ELO | 95% CI | # Appearances | | --- | --- | --- | --- | --- | --- | | 4 | MiniMax | Speech-02-HD | 1161 | -27/+26 | ae8 | | @ OpenAI | | TTS-1 HD | 1151 | -14/+12 | 6534 | | � | MiniMax | Speech-02-Turbo | 1146 | -25/+25 | ...
开源播客生成MoonCast:让AI播客告别"机械味",中英双语对话更自然!
量子位· 2025-06-04 05:21
输入知识源:经典经济学论文 (PDF 链接: https://gwern.net/doc/statistics/decision/1951-nash.pdf) Zeqian Ju 投稿 量子位 | 公众号 QbitAI 英文播客示例: 仅听几秒人声,即可完成逼真复刻,而且是 对话式语音。 这就是 MoonCast , 一款革新性的对话式语音合成模型, 目前已开源 。 MoonCast 的"人味"播客效果如何?立即试听以下示例音频,让耳朵告诉你答案。 (注:本文使用的所有音频仅用于展示,不代表任何真实事件或观点。禁止商用。) 中文播客示例: 输入知识源:诺贝尔物理学奖新闻稿 (URL 链接: https://www.nobelprize.org/prizes/physics/2024/press-release/) 生成一段地道的 相声 ,完全就是郭德纲于谦那味儿啊。 (注:本文使用的所有音频仅用于展示,不代表任何真实事件或观点。禁止商用。) 它专为高质量播客内容创作量身打造, 旨在将文档转化为引人入胜的播客音频。 这些对话无论是文本内容还是说话人音色,MoonCast在训 练时都从未见过。 这得 益于强大的 ...