腾讯研究院AI速递 20250609
腾讯研究院·2025-06-08 13:26
生成式AI 一、 OpenAI升级高级语音功能,更像真人,外加随身翻译官 1. ChatGPT高级语音功能升级,声音更自然,能表达情感和语调变化,使交流更具人性化; 2. 新增实时翻译功能,支持跨语言对话,可在国际环境中充当同声传译,无缝衔接对话; 3. 该功能已向所有付费用户开放,用户只需点击输入框中的语音图标即可使用。 https://mp.weixin.qq.com/s/E9NZu15JIlQA2mw9XKmGPQ 二、 独角兽ElevenLabs发布Eleven v3:狠狠拿捏情感控制 1. ElevenLabs发布新版TTS模型Eleven v3,支持70多种语言,声称是"迄今为止最具表现力 的文本转语音模型"; 2. 引入音频标签系统,可精确控制情感表达,包括情感标签、音效标签和特殊标签,标点符 号也影响情绪传递; 2. 采用双自回归架构和RLHF技术,支持13种语言,包括中英日等,在TTS-Arena排名第 一; 3. 定价每百万字节15美元(约0.8美元/小时),适用于内容创作和配音领域,未来计划推出版 权音色注册与分成机制。 https://mp.weixin.qq.com/s/UbyYrm ...