声网对话式AI引擎

Search documents
声网发布对话式AI引擎:让任意大模型开口说话
36氪· 2025-03-07 09:37
响应快、打断快 :通过全链路深度优化,并在 中、美、欧、东南亚主要城市实测,语音对话延迟中位数低至650ms ,让AI秒回 你的提问。超低打断延时,自研"智能打断"技术,模拟真人对话节奏,随时打断与AI的对话,响应低至340ms。 在生成式AI的浪潮下,行业普遍认为多模态大模型是实现AGI的必经之路,知名投资机构a16z最新关于Voice AI的报告也显示, 随着大模型的不断进步,语音将成为一种关键的切入点。声网作为全球实时互动云行业的开创者,在音视频领域积累了深厚的技 术优势与场景实践,一直致力于将RTE与生成式AI结合,并推出了对话式AI引擎,为开发者带来" 多快好省 "的AI语音对话体 验。 模型选择多 :真正把选择权交给开发者!支持包含DeepSeek、ChatGPT等在内的 全球 几乎所有大模型厂商 。同时也支持全球主 流语音合成供应商任意切换,支持开发者通过语音合成供应商定制的自定义音色接入。更有音视频SDK支持 30000+终端机型适 配,解决多设备兼容性的后顾之忧。 AI开口,互动无界。 3月6日,声网举办了主题为"AI开口,互动无界"的产品发布会,正式发布了全球首个对话式AI引擎。声网对话式 ...
2行代码与DeepSeek语音对话,1分钟不到一毛钱,所有大模型都能开口说话
量子位· 2025-03-07 07:12
梦晨 发自 凹非寺 量子位 | 公众号 QbitAI 声网AI RTE产品线负责人姚光华 在3月6日对话式AI引擎发布会上提到,"经过一段时间与客户的打磨及实际使用场景调研,我们统计出,用 户与AI 每产生1次对话中,平均会有约3轮问答,计算下来平均对话时长约为21.1s,单次成本仅需3分钱。如果每月对话次数15次,那么月成 本不到5毛钱,年成本也只需5元。" 起猛了, DeepSeek开口说话了 。 而且是 超低延迟实时秒回 ,还 可以随时打断 的那种,先来看一段VCR: DeepSeek以及其他任意大模型接入这样的高质量对话引擎,全程只需要 两行代码 。 开发一款语音交互的AI应用,门槛低到如此令人发指了吗? 这不算完,价格方面还有惊喜: 每分钟0.098元 ,不到一毛钱,单次还赠送1000分钟。 这就是来自声网的对话式AI引擎了。 声网在价格上做到了极致,按用量付费的模式更是不设上限,让多模态AI交互应用服务百万级用户规模成为可能。 这样便宜又好用,声网是怎么做到的呢? 揭秘AI对话流畅体验关键 AI对话要想体验丝滑,低延迟是必不可少的。 这里有一个关键数据: 延迟是否低于1.7秒 。 如果低于这个值, ...