全双工通话大模型

Search documents
赛道Hyper | Soul推出全双工通话大模型
Hua Er Jie Jian Wen· 2025-08-01 08:12
作者:周源/华尔街见闻 在 2025 世界人工智能大会暨人工智能全球治理高级别会议(WAIC 2025)展览现场,社交平台Soul App展示了其自研的全双工通话大模型。 该模型即将在Soul平台开启内测,后续计划应用于虚拟人实时通话、AI匹配等1V1及多对多互动场景, 是社交领域的一项新探索。 就眼下Soul的"虚拟人"应对用户互动场景的表现来看,已深具"真实感",但这种互动目前仅限于文字形 式。 此次推出自研全双工通话大模型,若能实现实时通话,则其智能性确然会有更大提升。 调整传统交互模式 传统语音交互长期依赖VAD(话音活性检测)机制与延迟控制逻辑,形成轮次对话模式。 这种模式的人机对话,呈现一问一答刻板节奏:用户发言结束后,AI才开始响应,中间存在明显延 迟,影响了交互的自然性。 在很多时候,用户发言过程中会出现短暂停顿,这可能被系统误判为发言结束,导致AI过早介入,打 断用户思路,交流显得过于生硬。 Soul自研的端到端全双工语音通话大模型,对这一传统模式做了调整:不再采用VAD机制,尝试通过算 法让AI自主把控对话节奏。 还有情绪表达,AI的声音情绪会随对话推进变化,用户分享喜悦时语调上扬,用户情 ...