Workflow
语音模型
icon
Search documents
OpenAI杀入语音模型大战,祭出最强GPT-RealTime,加量还降价
3 6 Ke· 2025-08-29 06:08
智东西8月29日消息,今天凌晨,OpenAI发布为开发人员打造的语音转语音模型GPT-RealTime,并同步更新了包括远程MCP服务器支持、图像输入和SIP (通过会话发起协议)电话呼叫支持的API功能。 OpenAI称这是其迄今为止最先进的语音合成模型,GPT-RealTime在遵循复杂指令、精确调用工具以及生成更自然、更具表现力的语音方面有所改进。该 模型可以自然朗读重复的字母、数字,无缝切换语言,甚至可以捕捉笑声等非语言信号。 今天OpenAI还发布了两个新语音Cedar和Marin,它们将在Realtime API中独家提供。 定价方面,通用版Realtime API和新的GPT-RealTime模型从今天起对所有开发者开放,GPT-RealTime每百万token音频输入价格为32美元(折合人民币约 228元),缓存输入每百万token为0.4美元(折合人民币约2.85元),每百万token音频输出价格64美元(折合人民币约456元),GPT-RealTime相比gpt-4o- realtime-preview价格下调20%。 但从OpenAI在社交平台X的评论区来看,有用户对这一新模型充满期待, ...