速递|为硬件铺路:OpenAI攻坚下一代音频AI模型,打造“主动式”系列AI设备
Z Potentials·2026-01-04 04:18
据知情人士透露, 为筹备即将放行的 AI 驱动个人设备, OpenAI 正着手提升其音频 AI 模型。 三位了解该设备的知情人士表示,这款设备预计将以音频交 互为主要形式。 当用户与 ChatGPT 对话时,聊天机器人能够进行语音回应,但其音频版本所依赖的大型语言模型与生成文本回复的模型并非同一套系统。据一名前员工与 一名现职员工透露,公司内部研究人员认为,当前音频模型在回答准确度和响应速度方面均落后于文本模型。 据知情人士透露,过去两个月间, OpenAI 已整合多个工程、产品与研究团队,共同致力于为未来设备优化音频模型。 提升音频模型的准确度对 OpenAI 实现语音交互设备目标至关重要。据 The Information 此前报道,首款此类设备预计还需约一年时间才会问世。 OpenAI 改善其音频模型的努力开始见效。知情人士表示,新的音频模型架构生成的回应听起来更加自然且富有情感,并能提供更准确、更具深度的答案。 该人士称,新音频模型还能够与人类用户同时讲话——这是现有模型无法实现的功能,并将更好地处理对话中断。 知情人士透露,公司目标是在 2026 年第一季度发布这款新型音频模型。 OpenAI 发言 ...