Workflow
传媒互联网行业周报:关注人机交互方式变革下的三条主线
Tai Ping Yang·2024-05-20 05:30

[Table_Mess2a0g2e4]- 05- 19 行业周 报 行 看好/维持 业 传媒互联网 研 究 [Table_Title] 传媒互联网 报 告 关注人机交互方式变革下的三条主线 [Table_Summary] ◼ 走势对比 报告摘要 ➢ OpenAI发布混合多模态模型GPT-4o,变革人机交互方式 太 OpenAI 发布混合多模态模型 GPT-4o,该模型是 OpenAI 探索提升模 平 型易用性的新成果,是一个集成文本、图片、视频、语音的全能模型。 洋 GPT-4o 改变了人机交互方式,在功能上体现为具备实时语音及视频 证 交互能力:1)在语音交互方面,GPT-4o响应音频输入的平均时间与 人类对话的反应速度一致,实现实时的复杂对话、语音翻译、通过语 券 音识别说话者情绪等功能;2)在视频交互方面,具备更复杂的多模 股 态交互能力,实现实时识别视频拍摄内容,并给予反馈等功能。同时 份 发布 GPT-4o API,速度提高2 倍,价格便宜 50%,调用模型的速率 有 限制较GPT-4-Turbo提高了5倍。 限 公 ◼ 子行业评级 ➢ 谷歌发布多项新成果,Project Astra实现视觉和语音交 ...