OpenAI发布GPT-Realtime,AI Agent进入超逼真对话时代;腾讯混元开源视频音效生成模型丨AIGC日报
- 【 OpenAI 发布 GPT-Realtime , AI Agent 进入超逼真对话时代】 OpenAI 发布语音模型 GPT-realtime 。 GPT-realtime 是一个专用于语音 AIAgent 的多模态模型,能够生成更加自然流 畅的语音,完美模仿人类丰富多样的语调、情感以及语速,支持图像理解并将其与语音或文本对话相 结合使用,非常适用于客服、教育、金融、医疗等领域打造语音智能体。 GPT-realtime 还新增了 Marin 与 Cedar 两种极具特色的语音,同时对原有的 8 种语音也进行了全面升级。(新浪财经) 2.【设计基因编辑工具的AI大模型问世】中国农业科学院表示,其农业基因组研究所农业基因编辑技 术研发与应用创新团队构建了全球规模最大的实验验证数据集,并基于此开发出人工智能(AI)大模 型AlphaCD。该模型不仅能高效预测超过2万余种胞嘧啶脱氨酶的酶活特征,还能设计出新型高性能 碱基编辑工具。相关成果日前发表于国际期刊《细胞研究》。(潇湘晨报) 4.【腾讯混元开源视频音效生成模型】腾讯混元正式开源端到端视频音效生成模型HunyuanVideo- Foley。据了解,用户 ...