四点速读2025谷歌开发者大会
第一财经·2025-05-21 03:22
谷歌推出的Veo 3视频生成模型支持原生音频生成,不仅能够生成高清视频,还可为视频添加背景音乐、 音效甚至对白,解决了以往AI视频生成中"有影无声"的问题,极大提升了AI视频的质量和真实感。 2025.05. 21 本文字数:977,阅读时长大约2分钟 作者 | 一财科技 北京时间5月21日,谷歌开发者大会(Google I/O)上公布了在AI技术上的最新进展,从基础模型升级到 生成式内容工具推出,再到硬件更新,标志着谷歌将AI技术融入其生态系统的进程又迈出重要一步。 一、Gemini模型升级,多模态能力显著提升 核心亮点仍是Gemini模型。Gemini 2.5 Pro 和 Flash 模型全面支持视听输入和原生音频输出对话,开发 者可通过Live API 预览版构建和微调对话体验的音调、口音和说话风格等。Gemini还可作为Chatbot登 录Chrome浏览器,帮助用户快速理解页面上下文并完成任务。其中,Deep Think模式引入增强型推理机 制,在处理数学、编程和多模态任务时,能够在回答前充分考虑多种可能性,显著提升了模型的推理能 力。 二、生成式内容工具 再升级 针对各项AI升级功能,谷歌推出了每 ...