谷歌年度大招:所有AI模型全升级一遍!Gemini2.5大杯中杯霸榜前二,新版视频/图像模型亮相
量子位·2025-05-20 20:33
梦晨 西风 发自 凹非寺 量子位 | 公众号 QbitAI 原生多模态输入输出、智能体、联网搜索……所有前沿AI能力集成在一起会怎么样? 谷歌最新版 Project Astra 展示了终极AI助手的能力: 实时观察周围环境,搜索资料指导小哥修自行车,零件不够还能自动电话询问周边商店有没有货。 在最新的I/O大会上,谷歌连续放大招,就好像大招不要钱。 Gemini 2.5 Pro和Gemini 2.5 Flash的预览版 已霸榜竞技场前两名。 视频生成模型Veo 3 ,实现视频与音频的原生集成,除音乐和音效,甚至是角色间的对话语音都能生成,画面上还能同步口型。 图像生成模型Imagen 4 ,图像更加丰富,色彩更加细腻,细节更加逼真。 现有AI模型全部更新一遍 原有的产品用AI重做一遍 实验性新产品也推出了一箩筐 …… 传统产品方面, 谷歌搜索 增加端到端AI搜索模式,整合推理和多模态分析能力,将问题分解为子问题,并同时发出多个查询,更深入地探索 网络。 视频会议Google Meet ,支持实时的双语翻译配音,并保留对话双方的音色,首批英语-西班牙语支持已上线,后续将添加更多语言。 Chrome浏览器,直接集 ...