Workflow
谷歌香蕉模型一夜登顶!干翻GPT-4o和FLUX,坐稳AI图像之王
3 6 Ke·2025-08-27 04:09

智东西8月27日报道,今天,谷歌推出了Gemini 2.5 Flash Image,这款模型是谷歌最先进的图像生成和编辑模型。 这一模型的核心亮点是其图像编辑能力。谷歌称,这一模型可将多个图像混合到单个图像中,保持高度角色一致性,还能使用自然语言进行有针对性的修 改,并充分利用Gemini的世界知识。 上述能力也解锁了不少有趣的用例,比如,按照特定视觉模板打造"球星卡"一般的设计,让普通人也能一键体验顶级运动员才有的待遇。 这一模型与谷歌Veo 3等视频生成模型是绝配,结合使用后可以打造出丰富的视频效果。海外AI创意平台Kera AI已经用类似的模式,打造了一部广告大 片。 诺贝尔奖得主、谷歌DeepMind联合创始人兼CEO Demis Hassabis专门发推,用自己的照片为新模型做宣传,展示Gemini 2.5 Flash Image的角色一致性。他 将照片背景做了修改,切换为古典风格,但是人物的容貌没有出现改变。 | 2 Text-to-Image | | | View > | 1. Image Edit | | View > | | --- | --- | --- | --- | --- | --- ...