Gemini 2.5 Flash 图像模型

Search documents
Nano Banana核心团队:图像生成质量几乎到顶了,下一步是让模型读懂用户的intention
Founder Park· 2025-09-22 11:39
现在最好的图像质量,和几年后图像质量可能相差不大,实际在于模型能力下限的提升。 未来的交互一定是多模态的,识别用户的意图特别关键。 这是一篇 Nano Banana 背后核心团队成员的专访, 信息量很大。 在 Nano Banana 正式上线后的近一个月以来,社交平台上充满了各种「 邪修 」玩法和探索。Nano Banana 的热度甚至一度冲击了图像、修图类产品的股价。 Nano Banana 为什么好用?读懂背后的 「 how 」特别重要 。Nano Banana 核心团队是如何思考和做图 像模型的?基于图像模型的能力,衍生出来的应用会有哪些特点? 在一期播客节目中,Nano Banana 核心团队研究员 Nicole Brichtova 和 Oliver Wang,围绕基于模型打造 产品时遇到的挑战、如何思考解决「空白画布难题」以及如何与其他图像编辑产品进行交互等话题进行 了分享。 TLDR: 图像模型未来的趋势可能和 LLM 的发展很像,从单纯的创意工具变为信息查询工具。 未来,模型应该会变得更主动、更智能,能根据用户的问题,灵活运用文本、图像等不同模态进 行交互。 如何把 LLM 中的「世界知识」融入 ...