Notebookcheck Logo

谷歌推出 Gemini 2.5 闪存图像 "纳米香蕉",编辑一致性更强

谷歌 DeepMind 的 "纳米香蕉 "模型可提供精确的图像编辑(图片来源:Gemini)
谷歌 DeepMind 的 "纳米香蕉 "模型可提供精确的图像编辑(图片来源:Gemini)
谷歌 DeepMind 的新款 Gemini 2.5 Flash Image(昵称为 "纳米香蕉")有望对人工智能图像编辑进行更精细的控制。 它能使不同场景中的字符保持一致,允许多轮编辑,并将图像与自然语言指令融合在一起,同时还能添加可见和不可见的水印以确保安全。
AI

谷歌 DeepMind 在发布Gemini 2.5 Flash Image,也称为 "nano-banana",适用于 Gemini 应用程序,开发人员也可以通过 Gemini API、Google AI Studio 和 Vertex AI 进行开发。这一更新解决了人工智能图像工具经常遇到的问题:小幅编辑最终会改变整个图像。谷歌将此版本描述为与早期版本相比在质量和控制方面的改进。

主要特点是人物一致性。你可以在不同的场景中保持人物、宠物或产品的外观一致,即使你改变了服装、发型、时间段或设置。该模型还可以将多个图像合并为一个图像,使用自然语言指令进行特定更改,并在图像创建和编辑过程中使用双子座的世界知识。

您可以使用这一工具将同一个人物放在不同的场景中,从不同角度展示产品,或在不同的宣传活动中保持品牌形象的一致性。多轮编辑让你可以不断进行修改,比如在房间里添加家具和装饰,尝试各种想法。你还可以混合设计,将一个图像中的图案添加到另一个图像中的物体上,或者将人和宠物融合到一个新的场景中。

对于开发人员来说,价格是透明的:Gemini 2.5 Flash Image 每一百万个输出代币的价格为 30 美元。每张图片算作 1,290 个输出代币,即每张图片约 0.039 美元。其他输入和输出方式遵循双子座 2.5 Flash 的标准定价。

为了安全起见,生成的图像包括一个可见的人工智能标记和一个不可见的 SynthID 数字水印。谷歌表示,SynthID 在经过普通编辑后仍能被检测到,这将有助于验证图像的来源,因为合成媒体变得越来越难以识别。

谷歌表示,早期预览将其评为领先的图像编辑模式。双子座应用的内置编辑功能现在可以保留照片中的微妙细节。你可以上传照片、要求修改、与宠物合影、交换背景尝试新壁纸,或将自己置身于不同的场景中。您还可以使用 Gemini 中编辑过的图片制作短视频。

资料来源

谷歌(英语)

Please share our article, every link counts!
Mail Logo
> Notebookcheck中文版(NBC中国) > 新闻 > 新闻档案 > 新闻档案 2025 08 > 谷歌推出 Gemini 2.5 闪存图像 "纳米香蕉",编辑一致性更强
Nathan Ali, 2025-08-28 (Update: 2025-08-28)