Google发布其最先进的图像生成模型Gemini 2.5 Flash Image

Google今日发布了 Gemini 2.5 Flash Image（测试代号“nano-banana”），这是其最先进的图像生成和编辑模型。Google声称，这款新模型能够在生成和编辑图像的同时保持字符的一致性，并将多幅图像融合成一幅。

据 LMArena 称，Gemini 2.5 Flash Image 目前是全球评价最高的图像编辑模型，击败了 OpenAI 的 GPT Image 1 和 Flux.1 Kontext。一般来说，之前的图像生成模型在美学方面表现更佳，但缺乏对现实世界的精准语义理解。全新的 Gemini 2.5 Flash Image 利用 Gemini 的世界知识，创作出更精准、更逼真的图像。

全新的 Gemini 2.5 Flash 模型可供消费者和开发者使用。开发者可以通过 Gemini API、Google AI Studio 和 Vertex AI 企业版获取此模型。对于开发者，Gemini 2.5 Flash Image 的价格为每 100 万个输出代币 30 美元。因此，每张图片的成本约为 0.039 美元。

对于消费者来说，可以通过 Gemini 网页和移动应用程序访问此模型。Google 强调了以下可供普通消费者在 Gemini 应用程序上尝试的用例：

给自己换一套服装或换个地点 ：上传一个人或宠物的照片，当你把它们放在新的场景中时，模型在每张图片中都会保持相同的外观。
混合照片 ：现在您可以上传多张照片并将它们混合在一起，打造一个全新的场景。例如，拍摄您和狗狗的照片，打造一张你们俩在篮球场上的完美肖像照。
尝试多轮编辑： 您可以继续编辑 Gemini 制作的图像 - 找一个空房间，粉刷墙壁，然后添加书架、一些家具或咖啡桌。
混合设计： 将一张图片的风格运用到另一张图片的某个物体上。你可以将花瓣的颜色和纹理运用到雨靴上，或者用蝴蝶翅膀的图案设计一条连衣裙。

Google声称，除非用户上传的图片包含在反馈中，否则它不会使用用户上传的实际图片来训练其生成式机器学习技术。在 Gemini 应用中创建或编辑的所有图片都会带有可见的水印和不可见的 SynthID 数字水印。

对文章打分

Google发布其最先进的图像生成模型Gemini 2.5 Flash Image

最新资讯

编辑精选

热门评论

相关文章

NotebookLM推出重大更新提升AI视频创作能力

Google在美全面开放Gemini Canvas AI模式帮用户写文档、做项目、搭应用

有开发者不慎泄露Gemini API后收到8.2万美元账单 Google不愿意减免费用

Google发布Gemini 3.1 Flash-Lite 主打“快与省” 性能碾压 2.5 Flash

Google在明尼苏达建设依靠风能、太阳能和铁锈反应电池的新数据中心

Google与OpenAI员工发表公开信支持Anthropic在五角大楼事件中的立场

Top 10

微信新能力上线可查图片使用次数

极客湾疑似遭"全网封杀"!背后力量深不可测？

极客湾遭"封杀"引热议连YouTube视频都下架了

微信新能力上线可查图片使用次数

极客湾疑似遭"全网封杀"!背后力量深不可测？

苹果不再允许用户扛着MacBook到苹果零售店拷贝Final Cut Pro