Google发布其最先进的图像生成模型Gemini 2.5 Flash Image

2025年08月27日 07:37 次阅读 稿源:Win10s.COM 条评论

Google今日发布了 Gemini 2.5 Flash Image(测试代号“nano-banana”),这是其最先进的图像生成和编辑模型。Google声称,这款新模型能够在生成和编辑图像的同时保持字符的一致性,并将多幅图像融合成一幅。

据 LMArena 称,Gemini 2.5 Flash Image 目前是全球评价最高的图像编辑模型,击败了 OpenAI 的 GPT Image 1 和 Flux.1 Kontext。一般来说,之前的图像生成模型在美学方面表现更佳,但缺乏对现实世界的精准语义理解。全新的 Gemini 2.5 Flash Image 利用 Gemini 的世界知识,创作出更精准、更逼真的图像。

全新的 Gemini 2.5 Flash 模型 可供消费者和开发者使用。开发者可以通过 Gemini API、Google AI Studio 和 Vertex AI 企业版获取此模型。对于开发者,Gemini 2.5 Flash Image 的价格为每 100 万个输出代币 30 美元。因此,每张图片的成本约为 0.039 美元。

对于消费者来说,可以通过 Gemini 网页和移动应用程序访问此模型。Google 强调了 以下可供普通消费者在 Gemini 应用程序上尝试的用例:

  • 给自己换一套服装或换个地点 :上传一个人或宠物的照片,当你把它们放在新的场景中时,模型在每张图片中都会保持相同的外观。

  • 混合照片 :现在您可以上传多张照片并将它们混合在一起,打造一个全新的场景。例如,拍摄您和狗狗的照片,打造一张你们俩在篮球场上的完美肖像照。

  • 尝试多轮编辑: 您可以继续编辑 Gemini 制作的图像 - 找一个空房间,粉刷墙壁,然后添加书架、一些家具或咖啡桌。

  • 混合设计: 将一张图片的风格运用到另一张图片的某个物体上。你可以将花瓣的颜色和纹理运用到雨靴上,或者用蝴蝶翅膀的图案设计一条连衣裙。

Google声称,除非用户上传的图片包含在反馈中,否则它不会使用用户上传的实际图片来训练其生成式机器学习技术。在 Gemini 应用中创建或编辑的所有图片都会带有可见的水印和不可见的 SynthID 数字水印。

对文章打分

Google发布其最先进的图像生成模型Gemini 2.5 Flash Image

1 (50%)
已有 条意见

    最新资讯

    加载中...

    编辑精选

    加载中...

    热门评论

      Top 10

      招聘