AI热点 7月前 • 223 阅读 • 0 评论

谷歌认领最强AI版Photoshop！现在人人可用，效果确实强悍

作者头像

量子位

AI技术专栏作家 | 发布了 246 篇文章

不圆时令发自凹非寺
量子位 | 公众号 QbitAI

爆火的神秘图像编辑模型nano-banana，终于脱掉了“香蕉皮”！

就在今天，谷歌官方认领，并表明这个模型其实是Gemini 2.5 Flash Image。

最新一波官方Demo也来了：

还展现出了高超的图像推理能力：

现在该模型可以在Gemini和Google AI Studio上免费使用，同时API以每张图像0.039$（折合人民币0.28￥）的价格开放。

模型的具体表现如何？一起来看~

出色的图像编辑能力

官方给出了很多有趣的用法。

除了常规的修图方式，它还可以合并最多三张图片来创造新事物。

生成超现实艺术，组合不同的照片元素，或无缝融合物体、颜色和纹理。

或者轻松实现设计想法。

还可以用几张照片生成堪称电影画面的连贯剧情故事。

而在官方实锤之前，网友们也早就被nano-banana的各种私家case吸引，开启疯狂讨论。

比如说精准改变面部表情和天气。

或者让秃头男人重新拥有不同发型。

网友表示：PhotoShop岌岌可危。

毕竟这个“香蕉”不仅可以完成平面图像的编辑，甚至还可以进行2D到3D的转换。用户只需提供一张普通的2D图片，系统就可自动生成相应的3D视角，每一个角度都是恰到好处、和谐统一。

最最最牛的是，它竟然还可以进行图像推理。勾股定理so easy，计算角度手拿把掐，识别图像里的水母结构，竟然也是瞬间反应，堪称你画我猜AI版。

说实话，最让我佩服的是，当我们要求此“香蕉”给出一个人从A到B的方案时，它竟然直接生成一个梯子！

好好好，图像编辑器真的能思考了。

我们自己也实测了一下这款模型，发现它确实很有意思：

给它一只猫猫，猫能环游世界。

提示词：以这只猫为主角，生成旅游照。

提示词：让猫猫去故宫拍张自拍照。

如果不想做真实场景，让林黛玉和孙悟空成为漫威英雄并肩战斗也就一句话的事儿~

另外，它对光影的细节理解也相当真实。

提示词：一根香蕉被放在厨房台面上，旁边有水杯、刀具和切菜板，阳光从窗户照进来，香蕉投下自然阴影。

可以看到生成结果还是很不错滴，阳光透过水杯折射的影子以及旁边植物的影子都还算合理。

它还能够很好地抓取角色特征，不出意外地改变角色主体：

如果那一年，工藤新一喝下的并不是缩小药水，而是……

神秘香蕉模型

Nano Banana最初出现在一个名为LMArena的网站上，这是一个让不同AI模型匿名进行“战斗模式”竞赛的地方。

而让Nano-banana爆火的原因无他，表现实在太好了。

这又是一个SOTA级别的图像编辑模型——而且在一开始没有任何官方文档。

不过在官方宣布之前，已经有一些人猜到了这是谷歌家族的一员。

一方面，该模型的表现与Gemini近期发布的多模态版本相似，这样出色的性能很难是车库团队的产品。

另一方面，它的发布策略——匿名发布、无品牌标识、让用户群体自行探索——与DeepMind早期在匿名测试平台上评估大语言模型的方式如出一辙。

还有一点额外原因：一些与谷歌有关联的开发者在社交媒体上发了奇怪的香蕉内容

有网友问到Google为什么要选择秘密发布，官方给出了这样的解释：

正在为全球规模的发布做准备工作。

网友：何时发布完整版本

既然官方都那样说了，网友们也坐不住了。

纷纷表示：那我们能用完整版了吗？

不过，虽然这个模型在图像生成的表现确实很好，但并不意味着它没有问题——

尤其是在大公司的服务政策下，很容易出现一些让人比较抓狂的情况：

有网友认为，这是一个非常有趣的营销方式，并且确实达到了他们想要的效果。

感兴趣的朋友也可以去试一下这个香蕉，哦不，这个Gemini 2.5 Flash Image。

参考链接：
[1]https://x.com/googleaistudio/status/1960344388560904213
[2]https://x.com/OfficialLoganK/status/1960343135436906754
[3]https://aistudio.google.com/prompts/new_chat?model=gemini-2.5-flash-image-preview
[4]https://techcrunch.com/2025/08/26/google-geminis-ai-image-model-gets-a-bananas-upgrade/
[5]https://deepmind.google/models/gemini/image/

— 完 —

量子位 QbitAI · 头条号签约

关注我们，第一时间获知前沿科技动态

作者头像

AI前线

专注人工智能前沿技术报道，深入解析AI发展趋势与应用场景

246篇文章 1.2M阅读 56.3k粉丝

评论 (128)

用户头像

AI爱好者

2小时前

这个更新太令人期待了！视频分析功能将极大扩展AI的应用场景，特别是在教育和内容创作领域。

用户头像

开发者小明

昨天

有没有人测试过新的API响应速度？我们正在开发一个实时视频分析应用，非常关注性能表现。

作者头像

AI前线作者

12小时前

我们测试的平均响应时间在300ms左右，比上一代快了很多，适合实时应用场景。

用户头像

科技观察家

3天前

GPT-4的视频处理能力已经接近专业级水平，这可能会对内容审核、视频编辑等行业产生颠覆性影响。期待看到更多创新应用！

文章章节

1. GPT-4简介与注册指南

1.1 账号注册步骤

推荐文章

何必DiT！字节首次拿着自回归，单GPU一分钟生成5秒720p视频

何必DiT！字节首次拿着自回归，单GPU一分钟生成5秒720p视频

5月前 • AI热点

用户破8亿！GPT-5.1来了，表情包含量可自定义

用户破8亿！GPT-5.1来了，表情包含量可自定义

5月前 • AI热点

发布即开放：百度猎户座葫芦里卖的什么药？

发布即开放：百度猎户座葫芦里卖的什么药？

5月前 • AI热点

李飞飞的世界模型来了！一句话生成3D世界，AI 真的开始理解现实了

李飞飞的世界模型来了！一句话生成3D世界，AI 真的开始理解现实了

5月前 • AI热点

科技巨头「偷偷借钱」搞AI，次贷危机魅影重现？

科技巨头「偷偷借钱」搞AI，次贷危机魅影重现？

5月前 • AI热点

腾讯总裁剧透微信搭载智能体！阿里和谷歌也都开始互相伤害了

腾讯总裁剧透微信搭载智能体！阿里和谷歌也都开始互相伤害了

5月前 • AI热点

AIGC大模型能力提升10倍！安谋科技Arm China掏出最强NPU IP大招

AIGC大模型能力提升10倍！安谋科技Arm China掏出最强NPU IP大招

5月前 • AI热点

速抢（2核2G）77元/年香港免备案服务器

速抢（2核2G）77元/年香港免备案服务器

0秒前 • AI热点

热门标签

大数据推荐给需要的人动态壁纸发现《莫愁乡》高科技产业发现《Aloha Heja He》瓦卡奖VACAT征集大赛京犀App 合同审查助手赛力斯汽车 AI生成美女

热门作者

作者头像

AI前沿

2.4k 粉丝

作者头像

机器学习实验室

1.8k 粉丝

作者头像

AI创业圈

3.1k 粉丝