AI热点 4小时前 188 阅读 0 评论

谷歌认领最强AI版Photoshop!现在人人可用,效果确实强悍

作者头像
量子位

AI技术专栏作家 | 发布了 246 篇文章

不圆 时令 发自 凹非寺

量子位 | 公众号 QbitAI

爆火的神秘图像编辑模型nano-banana,终于脱掉了“香蕉皮”!

就在今天,谷歌官方认领,并表明这个模型其实是Gemini 2.5 Flash Image

最新一波官方Demo也来了:

还展现出了高超的图像推理能力:

现在该模型可以在Gemini和Google AI Studio上免费使用,同时API以每张图像0.039$(折合人民币0.28¥)的价格开放。

模型的具体表现如何?一起来看~

出色的图像编辑能力

官方给出了很多有趣的用法。

除了常规的修图方式,它还可以合并最多三张图片来创造新事物。

生成超现实艺术,组合不同的照片元素,或无缝融合物体、颜色和纹理。

或者轻松实现设计想法。

还可以用几张照片生成堪称电影画面的连贯剧情故事。

而在官方实锤之前,网友们也早就被nano-banana的各种私家case吸引,开启疯狂讨论。

比如说精准改变面部表情和天气。

或者让秃头男人重新拥有不同发型。

网友表示:PhotoShop岌岌可危。

毕竟这个“香蕉”不仅可以完成平面图像的编辑,甚至还可以进行2D到3D的转换。用户只需提供一张普通的2D图片,系统就可自动生成相应的3D视角,每一个角度都是恰到好处、和谐统一。

最最最牛的是,它竟然还可以进行图像推理。勾股定理so easy,计算角度手拿把掐,识别图像里的水母结构,竟然也是瞬间反应,堪称你画我猜AI版。

说实话,最让我佩服的是,当我们要求此“香蕉”给出一个人从A到B的方案时,它竟然直接生成一个梯子!

好好好,图像编辑器真的能思考了。

我们自己也实测了一下这款模型,发现它确实很有意思:

给它一只猫猫,猫能环游世界。

提示词:以这只猫为主角,生成旅游照。

提示词:让猫猫去故宫拍张自拍照。

如果不想做真实场景,让林黛玉和孙悟空成为漫威英雄并肩战斗也就一句话的事儿~

另外,它对光影的细节理解也相当真实。

提示词:一根香蕉被放在厨房台面上,旁边有水杯、刀具和切菜板,阳光从窗户照进来,香蕉投下自然阴影。

可以看到生成结果还是很不错滴,阳光透过水杯折射的影子以及旁边植物的影子都还算合理。

它还能够很好地抓取角色特征,不出意外地改变角色主体:

如果那一年,工藤新一喝下的并不是缩小药水,而是……

神秘香蕉模型

Nano Banana最初出现在一个名为LMArena的网站上,这是一个让不同AI模型匿名进行“战斗模式”竞赛的地方。

而让Nano-banana爆火的原因无他,表现实在太好了。

这又是一个SOTA级别的图像编辑模型——而且在一开始没有任何官方文档。

不过在官方宣布之前,已经有一些人猜到了这是谷歌家族的一员。

一方面,该模型的表现与Gemini近期发布的多模态版本相似,这样出色的性能很难是车库团队的产品。

另一方面,它的发布策略——匿名发布、无品牌标识、让用户群体自行探索——与DeepMind早期在匿名测试平台上评估大语言模型的方式如出一辙。

还有一点额外原因:一些与谷歌有关联的开发者在社交媒体上发了奇怪的香蕉内容

有网友问到Google为什么要选择秘密发布,官方给出了这样的解释:

正在为全球规模的发布做准备工作。

网友:何时发布完整版本

既然官方都那样说了,网友们也坐不住了。

纷纷表示:那我们能用完整版了吗?

不过,虽然这个模型在图像生成的表现确实很好,但并不意味着它没有问题——

尤其是在大公司的服务政策下,很容易出现一些让人比较抓狂的情况:

有网友认为,这是一个非常有趣的营销方式,并且确实达到了他们想要的效果。

感兴趣的朋友也可以去试一下这个香蕉,哦不,这个Gemini 2.5 Flash Image。

参考链接:
[1]https://x.com/googleaistudio/status/1960344388560904213
[2]https://x.com/OfficialLoganK/status/1960343135436906754
[3]https://aistudio.google.com/prompts/new_chat?model=gemini-2.5-flash-image-preview
[4]https://techcrunch.com/2025/08/26/google-geminis-ai-image-model-gets-a-bananas-upgrade/
[5]https://deepmind.google/models/gemini/image/

— 完 —

量子位 QbitAI · 头条号签约

关注我们,第一时间获知前沿科技动态

作者头像

AI前线

专注人工智能前沿技术报道,深入解析AI发展趋势与应用场景

246篇文章 1.2M阅读 56.3k粉丝

评论 (128)

用户头像

AI爱好者

2小时前

这个更新太令人期待了!视频分析功能将极大扩展AI的应用场景,特别是在教育和内容创作领域。

用户头像

开发者小明

昨天

有没有人测试过新的API响应速度?我们正在开发一个实时视频分析应用,非常关注性能表现。

作者头像

AI前线 作者

12小时前

我们测试的平均响应时间在300ms左右,比上一代快了很多,适合实时应用场景。

用户头像

科技观察家

3天前

GPT-4的视频处理能力已经接近专业级水平,这可能会对内容审核、视频编辑等行业产生颠覆性影响。期待看到更多创新应用!