编辑:好困 桃子

【新智元导读】AI圈集体失眠!Nano Banana 2深夜炸场,登顶文生图榜首,以Flash级速度暴力直出Pro级4K超清画质。更离谱的是,成本直接砍半,全网首测玩疯。

一周一更,谷歌又在深夜扔出「深水炸弹」。

就在刚刚,最强生图模型Nano Banana 2横空出世,背靠全新Gemini 3.1 Flash Image。

它不仅生成速度飞快,多语言文字处理更强,还能实时联网,一次直出4K大片。

刚一发布,全网就被它的恐怖实力刷屏了。

一句话直接生成游戏UI界面;随手一张草图变成网页版UI;一次输出20张连环画,眼都不眨一下。

网友直呼:设计师完蛋了!

甚至,NB2写的汉字稳得一批,彻底告别了「鬼画符」。

各大评测,更是坐实了Nano Banana 2生图一哥的地位。

在Artificial Analysis的文生图基准测试中,它轻松拿下全球第一。

在图像编辑能力上则位列第三,仅次于GPT Image 1.5和Nano Banana Pro。

在Image Arena中,NB2文生图同样问鼎榜首,斩获1279 Elo得分,图像编辑实力仅次于GPT Image。

谷歌官方测评中,NB2(开启Thinking + 文本搜索 + 图像搜索后)在整体偏好、视觉质量和信息图表准确性三个维度上,不仅全面压制了GPT-Image 1.5、Grok Imagine Image Pro等一众竞品,甚至还超越了大哥Nano Banana Pro。

而且,它的输出价格只要0.0672美元/张,仅为Pro的一半。

01

快,但不只是快

话不多说,下面我们就来看看它都有哪些杀手级本领。

第一个是世界知识。

Nano Banana 2全面接入了Gemini的知识库和实时网络搜索。

你让它画一座真实存在的建筑,它会先上网搜一搜视觉参考资料,搞清楚这地方到底长什么样,然后再按照你指定的风格渲染。

这种理解力也让它能直接帮你做信息图表、把笔记变成示意图、生成数据可视化。

比如,让它生成水循环的科普信息图。

模型选择了正上方俯拍的鸟瞰视角,在干净的浅灰色纹理背景上,把水循环的每个步骤从左到右清晰铺开。

背景上还画了简约的黑色手绘箭头来引导视线,光线柔和均匀,几乎没有阴影干扰,整体既有教育感又不沉闷,是那种你真的可以直接拿去课堂用的水平。

描绘水循环的平铺俯拍信息图

描绘水循环的平铺俯拍信息图

再看这张云类型的对比图。

它采用了三联画的形式,把积云、层云和卷云分别放在三个画幅中,每种云都有极具戏剧感的天空作为背景,配上醒目的标签文字。

整体是高对比度的美漫风格,信息清晰,视觉冲击力也拉满了。

对比不同云类型的三联画信息图

对比不同云类型的三联画信息图

这张则是让模型先搜索克洛·吕斯城堡(达·芬奇晚年居住的法国城堡)的真实照片作为参考,然后用色彩明艳的综合立体主义风格重新演绎。

模型不仅准确还原了建筑的基本结构特征,还把立体主义那种多视角拼贴、几何化解构的精髓融了进去,而且严格遵守了「无文字」的要求。

这就是「世界知识」带来的差距——它知道这座城堡长什么样,而不是凭空捏造。

更厉害的是,谷歌还专门做了一个叫「Window Seat」(靠窗座位)的应用来秀这个能力。

具体来说,他们让Nano Banana 2调用知识库和网络图像搜索,再结合世界各地的真实场景和实时天气数据,生成逼真的飞机窗外风景。

相当于给你来了一场足不出户的环球旅行,而且每一帧窗外的景色都基于真实的地理和气象信息,不是随便糊弄的。

本文转自:凤凰网科技

原文地址: https://tech.ifeng.com/c/8r23jPimK0p