财联社11月21日讯(编辑 史正丞)北京时间周四深夜,AI巨头谷歌麾下的Nano Banana图像生成模型迎来重磅更新——Nano Banana Pro闪亮登场!

作为背景,谷歌于今年8月底发布基于Gemini 2.5 Flash模型的Nano Banana。由于该模型能够将人物或者动漫照片变成栩栩如生的“3D打印手办”,短时间内形成全球范围内的破圈效应。谷歌CEO皮查伊披露,在Nano Banana的推动下,Gemini应用的月活用户数在短短1个季度内,就从4.5亿暴增至6.5亿

随着本周谷歌发布新一代旗舰大模型,谷歌的图像生成模型也迎来了意料之中的飞跃式升级。

用谷歌的话来讲,Nano Banana Pro能“以空前的控制力、无瑕的文字呈现和增强的世界知识,将用户的构想变成工作室级的设计”。

据谷歌介绍,Nano Banana Pro基于本周早些时候发布的Gemini 3 Pro,不仅在细节表现力、图像分辨率和文本渲染准确性方面强于前一代Nano Banana,还能以不同风格、字体和语言生成本文。新一代图像生成模型还新增了编辑功能,并加入互联网搜索能力。

谷歌强调,Nano Banana Pro是在图像中生成正确且清晰可读文字的最佳AI模型,不论是简短的标语还是长段落均可,支持更加丰富的纹理、字体和书法。同时借助Gemini增强的多语言推理能力,用户可以生成多种语言的文本,或者对内容进行翻译和本地化。

image

image

(将一张照片转化为电影分镜,以及翻译饮料包装上的文字,来源:谷歌)

同时基于互联网知识库,Nano Banana Pro还能将现实世界的信息转化为生动形象的可视化信息,例如如何制作一杯豆蔻茶。

image

谷歌透露,Nano Banana Pro也非常适合用来做PPT或者信息图表,同时会加入谷歌的办公套件Workspace。

Google Labs和Gemini副总裁Josh Woodward介绍称:“Nano Banana Pro在信息图表方面非常出色,可以用来制作幻灯片。它最多可以处理14张不同的图像,或5个不同的角色,并在某种程度上保持角色一致性。”

image

对于创意产业的工作者而言,Nano Banana Pro也大幅升级了编辑功能,直接将创意的决策权交到使用者手中。

谷歌介绍称,新的编辑功能支持改变相机角度、场景光线、景深、对焦等,同时可以调整多种纵横比,分辨率也从Nano Banana的1024X1024上升到最高4K。

image

image

(调整角度或图片焦点)

谷歌正在各项AI工具中推出Nano Banana Pro,包括免费用户在内,都能在Gemini等应用中试用这一新功能(但会有限制配额)。Google AI Plus、Pro和Ultra订阅用户会获得更高的配额。谷歌也表示,该功能随后也将率先在Flow(谷歌的AI电影制作工具)向Ultra订阅用户推出。

本文转自:凤凰网科技

原文地址: https://tech.ifeng.com/c/8oRjo7feLzr