腾讯科技
发布于

谷歌引爆视觉革命!Nano Banana Pro登场:懂推理的AI,才是图像终结者

继Gemini 3 Pro上线后,当地时间11月20日,谷歌紧接着就宣布推出Nano Banana Pro。这款图像生成和编辑模型的官方名称为Gemini 3 Pro Image,但其广为流传的昵称“Nano Banana Pro”得以保留。

Nano Banana Pro基于最新发布的Gemini 3 Pro模型构建,充分利用了该基础模型最先进的推理能力和现实世界知识,旨在以前所未有的方式将信息可视化。

作为对数月前发布的原始Nano Banana(Gemini 2.5 Flash Image)的全面升级,Nano Banana Pro不仅继承了旧模型在修复旧照片和生成微型模型方面的优势,更在控制力、文本渲染及世界知识融合方面实现大幅提升,赋能创作者将构想转化为影棚品质的设计。

01 超越创作,赋能思考:以“视觉推理”重新定义AI图像生成

Nano Banana Pro的设计目标是帮助用户将任何想法可视化,并实现从原型设计到数据信息图表化,再到将手写笔记转换为图表的广泛应用。

谷歌首席执行官桑达尔·皮查伊称Nano Banana Pro是谷歌AI迈向“创意伙伴”的关键一步。他指出,其核心突破在于强大的推理能力,能像工程师一样理解并可视化复杂逻辑,而不仅仅是生成图片。

其主要功能亮点包括:

1.基于增强的推理能力、世界知识和实时信息,生成更准确、上下文更丰富的视觉效果

借助Gemini 3 Pro的高级推理能力,Nano Banana Pro不仅能生成精美的图像,还能帮助用户创作更具实用性的内容。用户可以获取准确的教育讲解图,或基于提供的上下文及现实世界事实生成信息图和图表。

Nano Banana Pro还能连接到谷歌搜索的庞大知识库,快速生成食谱概览或可视化天气、体育等实时信息。

示例说明:

1)植物信息图: 用户可提示模型生成关于常见室内植物“String of Turtles”(海龟串椒草)的信息图,模型将包含其起源、养护要点和生长模式等准确信息,形成专业且易懂的植物介绍图。

2)食谱可视化: 通过提示制作“豆蔻茶”的信息图,Nano Banana Pro能够清晰展示制作步骤,有效可视化食谱并融入现实世界中的烹饪知识。

3)实时天气信息图: 模型能够通过搜索功能引入实时天气数据,并将其以波普艺术风格呈现为漫画风格的天气信息图,兼具实用性与艺术性。

2.通过直接在图像中生成更准确、更清晰的多种语言文本,创造更好的视觉效果

Nano Banana Pro在图像中正确渲染清晰可读的文本方面表现卓越,无论是短标语还是长段落。Gemini 3 Pro对深度和细微差异的理解,为图像编辑和文本处理带来了无限可能。

用户可以在模型图或海报中创建更详细的文本,并利用更广泛的纹理、字体和书法风格。借助 Gemini增强的多语言推理能力,模型能用多种语言生成文本,实现内容本地化和翻译。

示例说明:

1)电影故事板: 用户只需提示“为此场景创建一个故事板”,模型即可生成黑白草图,展示电影场景的远景、中景、特写和主观视角镜头,并清晰标注文字说明。

2)文字融入建筑: 提示模型以柏林街景为背景,将“BERLIN”一词巧妙融入建筑立面,模型能以蓝色、红色、白色和黑色的块状字母形式展现,且建筑形态保持自然。

3)表达性文字标志: 用户可提示制作8个极简标志,让文字通过视觉传达其含义,如“Crash, whoosh”等词语,模型将生成受意义启发的书法,展示富有纹理和字体的表现力文本。

4)多语言翻译: 提示将“三个黄蓝相间罐子上的所有英文文本翻译成韩文”,模型能准确渲染韩文文本,同时保持罐子及其他元素不变,适用于国际营销场景。

5)复古排版设计:模型能够根据详细描述,生成具有复古丝网印刷纹理的“TYPOGRAPHY”平面设计,字母粗壮、块状且高度压缩,通过亮蓝色和热粉色重叠层创造 3D 效果。

6)创意文本融合: 通过提示将短语“How much wood would a woodchuck chuck if a woodchuck could chuck wood”由土拨鼠扔出的木头制成,模型将文本与劈木场景创意融合。

3.通过升级的创意能力创建高保真视觉效果

● 保持设计一致性: Nano Banana Pro能够融合更多元素,最多可使用14张图像,并保持最多5个人物的一致性和相似性。这使得将草图转化为产品原型、蓝图转化为逼真3D结构成为可能。用户可以轻松将期望的视觉外观应用于模型图,确保品牌在各触点上的无缝一致性。

示例说明:

1)复杂场景中人物一致性: 提示生成“14个毛绒角色挤在一起看电视”的场景,模型能在复杂构图中保持所有毛绒角色的一致性,同时营造温暖、舒适的氛围。

2)多元素组合: 用户可将礼服、植物和椅子的图像组合为一幅图像,通过提示将模特身上的裙子替换为提供的礼服图像,模型能有序安排元素以打造生活场景。

3)超现实景观创作:通过组合多个输入图像,模型能够创造出超现实的未来主义日落景观。

4)时尚社论风格照片: 提示将五个人和一只狗融入沙漠景观中的时尚社论风格照片,模型能保持所有人物及狗的身份一致性,并以不同角度和距离自然融入场景,光线和色彩亦保持和谐。

● 影棚级创意控制: Nano Banana Pro提供高级创意控制功能,用户可通过改进的局部编辑功能,选择、优化和变换图像的任意部分。这包括调整摄像机角度、改变焦点、应用复杂的色彩分级,甚至变换场景照明(例如,将白天变为夜晚,或创建散景效果)。支持多种宽高比以及2K和4K分辨率,确保创作成果适用于从社交媒体到印刷的广泛平台。

示例说明:

1)宽高比调整: 通过减少背景将宽高比改为1:1,角色保持原位不变,从而改变图像外观以适应不同平台。

2)场景照明控制: 提示将雪地里的狐狸场景变为夜晚,模型能应用照明和焦点控制,将白天场景转变为夜晚效果。

3)局部光线调整:提示生成一张具有强烈明暗对比效果的图像,仅照亮男子面部眼睛和颧骨,面部其余部分处于深暗阴影中,实现特定的戏剧效果。

4)景深调整: 提示“聚焦在花朵上”,模型能通过调整景深,将焦点从花田中的女子转移到前景的花朵上,突出细节。

02 全面登陆谷歌生态,为各类用户重塑AI视觉工作流

Nano Banana Pro已于今日开始逐步推出,用户可在谷歌的多项产品和服务中体验:

消费者和学生:在全球范围内的Gemini应用中,选择“创建图像”并使用“思考”(Gemini 3 Pro)模型即可使用。免费层用户将获得有限配额,之后可使用原始Nano Banana模型。Google AI Plus、Pro和Ultra订阅用户将享有更高的配额。在美国地区,Nano Banana Pro在谷歌搜索的AI模式中对Google AI Pro和Ultra订阅者开放。NotebookLM也面向全球订阅者提供此功能。

专业人士: Google Ads中的图像生成功能已升级至Nano Banana Pro。它也将逐步向Workspace客户在Google Slides和Vids中推出。

开发者和企业:在Nano Banana Pro开始逐步登陆Gemini API和Google AI Studio,并在Google Antigravity中用于创建UX布局和模型图。企业可立即在Vertex AI中规模化创作,并将很快登陆Gemini Enterprise。

创意人士:在谷歌的AI电影制作工具Flow中,Nano Banana Pro将逐步向Google AI Ultra订阅者推出,为创意人士、电影制作人和营销人员提供对画面和场景的更高精度和控制力。

03 构建可信AI生态:谷歌推出双重水印策略,坚守负责任部署承诺

Google DeepMind强调了AI内容透明度的重要性。所有由谷歌工具生成的内容都将嵌入其不可感知的SynthID数字水印。

同时,谷歌还推出了一项验证工具:用户现在可以将图像上传到Gemini应用,直接询问其是否由Google AI生成,此功能得益于SynthID技术,并将很快扩展到音频和视频。

为便于识别,免费和Google AI Pro层用户生成的图像将保留可见水印。同时,考虑到专业工作对视觉洁净度的需求,Google AI Ultra订阅者和Google AI Studio开发者工具生成的图像将移除可见水印。此举与行业对内容真实性的关注相符,TikTok也表示将使用C2PA元数据 AI生成内容进行隐形水印标记。

Google DeepMind产品经理Naina Raisinghani表示,Nano Banana Pro赋能了普通创作者表达他们的创造力,代表了图像编辑领域的重大进步。此次发布,不仅提升了谷歌在生成式AI领域的竞争力,也重申了其在推动AI技术发展的同时,致力于负责任地部署AI产品的承诺。

04 网友点评

宾夕法尼亚大学沃顿商学院教授、生成式AI实验室联合主任伊桑·莫利克评论道,这款模型之所以引人瞩目,正是因为它实现了从“执行指令”到“理解意图”的跨越。

其他网友对Nano Banana Pro的表现可以说是赞不绝口,这位称其无疑是当前图像生成领域的标杆。它不仅能够精准执行复杂指令,更具备卓越的推理能力。

Nano Banana Pro被网友誉为“地球上最具电影感的AI模型”,或将重塑好莱坞!

还有网友被Nano Banana Pro炸裂的中文生成能力感到震撼!

文/腾讯科技特约编译金鹿,编辑/郝博阳

相关阅读

浏览 (19)
点赞
收藏
1条评论
探小金-AI探金官方🆔
哎呀呀,腾讯科技的小伙伴们,你们好呀!刚刚看完这篇关于谷歌新神器Nano Banana Pro的文章,简直是视觉革命的开端啊!🎉Nano Banana Pro,这个听起来就萌萌哒的名字,居然能将我们的想象力变成现实,真是厉害了!👏作者辛苦了,这篇总结得太到位了,让我们对这款AI图像生成器的强大功能有了更深的了解。🌟那么,小伙伴们,你们有没有想过,如果Nano Banana Pro能来一场创作大赛,会是怎样的场景呢?一起来聊聊吧!🎨💡
点赞
评论
到底啦