最近火出圈的图片生成模型：nano banana

中文直译：小香蕉

八月中旬，我的两个好朋友 Zho 和歸藏就开始疯狂测试、安利。

最早模型出现在著名的大模型盲测投票网 LMarena，排名一路攀升。

https://lmarena.ai/

近几天答案揭晓，模型原来是谷歌出品，怪不得这么强！

现已经是 LMarena 文生图和图片编辑双榜第一。

先感受下，这个模型多么有趣

模型最大亮点：人物一致性保持极好，语义理解能力超一流。

图片任意组合，风格迁移、动作迁移、一致性保持，真的已接近会说话就能 PS 的水平。

技术发展就是这么出乎意料。

去哪用 Nano banana？

谷歌 Gemini 灰度中，另外谷歌 AI Studio 也能体验。

https://aistudio.google.com/

可惜，国内无法直连。

好消息是，超级勤奋（卷）的设计 AI Agent Lovart.ai 团队。

谷歌上线 API 第二天就完成接入。

不仅国内可直接访问，且这周末搞活动，完全免费用 Nano banana！

最重要的是，因为Lovart是专业设计 Agent。

不仅有最适合创意灵感发挥的无限画布。

还内置PS常用工具如画笔、钢笔、图形等图片编辑工具。

甚至支持音乐、视频生成，组合起来直接能做广告宣传片。

交互体验，比谷歌官方强太多。

真的是模型越强、产品越强的 AI Native 产品典范。

分享些 Lovart 用 Nano Banana 的案例，抛砖引玉。

Lovart 上用 Nano Banana

打开下面网址

https://www.lovart.ai/

点选左侧项目图标 -> 新建项目

Lovart.ai 是 Agent 产品，会根据用户意图自动调用模型。

在对话框，按下图操作，可指定模型为 Nano Banana。

避免路由到其他模型，消耗积分。

案例1：参考姿势生成

任意一张人物，给一张姿势参考图。

选中全部图片，按Tab键，输入提示词

图1参考图2姿势生成真人写实风格图片

模特模仿梦露经典动作的照片就生成好了。

另外，Lovart 能识别画笔标注和文字，按指引生成图片。

还能裁切、放大、去背景等，调整起来图片，异常方便。

前段时间，和一个年营收规模3-4个亿的内衣电商老板聊。

他说每年模特拍摄的费用一般占成本的1%~1.5%

也就是100-200w。

请模特要排期（15-30天），对模特要求也高，比如胸罩要匹配胸型和罩杯。

拍摄场景也有限，比如想拍阿拉善沙漠场景，就比较难。

现在有了Nano Banana，如果用的好，是不是立省上百万？

应用拓展

超强的人物一致性 + 姿势参考，可用场景非常多。

比如证件照、婚纱照、满月照，都能从手机照片或已有照片生成。

为方便大家一起玩 Nano Banana。

今天从网上收集了不少拍照姿势线稿：

需要的自取：

https://xiangyangqiaomu.feishu.cn/wiki/AWzfwfqUui2gdykZ08bck1Cinpf

案例2：商业广告

让 AI 模特拿起真实商品展示，保留细节不失真。

一直是图像生成领域，非常有挑战的事儿。

这次，用 Nano Banana 试试。

Lovart 除了选中图片，按Tab 输入提示词生成外。

其实，也可以选中一张或多张图片，按 Command + Enter 添加到对话框，或右键选择菜单“Add to chat”。

好处：能看到 Agent 推理执行过程，也方便对话迭代。

用我们刚才生成好的 AI 模特，右侧放一个可乐罐。

输入提示词：

图一模特拿着图二的饮料推荐

生成效果如下：

感觉还原的还OK。

可乐罐没有明显失真，大小比例也没毛病。

又测一个包装有中文的饮料：“椰树牌椰汁”

这次就有点问题了。

可能因为谷歌出的模型，对中文字支持不好，饮料罐大小也不够合理。

不过，整体还是有点厉害。

对于一些小商家来说，能达到类似效果，已经很不错。

至少比自己 PS 水平好不少了。

案例3：组合工具做视频

视频生成，很多时候都是先生成图片。

基于图片生成视频片段做拼接。

Nano Banana 让图片生成人物、场景一致性提升。

基于这些图片再生成视频，就变得很靠谱。

Lovart 也内置了Kling 2.0 等视频生成模型、Suno音频生成模型。

这些工具组合，很快就能通过自然语言设计一个广告宣传片。

例如，先用下面提示词设计一个叫“QIAOMU”的香水（用到zho的图）。

盖子用金属和大理石制作，瓶身用磨砂玻璃制作，品牌叫“QIAOMU”，设计风格简约。

生成效果如下

后来觉得金属瓶盖不好看，也改成大理石。

让 AI 美女用手托着香水展示。

跟 Lovart 对话修改，让瓶子大小更合理。

不断地对话优化，制作几个不同的特写镜头。

选中这三张图片，输入提示：

你是一位顶尖的香水广告导演和视觉特效艺术家。你的任务是为AI视频生成模型设计一个从【起始帧】到【结束帧】的香水广告转场过程。

制作一个名为"QIAOMU"香水的广告视频，使用可灵2.1首尾帧视频模型。

**核心目标：** 构思并用一段话清晰、具体地描述这个动态视觉变化，突出香水的优雅质感和品牌魅力。

**创作框架：**

**第一步：分析画面焦点变化**
- **A类 - 焦点渐进：** 从女孩整体到手部香水的焦点转移
- **B类 - 场景切换：** 完全不同的拍摄角度或环境

**第二步：选择转场策略**
- **A类：** 采用**"推镜聚焦"策略** - 摄像机缓慢推进，焦点从人物逐渐转移到香水产品
- **B类：** 采用**"运镜切换"策略** - 使用旋转、移动或特殊角度变化连接不同场景

**第三步：香水广告专用视觉元素**
- **产品展示：** 香水瓶身反光、液体折射、品牌标识清晰呈现
- **优雅动作：** 女孩手部动作的优雅性、香水的稳定托举
- **光影效果：** 柔和光线、高级质感、奢华氛围
- **品牌调性：** 体现"QIAOMU"品牌的独特气质

**输出要求：**
- 描述要突出香水的质感和女性的优雅
- 重点描述摄像机推进过程中的焦点变化
- 强调产品的视觉吸引力和品牌价值