最近火出圈的图片生成模型:nano banana
中文直译:小香蕉
八月中旬,我的两个好朋友 Zho 和 歸藏 就开始疯狂测试、安利。
最早模型出现在著名的大模型盲测投票网 LMarena,排名一路攀升。
https://lmarena.ai/
近几天答案揭晓,模型原来是谷歌出品,怪不得这么强!
现已经是 LMarena 文生图和图片编辑双榜第一。
先感受下,这个模型多么有趣
模型最大亮点:人物一致性保持极好,语义理解能力超一流。
图片任意组合,风格迁移、动作迁移、一致性保持,真的已接近会说话就能 PS 的水平。
技术发展就是这么出乎意料。
去哪用 Nano banana?
谷歌 Gemini 灰度中,另外谷歌 AI Studio 也能体验。
https://aistudio.google.com/
可惜,国内无法直连。
好消息是,超级勤奋(卷)的设计 AI Agent Lovart.ai 团队。
谷歌上线 API 第二天就完成接入。
不仅国内可直接访问,且这周末搞活动,完全免费用 Nano banana!
最重要的是,因为Lovart是专业设计 Agent。
不仅有最适合创意灵感发挥的无限画布。
还内置PS常用工具如画笔、钢笔、图形等图片编辑工具。
甚至支持音乐、视频生成,组合起来直接能做广告宣传片。
交互体验,比谷歌官方强太多。
真的是模型越强、产品越强的 AI Native 产品典范。
分享些 Lovart 用 Nano Banana 的案例,抛砖引玉。
Lovart 上用 Nano Banana
打开下面网址
https://www.lovart.ai/
点选左侧项目图标 -> 新建项目
Lovart.ai 是 Agent 产品,会根据用户意图自动调用模型。
在对话框,按下图操作,可指定模型为 Nano Banana。
避免路由到其他模型,消耗积分。
案例1:参考姿势生成
任意一张人物,给一张姿势参考图。
选中全部图片,按Tab键,输入提示词
图1参考图2姿势生成真人写实风格图片
模特模仿梦露经典动作的照片就生成好了。
另外,Lovart 能识别画笔标注和文字,按指引生成图片。
还能裁切、放大、去背景等,调整起来图片,异常方便。
前段时间,和一个年营收规模3-4个亿的内衣电商老板聊。
他说每年模特拍摄的费用一般占成本的1%~1.5%
也就是100-200w。
请模特要排期(15-30天),对模特要求也高,比如胸罩要匹配胸型和罩杯。
拍摄场景也有限,比如想拍阿拉善沙漠场景,就比较难。
现在有了Nano Banana,如果用的好,是不是立省上百万?
应用拓展
超强的人物一致性 + 姿势参考,可用场景非常多。
比如证件照、婚纱照、满月照,都能从手机照片或已有照片生成。
为方便大家一起玩 Nano Banana。
今天从网上收集了不少拍照姿势线稿:
需要的自取:
https://xiangyangqiaomu.feishu.cn/wiki/AWzfwfqUui2gdykZ08bck1Cinpf
案例2:商业广告
让 AI 模特拿起真实商品展示,保留细节不失真。
一直是图像生成领域,非常有挑战的事儿。
这次,用 Nano Banana 试试。
Lovart 除了选中图片,按Tab 输入提示词生成外。
其实,也可以选中一张或多张图片,按 Command + Enter 添加到对话框,或右键选择菜单“Add to chat”。
好处:能看到 Agent 推理执行过程,也方便对话迭代。
用我们刚才生成好的 AI 模特,右侧放一个可乐罐。
输入提示词:
图一模特拿着图二的饮料推荐
生成效果如下:
感觉还原的还OK。
可乐罐没有明显失真,大小比例也没毛病。
又测一个包装有中文的饮料:“椰树牌椰汁”
这次就有点问题了。
可能因为谷歌出的模型,对中文字支持不好,饮料罐大小也不够合理。
不过,整体还是有点厉害。
对于一些小商家来说,能达到类似效果,已经很不错。
至少比自己 PS 水平好不少了。
案例3:组合工具做视频
视频生成,很多时候都是先生成图片。
基于图片生成视频片段做拼接。
Nano Banana 让图片生成人物、场景一致性提升。
基于这些图片再生成视频,就变得很靠谱。
Lovart 也内置了Kling 2.0 等视频生成模型、Suno音频生成模型。
这些工具组合,很快就能通过自然语言设计一个广告宣传片。
例如,先用下面提示词设计一个叫“QIAOMU”的香水(用到zho的图)。
盖子用金属和大理石制作,瓶身用磨砂玻璃制作,品牌叫“QIAOMU”,设计风格简约。
生成效果如下
后来觉得金属瓶盖不好看,也改成大理石。
让 AI 美女用手托着香水展示。
跟 Lovart 对话修改,让瓶子大小更合理。
不断地对话优化,制作几个不同的特写镜头。
选中这三张图片,输入提示:
你是一位顶尖的香水广告导演和视觉特效艺术家。你的任务是为AI视频生成模型设计一个从【起始帧】到【结束帧】的香水广告转场过程。
制作一个名为"QIAOMU"香水的广告视频,使用可灵2.1首尾帧视频模型。
**核心目标:** 构思并用一段话清晰、具体地描述这个动态视觉变化,突出香水的优雅质感和品牌魅力。
**创作框架:**
**第一步:分析画面焦点变化**
- **A类 - 焦点渐进:** 从女孩整体到手部香水的焦点转移
- **B类 - 场景切换:** 完全不同的拍摄角度或环境
**第二步:选择转场策略**
- **A类:** 采用**"推镜聚焦"策略** - 摄像机缓慢推进,焦点从人物逐渐转移到香水产品
- **B类:** 采用**"运镜切换"策略** - 使用旋转、移动或特殊角度变化连接不同场景
**第三步:香水广告专用视觉元素**
- **产品展示:** 香水瓶身反光、液体折射、品牌标识清晰呈现
- **优雅动作:** 女孩手部动作的优雅性、香水的稳定托举
- **光影效果:** 柔和光线、高级质感、奢华氛围
- **品牌调性:** 体现"QIAOMU"品牌的独特气质
**输出要求:**
- 描述要突出香水的质感和女性的优雅
- 重点描述摄像机推进过程中的焦点变化
- 强调产品的视觉吸引力和品牌价值
对话要求视频拼接,加上BGM,宣传片就做好了。
短视频制作
马斯克和小扎之前约架要笼斗,可惜不了了之。
前几天“广州小孩”街霸 6 再次艰难夺冠,勾起我对街机的回忆。
用Nano 把他俩都做成街霸 6 角色,哈哈哈。
持续对话修改。
你一脚,我一拳,干起来。
这升龙拳,有点不太像,哈哈。
这几张图,交给 Lovart 的可灵2.1 生成视频,Suno生成格斗BGM,视频拼接如下。
其他场景案例
生成拆解图
直接对话生成,或先用 Lovart 创建一个矩形。
输入提示词:
绘制一幅展示 [电吉他] 工作原理的3D立体剖面设计图,以高度还原的方式精细呈现其内部结构。每个零部件被拆解并有序排列,各部分均配有清晰英文标注,注明结构名称与功能说明,整体布局兼具专业性与视觉逻辑性。
在教育领域也有场景,比如物品拆解、原理展示等。
黑白变成彩色照片
变成彩色照片,增加细节,增强质感,调整光影效果
提供衣物换装
展示女模特穿着提供的服装
跟Lovart对话,要求转身,或做出不同的姿势。
转身后效果
更多玩法
Nano Banana实在是有太多创意玩法。
尤其是 X 上看的案例,让人眼界大开。
国内大家看到的很多玩法,基本都来自于 X,已经转了好几手...
如果你不方便访问,我帮你收藏整理 X 上最热门的Nano Banana玩法和提示词。
https://xiangyangqiaomu.feishu.cn/wiki/WePCw9HN5ibEHNk72IwcvNo2nmr
写在后面
别看我写了这么多,其实我自己都还没玩够。
Nano Banana + Lovart 这套组合,像开了无限创意外挂。
一不小心就玩到天亮。
今天分享的玩法,只是冰山一角。
真正的乐趣,是亲自探索,把脑海里的想法变成作品,甚至创造出属于自己的风格。
不止是玩,两个工具的组合,也非常有商业潜力。
比如电商、教育、自媒体,都有很多使用场景。
欢迎在评论区分享你的创作成果。
说不定下一个爆火的Nano Banana玩法,就是你无心插柳的探索。
记得三连支持,点个赞、在看、转发,召唤更多脑洞玩家入伙!
想第一时间收到新玩法,顺手点个星标,咱们评论区不见不散~
感谢你看到最后,期待你的骚操作和神评论!
Nano Banana模型免费到这周日,抓紧玩起来,网址见下方。
本文由公众号“向阳乔木”授权AI产品之家转载,原文连接: https://mp.weixin.qq.com/s/tNj_URkxuLJT7R7E9AsN8Q