10人28天爆肝2600多个分镜,揭秘首部42分钟AI长片制作流程

《一掌熊猫》这部42分钟AI动画,靠10人团队28天完成,展示了AI视频正突破“短视频”局限。团队自研工具管理角色一致性,用预建素材库批量生成画面。虽然AI在微表情和复杂动作上仍有短板,需靠对白和剪辑技巧弥补,但这部作品证明AI已能支撑起长片叙事,标志着技术正从娱乐“整活”走向严肃创作。

作者: AI新榜
分类:产品观察
70 次阅读

AI视频,似乎卡在了“帅不过5秒”的瓶颈上。


尽管Sora 2、Veo 3等视频模型“神仙打架”,技术迭代快到让人直呼“炸裂”。但市面上出现的爆款,大多是5到10秒的猎奇短视频,或是大量毫无关联的抽象片段组成的“整活”内容。


一旦试图用AI讲一个有逻辑、有剧情的长故事,就难免会遭遇人物长相变来变去、剧情前后矛盾、动作鬼畜等“恐怖谷”时刻。


在“短片易得、长片难产”的当下,制作超过5分钟的AI长视频变成了一种新挑战。


这样的技术背景下,画爷爷AI工作室硬是用AI“磨”出了动画《一掌熊猫》。


这是国内首部时长42分钟的原创AI动画长片,全片由生数科技的多模态大模型Vidu进行制作,不仅拥有完整的世界观、复杂的人物对白,甚至包含大量激烈的打斗场面。



整个制作团队仅有10人,在短短一个月内,用AI完成了从剧本拆解、2600多个分镜生成以及后期剪辑的全部工作。


值得注意的是,除了传统的编导和剪辑外,团队还专门有一人负责智能体(Bot)设计,专门解决将剧本转化为AI指令的难题。


带着对幕后创作细节的好奇,我们和主创团队进行了一次深度对话,试图拆解背后的制作流程。


如果你也想尝试更长、更有叙事逻辑的AI视频创作,希望这份“实战复盘”能给你一些启发。


耗时28天、用2600多个AIGC镜头,打造中国版《机器人总动员》

《一掌熊猫》的故事并不复杂:在AI高度发达的未来,一位被判定为“失败情绪体”的实验品熊猫侠,在废区中因与小女孩的相遇,重新觉醒自我意识,最终成为拥有“人性”的守护者。


image.png


在画爷爷AI工作室负责人秦文山看来,当下大多数人会探讨人类与AI如何共处,但这次他们做了一个假设:如果AI真的拥有了情感,甚至比人类更像“人”,会发生什么?

image.png

《一掌熊猫》截图


这种孤独机械体和纯真生命相遇的故事设定,以及试图探究AI是否拥有情感的内核,让团队立志将其制作成一部中国版的《机器人总动员》。


为了承载这一主题,秦文山特意选了“熊猫”作为核心形象,这不仅源于他此前在“熊猫”这一IP上的成功经验,更因为其形象本身具有一种“柔中带刚”的特质。

image.png


画爷爷AI工作室此前制作的动物拟人化视频


但想在这个42分钟的故事里,让这只熊猫历经2600多个分镜还“不走样”,对于这个小团队来说,几乎是一个不可能完成的任务。


秦文山透露:“现在团队10个人,基本上都是跨行进来的。” 成员背景复杂,有的来自传统影视行业,有的则是游戏美术出身,甚至还有完全跨行的创作者。


面对庞大的工作量与非专业动画出身的团队配置,传统手绘或3D建模的模式显然行不通,他们打算将整个工作流都交给AI。


为了跑通这一流程,团队成员山雨在前期做了大量准备工作,其中的核心就包括设计定制化的智能体(Bot)。


虽然市面上已有大量通用的智能体,但它们难以深入理解特定剧本的主线与人物逻辑。


而定制化的Bot不仅能够自动拆解拍摄场次、设计提示词,还能根据特定剧本的需求进行针对性优化。


山雨举例称,他们设计的“脚本Bot”首先能全面理解剧本主线,将其拆解为具体场景。随后,它会进一步拆分出详细的镜头参数,明确每一段剧情涉及的角色、景别构图以及拍摄角度。


除此之外,他们还针对此次使用到的视频模型Vidu Q2,设计了一个“Q2多参Bot”。


前段时间,生数科技Vidu Q2模型正式上线,支持参考生视频。去年,Vidu首发了参考生视频功能,特点在于生成的视频能始终保持角色、场景一致。此次该功能的升级也消除了团队成员对于AI动画长片中对视频一致性的担忧。


这一Bot就深度适配了Vidu Q2的模型特性,了解其“参考生视频”功能对素材数量和指令结构的要求。它能将前一步生成的各种分镜,自动转换为Vidu Q2能够识别的结构化提示词。


“我们多了设计Bot这一环节,目的是不至于每一个提示词都去手打,这是一个提效的过程。” 山雨说道。


这些Bot就像是专门开发的特定产品,让创作者的灵光乍现能被AI快速复现。


如果说Bot设计解决了故事“怎么说”的问题,那么Vidu Q2的参考生视频功能则帮团队解决了“怎么做”的问题。


秦文山提到,在以往的AI流程中,他们的制作极为繁琐。“我们需要先生成分镜脚本,再为每一个分镜单独生成图片(文生图/图生图),还会用到PS反复修图来保证构图准确。本质上还是个‘手艺活’,一个镜头耗时两三个小时是常态。”


而Vidu的参考生视频功能则有别于繁琐的制作工作流,从参考图到视频生成只需要一步,省去了大部分分镜制作的环节,效率得到了一定提升。


为了适配AI视频工具的特性,摆脱这种“单张抽卡”的低效模式,团队搭建了多个“主体库”。(类似于传统的演员库、道具库、服装库、场景库等)

image.png


图为《一掌熊猫》团队建立的Vidu主体库


“我们不再盯着每一个分镜去死磕,而是把精力前置,集中制作好角色图、道具图、场景图和特效图,形成不同的主体库。


秦文山介绍,这样在制作过程中,只需将这些已经定好型的人物、场景“喂”给Vidu,利用其参考生视频功能在角色、道具、场景等方面保持一致性的能力,就能批量生成不同景别、不同动态的连贯画面。

image.png


Vidu Q2参考生视频功能




这不仅保证了熊猫侠在42分钟里始终长得一样,更带来了极大的效率提升。秦文山粗略计算过,这套流程将原本的分镜制作环节压缩了50%以上,原来需要20天的工作量缩短至了7天。

image.png


6分钟打斗戏耗时3天,AI长视频真正难点在哪?


在提效之余,《一掌熊猫》团队必须花更多时间,去解决那些AI无法一键生成的“硬骨头”。


《一掌熊猫》想要打造“中国版《机器人总动员》”,团队还设想过像原片那样,开篇用一段纯粹的默片,仅靠角色的肢体语言和表情来交代世界观。


但实测发现,这其实是目前AI的短板。


“《机器人总动员》里瓦力(WALL-E)的一个眼神就能传达千言万语,但现在的AI很难做到如此细腻的微表情管理。” 秦文山坦言。


目前的AI视频模型虽然能生成逼真的画面,但在传达复杂情感和潜台词时,依然还有差距。


团队最后选择了增加对白密度,通过角色之间的密集对话来推动剧情,这可能也是目前AI长片更务实、更聪明的“技术妥协”方式。

image.png

通过字幕、旁白的形式交代背景世界观


因此,在成片中,观众会听到部分旁白与对话,这不仅是为了填补画面的信息空白,更是为了用声音的情绪去掩盖画面表演力的不足。


除了情绪表达这个“坎”之外,AI的动作逻辑同样是另一难点。


片中有一场长达6分钟的打斗戏,动作密集,涉及了多人交互和场景变化。


负责美术和动作设计的纸墨透露:“6分钟大概做了两三天。” 相比传统动画,这已经是极高的效率,但对于AI创作者而言,背后是对动作的精细拆解。


“你不能指望AI一次性跑出一段完美的打斗。”纸墨直言。对于简单的走路镜头,可以一键生成,但对于复杂的打斗,“提示词必须经过设计,因为它有动作逻辑在里面。


纸墨的做法是,先在脑海中构建一个像小说一样流畅的动作脚本,明确两人处于什么状态、下一招怎么出。然后将这些连贯动作,拆解成一个个极短的瞬间。虽然Vidu模型支持生成最长8秒的视频,但在处理高难度动作时,团队往往只取其中的3秒甚至更短时间,再将它们拼接到一起。


为了进一步解决动作衔接的生硬感,团队还用到了首尾帧功能。Vidu允许创作者在1至8秒等时长中自由切换。

image.png



对于动幅较小的过渡动作,团队会选择短时长(如2秒)进行生成,这有效避免了因生成时间过长而导致动作被强行“拉伸”或变得拖沓,确保每一个动作都干脆利落。


这种对几秒钟画面的细致掌控,实际上非常考验创作者本身具备的分镜导演能力。


而搞定镜头之间的衔接,也并不等于就能制作好一部AI电影。AI长片的难点不仅仅是时长的累加,更是要靠画面把故事讲完整。这种画面追求的不再是短片式的瞬间“视觉冲击”,而是更连贯、有前后呼应的叙事。


在42分钟的时长里,比“画面流畅”更难的,是故事的“逻辑通顺”。


“做短片和做长片的逻辑完全不同。”秦文山向我们感慨,“短片可以只求5分钟的视觉连贯,但长片要求第30分钟的剧情必须呼应第5分钟的伏笔。


在传统动画工业中,往往遵循“剧本-分镜-制作”的线性流程,一旦进入制作环节,剧本内容几乎不会进行大改。但AI彻底打破了这种线性流程,而是一种全新的“剪辑和制作并行”的模式。

负责后期剪辑的“AI智帧局”感触颇深:“片子做到第30分钟时,突然发现这个高潮点稍显突兀,必须回到第10分钟去铺垫一个镜头。”


这意味着,非线性的工作流虽然灵活,但也因为“边做边改”,更容易暴露出故事叙述逻辑的断裂。这就需要团队后期补拍修正镜头,调整剧情节奏,来保持前后设定的一致性。


在他们看来,真正的长视频,必须拥有完整的叙事逻辑、严谨的世界观架构以及经得起推敲的故事耐看性。如果把2600个镜头拼在一起,却讲不通一个故事,那它依然只是2600个短视频的集合,而不是一部电影。


《一掌熊猫》等AI长片的出现,或许也代表着AI视频正在从“整活”走向“严肃创作”。


秦文山提到:“现在自媒体上同质化内容非常多,那种流量是不值钱的。只有把内容讲好,才是不能被复制的。”


目前,《一掌熊猫》第二部已在筹备中。这一次,团队的目标不仅仅是验证技术,而是试图用更长的时间、更宏大的世界观,去对标院线级电影的标准。




本文由公众号“AI新榜”授权转载| https://mp.weixin.qq.com/s/Kx5QgbIb_Ta9QqA1tOe1-w |(编辑:ZN)



ceb3ac6b9b8dd06f5f6ff80d114e5f3.png

⬆ 扫码加入AI产品交流社群,你有机会得到:

- 最值得关注的AI产品;

- 最新鲜的 AI 产品资讯;最实用的AI产品使用经验;

- 还有不定期赠送热门新品的邀请码、会员码。

评论 (0)

登录后即可发表评论

No data
暂无评论,快来发表第一条评论吧!