转载请注明来自「Biteye」社区
作者:Biteye 核心贡献者 Changan
编辑:Biteye 核心贡献者 Denise社区:@BiteyeCN
*全文约 3600 字,预计阅读时间为 10 分钟
最近,AI 短剧频繁出圈。
从「熊出没+修仙」的《熊人修仙传》的短剧爆火,到 Binance 发起「六大门派围攻光明顶」的加密武侠剧大赛;短剧的门槛已经从设备和演员,转移到了叙事与 Prompt。
那么如何从一个模糊的想法变成一部画面连贯的短剧呢?
接下来 Biteye 这本篇指南将为你拆解全流程:
不知道拍什么?先去看别人在看什么。打开红果短剧,直接看热门标签。
短剧的设定基本就是那几类:重生、系统、穿越、逆袭。
选定标签后,把它扔给 AI,让 AI 帮你出剧本大纲:
开端: 主角“阿安”曾是币圈顶尖交易员,因被兄弟背叛、深陷FUD谣言而归隐山林,沦为|被人瞧不起的“赘婿”。
发展: 市场遭遇剧烈波动,所谓“六大主流机构”(六大门派)联手做空,散户哀鸿遍野。|前妻和情敌拿着几张伪造的爆仓截图嘲讽阿安是“破产穷光蛋”。
AI 会给你一个完整的故事框架,你再根据自己的想法调整,剧本就有了。
不过上述的方式仅适用于短视频,长篇短剧对于剧本的连贯性要求较高。更高效的办法就是将网文改编成短剧剧本。
网文天然就是好的短剧素材——人物关系清晰,情节密集,逻辑顺畅。你要做的只是「格式转换」:把网文的文字,变成短剧的分镜台词。
操作方式也非常简单,将一段网文内容粘贴给 AI,让他执行以下内容:
以下是一段网文内容,请用「第一人称视角」
帮我进行改写【粘贴网文内容】
经过第一人称修改过的网文会更适配短剧,在短剧的生成过程中也不易出错。

剧本决定内容,Prompt 决定画质。
Prompt 就是你告诉 AI「拍什么」的指令。写得越具体,出来的视频越符合条件。
一个好 Prompt 分四个部分:
综述:定基调。视频质量、风格、光线、情绪一句话说清楚。比如:「生活流写实风,克制冷幽默,傍晚暖黄光。」
主体:写人物。年龄、长相、服装、表情、台词,全部写进去。这部分最重要,人物描述要固定,每段视频都用同一段文字,否则 AI 生成出来的角色每次都长不一样。
分镜:告诉 AI 怎么拍。近景还是中景,固定机位还是移动,这个镜头几秒。
细节:补充场景和氛围。道具、背景、声音,写得越细,画面越有质感。
实操案例:
1️⃣ 风格:生活流写实风,克制冷幽默,不刻意搞笑,笑点全靠留白和表情
2️⃣ 主体:丈夫 肖像:25-35岁,普通长相,有点邋遢感,不是那种"成功人士"
服装:宽松居家服,可以有点皱,袜子不一样颜色更好
表情:全程淡定,说出"离婚"两个字时语气像在说"今晚吃什么"
台词:"等我炒币发财了,就和你离婚。" / "等等——它在涨!!"
妻子 肖像:25-35岁,干净利落,眼神聪明,是那种"什么都看穿但懒得说"的感觉
服装:简单家居服,端茶的细节要自然
表情:三层递进——愣→运算→释然带笑,最后充值前嘴角微微抽了一下
台词:"没有比这更……天长地久的承诺了。"(轻声,像自言自语)
3️⃣ 分镜:第一段(共15秒,镜头1-8) #画面镜头时长
1妻子端茶走来,丈夫盯手机中景,固定机位2s
2丈夫头也不抬说出台词侧面近景,带手机屏幕3s
3妻子愣住,开始"运算"正面特写,眼神游离2s
4闪回①:K线图归零,丈夫盯屏幕手机屏幕特写,过曝处理1s
5闪回②:上次归零,丈夫摇头同上,快切1s
6闪回③:丈夫蒙被哭泣被子抖动,只露一个包1s
7切回妻子,低头抿茶侧面近景2s
8妻子嘴角慢慢弯起,说出台词正面特写,眼神温柔3s
4️⃣ 细节:客厅沙发有生活感,茶几上散落零食袋和充电线,丈夫那杯茶没有动过,背景电视静音播放财经节目。闪回镜头K线图全是真实绿色下跌走势。全程无背景音乐,只有自然环境音和克制的对话声。
将这段文字粘贴进即梦,选 9:16 比例、视频长度 15 s ,点击生成即可。

一集短剧通常 2~3 分钟,而即梦生成最长的视频只能 15 s,所以需要 8~10 段 15 秒的视频片段拼在一起。
但这就会遇到一个问题,这也是几乎每个人做短剧都会遇到的问题:第一集还是吴彦祖,第二集直接变成赵本山了。
AI 每次生成视频都是独立的,它不记得上一段里角色长什么样。所以同一个角色,不同片段里可能发型变了、脸型变了,甚至整个人都换了。
上下集人物对不上怎么办?多个视频如何保持人物的一致性呢?

目前主流的解决方法有三个:
1️⃣引用延长法
在生成下一段视频时,使用指令:将 @视频1 延长 15 秒,继续 [新动作/对话描述],
但该方法的局限性比较明显:受限于 Seedance 2.0 不支持生成真人,所以只能生成动漫类视频。(PS:即使视频1 的人物是 AI 生成出来的也不行,所以小编的 Demo 仅生成短视频,短剧的后半段未能完成。)
这也是为什么现在短视频都倾向于生成动漫类,而非真人类。
该方法还存在一个弊端就是使用的积分会翻倍,生成视频成本更高些。
2️⃣首尾帧过渡法
截取前一段视频的最后一帧作为下一段的首帧。(需要带有人物、或最后几秒的关键姿势帧)
提示词开头写类似:
从@首帧1 开始,平滑过渡到@尾帧2,保持角色五官、发型、服装、肤色完全一致,动作自然连贯,相同运镜风格,继续[新动作/对话描述]
该方式的弊端也是很明显的:如果首尾帧的空间差距过大,AI 会强行脑补环境/动作,会出现前后不协调的情况。当然也可以靠手动调帧(用PS/截图微调首尾帧匹配度),但会增加工作量。
3️⃣多角度建模引用(推荐)
上述两种方式都能从一定程度减少不连贯的可能性,但做不到完美。
只提供参考图只能告诉 AI 角色长这样,但没告诉 AI 人物应该如何动。所以只用参考图的模式,在出到多集后,人物长相可能会发生改变。
所以我们可以在最开始时:先用多角度/多表情参考图把角色建模固定。
准备3–8张同一人不同角度(正脸、45°、侧脸、3/4侧、低角度)、不同表情、不同光线的参考图,可用 AI 生成。
有了这个参考图库,在生成视频时就可以引用:@参考图1 戴上@参考图2的帽子

在生成视频的过程中,会遇到各类问题,Biteye 在这里也给各位解答如何解决:
1️⃣效率进阶:解决“排队两小时,出片十五秒”
由于 Seedance 2.0 过于火爆,最近太多人尝试生成视频。导致生成一个视频的时间可能达 2~5 个小时,即使高级会员也需要等待较长的时间。生成视频15秒,等待2小时,堪比 AIGC 届的聚能环南孚电池。
有两种解决方式:
1.切换至 Seedance 2.0 Fast 模式,生成视频速度更快,消耗积分更低。
2.使用其他平台,例如小云雀、豆包均可调用 Seedance API ,实测比即梦官网生成更快。
2️⃣视觉纯净:一键告别原生水印
AI 生成的视频存在水印,在展出时有水印的视频非常影响观感。
那么如何取消水印呢?
1.即梦官网左下角,点击「AI生成水印设置」,点击去除水印开关。
2.使用「神奇橡皮擦」,上传视频一键去除水印。
3️⃣容错储备:应对 99% 的卡顿与审核风险
在完整生成视频后,感觉最大的问题还是「生成时间」。排队终于等到你了,即梦也开始帮你生成视频了,结果进度条卡在 99% 。即使到最后一步还有可能被审核不通过,拒绝生成视频的可能性。
所以除了 Seedance 之外,还推荐尝试 Gemini 的 VEO 、ChatGPT 的 Sora、快手的 Kling ,听说 Kling 3.0 即将出来了,生成体验比 Seedance 2.0 更好。

AI短剧的门槛,正在肉眼可见的降低。一年前,你需要摄像机、演员、拍摄场地。现在,你只需要一个想法、一段 Prompt、和足够的耐心等待进度条跑完。
工具会越来越好用,生成速度会越来越快,角色一致性问题也会逐步被解决,但有一件事 AI 永远替代不了,那就是想出一个值得拍的故事。
一个能让人转发的短剧,核心永远是那句让人觉得「说到我了」的台词。就像「等我炒币发财了,就和你离婚」。工具只是把它变成画面,打动人的,还是那句话本身。
先去想那个故事吧。剩下的,交给 AI。
Biteye 是亚洲领先的Web3研究社区,通过社区驱动和 AI 驱动的方式产生前瞻性的投研内容和工具,帮助社区成员探索 Web3 兔子洞。
微信群:添加小助手 @Nicegirl327 入群
Twitter:@BiteyeCN
Discord:discord.gg/Biteye
*声明:本文分享内容仅作学习交流,不构成任何投资建议,且不代表 Biteye 立场。喜欢我们的文章,就点击下方的名片关注我们吧!