AI短剧制作元模型 · 架构全览

三条管线

管线 A

剧本拉片

上传文档（剧本/小说/大纲）→ 通读全文 → 分集规划 → 逐集产出四张表

输入：文档（.md .txt .pdf .docx） 阶段一：通读全文 · 整体把控 阶段二：分集规划（等用户确认） 阶段三：逐集拉片 × N集 产出： 表一·人物资产（C-NNN编号）表二·场景资产（S-NNN编号）表三·分镜脚本（核心创作层）表四·视频提示词（技术执行层）

只接文档，不触发学习。文档是创作源材料，不是学习素材。

管线 B

素材上传

上传图片/视频/PDF → 先过学习提取知识 → 再按归属分流存储

输入：图片 / 视频 / PDF 第一步：image-learning 知识提取（所有素材必过） 第二步：按 asset-registry 路由分流：项目资产 → 写注册表（C/S/P-NNN）学习素材 → 仅知识库通用素材 → 写全局索引（GA-NNN）无活跃项目 → global-assets/references/

所有素材先学后存。项目资产会同时写注册表和知识库。

管线 C

项目资产生成

导演分析完成后自动触发，美术+摄影协同生成资产

触发：导演分析（Phase 2）完成 执行：06-服化道 ←协同← 07-摄影指导 产出：角色/场景/道具设定提示词 + 生成图 写入：项目 assets-registry 人物 C-NNN / 场景 S-NNN / 道具 P-NNN 编号从当前最大值顺延

内部自动触发，与管线A/B的编号体系统一。

进化循环（核心能力）

每个项目结束，系统比上个项目更强

输入素材图片/视频/PDF

→

自动学习image-learning

→

知识库Markdown + JSON + COS

→

各阶段调取导演/美术/摄影/分镜

→

优质成果回写Phase 6 知识蒸馏

Phase 2 导演 ← 调取已学知识 · Phase 3 美术 ← 调取提示词/材质/光影 · Phase 4 分镜 ← 调取运镜/构图 · Phase 6 蒸馏 → 回写知识库

全链路流程图（输入 → 处理 → 产出）

管线 A · 剧本拉片（文档→四张表）

输入

文档

.md .txt .pdf .docx
剧本/小说/故事大纲

→

阶段一

通读全文

故事核心·人物谱系
情感弧线·叙事结构
视觉风格·分集建议

→

阶段二

分集规划

分集表（剧情/情感/时长/钩子）
全局人物表 C-NNN
全局场景表 S-NNN
等用户确认

→

阶段三 ×N集

逐集拉片

剧情梳理→风格定调
→四张表产出→校验
→确认→下一集

→

产出

每集四张表

表一·人物资产 C-NNN
表二·场景资产 S-NNN
表三·分镜脚本（核心）
表四·视频提示词（执行）

→

写入

资产注册表

表一新增→角色表
表二新增→场景表
表三四→epXX/04-分镜/

不触发学习 · 文档是创作源材料 · 每集确认后再做下一集

管线 B · 素材上传（图片/视频→学习+存储）

输入

素材文件

图片 / 视频 / PDF
（角色参考/风格参考
/教程/别人的作品）

→

第一步 · 必过

image-learning

深度分析8维度
→提炼提示词+参数
→写入 Markdown+JSON
→COS云端同步

→

第二步

归属判断

项目资产？
学习素材？
通用素材？
无活跃项目？

→

路径①

项目资产

文件→epXX/03-assets/
注册表→C/S/P-NNN
知识也进了知识库

路径②

学习素材

文件→global-assets/references/
不写注册表
知识已在知识库

|

路径③

通用素材

文件→global-assets/子目录
写全局索引 GA-NNN
知识已在知识库

|

路径④

无活跃项目

文件→global-assets/references/
不写注册表
知识已在知识库

所有素材先学后存 · 知识提取和文件存储并行 · 原文件永远保留

管线 C · 完整制作流水线（原创/改编 → 全链路）

输入

创作意图

原创方向或
小说/剧本改编

→

Phase 1

01 大纲+世界观

总大纲.md
世界观圣经.md
叙事线路图.md

→

Phase 1

02 分集剧本

三种模式选一
对白预算控制
连续性+保留率校验

→

Phase 2

03 导演分析

讲戏本+人物清单
+道具清单+场景清单
←知识库调取

→

审核

09 导演自审

业务评分≥8
+合规+连续性
三层全PASS

Phase 2 协同

04动作 05武术

关键词触发
武术最高优先级
设计融入讲戏本

↗

Phase 3

06 服化道

人物/道具/场景提示词
←知识库调取提示词
←07摄影强制协同

→

审核

09 服化道审核

人物提示词评分
场景宫格评分
三层全PASS

→

Phase 4

08 分镜师

Seedance 2.0提示词
←知识库调取运镜/构图
←07摄影强制协同
←内置规范复审

→

审核

10 分镜审核

业务+合规+连续性
+视觉品质(7项AP)
四层全PASS→复审改稿

Phase 5

11 分发适配

画幅/时长/封面/元数据
按平台差异化

→

交付

最终产出

多平台适配版本
封面brief
元数据文件

→

Phase 6

知识蒸馏

优质成果回写知识库
资产毕业→全局库
新知识沉淀

07摄影指导在Phase 2/3/4三个节点强制参与 · 任意阶段可触发迭代反馈工作流

每模块输入 → 处理 → 产出

00 剧本拉片

管线A入口 · 触发词 /vr /拉片

输入

文档（.md/.txt/.pdf/.docx）
剧本/小说/故事大纲

→

处理

通读全文·全局分析
分集规划·等用户确认
逐集拉片（剧情梳理→风格定调→四张表→校验）
行为链推演校验

→

产出

表一·人物资产（C-NNN）
表二·场景资产（S-NNN）
表三·分镜脚本（创意核心）
表四·视频提示词（技术执行）
→写入 assets-registry

01 大纲+世界观

Phase 1 · 顶层设计

输入

创作方向（原创）
或小说/剧本（改编）

→

处理

Step1 生成大纲（集数/钩子/节奏）
Step2 世界观圣经（力量体系/势力/规则）
Step3 叙事线路图（三幕/伏笔链/角色弧光）

→

产出

01-大纲/总大纲.md
01-大纲/世界观圣经.md
01-大纲/叙事线路图.md

02 分集剧本

Phase 1 · 三种模式

输入

总大纲.md
世界观圣经.md
原文（小说/剧本模式）

→

处理

自创(0%保留)/小说(30-50%)/剧本(90%+)
对白预算=段落秒数×4字×0.5
场景禁区检查
连续性+保留率校验

→

产出

epXX/01-剧本.md
对白标注 [原][简][补]

03 导演

Phase 2 · 核心角色 · 含关键词触发协同

输入

epXX/01-剧本.md
←知识库已学知识

→

处理

通读→拆剧情点P01..Pnn
确定时长(4-15s)
关键词触发04/05
五维度讲戏
提取角色/场景/道具清单
素材比对(ep02+)

→

产出

讲戏本.md
人物清单.md
道具清单.md
场景清单.md

←

协同触发

04动作(2+人物+3+交互词)
05武术(1+打斗词·最高优先)
07摄影(强制·光影+镜头)

06 服化道

Phase 3 · 摄影协同强制 · 含视觉设计知识

输入

人物/道具/场景清单
视觉风格方案
←知识库提示词/材质/光影

→

处理

选画风→协同摄影(人物)
→人物造型提示词
→道具提示词
→协同摄影(场景)
→场景环境提示词
融合P-04/P-05/P-06/P-14~16

→

产出

character-prompts.md
prop-prompts.md
scene-prompts.md
→资产注册表 C/S/P-NNN

←

强制协同

07摄影(人物)→K值+对比度
07摄影(场景)→光影+色调+氛围

08 分镜师

Phase 4 · Seedance 2.0 格式 · 摄影协同强制

输入

讲戏本.md
character/scene/prop-prompts
←知识库运镜/构图

→

处理

建@引用对应表
每剧情点协同摄影
四层结构：主体→动态→光影→参数
内置规范复审(美术+摄影+品质)

→

产出

02-seedance-prompts.md
02-seedance-prompts-polished.md

←

强制协同

07摄影→镜头语言+光影设计

09 导演自审 + 服化道审核

审核 · 三层（业务+合规+连续性）

输入

Phase2: 讲戏本+三清单
Phase3: 角色/场景/道具提示词

→

处理

逐行比对原始剧本
脑内预演可执行性
逐项评分(1-10)
连续性8项校验
合规清单逐条检查

→

产出

PASS→进入下一Phase
FAIL→修改建议+重做
平均≥8且无单项<6

10 分镜审核 + 复审改稿

审核 · 四层（+视觉品质7项AP排查）

输入

02-seedance-prompts.md

→

处理

铁律检查(遗漏/台词完整)
素材对应表检查
单条评分9维度
视觉品质7项AP排查
连贯性(衔接/节奏/弧线)
PASS→美术+摄影复审改稿

→

产出

02-seedance-prompts-polished.md
画风设定+负面提示补全
术语规范化

11 分发适配

Phase 5 · 多平台

输入

定稿分镜提示词
目标平台列表

→

处理

画幅适配(9:16↔16:9↔3:4)
时长适配(拆集/合集)
封面设计(人脸+情绪+文字)
元数据生成(标题/标签/发布时间)

→

产出

各平台画幅变体备注
时长适配方案
封面设计brief
元数据文件

学习系统流程图（输入 → 提取 → 蒸馏 → 归档 → 调用）

素材上传 → 知识提取 → 三路归档

输入

上传素材

图片/视频/PDF
"学一下这个"
"记住这种风格"

→

口语识别

意图判断

"古风"→古风+Chinese-classical
"赛博"→赛博朋克+cyberpunk
15种映射+动态扩展

→

深度分析

8维度提取

风格定位·技法要点
色彩体系·光影设计
构图法则·材质质感
细节亮点·可复用要素

→

知识蒸馏

提炼可复用知识

风格关键词
技法配方(具体参数)
提示词片段(中英双语)
适用场景

→

三路归档

写入知识库

① knowledge/ (Markdown)
② knowledge-json/ (JSON)
③ COS云端同步备份

IL-XX-NNN编号 · 更新knowledge-index.md · 汇报学习成果

风格分类自动扩展（动态生长）

触发

新风格标签

识别到"古风"
知识库中无此独立文件

→

检查

同标签条目数

扫描所有条目中
"古风"标签出现次数

→

<3条

暂存维度文件

写入scene-environment.md
或character-style.md
用标签标记风格

|

≥3条

自动建独立文件

style-chinese-classical.md
分配缩写CC·编号IL-CC-NNN
迁移已有条目·更新索引

维度文件=主库(按知识类型) · 风格文件=聚合视图(按风格) · 同一条目两处都有

知识调用 → 创作 → 回写（进化闭环）

知识库

已积累知识

IL-XX-NNN 条目
提示词片段·技法参数
构图配方·光影方案

→

Phase 2

导演调取

已学光影/氛围方案
融入讲戏本

→

Phase 3

美术调取

已学提示词/材质/光影
融入服化道设计

→

Phase 4

分镜调取

已学运镜/构图/节奏
融入视频提示词

→

交付

项目完成

最终产出
包含新的风格实践

→

Phase 6

回写知识库

资产毕业→全局库
新知识沉淀
系统越用越强

进化循环：知识库 → 调取 → 创作 → 回写 → 知识库（每个项目结束系统更强）

技能单元（12个模块）

00

剧本拉片

管线A入口

上传文档 → 通读全文 → 分集 → 逐集产出人物/场景/分镜/视频提示词四张表。资产写入 registry。

01

大纲+世界观

Phase 1 · 顶层设计

生成总大纲、世界观圣经、叙事线路图。三份文档构成项目的顶层设计基准。

02

分集剧本

Phase 1 · 三种模式

自创（全原创）/ 小说改编（30-50%保留）/ 剧本转化（90%+保留）。含对白预算控制。

03

导演

Phase 2 · 核心角色

剧本 → 讲戏本 + 人物清单 + 道具清单 + 场景清单。内置关键词触发04/05协同。

04

动作指导

Phase 2 · 导演触发

2+人物 + 3+交互关键词自动触发。设计人物动作、微表情、空间距离、表达形式。

05

武术指导

Phase 2 · 最高优先级

1+打斗关键词立即触发，先于动作指导。设计完整打斗序列、环境互动、节奏收束。

06

服化道

Phase 3 · 摄影协同

人物/道具/场景 → 文生图提示词。强制协同摄影指导。融合空间/材质/光影设计原则。

07

摄影指导

Phase 2/3/4 · 全程参与

三个节点强制参与。镜头运动必须使用标准术语。融合视觉设计知识库光影/构图原则。

08

分镜师

Phase 4 · 摄影协同

讲戏本 → Seedance 2.0 动态视频提示词。铁律：不凭空加戏，不改台词，不脑补表演。

09

导演自审

审核 · 三层

审核03产出（讲戏本/人物/道具/场景）。业务审核(评分≥8) + 合规 + 连续性校验。

10

分镜审核

审核 · 四层

审核08产出。业务 + 合规 + 连续性 + 视觉品质（7项anti-pattern排查）。含复审改稿。

11

分发适配

Phase 5 · 最终交付

按平台差异适配画幅比例、时长剪辑、封面设计、SEO元数据、字幕嵌入。

共享模块（6个）

资产注册 + 多集追踪

shared/asset-registry.md

全局+项目双层架构。人物C-NNN / 场景S-NNN / 道具P-NNN统一编号。跨项目引用不复制（global_ref）。上传素材四路分流。原始文件永远保留，知识库存提取结果。

全局素材索引

shared/global-assets-index.md

不属于任何项目的通用素材库。角色模板/场景模板/道具模板/光影方案/风格参考。标签体系检索（题材+风格+资产类型）。GA-NNN编号。

视频参考库

shared/reference-library.md

已分析视频的运镜、叙事、节奏、光影方案。REF-NNN编号。供导演(03)、摄影(07)、分镜(08)直接调用。与image-learning互补：这里存创作级方案，那边存提示词级知识。

迭代反馈工作流

shared/iteration-workflow.md

任意阶段可触发。四种迭代模式：参数微调 / 局部重做 / 方案切换 / 全局重做。版本管理（v1.0→v1.1）。原始产出不覆盖，修改存新版本。

合规审核清单

shared/compliance-checklist.md

被09/10审核模块引用。检查Seedance 2.0和Gemini平台内容红线。在每次审核的合规步骤使用。

连续性校验

shared/continuity-validation.md

前置依赖：世界观圣经+叙事线路图+总大纲。8项校验（人物/场景/道具/情节/时间线/对白/情绪弧/伏笔）。被09/10审核模块引用。

完整文件结构

ai-drama-metaskill/ ├── SKILL.md # 调度中枢（路由+流水线+协同规则） ├── preview.html # 本页面（架构预览+升级参考） │ ├── modules/ # 12个技能单元 │ ├── 00-video-replication.md # 剧本拉片（管线A入口） │ ├── 01-outline-worldview.md # 大纲+世界观+叙事线路图 │ ├── 02-screenplay.md # 分集剧本（三种模式） │ ├── 03-director.md # 导演（含关键词触发协同） │ ├── 04-action-director.md # 动作指导 │ ├── 05-fight-choreographer.md # 武术指导（最高优先级） │ ├── 06-art-design.md # 服化道（+摄影协同+设计原则） │ ├── 07-cinematographer.md # 摄影指导（Phase 2/3/4全程） │ ├── 08-storyboard.md # 分镜师（Seedance 2.0格式） │ ├── 09-director-review.md # 导演自审+服化道审核（三层） │ ├── 10-storyboard-review.md # 分镜审核+复审改稿（四层） │ └── 11-distribution.md # 分发适配（多平台） │ ├── shared/ # 6个共享模块 │ ├── asset-registry.md # 资产管理+多集追踪+跨项目调用 │ ├── global-assets-index.md # 全局素材索引（标签检索） │ ├── reference-library.md # 视频参考库 │ ├── iteration-workflow.md # 迭代反馈工作流 │ ├── compliance-checklist.md # 合规审核清单 │ └── continuity-validation.md # 连续性校验 │ └── scripts/ └── watch-assets.py # 素材投放目录监控（检测→待处理清单）外部依赖（不在本目录内）： ├── image-learning/SKILL.md # 知识提取引擎（口语识别+风格自动扩展） │ ├── knowledge/ # Markdown知识条目（人类可读） │ ├── knowledge-json/ # JSON结构化知识（机器可读） │ └── knowledge-index.md # 知识总索引 │ └── visual-design-mastery/ # 设计方法论库 ├── design-principles.md # 设计原则 ├── style-lexicon.md # 风格词典 └── anti-patterns.md # 反面排雷

路由规则

三条管线入口判断

用户意图	管线	入口模块
上传文档 + 创作意图（"拉片""分集"/vr）	A 剧本拉片	00-video-replication（只接文档，不触发学习）
上传图片/视频/PDF	B 素材上传	所有素材先过 image-learning，再按 asset-registry 分流：项目资产→写注册表 / 学习素材→仅知识库 / 通用素材→写全局索引
导演分析完成 → 自动进入	C 项目资产生成	06-art-design + 07-cinematographer

其他意图路由

意图	路由到
写大纲、世界观	01-outline-worldview
写剧本	02-screenplay
导演分析、讲戏	03-director
分镜、提示词	08-storyboard
多平台适配、封面、发布	11-distribution
"这个不对""改一下""重做"	shared/iteration-workflow
素材管理、资产查询、跨项目复用	shared/asset-registry + global-assets-index
新项目开工	asset-registry 跨项目调用 → 全局资源匹配
"之前学过的XX是什么"	image-learning 检索协议

协同规则

角色	触发条件	优先级	参与阶段
动作指导 [04]	剧情含 2+ 人物 + 3+ 交互关键词	正常	Phase 2 导演分析时
武术指导 [05]	含 1+ 打斗关键词	最高（先于动作指导）	Phase 2 导演分析时
摄影指导 [07]	强制参与，不可跳过	强制	Phase 2 + Phase 3 + Phase 4

审核机制

审核层	内容	适用阶段
业务审核	评分制，平均 ≥ 8 且无单项 < 6 → PASS	所有审核（09、10）
合规审核	引用 compliance-checklist.md	所有审核（09、10）
连续性校验	引用 continuity-validation.md · 8项校验	所有审核（09、10）
视觉品质审核	7项 anti-pattern 排查（仅此阶段有）	仅分镜审核（10）

外部依赖技能

image-learning（知识提取引擎）

C:\Users\matebook\.cursor\skills\image-learning\SKILL.md

从图片/视频中提取可复用知识（色调/光影/构图/材质/提示词片段）。归档到 Markdown + JSON + COS 三位一体知识库。支持口语化意图识别、15种风格自动映射、分类自动扩展（≥3条自动建独立风格文件）。

visual-design-mastery（设计方法论库）

C:\Users\matebook\.claude\skills\.claude\skills\06-visual-design-mastery\

跨领域设计原则 + 风格词典 + 反面排雷 + 12个案例。已内化到摄影(07)/服化道(06)/分镜(08)/审核(10)四个模块。与image-learning互补：这里是方法论，那边是具体知识。

学习系统架构

知识存储分工

image-learning/knowledge/ 提示词级知识（Markdown，人类可读快速浏览）
image-learning/knowledge-json/ 结构化参数（JSON，精确检索+参数组合）
image-learning/knowledge-index.md 总索引（条目目录+关联图谱）
visual-design-mastery/ 设计方法论（原则+词典+反面案例）
shared/reference-library.md 视频参考库（运镜/叙事/节奏方案）
COS云端 自动备份（ppt01-1419133239存储桶）

风格分类自动扩展

维度分类（构图/色彩/材质）= 固定骨架
风格分类（古风/赛博/废土）= 动态生长
前1-2条：暂存维度文件，用标签标记风格
≥3条同风格：自动建 style-{name}.md
维度文件是主库，风格文件是聚合视图
15种口语→标签映射，未知风格自动创建新标签

知识编号体系

IL-CS-NNN 人物风格
IL-SE-NNN 场景环境
IL-CL-NNN 构图版式
IL-CO-NNN 色彩光影
IL-RT-NNN 渲染技法
IL-VA-NNN 视频分析
IL-CP-NNN 人物姿势
IL-ST-NNN 服饰穿搭
IL-{XX}-NNN 风格分类（动态扩展）

口语化识别示例

"学一下这个" → 学习 + 自动判断分类
"这种感觉记一下" → 学习 + 归档
"古风/国风/水墨风" → 标签 古风 Chinese-classical
"赛博/霓虹风" → 标签 赛博朋克 cyberpunk
"之前那个废土的" → 按标签检索
"有没有暖光的" → 按参数检索

资产管理架构

全局层（不属于任何项目，持续积累） ├── image-learning/knowledge/ # 提取的知识（IL-XX-NNN） ├── image-learning/knowledge-json/ # 结构化知识（JSON） ├── visual-design-mastery/ # 设计原则+案例（KB-NNN） ├── reference-library.md # 视频参考库（REF-NNN） ├── global-assets-index.md # 全局素材索引（GA-NNN） └── global-assets/ # 全局原始文件存储 ├── characters/ # 通用角色模板原图 ├── scenes/ # 通用场景模板原图 ├── props/ # 通用道具模板原图 ├── references/ # 参考素材原文件 └── styles/ # 风格参考原文件项目层（每个项目独立隔离） ├── project-A/ │ ├── assets-registry.md # 项目A资产注册表 │ └── epXX/03-assets/generated/ # 项目A的生成文件 ├── project-B/ │ └── ... 原始文件永远保留，不删除。知识库存的是提取结果，原文件是溯源依据。项目资产通过 global_ref 引用全局素材，引用不复制。

素材上传四路分流

素材归属	原文件存储	注册表写入	知识提取
项目资产（当前项目的角色/场景/道具）	项目目录/epXX/03-assets/generated/	项目注册表 C/S/P-NNN	image-learning
参考/学习素材	global-assets/references/	不写入	image-learning
跨项目通用素材	global-assets/ 对应子目录	global-assets-index GA-NNN	image-learning
无活跃项目	global-assets/references/	不写入	image-learning

AI 短剧制作元模型

剧本拉片

素材上传

项目资产生成

每个项目结束，系统比上个项目更强

00 剧本拉片

输入

处理

产出

01 大纲+世界观

输入

处理

产出

02 分集剧本

输入

处理

产出

03 导演

输入

处理

产出

协同触发

06 服化道

输入

处理

产出

强制协同

08 分镜师

输入

处理

产出

强制协同

09 导演自审 + 服化道审核

输入

处理

产出

10 分镜审核 + 复审改稿

输入

处理

产出

11 分发适配

输入

处理

产出

资产注册 + 多集追踪

全局素材索引

视频参考库

迭代反馈工作流

合规审核清单

连续性校验

三条管线入口判断

其他意图路由

image-learning（知识提取引擎）

visual-design-mastery（设计方法论库）

知识存储分工

风格分类自动扩展

知识编号体系

口语化识别示例

素材上传四路分流