AI 短剧制作元模型

ai-drama-metaskill · 架构全览与升级参考手册
12 技能单元 6 共享模块 资产管理系统 持续进化引擎 触发词:/drama /短剧 /拉片 /vr
三条管线
管线 A

剧本拉片

上传文档(剧本/小说/大纲)→ 通读全文 → 分集规划 → 逐集产出四张表

输入:文档(.md .txt .pdf .docx) 阶段一:通读全文 · 整体把控 阶段二:分集规划(等用户确认) 阶段三:逐集拉片 × N集 产出: 表一·人物资产(C-NNN编号) 表二·场景资产(S-NNN编号) 表三·分镜脚本(核心创作层) 表四·视频提示词(技术执行层)
只接文档,不触发学习。文档是创作源材料,不是学习素材。
管线 B

素材上传

上传图片/视频/PDF → 先过学习提取知识 → 再按归属分流存储

输入:图片 / 视频 / PDF 第一步:image-learning 知识提取(所有素材必过) 第二步:按 asset-registry 路由分流: 项目资产 → 写注册表(C/S/P-NNN) 学习素材 → 仅知识库 通用素材 → 写全局索引(GA-NNN) 无活跃项目 → global-assets/references/
所有素材先学后存。项目资产会同时写注册表和知识库。
管线 C

项目资产生成

导演分析完成后自动触发,美术+摄影协同生成资产

触发:导演分析(Phase 2)完成 执行:06-服化道 ←协同← 07-摄影指导 产出:角色/场景/道具设定提示词 + 生成图 写入:项目 assets-registry 人物 C-NNN / 场景 S-NNN / 道具 P-NNN 编号从当前最大值顺延
内部自动触发,与管线A/B的编号体系统一。
进化循环(核心能力)

每个项目结束,系统比上个项目更强

输入素材图片/视频/PDF
自动学习image-learning
知识库Markdown + JSON + COS
各阶段调取导演/美术/摄影/分镜
优质成果回写Phase 6 知识蒸馏
Phase 2 导演 ← 调取已学知识 · Phase 3 美术 ← 调取提示词/材质/光影 · Phase 4 分镜 ← 调取运镜/构图 · Phase 6 蒸馏 → 回写知识库
全链路流程图(输入 → 处理 → 产出)
管线 A · 剧本拉片(文档→四张表)
输入
文档
.md .txt .pdf .docx
剧本/小说/故事大纲
阶段一
通读全文
故事核心·人物谱系
情感弧线·叙事结构
视觉风格·分集建议
阶段二
分集规划
分集表(剧情/情感/时长/钩子)
全局人物表 C-NNN
全局场景表 S-NNN
等用户确认
阶段三 ×N集
逐集拉片
剧情梳理→风格定调
→四张表产出→校验
→确认→下一集
产出
每集四张表
表一·人物资产 C-NNN
表二·场景资产 S-NNN
表三·分镜脚本(核心)
表四·视频提示词(执行)
写入
资产注册表
表一新增→角色表
表二新增→场景表
表三四→epXX/04-分镜/
不触发学习 · 文档是创作源材料 · 每集确认后再做下一集
管线 B · 素材上传(图片/视频→学习+存储)
输入
素材文件
图片 / 视频 / PDF
(角色参考/风格参考
/教程/别人的作品)
第一步 · 必过
image-learning
深度分析8维度
→提炼提示词+参数
→写入 Markdown+JSON
→COS云端同步
第二步
归属判断
项目资产?
学习素材?
通用素材?
无活跃项目?
路径①
项目资产
文件→epXX/03-assets/
注册表→C/S/P-NNN
知识也进了知识库
路径②
学习素材
文件→global-assets/references/
不写注册表
知识已在知识库
|
路径③
通用素材
文件→global-assets/子目录
写全局索引 GA-NNN
知识已在知识库
|
路径④
无活跃项目
文件→global-assets/references/
不写注册表
知识已在知识库
所有素材先学后存 · 知识提取和文件存储并行 · 原文件永远保留
管线 C · 完整制作流水线(原创/改编 → 全链路)
输入
创作意图
原创方向 或
小说/剧本改编
Phase 1
01 大纲+世界观
总大纲.md
世界观圣经.md
叙事线路图.md
Phase 1
02 分集剧本
三种模式选一
对白预算控制
连续性+保留率校验
Phase 2
03 导演分析
讲戏本+人物清单
+道具清单+场景清单
←知识库调取
审核
09 导演自审
业务评分≥8
+合规+连续性
三层全PASS
Phase 2 协同
04动作 05武术
关键词触发
武术最高优先级
设计融入讲戏本
Phase 3
06 服化道
人物/道具/场景提示词
←知识库调取提示词
←07摄影强制协同
审核
09 服化道审核
人物提示词评分
场景宫格评分
三层全PASS
Phase 4
08 分镜师
Seedance 2.0提示词
←知识库调取运镜/构图
←07摄影强制协同
←内置规范复审
审核
10 分镜审核
业务+合规+连续性
+视觉品质(7项AP)
四层全PASS→复审改稿
Phase 5
11 分发适配
画幅/时长/封面/元数据
按平台差异化
交付
最终产出
多平台适配版本
封面brief
元数据文件
Phase 6
知识蒸馏
优质成果回写知识库
资产毕业→全局库
新知识沉淀
07摄影指导在Phase 2/3/4三个节点强制参与 · 任意阶段可触发迭代反馈工作流
每模块 输入 → 处理 → 产出

00 剧本拉片

管线A入口 · 触发词 /vr /拉片
输入
  • 文档(.md/.txt/.pdf/.docx)
  • 剧本/小说/故事大纲
处理
  • 通读全文·全局分析
  • 分集规划·等用户确认
  • 逐集拉片(剧情梳理→风格定调→四张表→校验)
  • 行为链推演校验
产出
  • 表一·人物资产(C-NNN)
  • 表二·场景资产(S-NNN)
  • 表三·分镜脚本(创意核心)
  • 表四·视频提示词(技术执行)
  • →写入 assets-registry

01 大纲+世界观

Phase 1 · 顶层设计
输入
  • 创作方向(原创)
  • 或 小说/剧本(改编)
处理
  • Step1 生成大纲(集数/钩子/节奏)
  • Step2 世界观圣经(力量体系/势力/规则)
  • Step3 叙事线路图(三幕/伏笔链/角色弧光)
产出
  • 01-大纲/总大纲.md
  • 01-大纲/世界观圣经.md
  • 01-大纲/叙事线路图.md

02 分集剧本

Phase 1 · 三种模式
输入
  • 总大纲.md
  • 世界观圣经.md
  • 原文(小说/剧本模式)
处理
  • 自创(0%保留)/小说(30-50%)/剧本(90%+)
  • 对白预算=段落秒数×4字×0.5
  • 场景禁区检查
  • 连续性+保留率校验
产出
  • epXX/01-剧本.md
  • 对白标注 [原][简][补]

03 导演

Phase 2 · 核心角色 · 含关键词触发协同
输入
  • epXX/01-剧本.md
  • ←知识库已学知识
处理
  • 通读→拆剧情点P01..Pnn
  • 确定时长(4-15s)
  • 关键词触发04/05
  • 五维度讲戏
  • 提取角色/场景/道具清单
  • 素材比对(ep02+)
产出
  • 讲戏本.md
  • 人物清单.md
  • 道具清单.md
  • 场景清单.md
协同触发
  • 04动作(2+人物+3+交互词)
  • 05武术(1+打斗词·最高优先)
  • 07摄影(强制·光影+镜头)

06 服化道

Phase 3 · 摄影协同强制 · 含视觉设计知识
输入
  • 人物/道具/场景清单
  • 视觉风格方案
  • ←知识库提示词/材质/光影
处理
  • 选画风→协同摄影(人物)
  • →人物造型提示词
  • →道具提示词
  • →协同摄影(场景)
  • →场景环境提示词
  • 融合P-04/P-05/P-06/P-14~16
产出
  • character-prompts.md
  • prop-prompts.md
  • scene-prompts.md
  • →资产注册表 C/S/P-NNN
强制协同
  • 07摄影(人物)→K值+对比度
  • 07摄影(场景)→光影+色调+氛围

08 分镜师

Phase 4 · Seedance 2.0 格式 · 摄影协同强制
输入
  • 讲戏本.md
  • character/scene/prop-prompts
  • ←知识库运镜/构图
处理
  • 建@引用对应表
  • 每剧情点协同摄影
  • 四层结构:主体→动态→光影→参数
  • 内置规范复审(美术+摄影+品质)
产出
  • 02-seedance-prompts.md
  • 02-seedance-prompts-polished.md
强制协同
  • 07摄影→镜头语言+光影设计

09 导演自审 + 服化道审核

审核 · 三层(业务+合规+连续性)
输入
  • Phase2: 讲戏本+三清单
  • Phase3: 角色/场景/道具提示词
处理
  • 逐行比对原始剧本
  • 脑内预演可执行性
  • 逐项评分(1-10)
  • 连续性8项校验
  • 合规清单逐条检查
产出
  • PASS→进入下一Phase
  • FAIL→修改建议+重做
  • 平均≥8且无单项<6

10 分镜审核 + 复审改稿

审核 · 四层(+视觉品质7项AP排查)
输入
  • 02-seedance-prompts.md
处理
  • 铁律检查(遗漏/台词完整)
  • 素材对应表检查
  • 单条评分9维度
  • 视觉品质7项AP排查
  • 连贯性(衔接/节奏/弧线)
  • PASS→美术+摄影复审改稿
产出
  • 02-seedance-prompts-polished.md
  • 画风设定+负面提示补全
  • 术语规范化

11 分发适配

Phase 5 · 多平台
输入
  • 定稿分镜提示词
  • 目标平台列表
处理
  • 画幅适配(9:16↔16:9↔3:4)
  • 时长适配(拆集/合集)
  • 封面设计(人脸+情绪+文字)
  • 元数据生成(标题/标签/发布时间)
产出
  • 各平台画幅变体备注
  • 时长适配方案
  • 封面设计brief
  • 元数据文件
学习系统流程图(输入 → 提取 → 蒸馏 → 归档 → 调用)
素材上传 → 知识提取 → 三路归档
输入
上传素材
图片/视频/PDF
"学一下这个"
"记住这种风格"
口语识别
意图判断
"古风"→古风+Chinese-classical
"赛博"→赛博朋克+cyberpunk
15种映射+动态扩展
深度分析
8维度提取
风格定位·技法要点
色彩体系·光影设计
构图法则·材质质感
细节亮点·可复用要素
知识蒸馏
提炼可复用知识
风格关键词
技法配方(具体参数)
提示词片段(中英双语)
适用场景
三路归档
写入知识库
① knowledge/ (Markdown)
② knowledge-json/ (JSON)
③ COS云端同步备份
IL-XX-NNN编号 · 更新knowledge-index.md · 汇报学习成果
风格分类自动扩展(动态生长)
触发
新风格标签
识别到"古风"
知识库中无此独立文件
检查
同标签条目数
扫描所有条目中
"古风"标签出现次数
<3条
暂存维度文件
写入scene-environment.md
或character-style.md
用标签标记风格
|
≥3条
自动建独立文件
style-chinese-classical.md
分配缩写CC·编号IL-CC-NNN
迁移已有条目·更新索引
维度文件=主库(按知识类型) · 风格文件=聚合视图(按风格) · 同一条目两处都有
知识调用 → 创作 → 回写(进化闭环)
知识库
已积累知识
IL-XX-NNN 条目
提示词片段·技法参数
构图配方·光影方案
Phase 2
导演调取
已学光影/氛围方案
融入讲戏本
Phase 3
美术调取
已学提示词/材质/光影
融入服化道设计
Phase 4
分镜调取
已学运镜/构图/节奏
融入视频提示词
交付
项目完成
最终产出
包含新的风格实践
Phase 6
回写知识库
资产毕业→全局库
新知识沉淀
系统越用越强
进化循环:知识库 → 调取 → 创作 → 回写 → 知识库(每个项目结束系统更强)
技能单元(12个模块)
00
剧本拉片
管线A入口
上传文档 → 通读全文 → 分集 → 逐集产出人物/场景/分镜/视频提示词四张表。资产写入 registry。
01
大纲+世界观
Phase 1 · 顶层设计
生成总大纲、世界观圣经、叙事线路图。三份文档构成项目的顶层设计基准。
02
分集剧本
Phase 1 · 三种模式
自创(全原创)/ 小说改编(30-50%保留)/ 剧本转化(90%+保留)。含对白预算控制。
03
导演
Phase 2 · 核心角色
剧本 → 讲戏本 + 人物清单 + 道具清单 + 场景清单。内置关键词触发04/05协同。
04
动作指导
Phase 2 · 导演触发
2+人物 + 3+交互关键词自动触发。设计人物动作、微表情、空间距离、表达形式。
05
武术指导
Phase 2 · 最高优先级
1+打斗关键词立即触发,先于动作指导。设计完整打斗序列、环境互动、节奏收束。
06
服化道
Phase 3 · 摄影协同
人物/道具/场景 → 文生图提示词。强制协同摄影指导。融合空间/材质/光影设计原则。
07
摄影指导
Phase 2/3/4 · 全程参与
三个节点强制参与。镜头运动必须使用标准术语。融合视觉设计知识库光影/构图原则。
08
分镜师
Phase 4 · 摄影协同
讲戏本 → Seedance 2.0 动态视频提示词。铁律:不凭空加戏,不改台词,不脑补表演。
09
导演自审
审核 · 三层
审核03产出(讲戏本/人物/道具/场景)。业务审核(评分≥8) + 合规 + 连续性校验。
10
分镜审核
审核 · 四层
审核08产出。业务 + 合规 + 连续性 + 视觉品质(7项anti-pattern排查)。含复审改稿。
11
分发适配
Phase 5 · 最终交付
按平台差异适配画幅比例、时长剪辑、封面设计、SEO元数据、字幕嵌入。
共享模块(6个)

资产注册 + 多集追踪

shared/asset-registry.md

全局+项目双层架构。人物C-NNN / 场景S-NNN / 道具P-NNN统一编号。跨项目引用不复制(global_ref)。上传素材四路分流。原始文件永远保留,知识库存提取结果。

全局素材索引

shared/global-assets-index.md

不属于任何项目的通用素材库。角色模板/场景模板/道具模板/光影方案/风格参考。标签体系检索(题材+风格+资产类型)。GA-NNN编号。

视频参考库

shared/reference-library.md

已分析视频的运镜、叙事、节奏、光影方案。REF-NNN编号。供导演(03)、摄影(07)、分镜(08)直接调用。与image-learning互补:这里存创作级方案,那边存提示词级知识。

迭代反馈工作流

shared/iteration-workflow.md

任意阶段可触发。四种迭代模式:参数微调 / 局部重做 / 方案切换 / 全局重做。版本管理(v1.0→v1.1)。原始产出不覆盖,修改存新版本。

合规审核清单

shared/compliance-checklist.md

被09/10审核模块引用。检查Seedance 2.0和Gemini平台内容红线。在每次审核的合规步骤使用。

连续性校验

shared/continuity-validation.md

前置依赖:世界观圣经+叙事线路图+总大纲。8项校验(人物/场景/道具/情节/时间线/对白/情绪弧/伏笔)。被09/10审核模块引用。

完整文件结构
ai-drama-metaskill/ ├── SKILL.md # 调度中枢(路由+流水线+协同规则) ├── preview.html # 本页面(架构预览+升级参考) │ ├── modules/ # 12个技能单元 │ ├── 00-video-replication.md # 剧本拉片(管线A入口) │ ├── 01-outline-worldview.md # 大纲+世界观+叙事线路图 │ ├── 02-screenplay.md # 分集剧本(三种模式) │ ├── 03-director.md # 导演(含关键词触发协同) │ ├── 04-action-director.md # 动作指导 │ ├── 05-fight-choreographer.md # 武术指导(最高优先级) │ ├── 06-art-design.md # 服化道(+摄影协同+设计原则) │ ├── 07-cinematographer.md # 摄影指导(Phase 2/3/4全程) │ ├── 08-storyboard.md # 分镜师(Seedance 2.0格式) │ ├── 09-director-review.md # 导演自审+服化道审核(三层) │ ├── 10-storyboard-review.md # 分镜审核+复审改稿(四层) │ └── 11-distribution.md # 分发适配(多平台) │ ├── shared/ # 6个共享模块 │ ├── asset-registry.md # 资产管理+多集追踪+跨项目调用 │ ├── global-assets-index.md # 全局素材索引(标签检索) │ ├── reference-library.md # 视频参考库 │ ├── iteration-workflow.md # 迭代反馈工作流 │ ├── compliance-checklist.md # 合规审核清单 │ └── continuity-validation.md # 连续性校验 │ └── scripts/ └── watch-assets.py # 素材投放目录监控(检测→待处理清单) 外部依赖(不在本目录内): ├── image-learning/SKILL.md # 知识提取引擎(口语识别+风格自动扩展) │ ├── knowledge/ # Markdown知识条目(人类可读) │ ├── knowledge-json/ # JSON结构化知识(机器可读) │ └── knowledge-index.md # 知识总索引 │ └── visual-design-mastery/ # 设计方法论库 ├── design-principles.md # 设计原则 ├── style-lexicon.md # 风格词典 └── anti-patterns.md # 反面排雷
路由规则

三条管线入口判断

用户意图管线入口模块
上传文档 + 创作意图("拉片""分集"/vr)A 剧本拉片00-video-replication(只接文档,不触发学习)
上传图片/视频/PDFB 素材上传所有素材先过 image-learning,再按 asset-registry 分流:项目资产→写注册表 / 学习素材→仅知识库 / 通用素材→写全局索引
导演分析完成 → 自动进入C 项目资产生成06-art-design + 07-cinematographer

其他意图路由

意图路由到
写大纲、世界观01-outline-worldview
写剧本02-screenplay
导演分析、讲戏03-director
分镜、提示词08-storyboard
多平台适配、封面、发布11-distribution
"这个不对""改一下""重做"shared/iteration-workflow
素材管理、资产查询、跨项目复用shared/asset-registry + global-assets-index
新项目开工asset-registry 跨项目调用 → 全局资源匹配
"之前学过的XX是什么"image-learning 检索协议
协同规则
角色触发条件优先级参与阶段
动作指导 [04]剧情含 2+ 人物 + 3+ 交互关键词正常Phase 2 导演分析时
武术指导 [05]含 1+ 打斗关键词最高(先于动作指导)Phase 2 导演分析时
摄影指导 [07]强制参与,不可跳过强制Phase 2 + Phase 3 + Phase 4
审核机制
审核层内容适用阶段
业务审核评分制,平均 ≥ 8 且无单项 < 6 → PASS所有审核(09、10)
合规审核引用 compliance-checklist.md所有审核(09、10)
连续性校验引用 continuity-validation.md · 8项校验所有审核(09、10)
视觉品质审核7项 anti-pattern 排查(仅此阶段有)仅分镜审核(10)
外部依赖技能

image-learning(知识提取引擎)

C:\Users\matebook\.cursor\skills\image-learning\SKILL.md

从图片/视频中提取可复用知识(色调/光影/构图/材质/提示词片段)。归档到 Markdown + JSON + COS 三位一体知识库。支持口语化意图识别、15种风格自动映射、分类自动扩展(≥3条自动建独立风格文件)。

visual-design-mastery(设计方法论库)

C:\Users\matebook\.claude\skills\.claude\skills\06-visual-design-mastery\

跨领域设计原则 + 风格词典 + 反面排雷 + 12个案例。已内化到摄影(07)/服化道(06)/分镜(08)/审核(10)四个模块。与image-learning互补:这里是方法论,那边是具体知识。

学习系统架构

知识存储分工

  • image-learning/knowledge/ 提示词级知识(Markdown,人类可读快速浏览)
  • image-learning/knowledge-json/ 结构化参数(JSON,精确检索+参数组合)
  • image-learning/knowledge-index.md 总索引(条目目录+关联图谱)
  • visual-design-mastery/ 设计方法论(原则+词典+反面案例)
  • shared/reference-library.md 视频参考库(运镜/叙事/节奏方案)
  • COS云端 自动备份(ppt01-1419133239存储桶)

风格分类自动扩展

  • 维度分类(构图/色彩/材质)= 固定骨架
  • 风格分类(古风/赛博/废土)= 动态生长
  • 前1-2条:暂存维度文件,用标签标记风格
  • ≥3条同风格:自动建 style-{name}.md
  • 维度文件是主库,风格文件是聚合视图
  • 15种口语→标签映射,未知风格自动创建新标签

知识编号体系

  • IL-CS-NNN 人物风格
  • IL-SE-NNN 场景环境
  • IL-CL-NNN 构图版式
  • IL-CO-NNN 色彩光影
  • IL-RT-NNN 渲染技法
  • IL-VA-NNN 视频分析
  • IL-CP-NNN 人物姿势
  • IL-ST-NNN 服饰穿搭
  • IL-{XX}-NNN 风格分类(动态扩展)

口语化识别示例

  • "学一下这个" → 学习 + 自动判断分类
  • "这种感觉记一下" → 学习 + 归档
  • "古风/国风/水墨风" → 标签 古风 Chinese-classical
  • "赛博/霓虹风" → 标签 赛博朋克 cyberpunk
  • "之前那个废土的" → 按标签检索
  • "有没有暖光的" → 按参数检索
资产管理架构
全局层(不属于任何项目,持续积累) ├── image-learning/knowledge/ # 提取的知识(IL-XX-NNN) ├── image-learning/knowledge-json/ # 结构化知识(JSON) ├── visual-design-mastery/ # 设计原则+案例(KB-NNN) ├── reference-library.md # 视频参考库(REF-NNN) ├── global-assets-index.md # 全局素材索引(GA-NNN) └── global-assets/ # 全局原始文件存储 ├── characters/ # 通用角色模板原图 ├── scenes/ # 通用场景模板原图 ├── props/ # 通用道具模板原图 ├── references/ # 参考素材原文件 └── styles/ # 风格参考原文件 项目层(每个项目独立隔离) ├── project-A/ │ ├── assets-registry.md # 项目A资产注册表 │ └── epXX/03-assets/generated/ # 项目A的生成文件 ├── project-B/ │ └── ... 原始文件永远保留,不删除。知识库存的是提取结果,原文件是溯源依据。 项目资产通过 global_ref 引用全局素材,引用不复制。

素材上传四路分流

素材归属原文件存储注册表写入知识提取
项目资产(当前项目的角色/场景/道具)项目目录/epXX/03-assets/generated/项目注册表 C/S/P-NNNimage-learning
参考/学习素材global-assets/references/不写入image-learning
跨项目通用素材global-assets/ 对应子目录global-assets-index GA-NNNimage-learning
无活跃项目global-assets/references/不写入image-learning