| 123456789101112131415161718192021222324252627282930313233343536373839404142434445464748495051525354555657585960616263646566676869707172737475767778798081828384858687888990919293949596979899100101102103104105106107108109110111112113114115116117118119120121122123124125126127128129130131132133134135136137138139140141142143144145146147148149150151152153154155156157158159160161162163164165166167168169170171172173174175176177178179180181182183184185186187188189190191192193194195196197198199200201202203204205206207208209210211212213214215216217218219220221222223224225226227228229230231232233234235236237238239240241242243244245246247248249250251252253254255256257258259260261262263264265266267268269270271272273274275276277278279280281282283284285286287288289290291292293294295296297298299300301302303304305306307308309310311312313314315316317318319320321322323324325326327328329330331332333334335336337338339340341342343344345346347348349350351352353354355356357358359360361362363364365366367368369370371372373374375376377378379380381382383384385386387388389390391392393394395396397398399400401402 |
- {
- "$comment": "动作 字典树 (新结构: 获取/提取/生成/修改/存储). chip data-prefix=\"动作\". action 字段值用 根→叶 路径 (e.g. 提取/化学提取/解构). 单一来源, agent Phase 2 读. $control 是控制流类型 (与内容动作正交).",
- "$kind": "taxonomy",
- "$dimension": "动作",
- "$field": "action",
- "$path_separator": "/",
- "$control": [
- "并行",
- "遍历",
- "分支",
- "请求",
- "等待"
- ],
- "最终分类树": [
- {
- "分类名称": "获取",
- "分类说明": "把已经存在的、完整的对象原样取来作为素材、参考或依据使用——动作本身不创造、不拆解、不改造对象。典型:检索 / 下载 / 调取 / 上传 / 拍摄 / 录音 / 键入 / 选取。判别口诀:输入与输出指向同一个完整对象(或对象集合),只是发生了'转移 / 引用',没有从内部抽出局部信息,也没有改变其形态。与'提取'的边界:获取拿到的是整体本身(如把一张参考图拿进工作流),提取拿到的是整体的派生物(如从这张图反推出文字 prompt)。与'生成'的边界:获取的对象是预先存在的,生成的对象是当前动作创造出来的新产物。\n\n【L2 切分维度】按'对象的来源位格'切分——搜索(工序外·公共域)/ 查询(工序外·私有·预存)/ 录入(工序外·私有·当场)/ 引用(工序内·自产)。一个获取动作的对象只可能位于这 4 个位置之一,MECE 完备。L2 本身只承担'来源位格'的目录定位,不作为 actions[] 取值。\n\n【L3 切分维度】每个 L2 内按'具体动作动词'切分。L3 节点直接作为 actions[] 字段的规范取值——本树即动作词典,不用'直接元素'承载同义词,所有近义动词在 L3 的分类说明中显式标注规范化目标。",
- "直接元素": [],
- "子分类": [
- {
- "分类名称": "搜索",
- "分类说明": "对象来自工序之外、面向公众开放的资源——互联网、公开素材库、搜索引擎、公共知识库、平台预设 / 模板、开源模型 / LoRA。判别:所有权 = 公共,任何人可访问。与'查询'的边界:搜索面向公共域,查询面向创作者 / 团队的私有积累(所有权差异)。与'录入'的边界:搜索是从公共域取来(创作者并未持有),录入是用户从自己手上当场提供。与'引用'的边界:搜索的对象来自工序外部,引用的对象来自工序内部的自产中间件。",
- "直接元素": [],
- "子分类": [
- {
- "分类名称": "检索",
- "分类说明": "输入查询 / 关键词 / 筛选条件 / 问题,从公共域里主动找出对象。涵盖:搜索引擎检索、库内关键词查询、对 LLM 的提问式知识获取、无明确 query 的浏览翻找(本质都是'在公共域里找')。与'下载'的边界:检索强调'查找定位'的过程(不知道精确位置),下载是'已知地址直接拿'(无需查询过程)。同义动作(写 actions[] 时统一规范为「检索」):查找 / 浏览 / 翻找 / 搜寻 / 问答式查询(对 LLM)。",
- "直接元素": [],
- "子分类": [],
- "分类性质": "内容"
- },
- {
- "分类名称": "下载",
- "分类说明": "已知精确地址(URL、ID、文件路径、API endpoint),直接获取指定对象。涵盖:URL 下载、API 拉取、网络抓取、按链接导入。与'检索'的边界:检索需要查询过程(不知精确位置),下载是已知位置直接取。与 L1'提取'的边界:下载是文件级整体获取(拿到完整对象本身),提取是从对象内部抽出局部 / 派生信息(拿到对象的一片或派生物)。同义动作(写 actions[] 时统一规范为「下载」):拉取 / 抓取 / 导入 / URL 拉取 / API 拉取。",
- "直接元素": [],
- "子分类": [],
- "分类性质": "内容"
- }
- ],
- "分类性质": "内容"
- },
- {
- "分类名称": "查询",
- "分类说明": "对象来自工序之外、创作者或团队过去预存的私有资源——自建提示词库、个人素材库、团队成品库、自训风格 LoRA、参数预设、过去的成品。判别:所有权 = 私有 + 先于本次工序就已存在。与'搜索'的边界:查询走私有积累(创作者 / 团队专属),搜索走公共域。与'录入'的边界:查询的对象是预存的(先于本次工序),录入的对象是当下提供的(为本次工序专门接入)。与'引用'的边界:查询的对象在本次工序开始前就已存在于私库,引用的对象由本次工序内部前序步骤产出。",
- "直接元素": [],
- "子分类": [
- {
- "分类名称": "调取",
- "分类说明": "取用为复用目的而预存的'零件级'私有资产——这些资产以可被反复调取的单件形态存在。涵盖:自建 prompt 库的提示词、自训 LoRA / Embedding / 参数预设、私库素材(单件参考图 / 单段文案)、本地模型权重加载、个人收藏夹里的素材。与'检索'的边界:调取走的是已知地址直接拿(私库内单件资产有明确 ID / 路径),检索是面向公共域的查找定位过程。与 L1'修改'的边界:调取只是把已有资产'取来用'(对象不变),修改要在已有对象上做改动。同义动作(写 actions[] 时统一规范为「调取」):调用 / 复用 / 加载 / 引用(私库语境)/ 套用(私库模板 / 预设)。",
- "直接元素": [],
- "子分类": [],
- "分类性质": "内容"
- }
- ],
- "分类性质": "内容"
- },
- {
- "分类名称": "录入",
- "分类说明": "对象来自用户 / 创作者在本次工序里当下提供的素材——为这次工序专门接入,不属于过去的预存积累。判别:素材的'接入时点'是本次工序开始或进行中(而非更早预存)。与'查询'的边界:录入是为本次工序专门提供(即使来自用户本地相册),查询取的是创作者过去就有的、可反复调用的私有库资产。与'搜索'的边界:来源是用户 / 创作者自己(私有),不是公共域。与'引用'的边界:录入是工序外的人为输入(用户从工序外送进来),引用是工序内的前序产物(DAG 内自循环)。",
- "直接元素": [],
- "子分类": [
- {
- "分类名称": "上传",
- "分类说明": "用户提供'工序前就已存在'的既有素材——从设备本地、剪贴板等已有内容里拿出来给到工序。涵盖:本地文件上传、拖拽文件、粘贴既有内容(剪贴板里复制好的图 / 文 / 段落)、从本地相册选图。与'拍摄 / 录音 / 键入'的边界:上传的素材在用户提供时已经存在(既有),非现场制作。与'选取'(引用-工序内)的边界:上传是从工序外送入既有素材,选取是从工序内前序候选中挑选。同义动作(写 actions[] 时统一规范为「上传」):导入(本地)/ 粘贴 / 拖拽 / 上送 / 文件添加。",
- "直接元素": [],
- "子分类": [],
- "分类性质": "内容"
- },
- {
- "分类名称": "拍摄",
- "分类说明": "用户在工序中现场视觉捕获或产出图像 / 视频素材。涵盖:实时拍照、现场录像、屏幕录制(录自己的操作演示)、手绘 / 速写 / 涂鸦草图(现场画的简笔图也算'现场视觉产出')。与'上传'的边界:拍摄是现场制作(不是从既有里拿),上传是从既有里拿。与'录音 / 键入'的边界:输出形态是图像 / 视频。同义动作(写 actions[] 时统一规范为「拍摄」):录像 / 录屏(自己的)/ 手绘。",
- "直接元素": [],
- "子分类": [],
- "分类性质": "内容"
- },
- {
- "分类名称": "录音",
- "分类说明": "用户现场进行音频捕获或产出。涵盖:现场录音、口述录入、即兴配音、现场录歌。与'拍摄 / 键入'的边界:输出形态是音频。与'上传'的边界:现场录制,非既有音频文件提供。同义动作(写 actions[] 时统一规范为「录音」):录口述 / 配音录制。",
- "直接元素": [],
- "子分类": [],
- "分类性质": "内容"
- },
- {
- "分类名称": "键入",
- "分类说明": "用户现场进行文本或结构化参数录入——通过键盘、滑块、表单、选项控件等向工序输入文本或参数。涵盖:打字输入 prompt / 描述 / 文案 / 标题、调参(拖滑块 / 选下拉 / 勾选项)、表单填写。与'拍摄 / 录音'的边界:输出形态是文本或结构化参数。与'上传'的边界:现场敲入,非粘贴既有大段文本(粘贴既有归 上传)。同义动作(写 actions[] 时统一规范为「键入」):输入 / 调参 / 填写。",
- "直接元素": [],
- "子分类": [],
- "分类性质": "内容"
- }
- ],
- "分类性质": "内容"
- },
- {
- "分类名称": "引用",
- "分类说明": "对象来自同一工序内已完成步骤的输出,被后续步骤再次拿来使用——来源是 DAG 内部,对象是工序自产的中间产物或前序成品。判别:source_id 指向的是同一工序内某个 outputs[*].id(而不是 init_input_*)。与'搜索 / 查询 / 录入'的边界:前三者来源都是工序外部(外取),引用来源是工序自身(内引)。与 L1'提取'的边界:引用拿到的是前序输出的整体本身(原样转交),提取是从前序输出里抽出局部 / 派生信息。",
- "直接元素": [],
- "子分类": [
- {
- "分类名称": "选取",
- "分类说明": "从前序步骤产生的多个候选对象中挑选一个或若干个进入下一步。涵盖:从模型出的多张候选图里挑、从生成的多个 prompt 候选里选、从多个分镜方案里取一个、从批量生成结果里筛优。判别口诀:必有'多候选 → 挑选'的过程,候选来自同一工序内的前序步骤;如果只是无差别地引用前序唯一输出(无挑选),不归选取。与'调取'的边界:选取的对象来源是工序内自产的候选池(DAG 内),调取的对象来源是工序外的私有库。与'上传'的边界:选取从工序内候选池里挑,上传从工序外(设备本地 / 剪贴板)拿既有素材。同义动作(写 actions[] 时统一规范为「选取」):挑选 / 筛选 / 评选 / 优选 / 圈选(多候选场景)。",
- "直接元素": [],
- "子分类": [],
- "分类性质": "内容"
- }
- ],
- "分类性质": "内容"
- }
- ],
- "分类性质": "内容"
- },
- {
- "分类名称": "提取",
- "分类说明": "从一个已有对象中抽出局部内容、属性、特征或派生信息——动作的输入是完整对象,输出是这个对象的'派生物'(描述、标签、文字、结构化数据、局部区域、轮廓、关键帧等)。典型:反推 / 识别 / OCR / 提取 / 抽取 / 分割 / 解析。判别口诀:输出在'形态'或'粒度'上不等同于输入——例如从图反推出文本 prompt(形态变了)、从图中识别物体名称(粒度变了)、从画面切出主体蒙版(粒度变了)。与'获取'的边界:获取得到的是整体本身,提取得到的是整体的派生物。与'修改'的边界:提取的输出与输入不是'同类对象的改前/改后',而是'整体与它的派生物'。\n\n【本质】提取是'信息由多到少'的压缩动作——从一个完整对象里减信息、得到一个更小的派生产物。这种压缩有两条不同的实现路径,对应 L2 切分。\n\n【L2 切分维度】按'输出与原对象的关系'切分——实体片段(输出是原对象的实体一片,能在原对象里指出来)/ 派生信息(输出是关于原对象的派生信息,原对象里指不出来)。一个提取动作的输出只可能位于这 2 类之一,MECE 完备。\n\n【L3 切分维度】每个 L2 内按'具体动作动词'切分。L3 节点直接作为 actions[] 字段的规范取值——本树即动作词典,不用'直接元素'承载同义词,所有近义动词在 L3 的分类说明中显式标注规范化目标。",
- "直接元素": [],
- "子分类": [
- {
- "分类名称": "物理提取",
- "分类说明": "输出是原对象的实体片段——能在原对象里直接指出'就是这一块',输出与输入同质且是其物理子集。判别口诀:能不能在原对象里圈出输出对应的那部分(地理 / 时间 / 结构上的子区域)?能 = 实体片段。与'派生信息'的边界:实体片段的输出是原对象的'一片'(同质、可指认),派生信息的输出是关于原对象的'描述 / 特征 / 分析'(异质、原对象里指不出来)。",
- "直接元素": [],
- "子分类": [
- {
- "分类名称": "裁切",
- "分类说明": "按几何区域、时间区间或位置索引等明确规则把原对象的某一块切出来——切的边界由规则定义,不依赖语义判断。涵盖:矩形 / 自由形状裁剪、按时间轴截取视频 / 音频片段、按段落 / 句子位置取文本片段。与'抠取'的边界:裁切的边界是规则定义的几何区域(不需要理解内容),抠取的边界是语义边界(需要识别对象轮廓)。与'抽帧'(时序场景)的边界:裁切按规则切'连续段',抽帧按重要性抽'离散关键点'。同义动作(写 actions[] 时统一规范为「裁切」):裁剪 / 截取片段 / 切片 / 取段。",
- "直接元素": [],
- "子分类": [],
- "分类性质": "内容"
- },
- {
- "分类名称": "抠取",
- "分类说明": "按语义边界把特定对象 / 组件从原对象中切出——切的边界由对象本身的形状 / 层次 / 结构决定,需要识别后再切。涵盖:抠图主体(按对象轮廓切)、人物 / 物体分割、拆 PSD 图层(按图层结构切)、demux 音视频轨道(按轨道结构切)。与'裁切'的边界:抠取按对象语义切,裁切按几何规则切。同义动作(写 actions[] 时统一规范为「抠取」):分割 / 抠图 / 拆图层 / 拆轨道。",
- "直接元素": [],
- "子分类": [],
- "分类性质": "内容"
- },
- {
- "分类名称": "抽帧",
- "分类说明": "从时序媒体(视频 / 音频 / 动画)中抽出离散的关键时刻或代表性片段——抽出来的每一帧 / 段都是原时序的一个截面。涵盖:视频关键帧、代表性时刻、典型片段、采样帧。与'裁切'(时间区间切)的边界:裁切是按规则切'连续段',抽帧是按重要性抽'离散关键点'。同义动作(写 actions[] 时统一规范为「抽帧」):取关键帧 / 采样 / 取代表帧。",
- "直接元素": [],
- "子分类": [],
- "分类性质": "内容"
- }
- ],
- "分类性质": "内容"
- },
- {
- "分类名称": "化学提取",
- "分类说明": "输出是关于原对象的派生信息——原对象里直接指不出来,是从原对象推算 / 解读 / 提炼出来的派生产物。判别口诀:能不能在原对象里圈出输出对应的那部分?不能 = 派生信息。涵盖:表层显式信息的读取(识别)、深层隐含信息的推理(反推:风格 / 情感 / 意图 / 深度 / 姿态等)、内部组成方式的结构化拆解(解构:章节 / 框架 / 要点 / 摘要)。与'实体片段'的边界:派生信息的输出与输入异质(图 → 文 / 数 / 标签 / 表征图),不是原对象的物理子集。",
- "直接元素": [],
- "子分类": [
- {
- "分类名称": "识别",
- "分类说明": "读取原对象表层显式存在、可直接观察到的信息——把眼睛能看到、耳朵能听到的东西转成可处理的标签 / 文字 / 数据。涵盖:OCR 文字识别、物体识别(detection + classification)、人脸识别、场景识别、语音转文字、命名实体识别(NER)。与'反推'的边界:识别处理的是表层显式信息(信息就在眼前,只是换种形态),反推处理的是深层隐含信息(需要推理才能得到)。同义动作(写 actions[] 时统一规范为「识别」):检测 / OCR / 转录 / 标注。",
- "直接元素": [],
- "子分类": [],
- "分类性质": "内容"
- },
- {
- "分类名称": "反推",
- "分类说明": "推理出原对象深层隐含、不可直接观察的信息——需要'从结果推回原因 / 构成'的推理过程。涵盖两大类:(1)语义反推:反推 prompt、风格分析、情感分析、意图推断、创作手法推断;(2)结构表征反推:depth map / canny 边缘 / normal map / pose 骨架 / segmentation mask 等 ControlNet 类预处理(这些 map 都不在原图直接可见,是从 RGB 推算出来的隐含结构)。与'识别'的边界:识别读表层显式(图里的字、物体),反推推深层隐含(图的风格、深度、生成原因)。与'解构'的边界:反推推理'隐含的属性 / 原因 / 表征'(风格 / 情感 / depth 结构),解构分析'显式的内部组成方式'(层级 / 框架)。同义动作(写 actions[] 时统一规范为「反推」):推断 / 分析 / 预处理(ControlNet 类)/ 估计(深度 / 姿态)/ 风格分析 / 情感分析。",
- "直接元素": [],
- "子分类": [],
- "分类性质": "内容"
- },
- {
- "分类名称": "解构",
- "分类说明": "系统性地把原对象拆解成结构化的层级分析——输出是关于原对象内部组成方式的'结构描述',而不是原对象本身的物理碎片。涵盖:拆剧情结构(场景 / 冲突 / 转折)、拆构图层级(前景 / 中景 / 背景,三分法 / 对称)、拆文章章节框架(引言 / 论点 / 论据 / 结论)、拆角色构成(服饰 / 发型 / 姿态 / 表情)、内容浓缩与提炼(摘要 / 要点提炼 / 核心信息抽取)。与'抠取'的边界:抠取是物理拆分(输出是原对象的实体片段),解构是分析拆分(输出是关于原对象组成的描述)。与'反推'的边界:反推推理'隐含的属性 / 原因 / 表征'(风格 / 情感 / depth 结构),解构分析'显式的内部组成方式'(章节 / 层次 / 框架 / 要点)。同义动作(写 actions[] 时统一规范为「解构」):拆解(结构)/ 结构分析 / 框架分析 / 层级分析 / 摘要 / 要点提炼。",
- "直接元素": [],
- "子分类": [],
- "分类性质": "内容"
- }
- ],
- "分类性质": "内容"
- }
- ],
- "分类性质": "内容"
- },
- {
- "分类名称": "生成",
- "分类说明": "从无到有产出新的对象——动作本身不依赖某个被改造的'前身'对象,仅依靠引导信息(如 prompt、参考、规则、知识)创造出之前不存在的产物。典型:生成 / 文生图 / 文生视频 / 合成 / 补全 / 生成草图 / 起草。判别口诀:输出是一个新对象(图、文本、视频、音频),其'实体'在输入中并不存在;输入即使含参考素材,参考也只是引导而非'被改造的本体'。与'修改'的边界:生成的输出没有可对应的'同一个对象的前一版本',修改的输出能与输入对应到'同一个对象的不同形态'。与'获取'的边界:生成的对象是当前动作产出的全新产物,获取的对象是预先就存在的。\n\n【本质】生成是'产生信息增量'的动作——给出一个之前不存在的新信息片段。\n\n【L2 切分维度】按'增量结果的形态'切分——元素生成(结果是一个自成一体的独立单元)/ 关系生成(结果是多项之间的明确关系结构)。两类 MECE 完备:要么是单件独立单元,要么是多项 + 关系。L2'元素生成'本身即叶子节点,不再向下切分;L2'关系生成'下再按关系几何形态切分 L3。\n\n【L3 切分维度】关系生成下按'关系的几何形态'切分——数组生成(一维线性顺序)/ 结构生成(非线性结构 / 共时并置)。两类 MECE 完备:要么是先后排列,要么是同时并置。\n\n【actions[] 规范取值】叶子节点(元素生成 / 数组生成 / 结构生成)直接作为 actions[] 字段的规范取值。本树即动作词典,所有近义动词在叶子分类说明中显式标注规范化目标。",
- "直接元素": [],
- "子分类": [
- {
- "分类名称": "元素生成",
- "分类说明": "生成结果是一个自成一体的单个对象——对外是一个独立单元,不论内部是简单还是复合。涵盖:文生图(一张图)/ 图生图(产出新的一张图)/ 文生视频片段(一段独立短片)/ 起草文案(一段独立文本)/ 起草脚本(一份独立脚本)/ 生成单个角色 / 生成 BGM / 生成单个模板 / 生成单条 prompt。判别口诀:结果能否被指称为'一个 X'(一张图 / 一段视频 / 一份文案 / 一条 prompt)?能即归此。与'数组生成 / 结构生成'的边界:元素生成的产物对外呈一个独立单元(即使内部含多部件也对外呈一个),关系生成的产物本质是'多项 + 关系结构'。同义动作(写 actions[] 时统一规范为「元素生成」):起草 / 写稿 / 文生图 / 文生视频(单段)/ 图生图(单张产出)/ 草图生成 / 单件生成 / 撰写。",
- "直接元素": [],
- "子分类": [],
- "分类性质": "内容"
- },
- {
- "分类名称": "关系生成",
- "分类说明": "生成结果是多项之间的明确关系结构——多个东西按某种顺序 / 结构关联在一起。判别口诀:结果是否本质上是'多项 + 关系'(一组镜头序列、一套配色方案、一幅多元素布置)?是 = 关系。与'原子'的边界:原子结果对外是一个独立单元,关系结果是多项的关联结构。",
- "直接元素": [],
- "子分类": [
- {
- "分类名称": "数组生成",
- "分类说明": "生成结果是多项的线性顺序——给一组项确定它们的先后排列。涵盖:剧本时序、镜头序列、步骤清单、台本顺序、视频片段时间线、分镜先后、大纲排序、章节排序、教程步骤排布。判别口诀:产物的核心信息是'若干项 + 一条单向时间 / 顺序轴',调换顺序会破坏产物意义。与'元素生成'的边界:数组生成必含多项 + 先后约束(关系是核心信息),元素生成只是单个对象(无内部先后关系)。与'结构生成'的边界:数组是一维顺序(先后排列),结构是非线性 / 共时并置。同义动作(写 actions[] 时统一规范为「数组生成」):编排 / 串联 / 排序 / 时序排布 / 序列生成 / 时间轴编排 / 章节排序 / 剧本编排。",
- "直接元素": [],
- "子分类": [],
- "分类性质": "内容"
- },
- {
- "分类名称": "结构生成",
- "分类说明": "生成结果是多项的非线性结构——多个项以某种结构关系(融合 / 配合 / 空间布置 / 层级叠加)组合在一起。涵盖:场景画面合成、配色方案、UI 布局、多元素拼贴、风格 + 内容搭配、图层组合、版式构图、信息图组装、多视图布置。判别口诀:产物的核心信息是'多项 + 共时并置 / 空间层级关系',去掉任一元素或挪位置会破坏整体。与'数组生成'的边界:结构是非线性 / 共时并置(同时呈现),数组是一维线性顺序(先后排列)。与'元素生成'的边界:结构生成必含'多项 + 组合关系',元素生成是单件独立单元。同义动作(写 actions[] 时统一规范为「结构生成」):合成 / 搭配 / 布置 / 组合 / 拼贴 / 布局生成 / 配色生成 / 图层组合生成 / 版式生成。",
- "直接元素": [],
- "子分类": [],
- "分类性质": "内容"
- }
- ],
- "分类性质": "内容"
- }
- ],
- "分类性质": "内容"
- },
- {
- "分类名称": "修改",
- "分类说明": "在已有对象的基础上做改动——输入是一个待改造的本体对象,输出是它被改动后的版本,对象的身份保留但形态 / 属性 / 局部已发生变化。典型:编辑 / 局部重绘 / 上色 / 重打光 / 去背景 / 换脸 / 换装 / 修饰 / 增强 / 改写 / 翻译 / 风格化 / 转换 / 超分。判别口诀:能在输入与输出之间指认出'同一个对象'的'改前 / 改后'对应关系——超分前后是同一张图,改写前后是同一段文本。与'生成'的边界:修改有明确的'被改造本体',生成没有;若产物的主体来自输入对象的延续 → 修改,若产物的主体由动作新造 → 生成。与'提取'的边界:修改的输出仍是同类完整对象,提取的输出是输入的派生物(不同粒度或不同形态)。\n\n【L2 切分维度】按'改动性质'分 3 类——增(添加新的信息片段)/ 删(去除已有的信息片段)/ 变(改变已有部分:原位置上的替换 / 重述 / 风格化 / 格式转换 / 渐变调整 / 自动增强)。三类 MECE 完备:要么加新(信息总量增加)、要么去旧(信息总量减少)、要么原位置改变(信息总量基本不变,只是某部分变成不一样的)。\n\n【L3 切分维度】每个 L2 内按'具体动作动词'切分。L3 节点直接作为 actions[] 字段的规范取值——本树即动作词典,不用'直接元素'承载同义词,所有近义动词在 L3 的分类说明中显式标注规范化目标。",
- "直接元素": [],
- "子分类": [
- {
- "分类名称": "增",
- "分类说明": "添加新的信息片段到原对象上——原对象的现有部分保留,新内容 / 形态 / 装饰被叠加 / 嵌入进去。判别口诀:动作前后比较,原对象多了一些之前没有的信息。与'删'的边界:增是加新的(信息总量增加),删是去已有的(信息总量减少),方向相反。与'变'的边界:增是单纯加新(原位置不变,多出一份),变是在原位置上把已有部分改成不一样的(替换 / 渐变,无新增独立单元)。\n\n【L3 切分维度】按增加对象的层级切分——添加(substantive 内容元素的增)/ 叠加(form 形态层 / 装饰层的增)。",
- "直接元素": [],
- "子分类": [
- {
- "分类名称": "添加",
- "分类说明": "在原对象上增加新的语义内容元素——给画面新增一个主体 / 物体 / 角色,给文案新增一段内容,给视频新增一段片段,给脚本新增一段动作。判别口诀:动作前后比较,原对象多出了一个独立的语义内容元素,这个元素本身就是'被增加的内容'(有独立语义身份:人 / 物 / 段 / 镜)。与'叠加'的边界:添加加的是内容层(substantive,多出一个独立语义元素),叠加加的是形态层(form,多出一层装饰性 / 标识性 / 修饰性形态)。与'替换'的边界:添加只加不去(原对象不变,多出一份),替换是去旧 + 换新(一删一加)。与'增强'的边界:添加是主动放入新元素(创作者指定内容),增强是自动质量提升(无新增内容)。同义动作(写 actions[] 时统一规范为「添加」):新增 / 添入 / 加入 / 加段 / 加镜 / 加角色 / 加物体 / 补段 / 补镜。",
- "直接元素": [],
- "子分类": [],
- "分类性质": "内容"
- },
- {
- "分类名称": "叠加",
- "分类说明": "在原对象上叠加新的形态层 / 装饰层——给画面叠加水印 / logo / 装饰图层 / 边框、给视频叠加字幕轨 / 弹幕、给文档叠加页眉页脚、给图叠加蒙层 / 滤色层。判别口诀:动作前后比较,原对象多出了一层不属于'语义内容主体'的装饰性 / 标识性 / 修饰性形态。与'添加'的边界:叠加加的是形态层(装饰 / 标识 / 修饰,不构成独立语义内容),添加加的是内容层(独立语义元素:人 / 物 / 段 / 镜)。与'风格化'(变)的边界:叠加是在原对象上多出一层独立可见的形态元素(水印 / logo 是可指认的一层),风格化是对原对象整体外观做转换(无独立可指认的新层)。同义动作(写 actions[] 时统一规范为「叠加」):加水印 / 加 logo / 加图层 / 加装饰 / 加边框 / 加蒙层 / 加字幕轨 / overlay / 嵌入标识。",
- "直接元素": [],
- "子分类": [],
- "分类性质": "内容"
- }
- ],
- "分类性质": "内容"
- },
- {
- "分类名称": "删",
- "分类说明": "去除原对象的某部分信息——原对象的其余部分保留,被去除的部分从对象中消失。判别口诀:动作前后比较,原对象少了一些之前有的信息(信息总量减少)。与'增'的边界:删是去已有的(少一份),增是加新的(多一份),方向相反。与'变'下'替换'的边界:删只去不补(原位置变空),替换是去掉再补上不同的(原位置仍有内容,只是换成了别的)。\n\n【L3 切分维度】按被删除信息的空间 / 时间维度切分——抹除(空间维度内的内容删除)/ 剪除(时间维度上的片段删除)。",
- "直接元素": [],
- "子分类": [
- {
- "分类名称": "抹除",
- "分类说明": "去除空间内的内容元素——把对象空间维度上的某部分内容擦掉 / 去掉。涵盖:去背景、去水印、去画面里的某个角色 / 物体、抹除画面瑕疵。与'剪除'的边界:抹除针对'空间内'的内容(同一画面 / 同一帧里的某部分),剪除针对'时间维度'的片段(视频 / 序列里的某段时间)。同义动作(写 actions[] 时统一规范为「抹除」):擦除 / 移除 / 抠除 / erase。",
- "直接元素": [],
- "子分类": [],
- "分类性质": "内容"
- },
- {
- "分类名称": "剪除",
- "分类说明": "剪掉时间维度的片段——把对象时间序列上的某段去掉。涵盖:剪掉视频中的一段、删除文章中的一节、截短音频、去掉序列中的某项。与'抹除'的边界:剪除针对'时间维度'的片段,抹除针对'空间内'的内容。同义动作(写 actions[] 时统一规范为「剪除」):剪 / 截短 / 删段 / cut。",
- "直接元素": [],
- "子分类": [],
- "分类性质": "内容"
- }
- ],
- "分类性质": "内容"
- },
- {
- "分类名称": "变",
- "分类说明": "改变已有部分——原对象的内容 / 形态 / 属性 在原位置发生变化,无论是离散切换(替换:A → B)还是连续渐变(重述 / 风格化 / 转换 / 调整 / 增强)。判别口诀:动作前后比较,原对象的某部分'变成不一样的'(不是新增、不是删除,而是原位置改变);信息总量基本不变。与'增 / 删'的边界:变不改变信息总量(原位置改),增加新信息(多一份),删去除信息(少一份)。\n\n【L3 切分维度】按改变方式切分——替换(categorical 离散切换:A → B 实体不同)/ 重述(保原意改表达)/ 风格化(换审美 / 视觉风格)/ 转换(换技术形式 / 媒介 / 格式)/ 调整(continuous 手动微调属性)/ 增强(自动质量提升)。",
- "直接元素": [],
- "子分类": [
- {
- "分类名称": "重述",
- "分类说明": "实质改述——保留原意,改造表达 / 表述方式。涵盖:改写文段、翻译(中 → 英 / 英 → 中)、重构表述结构、转写口吻(书面 → 口语 / 正式 → 随意)、改述要点 / 段落润色。与'替换'的边界:重述保原意改表达(同一段意思的不同说法),替换是把整段内容主体换成不同的另一段(意思可不同)。与'风格化'的边界:重述改文字的'表达方式'(语种 / 用词 / 结构),风格化改文字 / 画面的'审美调性'(如转某文风、转某腔调、转视觉风格)。与'转换'的边界:重述走表达层(同语种内换说法 / 改写),转换走形式承载层(语种 / 格式 / 媒介整体切换)。同义动作(写 actions[] 时统一规范为「重述」):改写 / 翻译 / 重写 / 重构 / 改述 / 润色 / paraphrase / 转写口吻。",
- "直接元素": [],
- "子分类": [],
- "分类性质": "内容"
- },
- {
- "分类名称": "风格化",
- "分类说明": "换审美 / 视觉风格——同一对象在视觉风格上的转换,本体内容大致保留。涵盖:卡通化 / 油画化 / 写实化 / 水彩化、转赛博朋克风、转日漫风、文字转某文风。与'转换'的边界:风格化是'审美层面'的风格转换(卡通 / 油画 / 水彩等审美调性),转换是'技术形式'的格式 / 媒介 / 语种切换。同义动作(写 actions[] 时统一规范为「风格化」):风格转换 / 风格迁移 / stylize / style transfer。",
- "直接元素": [],
- "子分类": [],
- "分类性质": "内容"
- },
- {
- "分类名称": "转换",
- "分类说明": "换技术形式 / 媒介 / 格式 / 语种——同一对象在技术承载形式上的转换。涵盖:jpg → png(格式)、mp4 → gif(媒介格式)、横屏 → 竖屏(画幅形式)、PDF → Word(文档格式)、中 → 英(语种形式,作为形式转换而非内容改述时)、文 → 音(TTS 形式承载)。与'风格化'的边界:转换是'技术形式 / 格式'变化(容器变,呈现方式可能变),风格化是'审美 / 视觉风格'变化(容器不变,审美调性变)。与'重述'的边界:转换走形式承载层(语种 / 格式 / 媒介整体切换),重述走表达层(同语种内换说法)。与'调整'的边界:转换是 categorical 形式切换(jpg → png),调整是 continuous 属性微调(在原值附近滑动)。同义动作(写 actions[] 时统一规范为「转换」):转格式 / 转媒介 / 改格式 / convert / 转语种 / 转分辨率(格式语境)/ 转编码。",
- "直接元素": [],
- "子分类": [],
- "分类性质": "内容"
- },
- {
- "分类名称": "替换",
- "分类说明": "用不同的对象 / 元素 / 内容把原位置上的整个对应部分换掉——离散切换(categorical),新旧之间是不同的实体,不是渐变。涵盖:换脸 / 换装 / 换背景 / 换发型 / 换角色 / 换台词段 / 整段文案替换 / 整段镜头替换 / 换字体 / 换配色(指定枚举值)。判别口诀:动作前后比较,原位置上'这个东西'被换成'另一个东西'(A → B 的离散切换),不是 A 自身的渐变改造。与'重述'的边界:替换换内容主体(A 段换成 B 段,意思可不同),重述保原意改表达(同一段意思的不同说法)。与'调整'的边界:替换是 categorical 离散切换(A → B 实体不同),调整是 continuous 渐变(在原值附近滑动)。与'添加'的边界:替换是去旧 + 换新一并发生(原位置仍有内容,只是变了),添加是单纯加新不动旧。与'风格化'的边界:替换是某个具体元素被换成另一个具体元素(局部对象层),风格化是整体审美调性的切换(整图 / 整段层)。同义动作(写 actions[] 时统一规范为「替换」):换 / 替 / 换脸 / 换装 / 换背景 / 换角色 / replace / swap / 替代。",
- "直接元素": [],
- "子分类": [],
- "分类性质": "内容"
- },
- {
- "分类名称": "调整",
- "分类说明": "渐变属性值(手动微调)——属性值在原位置附近做连续 / 渐变性的微调。涵盖:调色 / 调亮 / 调对比 / 调饱和、调音量 / 调音色、调速度 / 调节奏、调透明度、调位置(局部微调)/ 调大小(局部微调)。与'替换'的边界:调整是 continuous 微调(在原值附近滑动),替换是 categorical 切换(A → B 离散值)。与'增强'的边界:调整是'手动渐变'(创作者主动指定方向 / 幅度),增强是'自动质量提升'(系统智能修复 / 提升,无创作者主观方向)。与'风格化'的边界:调整改的是低层属性数值(亮度 / 对比 / 速度),风格化改的是高层审美调性(卡通化 / 油画化)。同义动作(写 actions[] 时统一规范为「调整」):调 / 校 / 微调 / fine-tune / adjust / 校色 / 调音。",
- "直接元素": [],
- "子分类": [],
- "分类性质": "内容"
- },
- {
- "分类名称": "增强",
- "分类说明": "自动质量提升——系统智能算法对对象做自动质量改善,无需创作者指定具体方向 / 数值。涵盖:超分(提分辨率)、降噪、锐化、补帧、修复瑕疵 / 自动修图、画质增强、音频降噪 / 增强、人像自动美化、自动去模糊。判别口诀:算法自己决定怎么改、改多少(创作者只决定'要不要做'),且不增减语义内容(不改变'画面里有什么')。与'调整'的边界:增强是'自动算法'提升质量(创作者只按按钮),调整是'手动渐变'微调属性(创作者指定方向 / 幅度)。与'添加'的边界:增强是属性维度的整体质量提升(不增减语义内容),添加是新增独立语义元素(多出一个新对象)。与'替换'的边界:增强不改变对象身份(只是更清晰 / 更干净),替换是把对象换成不同的另一个。同义动作(写 actions[] 时统一规范为「增强」):超分 / 降噪 / 锐化 / 补帧 / 修复 / 画质提升 / enhance / 自动修图 / 一键美化。",
- "直接元素": [],
- "子分类": [],
- "分类性质": "内容"
- }
- ],
- "分类性质": "内容"
- }
- ],
- "分类性质": "内容"
- },
- {
- "分类名称": "存储",
- "分类说明": "把当前持有的对象保存到某个存储位格,使其在未来可被再次取用——动作本身不创造、不改变对象,只是把对象的拷贝放到指定的存储位格。典型:保存 / 暂存 / 入库 / 沉淀 / 归档 / 留底。判别口诀:输入是工序内已有的对象,输出是'同一对象被放到了某个存储位格里'(对象本身不变,只是落地位置发生变化)。与'获取'的边界:存储是把工序内的对象往外送到存储位格(工序内 → 存储位格,写入侧),获取是从存储位格取回到工序内(存储位格 → 工序内,读取侧),二者方向相反。与'生成'的边界:存储不产生新对象(只是搬运现有对象的拷贝),生成产出之前不存在的新产物。与作用树'交付'的边界:交付是把产物推向终态对外(功能性归宿,发布意义),存储侧重把产物保留到可被未来调用的位置(持久化意义,可不对外)。\n\n【L2 切分维度】按'存储位格的位置 / 时效'切分——暂存(工序内·临时缓存,per-batch 用完即释)/ 沉淀(工序外·私有·长效,跨工序反复调用)/ 归档(工序外·长期封存,被动留底)。三种位格 MECE 完备,且与'获取'L2 形成对称关系(沉淀对应查询、暂存对应引用)。\n\n【L3 切分维度】每个 L2 内按'具体动作动词'切分。L3 节点直接作为 actions[] 字段的规范取值——本树即动作词典,不用'直接元素'承载同义词,所有近义动词在 L3 的分类说明中显式标注规范化目标。",
- "直接元素": [],
- "子分类": [
- {
- "分类名称": "暂存",
- "分类说明": "对象被存放在本次工序内 / 当前会话内的临时缓存——只在本次工序内可被再次引用,工序结束后不保证存活。判别:存放位置是工序自身的中间缓存,不是跨工序的持久化位格。与'沉淀'的边界:暂存是 per-batch / 本次工序内的临时态(用完即释),沉淀是跨工序的长效私库(可被未来工序反复调取)。与获取树'引用'的边界:暂存是'把对象放到工序内缓存里'(写入侧),引用是'从工序内缓存取出来用'(读取侧),二者配对完成 DAG 内自循环。",
- "直接元素": [],
- "子分类": [
- {
- "分类名称": "缓存",
- "分类说明": "把对象放到工序内 / 会话内的临时缓存里,供本次工序后续步骤复用。涵盖:节点输出缓存 / 中间产物保留 / 临时变量存放 / session 级 cache / 草稿暂存。判别:存放期限仅限本次工序 / 当前会话,工序结束后通常被释放。同义动作(写 actions[] 时统一规范为「缓存」):暂存 / 临时保存 / 草稿存 / cache / hold / 中间产物保存。",
- "直接元素": [],
- "子分类": [],
- "分类性质": "内容"
- }
- ],
- "分类性质": "内容"
- },
- {
- "分类名称": "沉淀",
- "分类说明": "对象被存进创作者 / 团队的私有积累库,作为未来跨工序复用的资产。判别:存放位置是跨工序的长效私库(个人库 / 团队库 / 模板库),未来可被反复'查询.调取'取出。与'暂存'的边界:沉淀是跨工序长效(可被未来反复调用),暂存是本工序临时(用完即释)。与'归档'的边界:沉淀的目的是'供未来反复调用'(活跃资产 / 高频复用),归档的目的是'长期封存留底'(被动留底 / 低频访问)。与获取树'查询'的边界:沉淀是'把对象放进私库里'(写入侧),查询.调取是'从私库里取出来用'(读取侧),二者配对完成私库读写循环。",
- "直接元素": [],
- "子分类": [
- {
- "分类名称": "入库",
- "分类说明": "把对象作为私有零件级资产存进库里,供未来反复调用。涵盖:提示词入库 / 素材入库 / 模板入库 / 风格预设入库 / 参考图收藏入库 / 文案模板入库 / 镜头库入库 / LoRA 与 Embedding 等权重文件入库。判别:被存入的对象以'可被反复调取的单件形态'存在,目的是为下一次生产复用。与'存档'的边界:入库的对象是为'活跃复用'而存(高频调取),存档的对象是为'长期留底'而存(低频回溯)。同义动作(写 actions[] 时统一规范为「入库」):存入私库 / 收藏 / 加入收藏 / 模板沉淀 / 提示词沉淀 / 素材沉淀 / 加入素材库 / 权重入库。",
- "直接元素": [],
- "子分类": [],
- "分类性质": "内容"
- }
- ],
- "分类性质": "内容"
- },
- {
- "分类名称": "归档",
- "分类说明": "对象被长期封存留底——目的不是供未来反复调用,而是保留历史记录 / 留底备查 / 合规存档 / 法定保留期。判别:存放位置是冷存储 / 历史归档,调用频率极低(被动访问 / 偶发回溯)。与'沉淀'的边界:归档强调'长期封存留底'(被动留底,访问稀少),沉淀强调'供未来反复调用'(活跃资产,频繁取用)。与作用树'交付'的边界:交付是把产物推到对外终态(功能完成意义),归档是把产物(无论是否已交付)存进历史档案(留底意义,可发生在已交付之后)。",
- "直接元素": [],
- "子分类": [
- {
- "分类名称": "存档",
- "分类说明": "把对象(含成片、底稿、流程配置、版本快照)存进长期档案中,留底备查。涵盖:项目归档 / 版本快照存档 / 成片冷存档 / 流程配置存档 / 历史版本封存 / 工程文件归档 / 工作流配置存档。判别:存储动作的目的是'留底'而非'复用'。同义动作(写 actions[] 时统一规范为「存档」):归档 / 封存 / 冷存 / 留底 / archive / 版本快照 / 工程归档。",
- "直接元素": [],
- "子分类": [],
- "分类性质": "内容"
- }
- ],
- "分类性质": "内容"
- }
- ],
- "分类性质": "内容"
- }
- ],
- "$leaves": [
- "检索",
- "下载",
- "调取",
- "上传",
- "拍摄",
- "录音",
- "键入",
- "选取",
- "裁切",
- "抠取",
- "抽帧",
- "识别",
- "反推",
- "解构",
- "元素生成",
- "数组生成",
- "结构生成",
- "添加",
- "叠加",
- "抹除",
- "剪除",
- "重述",
- "风格化",
- "转换",
- "替换",
- "调整",
- "增强",
- "缓存",
- "入库",
- "存档"
- ]
- }
|