howard
/
Agent


			
				
					
						
						
							123456789101112131415161718192021222324252627282930313233343536373839404142434445464748495051525354555657585960616263646566676869707172737475767778798081828384858687888990919293949596979899100101102103104105106107108109110111112113114115116117118119120121122123124125126127128129130131132133134135136137138139140141142143144145146147148149150151152153154155156157158159160161162163164165166167168169170171172173174175176177178179180181182183184185186187188189190191192193194195196197198199200201202203204205206207208209210211212213214215216217218219220221222223224225226227228229230231232233234235236237238239240241242243244245246247248249250251252253254255256257258259260261262263264265266267268269270271272273274275276277278279280281282283284285286287288289290291292293294295296297298299300301302303304305306307308309310311312313314315316317318319320321322323324325326327328329330331332333334335336337338339340341342343344345346347348349350351352353354355356357358359360361362363364365366367368369370371372373374375376377378379380381382383384385386387388389390391392393394395396397398399400401402
							{
  "$comment": "动作 字典树 (新结构: 获取/提取/生成/修改/存储). chip data-prefix=\"动作\". action 字段值用 根→叶 路径 (e.g. 提取/化学提取/解构). 单一来源, agent Phase 2 读. $control 是控制流类型 (与内容动作正交).",
  "$kind": "taxonomy",
  "$dimension": "动作",
  "$field": "action",
  "$path_separator": "/",
  "$control": [
    "并行",
    "遍历",
    "分支",
    "请求",
    "等待"
  ],
  "最终分类树": [
    {
      "分类名称": "获取",
      "分类说明": "把已经存在的、完整的对象原样取来作为素材、参考或依据使用——动作本身不创造、不拆解、不改造对象。典型：检索 / 下载 / 调取 / 上传 / 拍摄 / 录音 / 键入 / 选取。判别口诀：输入与输出指向同一个完整对象（或对象集合），只是发生了'转移 / 引用'，没有从内部抽出局部信息，也没有改变其形态。与'提取'的边界：获取拿到的是整体本身（如把一张参考图拿进工作流），提取拿到的是整体的派生物（如从这张图反推出文字 prompt）。与'生成'的边界：获取的对象是预先存在的，生成的对象是当前动作创造出来的新产物。\n\n【L2 切分维度】按'对象的来源位格'切分——搜索（工序外·公共域）/ 查询（工序外·私有·预存）/ 录入（工序外·私有·当场）/ 引用（工序内·自产）。一个获取动作的对象只可能位于这 4 个位置之一，MECE 完备。L2 本身只承担'来源位格'的目录定位，不作为 actions[] 取值。\n\n【L3 切分维度】每个 L2 内按'具体动作动词'切分。L3 节点直接作为 actions[] 字段的规范取值——本树即动作词典，不用'直接元素'承载同义词，所有近义动词在 L3 的分类说明中显式标注规范化目标。",
      "直接元素": [],
      "子分类": [
        {
          "分类名称": "搜索",
          "分类说明": "对象来自工序之外、面向公众开放的资源——互联网、公开素材库、搜索引擎、公共知识库、平台预设 / 模板、开源模型 / LoRA。判别：所有权 = 公共，任何人可访问。与'查询'的边界：搜索面向公共域，查询面向创作者 / 团队的私有积累（所有权差异）。与'录入'的边界：搜索是从公共域取来（创作者并未持有），录入是用户从自己手上当场提供。与'引用'的边界：搜索的对象来自工序外部，引用的对象来自工序内部的自产中间件。",
          "直接元素": [],
          "子分类": [
            {
              "分类名称": "检索",
              "分类说明": "输入查询 / 关键词 / 筛选条件 / 问题，从公共域里主动找出对象。涵盖：搜索引擎检索、库内关键词查询、对 LLM 的提问式知识获取、无明确 query 的浏览翻找（本质都是'在公共域里找'）。与'下载'的边界：检索强调'查找定位'的过程（不知道精确位置），下载是'已知地址直接拿'（无需查询过程）。同义动作（写 actions[] 时统一规范为「检索」）：查找 / 浏览 / 翻找 / 搜寻 / 问答式查询（对 LLM）。",
              "直接元素": [],
              "子分类": [],
              "分类性质": "内容"
            },
            {
              "分类名称": "下载",
              "分类说明": "已知精确地址（URL、ID、文件路径、API endpoint），直接获取指定对象。涵盖：URL 下载、API 拉取、网络抓取、按链接导入。与'检索'的边界：检索需要查询过程（不知精确位置），下载是已知位置直接取。与 L1'提取'的边界：下载是文件级整体获取（拿到完整对象本身），提取是从对象内部抽出局部 / 派生信息（拿到对象的一片或派生物）。同义动作（写 actions[] 时统一规范为「下载」）：拉取 / 抓取 / 导入 / URL 拉取 / API 拉取。",
              "直接元素": [],
              "子分类": [],
              "分类性质": "内容"
            }
          ],
          "分类性质": "内容"
        },
        {
          "分类名称": "查询",
          "分类说明": "对象来自工序之外、创作者或团队过去预存的私有资源——自建提示词库、个人素材库、团队成品库、自训风格 LoRA、参数预设、过去的成品。判别：所有权 = 私有 + 先于本次工序就已存在。与'搜索'的边界：查询走私有积累（创作者 / 团队专属），搜索走公共域。与'录入'的边界：查询的对象是预存的（先于本次工序），录入的对象是当下提供的（为本次工序专门接入）。与'引用'的边界：查询的对象在本次工序开始前就已存在于私库，引用的对象由本次工序内部前序步骤产出。",
          "直接元素": [],
          "子分类": [
            {
              "分类名称": "调取",
              "分类说明": "取用为复用目的而预存的'零件级'私有资产——这些资产以可被反复调取的单件形态存在。涵盖：自建 prompt 库的提示词、自训 LoRA / Embedding / 参数预设、私库素材（单件参考图 / 单段文案）、本地模型权重加载、个人收藏夹里的素材。与'检索'的边界：调取走的是已知地址直接拿（私库内单件资产有明确 ID / 路径），检索是面向公共域的查找定位过程。与 L1'修改'的边界：调取只是把已有资产'取来用'（对象不变），修改要在已有对象上做改动。同义动作（写 actions[] 时统一规范为「调取」）：调用 / 复用 / 加载 / 引用（私库语境）/ 套用（私库模板 / 预设）。",
              "直接元素": [],
              "子分类": [],
              "分类性质": "内容"
            }
          ],
          "分类性质": "内容"
        },
        {
          "分类名称": "录入",
          "分类说明": "对象来自用户 / 创作者在本次工序里当下提供的素材——为这次工序专门接入，不属于过去的预存积累。判别：素材的'接入时点'是本次工序开始或进行中（而非更早预存）。与'查询'的边界：录入是为本次工序专门提供（即使来自用户本地相册），查询取的是创作者过去就有的、可反复调用的私有库资产。与'搜索'的边界：来源是用户 / 创作者自己（私有），不是公共域。与'引用'的边界：录入是工序外的人为输入（用户从工序外送进来），引用是工序内的前序产物（DAG 内自循环）。",
          "直接元素": [],
          "子分类": [
            {
              "分类名称": "上传",
              "分类说明": "用户提供'工序前就已存在'的既有素材——从设备本地、剪贴板等已有内容里拿出来给到工序。涵盖：本地文件上传、拖拽文件、粘贴既有内容（剪贴板里复制好的图 / 文 / 段落）、从本地相册选图。与'拍摄 / 录音 / 键入'的边界：上传的素材在用户提供时已经存在（既有），非现场制作。与'选取'（引用-工序内）的边界：上传是从工序外送入既有素材，选取是从工序内前序候选中挑选。同义动作（写 actions[] 时统一规范为「上传」）：导入（本地）/ 粘贴 / 拖拽 / 上送 / 文件添加。",
              "直接元素": [],
              "子分类": [],
              "分类性质": "内容"
            },
            {
              "分类名称": "拍摄",
              "分类说明": "用户在工序中现场视觉捕获或产出图像 / 视频素材。涵盖：实时拍照、现场录像、屏幕录制（录自己的操作演示）、手绘 / 速写 / 涂鸦草图（现场画的简笔图也算'现场视觉产出'）。与'上传'的边界：拍摄是现场制作（不是从既有里拿），上传是从既有里拿。与'录音 / 键入'的边界：输出形态是图像 / 视频。同义动作（写 actions[] 时统一规范为「拍摄」）：录像 / 录屏（自己的）/ 手绘。",
              "直接元素": [],
              "子分类": [],
              "分类性质": "内容"
            },
            {
              "分类名称": "录音",
              "分类说明": "用户现场进行音频捕获或产出。涵盖：现场录音、口述录入、即兴配音、现场录歌。与'拍摄 / 键入'的边界：输出形态是音频。与'上传'的边界：现场录制，非既有音频文件提供。同义动作（写 actions[] 时统一规范为「录音」）：录口述 / 配音录制。",
              "直接元素": [],
              "子分类": [],
              "分类性质": "内容"
            },
            {
              "分类名称": "键入",
              "分类说明": "用户现场进行文本或结构化参数录入——通过键盘、滑块、表单、选项控件等向工序输入文本或参数。涵盖：打字输入 prompt / 描述 / 文案 / 标题、调参（拖滑块 / 选下拉 / 勾选项）、表单填写。与'拍摄 / 录音'的边界：输出形态是文本或结构化参数。与'上传'的边界：现场敲入，非粘贴既有大段文本（粘贴既有归 上传）。同义动作（写 actions[] 时统一规范为「键入」）：输入 / 调参 / 填写。",
              "直接元素": [],
              "子分类": [],
              "分类性质": "内容"
            }
          ],
          "分类性质": "内容"
        },
        {
          "分类名称": "引用",
          "分类说明": "对象来自同一工序内已完成步骤的输出，被后续步骤再次拿来使用——来源是 DAG 内部，对象是工序自产的中间产物或前序成品。判别：source_id 指向的是同一工序内某个 outputs[*].id（而不是 init_input_*）。与'搜索 / 查询 / 录入'的边界：前三者来源都是工序外部（外取），引用来源是工序自身（内引）。与 L1'提取'的边界：引用拿到的是前序输出的整体本身（原样转交），提取是从前序输出里抽出局部 / 派生信息。",
          "直接元素": [],
          "子分类": [
            {
              "分类名称": "选取",
              "分类说明": "从前序步骤产生的多个候选对象中挑选一个或若干个进入下一步。涵盖：从模型出的多张候选图里挑、从生成的多个 prompt 候选里选、从多个分镜方案里取一个、从批量生成结果里筛优。判别口诀：必有'多候选 → 挑选'的过程，候选来自同一工序内的前序步骤；如果只是无差别地引用前序唯一输出（无挑选），不归选取。与'调取'的边界：选取的对象来源是工序内自产的候选池（DAG 内），调取的对象来源是工序外的私有库。与'上传'的边界：选取从工序内候选池里挑，上传从工序外（设备本地 / 剪贴板）拿既有素材。同义动作（写 actions[] 时统一规范为「选取」）：挑选 / 筛选 / 评选 / 优选 / 圈选（多候选场景）。",
              "直接元素": [],
              "子分类": [],
              "分类性质": "内容"
            }
          ],
          "分类性质": "内容"
        }
      ],
      "分类性质": "内容"
    },
    {
      "分类名称": "提取",
      "分类说明": "从一个已有对象中抽出局部内容、属性、特征或派生信息——动作的输入是完整对象，输出是这个对象的'派生物'（描述、标签、文字、结构化数据、局部区域、轮廓、关键帧等）。典型：反推 / 识别 / OCR / 提取 / 抽取 / 分割 / 解析。判别口诀：输出在'形态'或'粒度'上不等同于输入——例如从图反推出文本 prompt（形态变了）、从图中识别物体名称（粒度变了）、从画面切出主体蒙版（粒度变了）。与'获取'的边界：获取得到的是整体本身，提取得到的是整体的派生物。与'修改'的边界：提取的输出与输入不是'同类对象的改前/改后'，而是'整体与它的派生物'。\n\n【本质】提取是'信息由多到少'的压缩动作——从一个完整对象里减信息、得到一个更小的派生产物。这种压缩有两条不同的实现路径，对应 L2 切分。\n\n【L2 切分维度】按'输出与原对象的关系'切分——实体片段（输出是原对象的实体一片，能在原对象里指出来）/ 派生信息（输出是关于原对象的派生信息，原对象里指不出来）。一个提取动作的输出只可能位于这 2 类之一，MECE 完备。\n\n【L3 切分维度】每个 L2 内按'具体动作动词'切分。L3 节点直接作为 actions[] 字段的规范取值——本树即动作词典，不用'直接元素'承载同义词，所有近义动词在 L3 的分类说明中显式标注规范化目标。",
      "直接元素": [],
      "子分类": [
        {
          "分类名称": "物理提取",
          "分类说明": "输出是原对象的实体片段——能在原对象里直接指出'就是这一块'，输出与输入同质且是其物理子集。判别口诀：能不能在原对象里圈出输出对应的那部分（地理 / 时间 / 结构上的子区域）？能 = 实体片段。与'派生信息'的边界：实体片段的输出是原对象的'一片'（同质、可指认），派生信息的输出是关于原对象的'描述 / 特征 / 分析'（异质、原对象里指不出来）。",
          "直接元素": [],
          "子分类": [
            {
              "分类名称": "裁切",
              "分类说明": "按几何区域、时间区间或位置索引等明确规则把原对象的某一块切出来——切的边界由规则定义，不依赖语义判断。涵盖：矩形 / 自由形状裁剪、按时间轴截取视频 / 音频片段、按段落 / 句子位置取文本片段。与'抠取'的边界：裁切的边界是规则定义的几何区域（不需要理解内容），抠取的边界是语义边界（需要识别对象轮廓）。与'抽帧'（时序场景）的边界：裁切按规则切'连续段'，抽帧按重要性抽'离散关键点'。同义动作（写 actions[] 时统一规范为「裁切」）：裁剪 / 截取片段 / 切片 / 取段。",
              "直接元素": [],
              "子分类": [],
              "分类性质": "内容"
            },
            {
              "分类名称": "抠取",
              "分类说明": "按语义边界把特定对象 / 组件从原对象中切出——切的边界由对象本身的形状 / 层次 / 结构决定，需要识别后再切。涵盖：抠图主体（按对象轮廓切）、人物 / 物体分割、拆 PSD 图层（按图层结构切）、demux 音视频轨道（按轨道结构切）。与'裁切'的边界：抠取按对象语义切，裁切按几何规则切。同义动作（写 actions[] 时统一规范为「抠取」）：分割 / 抠图 / 拆图层 / 拆轨道。",
              "直接元素": [],
              "子分类": [],
              "分类性质": "内容"
            },
            {
              "分类名称": "抽帧",
              "分类说明": "从时序媒体（视频 / 音频 / 动画）中抽出离散的关键时刻或代表性片段——抽出来的每一帧 / 段都是原时序的一个截面。涵盖：视频关键帧、代表性时刻、典型片段、采样帧。与'裁切'（时间区间切）的边界：裁切是按规则切'连续段'，抽帧是按重要性抽'离散关键点'。同义动作（写 actions[] 时统一规范为「抽帧」）：取关键帧 / 采样 / 取代表帧。",
              "直接元素": [],
              "子分类": [],
              "分类性质": "内容"
            }
          ],
          "分类性质": "内容"
        },
        {
          "分类名称": "化学提取",
          "分类说明": "输出是关于原对象的派生信息——原对象里直接指不出来，是从原对象推算 / 解读 / 提炼出来的派生产物。判别口诀：能不能在原对象里圈出输出对应的那部分？不能 = 派生信息。涵盖：表层显式信息的读取（识别）、深层隐含信息的推理（反推：风格 / 情感 / 意图 / 深度 / 姿态等）、内部组成方式的结构化拆解（解构：章节 / 框架 / 要点 / 摘要）。与'实体片段'的边界：派生信息的输出与输入异质（图 → 文 / 数 / 标签 / 表征图），不是原对象的物理子集。",
          "直接元素": [],
          "子分类": [
            {
              "分类名称": "识别",
              "分类说明": "读取原对象表层显式存在、可直接观察到的信息——把眼睛能看到、耳朵能听到的东西转成可处理的标签 / 文字 / 数据。涵盖：OCR 文字识别、物体识别（detection + classification）、人脸识别、场景识别、语音转文字、命名实体识别（NER）。与'反推'的边界：识别处理的是表层显式信息（信息就在眼前，只是换种形态），反推处理的是深层隐含信息（需要推理才能得到）。同义动作（写 actions[] 时统一规范为「识别」）：检测 / OCR / 转录 / 标注。",
              "直接元素": [],
              "子分类": [],
              "分类性质": "内容"
            },
            {
              "分类名称": "反推",
              "分类说明": "推理出原对象深层隐含、不可直接观察的信息——需要'从结果推回原因 / 构成'的推理过程。涵盖两大类：（1）语义反推：反推 prompt、风格分析、情感分析、意图推断、创作手法推断；（2）结构表征反推：depth map / canny 边缘 / normal map / pose 骨架 / segmentation mask 等 ControlNet 类预处理（这些 map 都不在原图直接可见，是从 RGB 推算出来的隐含结构）。与'识别'的边界：识别读表层显式（图里的字、物体），反推推深层隐含（图的风格、深度、生成原因）。与'解构'的边界：反推推理'隐含的属性 / 原因 / 表征'（风格 / 情感 / depth 结构），解构分析'显式的内部组成方式'（层级 / 框架）。同义动作（写 actions[] 时统一规范为「反推」）：推断 / 分析 / 预处理（ControlNet 类）/ 估计（深度 / 姿态）/ 风格分析 / 情感分析。",
              "直接元素": [],
              "子分类": [],
              "分类性质": "内容"
            },
            {
              "分类名称": "解构",
              "分类说明": "系统性地把原对象拆解成结构化的层级分析——输出是关于原对象内部组成方式的'结构描述'，而不是原对象本身的物理碎片。涵盖：拆剧情结构（场景 / 冲突 / 转折）、拆构图层级（前景 / 中景 / 背景，三分法 / 对称）、拆文章章节框架（引言 / 论点 / 论据 / 结论）、拆角色构成（服饰 / 发型 / 姿态 / 表情）、内容浓缩与提炼（摘要 / 要点提炼 / 核心信息抽取）。与'抠取'的边界：抠取是物理拆分（输出是原对象的实体片段），解构是分析拆分（输出是关于原对象组成的描述）。与'反推'的边界：反推推理'隐含的属性 / 原因 / 表征'（风格 / 情感 / depth 结构），解构分析'显式的内部组成方式'（章节 / 层次 / 框架 / 要点）。同义动作（写 actions[] 时统一规范为「解构」）：拆解（结构）/ 结构分析 / 框架分析 / 层级分析 / 摘要 / 要点提炼。",
              "直接元素": [],
              "子分类": [],
              "分类性质": "内容"
            }
          ],
          "分类性质": "内容"
        }
      ],
      "分类性质": "内容"
    },
    {
      "分类名称": "生成",
      "分类说明": "从无到有产出新的对象——动作本身不依赖某个被改造的'前身'对象，仅依靠引导信息（如 prompt、参考、规则、知识）创造出之前不存在的产物。典型：生成 / 文生图 / 文生视频 / 合成 / 补全 / 生成草图 / 起草。判别口诀：输出是一个新对象（图、文本、视频、音频），其'实体'在输入中并不存在；输入即使含参考素材，参考也只是引导而非'被改造的本体'。与'修改'的边界：生成的输出没有可对应的'同一个对象的前一版本'，修改的输出能与输入对应到'同一个对象的不同形态'。与'获取'的边界：生成的对象是当前动作产出的全新产物，获取的对象是预先就存在的。\n\n【本质】生成是'产生信息增量'的动作——给出一个之前不存在的新信息片段。\n\n【L2 切分维度】按'增量结果的形态'切分——元素生成（结果是一个自成一体的独立单元）/ 关系生成（结果是多项之间的明确关系结构）。两类 MECE 完备：要么是单件独立单元，要么是多项 + 关系。L2'元素生成'本身即叶子节点，不再向下切分；L2'关系生成'下再按关系几何形态切分 L3。\n\n【L3 切分维度】关系生成下按'关系的几何形态'切分——数组生成（一维线性顺序）/ 结构生成（非线性结构 / 共时并置）。两类 MECE 完备：要么是先后排列，要么是同时并置。\n\n【actions[] 规范取值】叶子节点（元素生成 / 数组生成 / 结构生成）直接作为 actions[] 字段的规范取值。本树即动作词典，所有近义动词在叶子分类说明中显式标注规范化目标。",
      "直接元素": [],
      "子分类": [
        {
          "分类名称": "元素生成",
          "分类说明": "生成结果是一个自成一体的单个对象——对外是一个独立单元，不论内部是简单还是复合。涵盖：文生图（一张图）/ 图生图（产出新的一张图）/ 文生视频片段（一段独立短片）/ 起草文案（一段独立文本）/ 起草脚本（一份独立脚本）/ 生成单个角色 / 生成 BGM / 生成单个模板 / 生成单条 prompt。判别口诀：结果能否被指称为'一个 X'（一张图 / 一段视频 / 一份文案 / 一条 prompt）？能即归此。与'数组生成 / 结构生成'的边界：元素生成的产物对外呈一个独立单元（即使内部含多部件也对外呈一个），关系生成的产物本质是'多项 + 关系结构'。同义动作（写 actions[] 时统一规范为「元素生成」）：起草 / 写稿 / 文生图 / 文生视频（单段）/ 图生图（单张产出）/ 草图生成 / 单件生成 / 撰写。",
          "直接元素": [],
          "子分类": [],
          "分类性质": "内容"
        },
        {
          "分类名称": "关系生成",
          "分类说明": "生成结果是多项之间的明确关系结构——多个东西按某种顺序 / 结构关联在一起。判别口诀：结果是否本质上是'多项 + 关系'（一组镜头序列、一套配色方案、一幅多元素布置）？是 = 关系。与'原子'的边界：原子结果对外是一个独立单元，关系结果是多项的关联结构。",
          "直接元素": [],
          "子分类": [
            {
              "分类名称": "数组生成",
              "分类说明": "生成结果是多项的线性顺序——给一组项确定它们的先后排列。涵盖：剧本时序、镜头序列、步骤清单、台本顺序、视频片段时间线、分镜先后、大纲排序、章节排序、教程步骤排布。判别口诀：产物的核心信息是'若干项 + 一条单向时间 / 顺序轴'，调换顺序会破坏产物意义。与'元素生成'的边界：数组生成必含多项 + 先后约束（关系是核心信息），元素生成只是单个对象（无内部先后关系）。与'结构生成'的边界：数组是一维顺序（先后排列），结构是非线性 / 共时并置。同义动作（写 actions[] 时统一规范为「数组生成」）：编排 / 串联 / 排序 / 时序排布 / 序列生成 / 时间轴编排 / 章节排序 / 剧本编排。",
              "直接元素": [],
              "子分类": [],
              "分类性质": "内容"
            },
            {
              "分类名称": "结构生成",
              "分类说明": "生成结果是多项的非线性结构——多个项以某种结构关系（融合 / 配合 / 空间布置 / 层级叠加）组合在一起。涵盖：场景画面合成、配色方案、UI 布局、多元素拼贴、风格 + 内容搭配、图层组合、版式构图、信息图组装、多视图布置。判别口诀：产物的核心信息是'多项 + 共时并置 / 空间层级关系'，去掉任一元素或挪位置会破坏整体。与'数组生成'的边界：结构是非线性 / 共时并置（同时呈现），数组是一维线性顺序（先后排列）。与'元素生成'的边界：结构生成必含'多项 + 组合关系'，元素生成是单件独立单元。同义动作（写 actions[] 时统一规范为「结构生成」）：合成 / 搭配 / 布置 / 组合 / 拼贴 / 布局生成 / 配色生成 / 图层组合生成 / 版式生成。",
              "直接元素": [],
              "子分类": [],
              "分类性质": "内容"
            }
          ],
          "分类性质": "内容"
        }
      ],
      "分类性质": "内容"
    },
    {
      "分类名称": "修改",
      "分类说明": "在已有对象的基础上做改动——输入是一个待改造的本体对象，输出是它被改动后的版本，对象的身份保留但形态 / 属性 / 局部已发生变化。典型：编辑 / 局部重绘 / 上色 / 重打光 / 去背景 / 换脸 / 换装 / 修饰 / 增强 / 改写 / 翻译 / 风格化 / 转换 / 超分。判别口诀：能在输入与输出之间指认出'同一个对象'的'改前 / 改后'对应关系——超分前后是同一张图，改写前后是同一段文本。与'生成'的边界：修改有明确的'被改造本体'，生成没有；若产物的主体来自输入对象的延续 → 修改，若产物的主体由动作新造 → 生成。与'提取'的边界：修改的输出仍是同类完整对象，提取的输出是输入的派生物（不同粒度或不同形态）。\n\n【L2 切分维度】按'改动性质'分 3 类——增（添加新的信息片段）/ 删（去除已有的信息片段）/ 变（改变已有部分：原位置上的替换 / 重述 / 风格化 / 格式转换 / 渐变调整 / 自动增强）。三类 MECE 完备：要么加新（信息总量增加）、要么去旧（信息总量减少）、要么原位置改变（信息总量基本不变，只是某部分变成不一样的）。\n\n【L3 切分维度】每个 L2 内按'具体动作动词'切分。L3 节点直接作为 actions[] 字段的规范取值——本树即动作词典，不用'直接元素'承载同义词，所有近义动词在 L3 的分类说明中显式标注规范化目标。",
      "直接元素": [],
      "子分类": [
        {
          "分类名称": "增",
          "分类说明": "添加新的信息片段到原对象上——原对象的现有部分保留，新内容 / 形态 / 装饰被叠加 / 嵌入进去。判别口诀：动作前后比较，原对象多了一些之前没有的信息。与'删'的边界：增是加新的（信息总量增加），删是去已有的（信息总量减少），方向相反。与'变'的边界：增是单纯加新（原位置不变，多出一份），变是在原位置上把已有部分改成不一样的（替换 / 渐变，无新增独立单元）。\n\n【L3 切分维度】按增加对象的层级切分——添加（substantive 内容元素的增）/ 叠加（form 形态层 / 装饰层的增）。",
          "直接元素": [],
          "子分类": [
            {
              "分类名称": "添加",
              "分类说明": "在原对象上增加新的语义内容元素——给画面新增一个主体 / 物体 / 角色，给文案新增一段内容，给视频新增一段片段，给脚本新增一段动作。判别口诀：动作前后比较，原对象多出了一个独立的语义内容元素，这个元素本身就是'被增加的内容'（有独立语义身份：人 / 物 / 段 / 镜）。与'叠加'的边界：添加加的是内容层（substantive，多出一个独立语义元素），叠加加的是形态层（form，多出一层装饰性 / 标识性 / 修饰性形态）。与'替换'的边界：添加只加不去（原对象不变，多出一份），替换是去旧 + 换新（一删一加）。与'增强'的边界：添加是主动放入新元素（创作者指定内容），增强是自动质量提升（无新增内容）。同义动作（写 actions[] 时统一规范为「添加」）：新增 / 添入 / 加入 / 加段 / 加镜 / 加角色 / 加物体 / 补段 / 补镜。",
              "直接元素": [],
              "子分类": [],
              "分类性质": "内容"
            },
            {
              "分类名称": "叠加",
              "分类说明": "在原对象上叠加新的形态层 / 装饰层——给画面叠加水印 / logo / 装饰图层 / 边框、给视频叠加字幕轨 / 弹幕、给文档叠加页眉页脚、给图叠加蒙层 / 滤色层。判别口诀：动作前后比较，原对象多出了一层不属于'语义内容主体'的装饰性 / 标识性 / 修饰性形态。与'添加'的边界：叠加加的是形态层（装饰 / 标识 / 修饰，不构成独立语义内容），添加加的是内容层（独立语义元素：人 / 物 / 段 / 镜）。与'风格化'（变）的边界：叠加是在原对象上多出一层独立可见的形态元素（水印 / logo 是可指认的一层），风格化是对原对象整体外观做转换（无独立可指认的新层）。同义动作（写 actions[] 时统一规范为「叠加」）：加水印 / 加 logo / 加图层 / 加装饰 / 加边框 / 加蒙层 / 加字幕轨 / overlay / 嵌入标识。",
              "直接元素": [],
              "子分类": [],
              "分类性质": "内容"
            }
          ],
          "分类性质": "内容"
        },
        {
          "分类名称": "删",
          "分类说明": "去除原对象的某部分信息——原对象的其余部分保留，被去除的部分从对象中消失。判别口诀：动作前后比较，原对象少了一些之前有的信息（信息总量减少）。与'增'的边界：删是去已有的（少一份），增是加新的（多一份），方向相反。与'变'下'替换'的边界：删只去不补（原位置变空），替换是去掉再补上不同的（原位置仍有内容，只是换成了别的）。\n\n【L3 切分维度】按被删除信息的空间 / 时间维度切分——抹除（空间维度内的内容删除）/ 剪除（时间维度上的片段删除）。",
          "直接元素": [],
          "子分类": [
            {
              "分类名称": "抹除",
              "分类说明": "去除空间内的内容元素——把对象空间维度上的某部分内容擦掉 / 去掉。涵盖：去背景、去水印、去画面里的某个角色 / 物体、抹除画面瑕疵。与'剪除'的边界：抹除针对'空间内'的内容（同一画面 / 同一帧里的某部分），剪除针对'时间维度'的片段（视频 / 序列里的某段时间）。同义动作（写 actions[] 时统一规范为「抹除」）：擦除 / 移除 / 抠除 / erase。",
              "直接元素": [],
              "子分类": [],
              "分类性质": "内容"
            },
            {
              "分类名称": "剪除",
              "分类说明": "剪掉时间维度的片段——把对象时间序列上的某段去掉。涵盖：剪掉视频中的一段、删除文章中的一节、截短音频、去掉序列中的某项。与'抹除'的边界：剪除针对'时间维度'的片段，抹除针对'空间内'的内容。同义动作（写 actions[] 时统一规范为「剪除」）：剪 / 截短 / 删段 / cut。",
              "直接元素": [],
              "子分类": [],
              "分类性质": "内容"
            }
          ],
          "分类性质": "内容"
        },
        {
          "分类名称": "变",
          "分类说明": "改变已有部分——原对象的内容 / 形态 / 属性 在原位置发生变化，无论是离散切换（替换：A → B）还是连续渐变（重述 / 风格化 / 转换 / 调整 / 增强）。判别口诀：动作前后比较，原对象的某部分'变成不一样的'（不是新增、不是删除，而是原位置改变）；信息总量基本不变。与'增 / 删'的边界：变不改变信息总量（原位置改），增加新信息（多一份），删去除信息（少一份）。\n\n【L3 切分维度】按改变方式切分——替换（categorical 离散切换：A → B 实体不同）/ 重述（保原意改表达）/ 风格化（换审美 / 视觉风格）/ 转换（换技术形式 / 媒介 / 格式）/ 调整（continuous 手动微调属性）/ 增强（自动质量提升）。",
          "直接元素": [],
          "子分类": [
            {
              "分类名称": "重述",
              "分类说明": "实质改述——保留原意，改造表达 / 表述方式。涵盖：改写文段、翻译（中 → 英 / 英 → 中）、重构表述结构、转写口吻（书面 → 口语 / 正式 → 随意）、改述要点 / 段落润色。与'替换'的边界：重述保原意改表达（同一段意思的不同说法），替换是把整段内容主体换成不同的另一段（意思可不同）。与'风格化'的边界：重述改文字的'表达方式'（语种 / 用词 / 结构），风格化改文字 / 画面的'审美调性'（如转某文风、转某腔调、转视觉风格）。与'转换'的边界：重述走表达层（同语种内换说法 / 改写），转换走形式承载层（语种 / 格式 / 媒介整体切换）。同义动作（写 actions[] 时统一规范为「重述」）：改写 / 翻译 / 重写 / 重构 / 改述 / 润色 / paraphrase / 转写口吻。",
              "直接元素": [],
              "子分类": [],
              "分类性质": "内容"
            },
            {
              "分类名称": "风格化",
              "分类说明": "换审美 / 视觉风格——同一对象在视觉风格上的转换，本体内容大致保留。涵盖：卡通化 / 油画化 / 写实化 / 水彩化、转赛博朋克风、转日漫风、文字转某文风。与'转换'的边界：风格化是'审美层面'的风格转换（卡通 / 油画 / 水彩等审美调性），转换是'技术形式'的格式 / 媒介 / 语种切换。同义动作（写 actions[] 时统一规范为「风格化」）：风格转换 / 风格迁移 / stylize / style transfer。",
              "直接元素": [],
              "子分类": [],
              "分类性质": "内容"
            },
            {
              "分类名称": "转换",
              "分类说明": "换技术形式 / 媒介 / 格式 / 语种——同一对象在技术承载形式上的转换。涵盖：jpg → png（格式）、mp4 → gif（媒介格式）、横屏 → 竖屏（画幅形式）、PDF → Word（文档格式）、中 → 英（语种形式，作为形式转换而非内容改述时）、文 → 音（TTS 形式承载）。与'风格化'的边界：转换是'技术形式 / 格式'变化（容器变，呈现方式可能变），风格化是'审美 / 视觉风格'变化（容器不变，审美调性变）。与'重述'的边界：转换走形式承载层（语种 / 格式 / 媒介整体切换），重述走表达层（同语种内换说法）。与'调整'的边界：转换是 categorical 形式切换（jpg → png），调整是 continuous 属性微调（在原值附近滑动）。同义动作（写 actions[] 时统一规范为「转换」）：转格式 / 转媒介 / 改格式 / convert / 转语种 / 转分辨率（格式语境）/ 转编码。",
              "直接元素": [],
              "子分类": [],
              "分类性质": "内容"
            },
            {
              "分类名称": "替换",
              "分类说明": "用不同的对象 / 元素 / 内容把原位置上的整个对应部分换掉——离散切换（categorical），新旧之间是不同的实体，不是渐变。涵盖：换脸 / 换装 / 换背景 / 换发型 / 换角色 / 换台词段 / 整段文案替换 / 整段镜头替换 / 换字体 / 换配色（指定枚举值）。判别口诀：动作前后比较，原位置上'这个东西'被换成'另一个东西'（A → B 的离散切换），不是 A 自身的渐变改造。与'重述'的边界：替换换内容主体（A 段换成 B 段，意思可不同），重述保原意改表达（同一段意思的不同说法）。与'调整'的边界：替换是 categorical 离散切换（A → B 实体不同），调整是 continuous 渐变（在原值附近滑动）。与'添加'的边界：替换是去旧 + 换新一并发生（原位置仍有内容，只是变了），添加是单纯加新不动旧。与'风格化'的边界：替换是某个具体元素被换成另一个具体元素（局部对象层），风格化是整体审美调性的切换（整图 / 整段层）。同义动作（写 actions[] 时统一规范为「替换」）：换 / 替 / 换脸 / 换装 / 换背景 / 换角色 / replace / swap / 替代。",
              "直接元素": [],
              "子分类": [],
              "分类性质": "内容"
            },
            {
              "分类名称": "调整",
              "分类说明": "渐变属性值（手动微调）——属性值在原位置附近做连续 / 渐变性的微调。涵盖：调色 / 调亮 / 调对比 / 调饱和、调音量 / 调音色、调速度 / 调节奏、调透明度、调位置（局部微调）/ 调大小（局部微调）。与'替换'的边界：调整是 continuous 微调（在原值附近滑动），替换是 categorical 切换（A → B 离散值）。与'增强'的边界：调整是'手动渐变'（创作者主动指定方向 / 幅度），增强是'自动质量提升'（系统智能修复 / 提升，无创作者主观方向）。与'风格化'的边界：调整改的是低层属性数值（亮度 / 对比 / 速度），风格化改的是高层审美调性（卡通化 / 油画化）。同义动作（写 actions[] 时统一规范为「调整」）：调 / 校 / 微调 / fine-tune / adjust / 校色 / 调音。",
              "直接元素": [],
              "子分类": [],
              "分类性质": "内容"
            },
            {
              "分类名称": "增强",
              "分类说明": "自动质量提升——系统智能算法对对象做自动质量改善，无需创作者指定具体方向 / 数值。涵盖：超分（提分辨率）、降噪、锐化、补帧、修复瑕疵 / 自动修图、画质增强、音频降噪 / 增强、人像自动美化、自动去模糊。判别口诀：算法自己决定怎么改、改多少（创作者只决定'要不要做'），且不增减语义内容（不改变'画面里有什么'）。与'调整'的边界：增强是'自动算法'提升质量（创作者只按按钮），调整是'手动渐变'微调属性（创作者指定方向 / 幅度）。与'添加'的边界：增强是属性维度的整体质量提升（不增减语义内容），添加是新增独立语义元素（多出一个新对象）。与'替换'的边界：增强不改变对象身份（只是更清晰 / 更干净），替换是把对象换成不同的另一个。同义动作（写 actions[] 时统一规范为「增强」）：超分 / 降噪 / 锐化 / 补帧 / 修复 / 画质提升 / enhance / 自动修图 / 一键美化。",
              "直接元素": [],
              "子分类": [],
              "分类性质": "内容"
            }
          ],
          "分类性质": "内容"
        }
      ],
      "分类性质": "内容"
    },
    {
      "分类名称": "存储",
      "分类说明": "把当前持有的对象保存到某个存储位格，使其在未来可被再次取用——动作本身不创造、不改变对象，只是把对象的拷贝放到指定的存储位格。典型：保存 / 暂存 / 入库 / 沉淀 / 归档 / 留底。判别口诀：输入是工序内已有的对象，输出是'同一对象被放到了某个存储位格里'（对象本身不变，只是落地位置发生变化）。与'获取'的边界：存储是把工序内的对象往外送到存储位格（工序内 → 存储位格，写入侧），获取是从存储位格取回到工序内（存储位格 → 工序内，读取侧），二者方向相反。与'生成'的边界：存储不产生新对象（只是搬运现有对象的拷贝），生成产出之前不存在的新产物。与作用树'交付'的边界：交付是把产物推向终态对外（功能性归宿，发布意义），存储侧重把产物保留到可被未来调用的位置（持久化意义，可不对外）。\n\n【L2 切分维度】按'存储位格的位置 / 时效'切分——暂存（工序内·临时缓存，per-batch 用完即释）/ 沉淀（工序外·私有·长效，跨工序反复调用）/ 归档（工序外·长期封存，被动留底）。三种位格 MECE 完备，且与'获取'L2 形成对称关系（沉淀对应查询、暂存对应引用）。\n\n【L3 切分维度】每个 L2 内按'具体动作动词'切分。L3 节点直接作为 actions[] 字段的规范取值——本树即动作词典，不用'直接元素'承载同义词，所有近义动词在 L3 的分类说明中显式标注规范化目标。",
      "直接元素": [],
      "子分类": [
        {
          "分类名称": "暂存",
          "分类说明": "对象被存放在本次工序内 / 当前会话内的临时缓存——只在本次工序内可被再次引用，工序结束后不保证存活。判别：存放位置是工序自身的中间缓存，不是跨工序的持久化位格。与'沉淀'的边界：暂存是 per-batch / 本次工序内的临时态（用完即释），沉淀是跨工序的长效私库（可被未来工序反复调取）。与获取树'引用'的边界：暂存是'把对象放到工序内缓存里'（写入侧），引用是'从工序内缓存取出来用'（读取侧），二者配对完成 DAG 内自循环。",
          "直接元素": [],
          "子分类": [
            {
              "分类名称": "缓存",
              "分类说明": "把对象放到工序内 / 会话内的临时缓存里，供本次工序后续步骤复用。涵盖：节点输出缓存 / 中间产物保留 / 临时变量存放 / session 级 cache / 草稿暂存。判别：存放期限仅限本次工序 / 当前会话，工序结束后通常被释放。同义动作（写 actions[] 时统一规范为「缓存」）：暂存 / 临时保存 / 草稿存 / cache / hold / 中间产物保存。",
              "直接元素": [],
              "子分类": [],
              "分类性质": "内容"
            }
          ],
          "分类性质": "内容"
        },
        {
          "分类名称": "沉淀",
          "分类说明": "对象被存进创作者 / 团队的私有积累库，作为未来跨工序复用的资产。判别：存放位置是跨工序的长效私库（个人库 / 团队库 / 模板库），未来可被反复'查询.调取'取出。与'暂存'的边界：沉淀是跨工序长效（可被未来反复调用），暂存是本工序临时（用完即释）。与'归档'的边界：沉淀的目的是'供未来反复调用'（活跃资产 / 高频复用），归档的目的是'长期封存留底'（被动留底 / 低频访问）。与获取树'查询'的边界：沉淀是'把对象放进私库里'（写入侧），查询.调取是'从私库里取出来用'（读取侧），二者配对完成私库读写循环。",
          "直接元素": [],
          "子分类": [
            {
              "分类名称": "入库",
              "分类说明": "把对象作为私有零件级资产存进库里，供未来反复调用。涵盖：提示词入库 / 素材入库 / 模板入库 / 风格预设入库 / 参考图收藏入库 / 文案模板入库 / 镜头库入库 / LoRA 与 Embedding 等权重文件入库。判别：被存入的对象以'可被反复调取的单件形态'存在，目的是为下一次生产复用。与'存档'的边界：入库的对象是为'活跃复用'而存（高频调取），存档的对象是为'长期留底'而存（低频回溯）。同义动作（写 actions[] 时统一规范为「入库」）：存入私库 / 收藏 / 加入收藏 / 模板沉淀 / 提示词沉淀 / 素材沉淀 / 加入素材库 / 权重入库。",
              "直接元素": [],
              "子分类": [],
              "分类性质": "内容"
            }
          ],
          "分类性质": "内容"
        },
        {
          "分类名称": "归档",
          "分类说明": "对象被长期封存留底——目的不是供未来反复调用，而是保留历史记录 / 留底备查 / 合规存档 / 法定保留期。判别：存放位置是冷存储 / 历史归档，调用频率极低（被动访问 / 偶发回溯）。与'沉淀'的边界：归档强调'长期封存留底'（被动留底，访问稀少），沉淀强调'供未来反复调用'（活跃资产，频繁取用）。与作用树'交付'的边界：交付是把产物推到对外终态（功能完成意义），归档是把产物（无论是否已交付）存进历史档案（留底意义，可发生在已交付之后）。",
          "直接元素": [],
          "子分类": [
            {
              "分类名称": "存档",
              "分类说明": "把对象（含成片、底稿、流程配置、版本快照）存进长期档案中，留底备查。涵盖：项目归档 / 版本快照存档 / 成片冷存档 / 流程配置存档 / 历史版本封存 / 工程文件归档 / 工作流配置存档。判别：存储动作的目的是'留底'而非'复用'。同义动作（写 actions[] 时统一规范为「存档」）：归档 / 封存 / 冷存 / 留底 / archive / 版本快照 / 工程归档。",
              "直接元素": [],
              "子分类": [],
              "分类性质": "内容"
            }
          ],
          "分类性质": "内容"
        }
      ],
      "分类性质": "内容"
    }
  ],
  "$leaves": [
    "检索",
    "下载",
    "调取",
    "上传",
    "拍摄",
    "录音",
    "键入",
    "选取",
    "裁切",
    "抠取",
    "抽帧",
    "识别",
    "反推",
    "解构",
    "元素生成",
    "数组生成",
    "结构生成",
    "添加",
    "叠加",
    "抹除",
    "剪除",
    "重述",
    "风格化",
    "转换",
    "替换",
    "调整",
    "增强",
    "缓存",
    "入库",
    "存档"
  ]
}