# 能力 / 工序 提炼 Prompt(首次入库) 提供两个版本: 1. **单帖版**(Prompt 1)— 从一篇原帖产出 1 个 strategy + N 个 capabilities 2. **批次版**(Prompt 2)— 从一批相关原帖产出多个 strategy + 跨帖合并的 capabilities 何时用哪个见文末"使用建议"。 --- ## 字段范围 ### 首次提炼覆盖(核心字段) | 实体 | 必填字段 | 可空字段 | |---|---|---| | capability | name, method, effects, body, inputs, outputs | criterion | | strategy | name, method, effects, steps(每步含 order/summary/body), inputs, outputs | criterion | ### 留二轮补 - `description`:基于 effects + method/body 自动合成 - `steps[].ref_id`:对齐到正式 capability 库后绑定 - `category`:跨 case 视角下分类 - capability:`failure_modes`、`preconditions` - strategy:顶层 `body`(全局叙述/原则/坑)、`preconditions`、`expected_cost`、`coverage_estimate` 入库时系统填:`id`、`version`、`created_at`、`updated_at`、`embedding`、`maturity`(默认 `experimental`)、`validation_count`(默认 1,批次版按合并的来源帖数)。 每个 prompt 块都自包含、可直接复制使用。占位符由调用方填充:单帖版用 `{post_content}`,批次版用 `{posts_block}`(每篇原帖以 `[POST id=p?]\n{content}\n\n` 起头)。 --- ## Prompt 1:单帖版 ``` 你是 AI 内容制作能力沉淀助手。从下方一篇原帖中,提炼能入库的"能力(capability)"和"工序(strategy)",输出严格 JSON,无任何额外文字。 # 概念 **capability(能力)**:能独立交付产出 + 能在多个工序中复用的最小动作单元。 - ✅ 例:人像角色一致性生成、三段式排版、图像超分 - ❌ 单一 prompt 词(太细)/ "做一篇穿搭分享"(太粗)/ "发到小红书"(是 tool action) **strategy(工序)**:端到端制作流程,由能力组合而成。 - ✅ 例:小红书穿搭分享首图制作流程 判定:能在另一个工序里复用 → 能力;只能整体用 → 工序内部步骤。 # 字段要点 1. **method 严格去参数化**:写做法机理("用 LoRA + IP-Adapter 维持一致性"),不写具体参数(rank/alpha/weight)。具体参数留 body 2. **body** 写具体做法:关键 prompt 文本、关键参数值、关键调用顺序 3. **effects** 是需求/效果描述,每条形如"实现 XX 效果",不写工具名也不写做法 4. **strategy.steps** 每步含 {order, summary, body}:summary 一句话骨架,body 该步具体做法 5. **inputs / outputs** 用自然语言简述 6. **criterion** 原帖有质量描述就填,没就 null 7. **strategy 可为 null**:原帖只是单一技法分享、没有端到端流程时 8. capability 数量参考 2-6 个,>8 可能粒度过细 # 输入 原帖如下: --- {post_content} --- # 输出(严格 JSON) {{ "skip": false, "skip_reason": "", "strategy": null, "capabilities": [] }} 非跳过时,strategy 与 capabilities 各项填充: strategy(如有端到端流程则填,否则 null): {{ "name": "工序名", "method": "工序整体方法论概述(去具体步骤序列),保留核心技术路线", "effects": ["实现 XX 效果", "..."], "steps": [ {{"order": 1, "summary": "骨架一句话", "body": "该步具体做法(prompt/参数/tip)"}} ], "inputs": "整体输入需要什么(自然语言)", "outputs": "最终产出形态(自然语言)", "criterion": null }} capabilities(数组,每项一个能力): {{ "name": "能力名", "method": "去参数化做法概述", "effects": ["实现 XX 效果", "..."], "body": "具体做法(关键 prompt / 参数 / 步骤)", "inputs": "输入(自然语言)", "outputs": "产出(自然语言)", "criterion": null }} # 跳过条件(满足任一设 skip=true 并写 skip_reason) - 原帖纯营销,没有具体方法 / 步骤 / 参数 - 信息密度过低,连一个 capability 都凑不出 - 只是结果展示,没有任何"怎么做"的描述 ``` --- ## Prompt 2:批次版 ``` 你是 AI 内容制作能力沉淀助手。从下方一批相关原帖中,横向归纳出可入库的"能力(capability)"和"工序(strategy)",输出严格 JSON,无任何额外文字。 # 概念 **capability(能力)**:能独立交付产出 + 能在多个工序中复用的最小动作单元。 - ✅ 例:人像角色一致性生成、三段式排版、图像超分 - ❌ 单一 prompt 词(太细)/ "做一篇穿搭分享"(太粗)/ "发到小红书"(是 tool action) **strategy(工序)**:端到端制作流程,由能力组合而成。 - ✅ 例:小红书穿搭分享首图制作流程 判定:能在另一个工序里复用 → 能力;只能整体用 → 工序内部步骤。 # 批次提炼的核心要求 1. **跨帖合并 capability**:相同或相似的能力(叫法、参数可能不同)在多帖出现 → 合并为一条 - method 取多帖参数的共性,去参数化要更彻底 - effects 合并多帖视角,覆盖更全面 - body 选最完整的;如各帖在参数 / prompt 上有有意义的差异,把差异点合并写进 body(标注来源帖) 2. **strategy 通常按帖产**:每帖对应一个 strategy 草稿 - 例外:两帖步骤序列相似度 ≥ 70% 时合并为同一 strategy(多源) 3. **来源标注**:每条 capability / strategy 都标 `source_post_ids`,列出来自哪些帖子(用于追溯和置信度评估) # 字段要点 1. **method 严格去参数化**:批次场景下尤其重要——多帖参数不同,正好用来抽共性机理 2. **body** 写具体做法:合并时保留多帖优点,差异参数标注来源 3. **effects** 多帖视角合并,每条形如"实现 XX 效果" 4. **strategy.steps** 每步含 {order, summary, body} 5. **inputs / outputs** 自然语言简述 6. **criterion** 原帖有就填、没就 null # 提炼步骤建议(内部思考流程,不必输出) 1. 逐帖识别 strategy 草稿(端到端流程) 2. 横向扫描所有帖子,识别重复出现的 capability 候选 3. 合并候选 → 最终 capability:method 去参数化、effects 合并、body 选最完整 4. 跨帖 strategy 合并:步骤序列高度相似(≥70%)才合并,否则各自保留 5. 每条产出都填 source_post_ids # 输入 原帖列表(每篇带 id 标识): --- [POST id=p1] {post_1_content} [POST id=p2] {post_2_content} [POST id=p3] {post_3_content} (按需续) --- # 输出(严格 JSON) {{ "skipped_posts": [ {{"post_id": "p?", "reason": ""}} ], "strategies": [ {{ "name": "工序名", "source_post_ids": ["p1", "p2"], "method": "工序整体方法论概述", "effects": ["实现 XX 效果", "..."], "steps": [ {{"order": 1, "summary": "骨架一句话", "body": "该步具体做法"}} ], "inputs": "整体输入(自然语言)", "outputs": "最终产出形态", "criterion": null }} ], "capabilities": [ {{ "name": "能力名", "source_post_ids": ["p1", "p3", "p5"], "method": "去参数化做法概述(多帖共性)", "effects": ["实现 XX 效果", "..."], "body": "合并后的具体做法(差异参数可标注来源帖)", "inputs": "输入(自然语言)", "outputs": "产出(自然语言)", "criterion": null }} ] }} # 跳过条件(per post) 某帖满足任一时进 skipped_posts,不进入提炼: - 纯营销,无方法/步骤/参数 - 信息密度过低 - 只是结果展示 ``` --- **两步法默认建议**(适合大多数场景): 1. 用单帖版跑全量原帖 → capability 标 `maturity=experimental` 进 candidate 状态,strategy 直接入库为 `status=draft` 2. capability candidates 按 `method + effects` embedding 聚类后,再喂"合并 prompt"(独立 prompt,本文件不含)→ 簇内 ≥2 个独立 case 升级 `validated` **直接批次法**(仅当一批高度相似时):直接用批次版一次喂入相似帖子组,产出已经合并,跳过 candidate 阶段。但聚类质量决定结果,不是普适首选。 --- ## 二轮处理 TODO(本文件不含) - description 自动合成 prompt:基于 effects + method/body 生成一句话定位 - capability 合并 prompt:candidate 池聚类后,每簇喂入合并产稳定 capability - steps[].ref_id 对齐 prompt:把 strategy.steps 绑到正式 capability 库 - 边缘字段补全:category(跨 case)、failure_modes / preconditions(人工 review)