extract_capability_strategy_prompts.md 8.5 KB

能力 / 工序 提炼 Prompt(首次入库)

提供两个版本:

  1. 单帖版(Prompt 1)— 从一篇原帖产出 1 个 strategy + N 个 capabilities
  2. 批次版(Prompt 2)— 从一批相关原帖产出多个 strategy + 跨帖合并的 capabilities

何时用哪个见文末"使用建议"。


字段范围

首次提炼覆盖(核心字段)

实体 必填字段 可空字段
capability name, method, effects, body, inputs, outputs criterion
strategy name, method, effects, steps(每步含 order/summary/body), inputs, outputs criterion

留二轮补

  • description:基于 effects + method/body 自动合成
  • steps[].ref_id:对齐到正式 capability 库后绑定
  • category:跨 case 视角下分类
  • capability:failure_modespreconditions
  • strategy:顶层 body(全局叙述/原则/坑)、preconditionsexpected_costcoverage_estimate

入库时系统填:idversioncreated_atupdated_atembeddingmaturity(默认 experimental)、validation_count(默认 1,批次版按合并的来源帖数)。

每个 prompt 块都自包含、可直接复制使用。占位符由调用方填充:单帖版用 {post_content},批次版用 {posts_block}(每篇原帖以 [POST id=p?]\n{content}\n\n 起头)。


Prompt 1:单帖版

你是 AI 内容制作能力沉淀助手。从下方一篇原帖中,提炼能入库的"能力(capability)"和"工序(strategy)",输出严格 JSON,无任何额外文字。

# 概念

**capability(能力)**:能独立交付产出 + 能在多个工序中复用的最小动作单元。
- ✅ 例:人像角色一致性生成、三段式排版、图像超分
- ❌ 单一 prompt 词(太细)/ "做一篇穿搭分享"(太粗)/ "发到小红书"(是 tool action)

**strategy(工序)**:端到端制作流程,由能力组合而成。
- ✅ 例:小红书穿搭分享首图制作流程

判定:能在另一个工序里复用 → 能力;只能整体用 → 工序内部步骤。

# 字段要点

1. **method 严格去参数化**:写做法机理("用 LoRA + IP-Adapter 维持一致性"),不写具体参数(rank/alpha/weight)。具体参数留 body
2. **body** 写具体做法:关键 prompt 文本、关键参数值、关键调用顺序
3. **effects** 是需求/效果描述,每条形如"实现 XX 效果",不写工具名也不写做法
4. **strategy.steps** 每步含 {order, summary, body}:summary 一句话骨架,body 该步具体做法
5. **inputs / outputs** 用自然语言简述
6. **criterion** 原帖有质量描述就填,没就 null
7. **strategy 可为 null**:原帖只是单一技法分享、没有端到端流程时
8. capability 数量参考 2-6 个,>8 可能粒度过细

# 输入

原帖如下:
---
{post_content}
---

# 输出(严格 JSON)

{{
  "skip": false,
  "skip_reason": "",
  "strategy": null,
  "capabilities": []
}}

非跳过时,strategy 与 capabilities 各项填充:

strategy(如有端到端流程则填,否则 null):
{{
  "name": "工序名",
  "method": "工序整体方法论概述(去具体步骤序列),保留核心技术路线",
  "effects": ["实现 XX 效果", "..."],
  "steps": [
    {{"order": 1, "summary": "骨架一句话", "body": "该步具体做法(prompt/参数/tip)"}}
  ],
  "inputs": "整体输入需要什么(自然语言)",
  "outputs": "最终产出形态(自然语言)",
  "criterion": null
}}

capabilities(数组,每项一个能力):
{{
  "name": "能力名",
  "method": "去参数化做法概述",
  "effects": ["实现 XX 效果", "..."],
  "body": "具体做法(关键 prompt / 参数 / 步骤)",
  "inputs": "输入(自然语言)",
  "outputs": "产出(自然语言)",
  "criterion": null
}}

# 跳过条件(满足任一设 skip=true 并写 skip_reason)

- 原帖纯营销,没有具体方法 / 步骤 / 参数
- 信息密度过低,连一个 capability 都凑不出
- 只是结果展示,没有任何"怎么做"的描述

Prompt 2:批次版

你是 AI 内容制作能力沉淀助手。从下方一批相关原帖中,横向归纳出可入库的"能力(capability)"和"工序(strategy)",输出严格 JSON,无任何额外文字。

# 概念

**capability(能力)**:能独立交付产出 + 能在多个工序中复用的最小动作单元。
- ✅ 例:人像角色一致性生成、三段式排版、图像超分
- ❌ 单一 prompt 词(太细)/ "做一篇穿搭分享"(太粗)/ "发到小红书"(是 tool action)

**strategy(工序)**:端到端制作流程,由能力组合而成。
- ✅ 例:小红书穿搭分享首图制作流程

判定:能在另一个工序里复用 → 能力;只能整体用 → 工序内部步骤。

# 批次提炼的核心要求

1. **跨帖合并 capability**:相同或相似的能力(叫法、参数可能不同)在多帖出现 → 合并为一条
   - method 取多帖参数的共性,去参数化要更彻底
   - effects 合并多帖视角,覆盖更全面
   - body 选最完整的;如各帖在参数 / prompt 上有有意义的差异,把差异点合并写进 body(标注来源帖)
2. **strategy 通常按帖产**:每帖对应一个 strategy 草稿
   - 例外:两帖步骤序列相似度 ≥ 70% 时合并为同一 strategy(多源)
3. **来源标注**:每条 capability / strategy 都标 `source_post_ids`,列出来自哪些帖子(用于追溯和置信度评估)

# 字段要点

1. **method 严格去参数化**:批次场景下尤其重要——多帖参数不同,正好用来抽共性机理
2. **body** 写具体做法:合并时保留多帖优点,差异参数标注来源
3. **effects** 多帖视角合并,每条形如"实现 XX 效果"
4. **strategy.steps** 每步含 {order, summary, body}
5. **inputs / outputs** 自然语言简述
6. **criterion** 原帖有就填、没就 null

# 提炼步骤建议(内部思考流程,不必输出)

1. 逐帖识别 strategy 草稿(端到端流程)
2. 横向扫描所有帖子,识别重复出现的 capability 候选
3. 合并候选 → 最终 capability:method 去参数化、effects 合并、body 选最完整
4. 跨帖 strategy 合并:步骤序列高度相似(≥70%)才合并,否则各自保留
5. 每条产出都填 source_post_ids

# 输入

原帖列表(每篇带 id 标识):
---
[POST id=p1]
{post_1_content}

[POST id=p2]
{post_2_content}

[POST id=p3]
{post_3_content}
(按需续)
---

# 输出(严格 JSON)

{{
  "skipped_posts": [
    {{"post_id": "p?", "reason": ""}}
  ],
  "strategies": [
    {{
      "name": "工序名",
      "source_post_ids": ["p1", "p2"],
      "method": "工序整体方法论概述",
      "effects": ["实现 XX 效果", "..."],
      "steps": [
        {{"order": 1, "summary": "骨架一句话", "body": "该步具体做法"}}
      ],
      "inputs": "整体输入(自然语言)",
      "outputs": "最终产出形态",
      "criterion": null
    }}
  ],
  "capabilities": [
    {{
      "name": "能力名",
      "source_post_ids": ["p1", "p3", "p5"],
      "method": "去参数化做法概述(多帖共性)",
      "effects": ["实现 XX 效果", "..."],
      "body": "合并后的具体做法(差异参数可标注来源帖)",
      "inputs": "输入(自然语言)",
      "outputs": "产出(自然语言)",
      "criterion": null
    }}
  ]
}}

# 跳过条件(per post)

某帖满足任一时进 skipped_posts,不进入提炼:
- 纯营销,无方法/步骤/参数
- 信息密度过低
- 只是结果展示

两步法默认建议(适合大多数场景):

  1. 用单帖版跑全量原帖 → capability 标 maturity=experimental 进 candidate 状态,strategy 直接入库为 status=draft
  2. capability candidates 按 method + effects embedding 聚类后,再喂"合并 prompt"(独立 prompt,本文件不含)→ 簇内 ≥2 个独立 case 升级 validated

直接批次法(仅当一批高度相似时):直接用批次版一次喂入相似帖子组,产出已经合并,跳过 candidate 阶段。但聚类质量决定结果,不是普适首选。


二轮处理 TODO(本文件不含)

  • description 自动合成 prompt:基于 effects + method/body 生成一句话定位
  • capability 合并 prompt:candidate 池聚类后,每簇喂入合并产稳定 capability
  • steps[].ref_id 对齐 prompt:把 strategy.steps 绑到正式 capability 库
  • 边缘字段补全:category(跨 case)、failure_modes / preconditions(人工 review)