# 能力 / 工序 提炼 Prompt（首次入库）

提供两个版本：
1. **单帖版**（Prompt 1）— 从一篇原帖产出 1 个 strategy + N 个 capabilities
2. **批次版**（Prompt 2）— 从一批相关原帖产出多个 strategy + 跨帖合并的 capabilities

何时用哪个见文末"使用建议"。

---

## 字段范围

### 首次提炼覆盖（核心字段）

| 实体 | 必填字段 | 可空字段 |
|---|---|---|
| capability | name, method, effects, body, inputs, outputs | criterion |
| strategy | name, method, effects, steps（每步含 order/summary/body）, inputs, outputs | criterion |

### 留二轮补

- `description`：基于 effects + method/body 自动合成
- `steps[].ref_id`：对齐到正式 capability 库后绑定
- `category`：跨 case 视角下分类
- capability：`failure_modes`、`preconditions`
- strategy：顶层 `body`（全局叙述/原则/坑）、`preconditions`、`expected_cost`、`coverage_estimate`

入库时系统填：`id`、`version`、`created_at`、`updated_at`、`embedding`、`maturity`（默认 `experimental`）、`validation_count`（默认 1，批次版按合并的来源帖数）。

每个 prompt 块都自包含、可直接复制使用。占位符由调用方填充：单帖版用 `{post_content}`，批次版用 `{posts_block}`（每篇原帖以 `[POST id=p?]\n{content}\n\n` 起头）。

---

## Prompt 1：单帖版

```
你是 AI 内容制作能力沉淀助手。从下方一篇原帖中，提炼能入库的"能力（capability）"和"工序（strategy）"，输出严格 JSON，无任何额外文字。

# 概念

**capability（能力）**：能独立交付产出 + 能在多个工序中复用的最小动作单元。
- ✅ 例：人像角色一致性生成、三段式排版、图像超分
- ❌ 单一 prompt 词（太细）/ "做一篇穿搭分享"（太粗）/ "发到小红书"（是 tool action）

**strategy（工序）**：端到端制作流程，由能力组合而成。
- ✅ 例：小红书穿搭分享首图制作流程

判定：能在另一个工序里复用 → 能力；只能整体用 → 工序内部步骤。

# 字段要点

1. **method 严格去参数化**：写做法机理（"用 LoRA + IP-Adapter 维持一致性"），不写具体参数（rank/alpha/weight）。具体参数留 body
2. **body** 写具体做法：关键 prompt 文本、关键参数值、关键调用顺序
3. **effects** 是需求/效果描述，每条形如"实现 XX 效果"，不写工具名也不写做法
4. **strategy.steps** 每步含 {order, summary, body}：summary 一句话骨架，body 该步具体做法
5. **inputs / outputs** 用自然语言简述
6. **criterion** 原帖有质量描述就填，没就 null
7. **strategy 可为 null**：原帖只是单一技法分享、没有端到端流程时
8. capability 数量参考 2-6 个，>8 可能粒度过细

# 输入

原帖如下：
---
{post_content}
---

# 输出（严格 JSON）

{{
  "skip": false,
  "skip_reason": "",
  "strategy": null,
  "capabilities": []
}}

非跳过时，strategy 与 capabilities 各项填充：

strategy（如有端到端流程则填，否则 null）：
{{
  "name": "工序名",
  "method": "工序整体方法论概述（去具体步骤序列），保留核心技术路线",
  "effects": ["实现 XX 效果", "..."],
  "steps": [
    {{"order": 1, "summary": "骨架一句话", "body": "该步具体做法（prompt/参数/tip）"}}
  ],
  "inputs": "整体输入需要什么（自然语言）",
  "outputs": "最终产出形态（自然语言）",
  "criterion": null
}}

capabilities（数组，每项一个能力）：
{{
  "name": "能力名",
  "method": "去参数化做法概述",
  "effects": ["实现 XX 效果", "..."],
  "body": "具体做法（关键 prompt / 参数 / 步骤）",
  "inputs": "输入（自然语言）",
  "outputs": "产出（自然语言）",
  "criterion": null
}}

# 跳过条件（满足任一设 skip=true 并写 skip_reason）

- 原帖纯营销，没有具体方法 / 步骤 / 参数
- 信息密度过低，连一个 capability 都凑不出
- 只是结果展示，没有任何"怎么做"的描述
```

---

## Prompt 2：批次版

```
你是 AI 内容制作能力沉淀助手。从下方一批相关原帖中，横向归纳出可入库的"能力（capability）"和"工序（strategy）"，输出严格 JSON，无任何额外文字。

# 概念

**capability（能力）**：能独立交付产出 + 能在多个工序中复用的最小动作单元。
- ✅ 例：人像角色一致性生成、三段式排版、图像超分
- ❌ 单一 prompt 词（太细）/ "做一篇穿搭分享"（太粗）/ "发到小红书"（是 tool action）

**strategy（工序）**：端到端制作流程，由能力组合而成。
- ✅ 例：小红书穿搭分享首图制作流程

判定：能在另一个工序里复用 → 能力；只能整体用 → 工序内部步骤。

# 批次提炼的核心要求

1. **跨帖合并 capability**：相同或相似的能力（叫法、参数可能不同）在多帖出现 → 合并为一条
   - method 取多帖参数的共性，去参数化要更彻底
   - effects 合并多帖视角，覆盖更全面
   - body 选最完整的；如各帖在参数 / prompt 上有有意义的差异，把差异点合并写进 body（标注来源帖）
2. **strategy 通常按帖产**：每帖对应一个 strategy 草稿
   - 例外：两帖步骤序列相似度 ≥ 70% 时合并为同一 strategy（多源）
3. **来源标注**：每条 capability / strategy 都标 `source_post_ids`，列出来自哪些帖子（用于追溯和置信度评估）

# 字段要点

1. **method 严格去参数化**：批次场景下尤其重要——多帖参数不同，正好用来抽共性机理
2. **body** 写具体做法：合并时保留多帖优点，差异参数标注来源
3. **effects** 多帖视角合并，每条形如"实现 XX 效果"
4. **strategy.steps** 每步含 {order, summary, body}
5. **inputs / outputs** 自然语言简述
6. **criterion** 原帖有就填、没就 null

# 提炼步骤建议（内部思考流程，不必输出）

1. 逐帖识别 strategy 草稿（端到端流程）
2. 横向扫描所有帖子，识别重复出现的 capability 候选
3. 合并候选 → 最终 capability：method 去参数化、effects 合并、body 选最完整
4. 跨帖 strategy 合并：步骤序列高度相似（≥70%）才合并，否则各自保留
5. 每条产出都填 source_post_ids

# 输入

原帖列表（每篇带 id 标识）：
---
[POST id=p1]
{post_1_content}

[POST id=p2]
{post_2_content}

[POST id=p3]
{post_3_content}
（按需续）
---

# 输出（严格 JSON）

{{
  "skipped_posts": [
    {{"post_id": "p?", "reason": ""}}
  ],
  "strategies": [
    {{
      "name": "工序名",
      "source_post_ids": ["p1", "p2"],
      "method": "工序整体方法论概述",
      "effects": ["实现 XX 效果", "..."],
      "steps": [
        {{"order": 1, "summary": "骨架一句话", "body": "该步具体做法"}}
      ],
      "inputs": "整体输入（自然语言）",
      "outputs": "最终产出形态",
      "criterion": null
    }}
  ],
  "capabilities": [
    {{
      "name": "能力名",
      "source_post_ids": ["p1", "p3", "p5"],
      "method": "去参数化做法概述（多帖共性）",
      "effects": ["实现 XX 效果", "..."],
      "body": "合并后的具体做法（差异参数可标注来源帖）",
      "inputs": "输入（自然语言）",
      "outputs": "产出（自然语言）",
      "criterion": null
    }}
  ]
}}

# 跳过条件（per post）

某帖满足任一时进 skipped_posts，不进入提炼：
- 纯营销，无方法/步骤/参数
- 信息密度过低
- 只是结果展示
```

---

**两步法默认建议**（适合大多数场景）：

1. 用单帖版跑全量原帖 → capability 标 `maturity=experimental` 进 candidate 状态，strategy 直接入库为 `status=draft`
2. capability candidates 按 `method + effects` embedding 聚类后，再喂"合并 prompt"（独立 prompt，本文件不含）→ 簇内 ≥2 个独立 case 升级 `validated`

**直接批次法**（仅当一批高度相似时）：直接用批次版一次喂入相似帖子组，产出已经合并，跳过 candidate 阶段。但聚类质量决定结果，不是普适首选。

---

## 二轮处理 TODO（本文件不含）

- description 自动合成 prompt：基于 effects + method/body 生成一句话定位
- capability 合并 prompt：candidate 池聚类后，每簇喂入合并产稳定 capability
- steps[].ref_id 对齐 prompt：把 strategy.steps 绑到正式 capability 库
- 边缘字段补全：category（跨 case）、failure_modes / preconditions（人工 review）