# 选题生成方法对比分析
## 文档对比
- **create_process_v4.md**: 基于图数据库游走的选题推导
- **topic_build_agent_prompt.md**: 基于频繁项集挖掘的选题构建
---
## 核心差异对比
### 1. 数据基础与方法论
#### create_process_v4.md (图数据库游走)
- 基于**图数据库**,通过节点和边的关系进行游走
- 数据来源:人设常量点 + 分类路径(class_path)+ 点(point)
- 方法:BFS广度优先遍历,从起始常量点出发,通过关联边逐步扩展
- 核心操作:横向关联、向上抽象、向下展开
#### topic_build_agent_prompt.md (频繁项集挖掘)
- 基于**Pattern Mining(FP-Growth算法)**的频繁项集结果
- 数据来源:社交媒体帖子的结构化分析 + 元素共现关系
- 方法:推导图谱(DAG),从种子元素通过数据证据逐步推导
- 核心操作:共现探索、层级泛化/特化、跨维度关联
---
### 2. 推导策略
#### create_process_v4.md
**游走方法:**
- 横向关联:search_relation_class_by_class
- 向上抽象:search_class_by_point
- 向下展开:search_point_by_class
**策略特点:**
- LLM自主选择游走方法
- 全局TopK剪枝(每轮保留TOP_K_PATHS条路径)
- 避免路径循环(不允许重复节点)
- 路径独立性(各路径独立探索)
#### topic_build_agent_prompt.md
**推导类型:**
- itemset_co_pattern:项集内共现
- co_occurrence:帖子级共现
- hierarchy_generalize/specialize:分类泛化/特化
- post_content_extract:从帖子提取
- demand_input:用户需求输入
**策略特点:**
- 每步必须有数据证据支撑
- 因果链完整(每个节点可追溯到种子)
- 每步一个动作(不堆砌多个元素)
- 禁止凭空联想
---
### 3. 路径/图谱结构
#### create_process_v4.md - 路径结构
```json
{
"名称": "懒人妻子",
"类型": "灵感点/目的点/关键点",
"维度": "实质/形式/意图",
"分类": "point / class",
"来源": "上一个节点名称",
"游走方法": "横向关联/向上抽象",
"推理": "选择该方法的原因"
}
```
- 线性路径结构(数组)
- 强调路径连续性
- 每条路径只有一个起始常量点
#### topic_build_agent_prompt.md - 图谱结构
**节点:CompositionItem**
- item_level: category(分类)/ element(具体元素)
- dimension: 实质/形式/意图
- category_path: 分类归属
**边:DerivationLink**
- link_type: 推导关系类型
- evidence_type + evidence_detail: 数据证据
- derived_from: 来源节点ID
特点:
- DAG图结构(有向无环图)
- 强调数据证据
- 区分分类层和元素层
---
### 4. 执行流程对比
| 阶段 | create_process_v4.md | topic_build_agent_prompt.md |
|------|---------------------|---------------------------|
| **初始化** | 提取人设常量点 → 为每个常量点创建初始路径 | 理解执行概况 → 获取分类树和组合模式 |
| **核心推导** | 多轮循环游走(MAX_ROUNDS轮)
- 选择游走方法
- 执行游走
- 构建候选路径
- 评估与全局TopK剪枝 | 逐步推导(不限轮次)
- 创建种子(只放起点)
- 逐步add_derivation_step
- 每步一个动作,必须有数据证据 |
| **终止条件** | loop >= MAX_ROUNDS 或 无法继续扩展 | 推导图谱完整,满足质量标准 |
| **输出生成** | 每条路径 → 一个选题
选题数量 = TOP_K_PATHS | 从活跃元素构建选题
必须满足两层完整(category + element) |
---
### 5. 选题生成差异
#### create_process_v4.md
**一对一映射:**
- 每条路径 → 一个选题
- 禁止路径融合
- 选题是5-8句话的完整创作指导
- 包含:主题、灵感展开、形式呈现、目的效果
**输出内容:**
- 选题(完整创作指导)
- 点组合(所有具体点)
- 完整路径(详细游走信息)
- 预期效果
- 推理过程
#### topic_build_agent_prompt.md
**从图谱提炼:**
- title:核心主题
- description:选题方向
- content_direction:具体创作方向
- target_audience:目标受众
**质量标准:**
- 两层完整(category + element)
- 至少覆盖实质+形式两个维度
- 推理链 ≥ 3步
- 无孤立联想(每条边有数据证据)
---
### 6. 关键约束对比
| 约束类型 | create_process_v4.md | topic_build_agent_prompt.md |
|---------|---------------------|---------------------------|
| **数据依据** | 图数据库关系(class关联、点归属) | 频繁项集、共现数据、分类层级 |
| **推导自由度** | LLM自主选择游走方法 | 必须有数据证据,禁止凭空联想 |
| **路径/图完整性** | 路径连续性(每个节点来源于上一节点) | 因果链完整(每个节点可追溯到种子) |
| **循环控制** | 禁止路径中重复节点 | DAG结构天然无环 |
| **输出数量** | 固定 = TOP_K_PATHS | 不固定,满足质量标准即可 |
---
### 7. 适用场景分析
#### create_process_v4.md 更适合:
- 已有明确人设体系和分类结构
- 需要批量生成固定数量选题
- 强调从人设出发的创作一致性
- 路径探索型任务(发现新的组合可能)
#### topic_build_agent_prompt.md 更适合:
- 基于历史数据挖掘热门模式
- 需要数据驱动的选题验证
- 强调选题的数据支撑和可落地性
- 用户需求驱动型任务(从具体需求推导)
---
### 8. 技术实现差异
#### create_process_v4.md
- **工具**:4个图数据库查询工具
- **状态管理**:current_paths + discarded_paths + edges_to_expand
- **评估**:矛盾检测 + 人设风格匹配
- **剪枝**:全局TopK(所有候选路径竞争)
#### topic_build_agent_prompt.md
- **工具**:10+个数据挖掘相关工具(get_execution_summary, search_elements, create_topic_seed, add_derivation_step等)
- **状态管理**:推导图谱(节点+边)+ 活跃/非活跃标记
- **评估**:数据证据验证 + 两层完整性检查
- **优化**:deactivate移除不合适元素
---
## 核心区别总结
### 范式差异
| 维度 | create_process_v4.md | topic_build_agent_prompt.md |
|------|---------------------|---------------------------|
| **核心范式** | 探索式游走 | 证据式推导 |
| **起点** | 人设常量点 | 用户需求/频繁模式 |
| **推导依据** | 图结构关系 | 数据共现证据 |
| **输出特点** | 创意发散,路径多样 | 数据支撑,可验证 |
| **质量保证** | 人设风格一致性 | 数据证据完整性 |
### 方法论对比
**create_process_v4.md:探索式游走**
- 从人设出发,通过图结构探索可能的内容组合
- 强调创意发散和路径多样性
- 适合内容创新和人设一致性维护
**topic_build_agent_prompt.md:证据式推导**
- 从数据出发,通过频繁模式和共现关系构建选题
- 强调可验证性和落地性
- 适合数据驱动的选题优化和验证
---
## 互补使用建议
两种方法可以形成完整的选题生成流程:
1. **发散阶段**:使用 create_process_v4.md 进行创意探索
- 从人设出发,生成多样化的选题路径
- 发现新的元素组合可能性
2. **验证阶段**:使用 topic_build_agent_prompt.md 进行数据验证
- 检查选题是否有数据支撑
- 优化选题的可落地性
3. **迭代优化**:
- 将验证通过的选题反馈到图数据库
- 将探索发现的新组合补充到频繁项集
- 形成数据和创意的双向增强
---
## 技术架构建议
```
用户需求
↓
┌─────────────────────────────────┐
│ 方法选择 │
│ - 人设驱动 → create_process_v4 │
│ - 数据驱动 → topic_build │
└─────────────────────────────────┘
↓
┌─────────────────────────────────┐
│ 选题生成 │
│ - 图游走 / 推导图谱 │
└─────────────────────────────────┘
↓
┌─────────────────────────────────┐
│ 交叉验证 │
│ - 图游走结果 → 数据证据验证 │
│ - 推导图谱 → 人设一致性检查 │
└─────────────────────────────────┘
↓
最终选题输出
```
---
生成时间:2026-03-19