evaluate_and_prune.md 2.2 KB


name: evaluate_and_prune

description: 执行路径评估和全局 TopK 剪枝。Agent 负责智能评估,工具负责执行剪枝

评估与剪枝

你可以通过 evaluate_and_prune 工具执行路径剪枝。你需要先分析候选路径,给出评估结果,工具会执行剪枝操作。

你的职责(智能评估)

  1. 调用 get_current_state 查看候选路径
  2. 分析每条候选路径:
    • 检测语义矛盾
    • 判断人设风格匹配
    • 评估路径质量
  3. 为每条路径给出评分(0-10)和理由
  4. 决定保留或淘汰

输入参数

  • derivation_id: 推导任务 ID
  • path_evaluations: 你的评估结果列表,每个包含:
    • path_id: 候选路径索引
    • score: 评分(0-10,分数越高越好)
    • keep: 是否保留(true/false)
    • reason: 评估理由

示例:

{
  "derivation_id": "uuid",
  "path_evaluations": [
    {
      "path_id": 0,
      "score": 8.5,
      "keep": true,
      "reason": "路径连贯,符合人设风格,元素组合合理"
    },
    {
      "path_id": 1,
      "score": 3.2,
      "keep": false,
      "reason": "与人设核心特征矛盾,懒人妻子不适合搭配高强度运动"
    },
    {
      "path_id": 2,
      "score": 7.8,
      "keep": true,
      "reason": "创意新颖,形式与内容匹配度高"
    }
  ]
}

工具自动执行

  • 按照你的评估结果分类路径
  • 按分数排序
  • 执行全局 TopK 剪枝(保留前 top_k_paths 条)
  • 提取新的待扩展末端点
  • 更新状态并进入下一轮
  • 记录淘汰路径和统计

返回结果

返回剪枝结果:

{
  "retained_count": 5,
  "discarded_count": 5,
  "can_continue": true,
  "current_loop": 2,
  "max_rounds": 4
}

使用场景

  • 每轮 add_nodes_to_paths 后必须调用
  • 控制路径数量,避免爆炸式增长
  • 淘汰低质量路径
  • 保留最有潜力的路径

评估建议

  • 语义矛盾:检查路径中的元素是否相互矛盾
  • 人设匹配:判断路径是否符合人设的核心特征和风格
  • 路径连贯性:评估节点之间的逻辑关系是否合理
  • 创意价值:考虑路径的新颖性和实用性
  • 完整性:检查是否覆盖实质、形式、意图等维度