tool_research.md 8.2 KB

Skill: tool_research

⚠️ 关键规则(必须首先阅读)

在构造任何query前,必须通过以下检查:

  1. Query中是否包含"工具"或"方法"?

    • 必须包含:工具、方法、软件、插件、模型、API等
    • 如果没有这些词,这个query是错误的
  2. Query是否在搜索"用什么工具"而不是"是什么内容"?

    • ✅ 正确:姿态检测工具、深度提取方法
    • ❌ 错误:女性画家、户外写生、白色裙子
  3. Query是否会搜到工具推荐?

    • ✅ 正确:会搜到工具名称、使用教程
    • ❌ 错误:会搜到图片、作品、内容

示例对比

错误Query(只有内容) 正确Query(包含工具)
❌ 女性画家 姿态 ✅ 姿态检测 工具推荐
❌ 户外 深度 ✅ 深度图提取 方法
❌ 白色裙子 ✅ 服装分割 工具
❌ 画架 识别 ✅ 物体检测 模型推荐

强制自检流程

构造query → 检查是否包含"工具/方法" → 检查是否搜索工具 → 确认后搜索
           ↓ 没有工具/方法                ↓ 只搜内容
           重新构造                        重新构造

目标

Control Signals(控制信号/特征维度)寻找最合适的提取工具。

工具用于从图片中提取Feature Values(特征值)

注意:本skill只负责寻找工具,不负责提炼Control Signal。


输入格式

{
  "highlight_id": "[亮点ID](可选)",
  "highlight_type": "[实质/形式/全局]",
  "dimensions": [
    {
      "name": "pose",
      "category": "form",
      "output_format": "image",
      "belongs_to_highlight": true
    }
  ]
}

注意

  • dimensions实际上表示Control Signals
  • 需要知道每个维度的category和output_format,以便选择合适的工具
  • highlight_type帮助理解维度的边界和范围
  • belongs_to_highlight标识该维度是否属于当前亮点

输出格式

文件knowledge/tool_research_result.json

{
  "tools": [
    {
      "dimension": "pose",
      "category": "form",
      "output_format": "image",
      "tool_name": "OpenPose",
      "type": "model",
      "availability": "ComfyUI节点",
      "usage": "使用方法描述",
      "parameters": "关键参数说明",
      "search_evidence": ["URL1", "URL2"],
      "reasoning": "为什么选择这个工具"
    }
  ]
}

工作流程

0. 初始假设

⚠️ 搜索前必须先给出假设:基于自身知识,列出可能的工具和理由

格式:假设:[工具1/2/3] | 理由:[知识来源] | 待验证:[具体问题]

报告中必须对比初始假设和最终结果

1. Query构造(关键)

⚠️ 搜索目的:寻找"提取工具",而不是寻找类似的图片内容

Query公式:[特征维度] + [提取动作] + [工具/方法]

严格禁止

  • ❌ 直接使用亮点描述作为搜索词
  • ❌ 只搜索内容关键词
  • ❌ 缺少"工具"、"方法"、"提取"等词

自检问题

  • 这个query是在搜索"提取工具"吗?
  • 这个query包含工具/方法相关的词了吗?
  • 这个query会搜到工具推荐和使用方法吗?

Query要求

  • 简短(3-5词)
  • 语义完整
  • 包含工具/方法意图

搜索平台:只在小红书搜索,使用中文

2. 搜索迭代

⚠️ 每一轮迭代必须基于上一轮的搜索结果,并在报告中说明迭代理由

第一轮(验证初始假设)

  • 目标:验证初始假设中的工具是否存在和可用
  • Query:[假设的工具] + [使用/教程] + [案例/效果]
  • 记录:
    • query词
    • 迭代理由:验证初始假设中的[具体假设]
    • 工具名称、工具类型、可用性
    • 与假设的对比:哪些假设被验证,哪些需要修正

第二轮(基于第一轮结果深入)

  • 目标:基于第一轮发现,了解工具的详细使用方法或探索新工具
  • Query:[第一轮发现的工具] + [参数/设置] + [效果/对比]
  • 记录:
    • query词
    • 迭代理由:基于第一轮发现的[具体发现],需要进一步了解[具体问题]
    • 使用方法、参数设置、实际效果
    • 对假设的修正或补充

第三轮(可选,对比评估)

  • 目标:对比多个工具,选择最优
  • Query:[工具A] vs [工具B] + [对比/评测]
  • 记录:
    • query词
    • 迭代理由:基于第二轮的[具体发现],需要对比[具体问题]
    • 对比结果和选择依据

迭代记录要求

  • 每一轮必须明确说明:为什么进行这一轮搜索
  • 每一轮必须说明:基于上一轮的哪些发现
  • 每一轮必须记录:这一轮验证或修正了什么

停止条件(满足任一即停止):

  • 找到2-3个可用工具及其使用方法
  • 能够清晰描述工具的使用流程
  • 搜索结果开始重复
  • 已完成2-3轮搜索
  • 初始假设已被充分验证或修正

3. 工具评估

⚠️ 必须优先选择最新、最好的模型和工具

评估标准(按优先级排序)

  1. 时间性(最重要)

    • 优先选择最新发布或更新的工具
    • 关注工具的发布时间、更新频率
    • 新版本通常性能更好、功能更强
    • 在搜索时主动寻找"最新"、"2024"、"2025"等时间信息
  2. 用户偏好

    • 大家都在用什么工具(使用频率、讨论热度)
    • 用户评价如何(好评率、推荐度)
    • 创作者的实际反馈和使用体验
    • 在小红书上的真实使用案例数量
  3. 可用性

    • 工具可用性强(优先已有工具、在线服务、API)
    • 易于集成和使用
    • 文档和教程完善
  4. 效果质量

    • 提取效果符合需求
    • 准确度和稳定性
    • 实际案例的效果展示

评估记录要求

  • 必须记录工具的发布/更新时间
  • 必须记录用户使用情况和评价
  • 必须说明为什么这是"最新、最好"的选择
  • 如果有多个工具,必须对比时间和用户偏好

工具类型

  • model:AI模型(如OpenPose、DepthAnything)
  • api:在线API服务
  • software:软件工具
  • plugin:插件(如ComfyUI节点、Photoshop插件)

4. 工具选择

推理过程

  • 列出搜索得到的工具和案例
  • 对每个维度:
    • 前提:引用搜索得到的工具信息和使用案例
    • 时间评估:工具的发布/更新时间,是否是最新的
    • 用户评估:使用频率、评价、推荐度
    • 推理逻辑:说明为什么这是最新、最好的工具
    • 结论:选择工具名称

选择原则

  • 最新优先:在功能相近的情况下,优先选择最新的工具
  • 最好优先:综合考虑用户评价、使用频率、效果质量
  • 实证支持:必须有小红书上的真实案例支持
  • 可用性保证:确保工具可以直接使用或容易获取

5. 输出结果

每个工具必须包含:

  • dimension(维度名称)
  • category(global/substance/form)
  • output_format(image/json)
  • tool_name(工具名称)
  • type(model/api/software/plugin)
  • availability(可用性说明)
  • usage(使用方法)
  • parameters(关键参数)
  • release_time(发布/更新时间)
  • user_feedback(用户评价和使用情况)
  • search_evidence(支持的URL)
  • reasoning(选择理由,必须说明为什么这是最新、最好的工具)

报告必须包含

  • 初始假设:搜索前基于自身知识的假设
  • 迭代过程:每一轮搜索的理由、基于什么发现、验证了什么
  • 假设对比:初始假设与最终结果的对比,哪些被验证,哪些被修正
  • 时间评估:每个工具的时间性分析,为什么是最新的
  • 用户评估:每个工具的用户偏好分析,为什么是最好的
  • 最终结论:基于搜索证据的最终工具列表

禁止

  • 凭空推测工具效果
  • 没有实际使用案例支持的工具选择
  • 选择无法验证可用性的工具
  • 为不属于当前亮点的维度选择工具
  • 选择过时的工具而忽略更新的版本
  • 报告中缺少迭代理由、假设对比、时间和用户评估

重要原则

工具必须服务于维度

维度设计优先