# Skill: tool_research ## Purpose 该 skill 用于为 **Control Signals(控制信号 / 特征维度)** 寻找最合适的提取方法。Control Signal 表示生成模型可消费的特征空间, tool_research 的任务是: 寻找能够从图片中提取这些特征维度的**Feature Values(特征值)** 的工具或方法。 工具可以包括: - AI 模型 - 图像算法 - 开源工具 - API - Python 图像处理库 ## Definitions Control Signal 是生成模型可消费的特征维度,描述了一个可逆的特征空间,而不是某张图片的具体值。 Feature Value 是 Control Signal 在具体图片上的实例化结果,也是特征维度的具体维度值。Feature Value 由工具从图片中提取。 --- # Input 来自主 agent 的 JSON: { "dimensions": [ "pose", "lighting_direction", "color_palette", "texture_pattern" ] } 注意: 这里的 dimensions 实际上表示 **Control Signals**,而不是 Image Dimensions。 --- # Output 输出文件: knowledge/tool_research_result.json 结构: { "tools": [ { "dimension": "pose", "tool_name": "OpenPose", "type": "model", "input": "image", "output": "skeleton keypoints", "api": true, "reason": "广泛用于人体姿态检测" } ] } --- # Search Strategy ## Stage 1 — Discover(工具发现) 目标: 发现能够提取指定 Control Signal 的算法或模型。 Query 结构: control_signal + extraction intent intent 可以包括: - estimation - detection - segmentation - analysis - extraction - recognition 示例: pose keypoints extraction model pose estimation model lighting direction estimation image color palette extraction python texture analysis algorithm 来源优先级: 1. 小红书(创作者经验) 2. 技术博客 3. GitHub 4. 论文 该阶段目标: 获得候选工具名称。 --- ## Stage 2 — Narrow(工具定位) 目标:确认工具是否能够输出符合 Control Signal 的 Feature Value。 Query 结构: tool_name + capability 示例: - OpenPose keypoints output format - MediaPipe Pose python api - Segment Anything segmentation python - MiDaS depth estimation github 需要确认: - 输入格式 - 输出格式 - API 支持 - 是否支持批量处理 - 是否开源 --- ## Stage 3 — Verify(工具验证) 目标: 验证工具可靠性、泛用性。可以参考评论反馈,或者搜索失败案例 Query 结构: tool_name + evaluation intent intent 可以包括: - benchmark - comparison - vs - accuracy - limitations - latest release 示例: OpenPose vs MediaPipe Pose MiDaS depth benchmark Segment Anything limitations MediaPipe Pose accuracy benchmark 需要确认: - 精度 - 适用场景 - 是否存在明显限制 --- # Tool Selection Criteria 工具必须满足: - 支持图像输入 - 输出结构符合维度需求 - 支持 API 或代码调用 - 可用于批量处理 优先选择: - 近期更新工具 - 社区广泛使用工具 - 评论中有大量好评的工具 --- # Verification 工具选择后需要验证: 例如: - pose: 骨架结构是否符合人体姿态 - palette: 提取颜色是否接近原图 - texture: 纹理是否符合视觉观察 --- # Stop Condition 当每个维度找到,至少 2 个候选工具,即可停止搜索。 --- # Important Principle 工具必须服务于维度。 维度设计优先。 # Search Language Strategy 查询语言必须根据平台自动选择。 --- ## 中文优先 默认情况下: 优先使用中文查询。 原因: - 内容平台主要为中文内容 - 中文 query 更容易找到真实创作者经验 适用平台: - 小红书 - 知乎 - B站 - 中文博客 --- ## 英文查询 当搜索来源为: - GitHub - 论文 - 技术博客 - AI工具库 - API文档 才使用英文 query。 --- ## 双语搜索策略 若中文搜索结果不足: 可以进行第二轮搜索: --- ## Query 翻译规则 从中文平台切换到英文平台时,将核心概念翻译为英文。 --- ## 禁止行为 禁止: 在中文平台使用纯英文 query。