# Skill: dimension_research ## Purpose 该 skill 用于在内容平台(主要是小红书)研究: 哪些 **Control Signals(控制信号 / 特征维度)** 适合表达输入的 **Image Dimensions(图片维度 / 需求)**。 输入来自主 agent: - global_features - substances - forms - highlights 这些输入代表不同类的 **Image Dimensions**。 该 skill 的任务是:通过案例研究和创作者经验,为每个 Image Dimension 提炼:**可复用的 Control Signals。** 注意:dimension_research 不负责寻找工具。,只负责:Image Dimension → Control Signal。 --- ## Definitions Image Dimension(图片维度 / 需求)指图片中需要被结构化表达的方面。 Control Signal(控制信号 / 特征维度)可以将 Image Dimension 转换到生成模型可使用的信号空间。 Control Signal 不是某张图片的具体值, 是特征的表示方式。 Feature Value(特征值)是 Control Signal 在具体图片上的实例化结果,由工具提取。 dimension_research 不负责提取 Feature Value。 # Input subagent 将收到来自主 agent 的 JSON: { "global_features": [], "substances": [], "forms": [], "highlights": [], "goal": "寻找适合生成控制的多模态维度" } 字段说明: global_features:图像整体特征 substances:图像中的实体 forms:实体的形式 highlights:亮点信息 --- # Output 输出文件: knowledge/dimension_research_result.json 结构: { "control_signal_candidates": [ { "image_dimension": "多模态维度", "level": "global / substance / form", "control_signal": "特征维度", "signal_type": "graph/...", "representation": "json/...", "reason": "选择的原因", "generation_usage": "特征维度在还原过程中应该被怎样使用", "evidence": [ { "url": "...", "snippet": "..." } ] } ] } 每个特征维度必须说明: - 所属层级(global / substance / form) - 选择原因 - 表示方式 - 在生成中的作用 - 原始证据 --- # Search Strategy ## 搜索目标 优先寻找: 如何使用某个特征维度复刻某种视觉效果,也就是图片维度 而不是: 某个工具如何使用 --- ## 搜索重点 优先寻找: - 复刻流程 - 工作流 - 案例中使用的视觉控制变量 - 参数经验 - 常见失败案例 避免: - 单纯工具介绍 - 无流程说明的教程 - 纯理论讨论 最终从案例中提炼可复用的控制信号 --- ## 搜索循环 执行循环: search ↓ 分析案例 ↓ 提炼控制信号 ↓ 如果维度不清晰 ↓ 改写 query ↓ 继续搜索 --- # Query 扩展 dimension_research 的 query 不应只有少量关键词。 必须通过系统化方式生成 20–40 个 query。 获得的特征 ↓ 生成 Query Seeds ↓ 扩展 Query ↓ 执行搜索 --- ## Query Seeds Query Seeds 来源: 1. Substance(实体) 2. Form(形式) 3. Highlight(亮点) 4. 搜索内容补充 --- ## Query 模板 Query **必须**由以下结构组成: seed + intent + context seed:来自输入特征 intent:implementation / analysis / control / workflow / comparison /... context:教程 / workflow / 拆解 / 案例 / 参数 /... 每个 seed 必须生成 5–8 个 query。 总 query 数量建议 20–40。 --- ## Query 过滤规则 删除: 重复 query、过于相似 query、没有信息量 query、不符合结构组成 query --- ## Query 迭代规则 **重要** :对每一个维度的搜索,都必须经过多次迭代。每一次搜索完成后,根据搜索的效果以及得到的知识,改进query的seed、intent和context,使用优化后的query继续搜索,直到得到的知识足够丰富,且都可以通过评估。 **策略** :每一轮迭代,除了是对query的优化,也应该缩小搜索空间。比如:第一轮搜索宽泛的概念,从搜索结果中得到一些子领域的关键词,并运用到第二轮搜索。最终通过迭代,缩小范围,锁定一个或几个特征维度。 --- # Evaluation 搜索完成后,对每个候选维度进行评估: 是否: - 可用于生成模型控制 - 可独立修改 - 不包含原始像素 - 可用于学习和复用 - 不与原图高度相似 避免: - 与原图高度相似的特征 - 无法泛化的特征 --- # Dimension Research Documentation 搜索完成后,必须生成一份研究记录,用于说明每一个维度是如何被发现并确定的。 研究记录必须包含以下信息: 1. Image Dimension 原始信息 说明该维度来自图片的哪个方面。 必须标明来源: - global feature - substance - form - highlight 并记录制作表或亮点中的来源路径。 2. Initial Hypothesis 说明该维度最初的理解或假设: 图片的这个方面可能由哪些视觉变量控制。 3. Query Iteration 记录 query 的修改过程。 至少包含: - 使用的 seed - 每一轮 query - 搜索结果观察 - 为什么需要修改 query - 新发现的关键词或概念 4. Evidence 记录关键搜索案例,包括: - URL - 简要说明 - 从案例中得到的结论 5. Control Signal Decision 说明最终选择的控制信号: Image Dimension → Control Signal 并解释: - 为什么选择该信号 - 它如何控制视觉效果 - 该信号如何用于生成模型 6. Rejected Alternatives 记录被否决的方案,并说明原因,例如: - 与原图过于相似 - 无法泛化 - 无法提取 --- # Stop Condition 当搜索结果能够解释以下问题: - 为什么这种效果成立 - 如何实现 - 哪些因素控制 即可停止搜索。 # Search Language Strategy 查询语言必须根据平台自动选择。 --- ## 中文优先 默认情况下: 优先使用中文查询。 原因: - 内容平台主要为中文内容 - 中文 query 更容易找到真实创作者经验 适用平台: - 小红书 - 知乎 - B站 - 中文博客 --- ## 英文查询 当搜索来源为: - GitHub - 论文 - 技术博客 - AI工具库 - API文档 才使用英文 query。 --- ## 双语搜索策略 若中文搜索结果不足: 可以进行第二轮搜索: --- ## Query 翻译规则 从中文平台切换到英文平台时,将核心概念翻译为英文。 --- ## 禁止行为 禁止: 在中文平台使用纯英文 query。