dimension_research.md 6.3 KB

Skill: dimension_research

Purpose

该 skill 用于在内容平台(主要是小红书)研究: 哪些 Control Signals(控制信号 / 特征维度) 适合表达输入的 Image Dimensions(图片维度 / 需求)

输入来自主 agent:

  • global_features
  • substances
  • forms
  • highlights 这些输入代表不同类的 Image Dimensions

该 skill 的任务是:通过案例研究和创作者经验,为每个 Image Dimension 提炼:可复用的 Control Signals。

注意:dimension_research 不负责寻找工具。,只负责:Image Dimension → Control Signal。


Definitions

Image Dimension(图片维度 / 需求)指图片中需要被结构化表达的方面。

Control Signal(控制信号 / 特征维度)可以将 Image Dimension 转换到生成模型可使用的信号空间。

Control Signal 不是某张图片的具体值, 是特征的表示方式。

Feature Value(特征值)是 Control Signal 在具体图片上的实例化结果,由工具提取。 dimension_research 不负责提取 Feature Value。

Input

subagent 将收到来自主 agent 的 JSON: { "global_features": [], "substances": [], "forms": [], "highlights": [], "goal": "寻找适合生成控制的多模态维度" }

字段说明: global_features:图像整体特征 substances:图像中的实体 forms:实体的形式

highlights:亮点信息

Output

输出文件: knowledge/dimension_research_result.json 结构: { "control_signal_candidates": [

{
  "image_dimension": "多模态维度",
  "level": "global / substance / form",
  "control_signal": "特征维度",
  "signal_type": "graph/...",
  "representation": "json/...",
  "reason": "选择的原因",
  "generation_usage": "特征维度在还原过程中应该被怎样使用",
  "evidence": [
    {
      "url": "...",
      "snippet": "..."
    }
  ]
}

] }

每个特征维度必须说明:

- 所属层级(global / substance / form)
- 选择原因
- 表示方式
- 在生成中的作用
- 原始证据

Search Strategy

搜索目标

优先寻找: 如何使用某个特征维度复刻某种视觉效果,也就是图片维度 而不是: 某个工具如何使用


搜索重点

优先寻找:

  • 复刻流程
  • 工作流
  • 案例中使用的视觉控制变量
  • 参数经验
  • 常见失败案例

避免:

  • 单纯工具介绍
  • 无流程说明的教程
  • 纯理论讨论

最终从案例中提炼可复用的控制信号


搜索循环

执行循环: search

分析案例

提炼控制信号

如果维度不清晰

改写 query

继续搜索


Query 扩展

dimension_research 的 query 不应只有少量关键词。 必须通过系统化方式生成 20–40 个 query。

获得的特征 ↓ 生成 Query Seeds ↓ 扩展 Query ↓ 执行搜索


Query Seeds

Query Seeds 来源:

  1. Substance(实体)
  2. Form(形式)
  3. Highlight(亮点)
  4. 搜索内容补充

Query 模板

Query 必须由以下结构组成: seed + intent + context

seed:来自输入特征 intent:implementation / analysis / control / workflow / comparison /... context:教程 / workflow / 拆解 / 案例 / 参数 /...

每个 seed 必须生成 5–8 个 query。 总 query 数量建议 20–40。


Query 过滤规则

删除: 重复 query、过于相似 query、没有信息量 query、不符合结构组成 query


Query 迭代规则

重要 :对每一个维度的搜索,都必须经过多次迭代。每一次搜索完成后,根据搜索的效果以及得到的知识,改进query的seed、intent和context,使用优化后的query继续搜索,直到得到的知识足够丰富,且都可以通过评估。 策略 :每一轮迭代,除了是对query的优化,也应该缩小搜索空间。比如:第一轮搜索宽泛的概念,从搜索结果中得到一些子领域的关键词,并运用到第二轮搜索。最终通过迭代,缩小范围,锁定一个或几个特征维度。


Evaluation

搜索完成后,对每个候选维度进行评估: 是否:

  • 可用于生成模型控制
  • 可独立修改
  • 不包含原始像素
  • 可用于学习和复用
  • 不与原图高度相似

避免:

  • 与原图高度相似的特征
  • 无法泛化的特征

    Dimension Research Documentation

搜索完成后,必须生成一份研究记录,用于说明每一个维度是如何被发现并确定的。

研究记录必须包含以下信息:

  1. Image Dimension 原始信息 说明该维度来自图片的哪个方面。 必须标明来源:
  2. global feature
  3. substance
  4. form
  5. highlight 并记录制作表或亮点中的来源路径。

  6. Initial Hypothesis 说明该维度最初的理解或假设: 图片的这个方面可能由哪些视觉变量控制。

  7. Query Iteration 记录 query 的修改过程。 至少包含:

  8. 使用的 seed

  9. 每一轮 query

  10. 搜索结果观察

  11. 为什么需要修改 query

  12. 新发现的关键词或概念

  13. Evidence 记录关键搜索案例,包括:

  14. URL

  15. 简要说明

  16. 从案例中得到的结论

  17. Control Signal Decision 说明最终选择的控制信号: Image Dimension → Control Signal 并解释:

  18. 为什么选择该信号

  19. 它如何控制视觉效果

  20. 该信号如何用于生成模型

  21. Rejected Alternatives 记录被否决的方案,并说明原因,例如:

  22. 与原图过于相似

  23. 无法泛化

  24. 无法提取


Stop Condition

当搜索结果能够解释以下问题:

  • 为什么这种效果成立
  • 如何实现
  • 哪些因素控制 即可停止搜索。

Search Language Strategy

查询语言必须根据平台自动选择。


中文优先

默认情况下: 优先使用中文查询。 原因:

  • 内容平台主要为中文内容
  • 中文 query 更容易找到真实创作者经验

适用平台:

  • 小红书
  • 知乎
  • B站
  • 中文博客

英文查询

当搜索来源为:

  • GitHub
  • 论文
  • 技术博客
  • AI工具库
  • API文档 才使用英文 query。

双语搜索策略

若中文搜索结果不足: 可以进行第二轮搜索:


Query 翻译规则

从中文平台切换到英文平台时,将核心概念翻译为英文。


禁止行为

禁止: 在中文平台使用纯英文 query。