# Skill: dimension_research

## Purpose

该 skill 用于在内容平台（主要是小红书）研究： 哪些 **Control Signals（控制信号 / 特征维度）** 适合表达输入的 **Image Dimensions（图片维度 / 需求）**。

输入来自主 agent：
- global_features
- substances
- forms
- highlights
这些输入代表不同类的 **Image Dimensions**。

该 skill 的任务是：通过案例研究和创作者经验，为每个 Image Dimension 提炼：**可复用的 Control Signals。**

注意：dimension_research 不负责寻找工具。，只负责：Image Dimension → Control Signal。

---
## Definitions

Image Dimension（图片维度 / 需求）指图片中需要被结构化表达的方面。

Control Signal（控制信号 / 特征维度）可以将 Image Dimension 转换到生成模型可使用的信号空间。

Control Signal 不是某张图片的具体值， 是特征的表示方式。

Feature Value（特征值）是 Control Signal 在具体图片上的实例化结果，由工具提取。
dimension_research 不负责提取 Feature Value。

# Input
subagent 将收到来自主 agent 的 JSON：
{
  "global_features": [],
  "substances": [],
  "forms": [],
  "highlights": [],
  "goal": "寻找适合生成控制的多模态维度"
}

字段说明：
global_features：图像整体特征
substances：图像中的实体
forms：实体的形式
highlights：亮点信息
---

# Output
输出文件： knowledge/dimension_research_result.json
结构：
{
  "control_signal_candidates": [
    {
      "image_dimension": "多模态维度",
      "level": "global / substance / form",
      "control_signal": "特征维度",
      "signal_type": "graph/...",
      "representation": "json/...",
      "reason": "选择的原因",
      "generation_usage": "特征维度在还原过程中应该被怎样使用",
      "evidence": [
        {
          "url": "...",
          "snippet": "..."
        }
      ]
    }
  ]
}

每个特征维度必须说明：
    - 所属层级（global / substance / form）
    - 选择原因
    - 表示方式
    - 在生成中的作用
    - 原始证据
---
# Search Strategy
## 搜索目标

优先寻找： 如何使用某个特征维度复刻某种视觉效果，也就是图片维度
而不是： 某个工具如何使用

---
## 搜索重点

优先寻找：
- 复刻流程
- 工作流
- 案例中使用的视觉控制变量
- 参数经验
- 常见失败案例

避免：
- 单纯工具介绍
- 无流程说明的教程
- 纯理论讨论

最终从案例中提炼可复用的控制信号

---

## 搜索循环
执行循环：
search  
↓  
分析案例  
↓  
提炼控制信号  
↓  
如果维度不清晰  
↓  
改写 query  
↓  
继续搜索  

---
# Query 扩展
dimension_research 的 query 不应只有少量关键词。 必须通过系统化方式生成 20–40 个 query。

获得的特征
↓
生成 Query Seeds
↓
扩展 Query
↓
执行搜索

---
## Query Seeds

Query Seeds 来源：
1. Substance（实体）
2. Form（形式）
3. Highlight（亮点）
4. 搜索内容补充

---
## Query 模板
Query **必须**由以下结构组成： seed + intent + context

seed：来自输入特征
intent：implementation / analysis / control / workflow / comparison /...
context：教程 / workflow / 拆解 / 案例 / 参数 /...

每个 seed 必须生成 5–8 个 query。
总 query 数量建议 20–40。

---
## Query 过滤规则
删除： 重复 query、过于相似 query、没有信息量 query、不符合结构组成 query

---
## Query 迭代规则
**重要** ：对每一个维度的搜索，都必须经过多次迭代。每一次搜索完成后，根据搜索的效果以及得到的知识，改进query的seed、intent和context，使用优化后的query继续搜索，直到得到的知识足够丰富，且都可以通过评估。
**策略** ：每一轮迭代，除了是对query的优化，也应该缩小搜索空间。比如：第一轮搜索宽泛的概念，从搜索结果中得到一些子领域的关键词，并运用到第二轮搜索。最终通过迭代，缩小范围，锁定一个或几个特征维度。

---
# Evaluation
搜索完成后，对每个候选维度进行评估：
是否：
- 可用于生成模型控制
- 可独立修改
- 不包含原始像素
- 可用于学习和复用
- 不与原图高度相似

避免：
- 与原图高度相似的特征
- 无法泛化的特征
---
# Dimension Research Documentation

搜索完成后，必须生成一份研究记录，用于说明每一个维度是如何被发现并确定的。

研究记录必须包含以下信息：

1. Image Dimension 原始信息
说明该维度来自图片的哪个方面。
必须标明来源：
- global feature
- substance
- form
- highlight
并记录制作表或亮点中的来源路径。

2. Initial Hypothesis
说明该维度最初的理解或假设：
图片的这个方面可能由哪些视觉变量控制。

3. Query Iteration
记录 query 的修改过程。
至少包含：
- 使用的 seed
- 每一轮 query
- 搜索结果观察
- 为什么需要修改 query
- 新发现的关键词或概念

4. Evidence
记录关键搜索案例，包括：
- URL
- 简要说明
- 从案例中得到的结论

5. Control Signal Decision
说明最终选择的控制信号：
Image Dimension → Control Signal
并解释：
- 为什么选择该信号
- 它如何控制视觉效果
- 该信号如何用于生成模型

6. Rejected Alternatives
记录被否决的方案，并说明原因，例如：
- 与原图过于相似
- 无法泛化
- 无法提取

---
# Stop Condition

当搜索结果能够解释以下问题：
- 为什么这种效果成立
- 如何实现
- 哪些因素控制
即可停止搜索。

# Search Language Strategy
查询语言必须根据平台自动选择。

---
## 中文优先
默认情况下： 优先使用中文查询。
原因：
- 内容平台主要为中文内容
- 中文 query 更容易找到真实创作者经验

适用平台：
- 小红书
- 知乎
- B站
- 中文博客

---
## 英文查询
当搜索来源为：
- GitHub
- 论文
- 技术博客
- AI工具库
- API文档
才使用英文 query。

---
## 双语搜索策略
若中文搜索结果不足： 可以进行第二轮搜索：

---
## Query 翻译规则
从中文平台切换到英文平台时，将核心概念翻译为英文。

---
## 禁止行为
禁止： 在中文平台使用纯英文 query。