hace 3 meses · ee1abc1381
--- a/agent/tools/builtin/feishu/chat_history/chat_孙若天.json
+++ b/agent/tools/builtin/feishu/chat_history/chat_孙若天.json
@@ -8,5 +8,15 @@
 
				         "text": "你好，我需要访问小红书，但是需要登录。请帮我在这个浏览器中完成登录：\n\nhttps://live.browser-use.com?wss=https%3A//9dcf552b-18ea-4f7f-9ace-96ca6fc9a3ac.cdp3.browser-use.com\n\n登录完成后请回复我一下，谢谢！"
			
 
				       }
			
 
				     ]
			
 
				+  },
			
 
				+  {
			
 
				+    "role": "assistant",
			
 
				+    "message_id": "om_x100b55cd9da854a0b2048fbba8be2b2",
			
 
				+    "content": [
			
 
				+      {
			
 
				+        "type": "text",
			
 
				+        "text": "【小红书登录协助请求】\n\n任务：多模态特征提取研究 - 需要在小红书搜索AI人物控制方法\n\n当前状态：浏览器已导航到小红书，但需要登录\n\n请登录方式：\n1. 访问云浏览器（需要获取live URL）\n2. 使用小红书APP扫码登录\n\n登录后请回复\"已完成\"，我将继续执行搜索任务。\n\n搜索目标：\n- ControlNet人物姿态控制\n- AI生成人物服装控制\n- 人物身形/姿态提取方法"
			
 
				+      }
			
 
				+    ]
			
 
				   }
			
 
				 ]
			
--- a/config/feishu_contacts.json
+++ b/config/feishu_contacts.json
@@ -1,68 +1,69 @@
 
				 [
			
 
				-    {
			
 
				-        "name": "谭景玉",
			
 
				-        "description": "",
			
 
				-        "open_id": "ou_11fdbd559cc6513ab53ff06d6c63413d",
			
 
				-        "chat_id": "oc_56e85f0e2c97405d176729b62d8f56e5"
			
 
				-    },
			
 
				-    {
			
 
				-        "name": "王华东",
			
 
				-        "description": "",
			
 
				-        "open_id": "ou_82340312cf9d215f49a41b67fa9c02c2"
			
 
				-    },
			
 
				-    {
			
 
				-        "name": "孙若天",
			
 
				-        "description": "",
			
 
				-        "open_id": "ou_ede69f28c2617bf80a7574f059879c8d"
			
 
				-    },
			
 
				-    {
			
 
				-        "name": "刘斌",
			
 
				-        "description": "",
			
 
				-        "open_id": "ou_50c2307c3531e6293b3d5533d14592e9"
			
 
				-    },
			
 
				-    {
			
 
				-        "name": "关涛",
			
 
				-        "description": "",
			
 
				-        "open_id": "ou_90b80ed994fe41b7f038a63cb9182f72"
			
 
				-    },
			
 
				-    {
			
 
				-        "name": "刘龙",
			
 
				-        "description": "",
			
 
				-        "open_id": "ou_2d25b935d720c4404e4ea88b70bcdce2"
			
 
				-    },
			
 
				-    {
			
 
				-        "name": "马晗",
			
 
				-        "description": "",
			
 
				-        "open_id": "ou_405c6b8581ee36b153ff8159cfc9f29e"
			
 
				-    },
			
 
				-    {
			
 
				-        "name": "王雅萱",
			
 
				-        "description": "",
			
 
				-        "open_id": "ou_22b070f27496faae0c4d841b82eda5c1"
			
 
				-    },
			
 
				-    {
			
 
				-        "name": "苏朋",
			
 
				-        "description": "",
			
 
				-        "open_id": "ou_1bca759ca8efc4870f262c97c1a05e52"
			
 
				-    },
			
 
				-    {
			
 
				-        "name": "杨孝辉",
			
 
				-        "description": "",
			
 
				-        "open_id": "ou_68709278795778df53519a577e3da486"
			
 
				-    },
			
 
				-    {
			
 
				-        "name": "刘志恒",
			
 
				-        "description": "",
			
 
				-        "open_id": "ou_1922d32126d44e1cdbe658e6c184f502"
			
 
				-    },
			
 
				-    {
			
 
				-        "name": "聂琦",
			
 
				-        "description": "",
			
 
				-        "open_id": "ou_3707d21dd00fa8753b9827214b834142"
			
 
				-    },
			
 
				-    {
			
 
				-        "name": "蒋德敏",
			
 
				-        "description": "",
			
 
				-        "open_id": "ou_f6a659e740ebd110cfe27dc38bbddb37"
			
 
				-    }
			
 
				+  {
			
 
				+    "name": "谭景玉",
			
 
				+    "description": "",
			
 
				+    "open_id": "ou_11fdbd559cc6513ab53ff06d6c63413d",
			
 
				+    "chat_id": "oc_56e85f0e2c97405d176729b62d8f56e5"
			
 
				+  },
			
 
				+  {
			
 
				+    "name": "王华东",
			
 
				+    "description": "",
			
 
				+    "open_id": "ou_82340312cf9d215f49a41b67fa9c02c2"
			
 
				+  },
			
 
				+  {
			
 
				+    "name": "孙若天",
			
 
				+    "description": "",
			
 
				+    "open_id": "ou_ede69f28c2617bf80a7574f059879c8d",
			
 
				+    "chat_id": "oc_98019f9a0419b46a215ca604b04c5cc6"
			
 
				+  },
			
 
				+  {
			
 
				+    "name": "刘斌",
			
 
				+    "description": "",
			
 
				+    "open_id": "ou_50c2307c3531e6293b3d5533d14592e9"
			
 
				+  },
			
 
				+  {
			
 
				+    "name": "关涛",
			
 
				+    "description": "",
			
 
				+    "open_id": "ou_90b80ed994fe41b7f038a63cb9182f72"
			
 
				+  },
			
 
				+  {
			
 
				+    "name": "刘龙",
			
 
				+    "description": "",
			
 
				+    "open_id": "ou_2d25b935d720c4404e4ea88b70bcdce2"
			
 
				+  },
			
 
				+  {
			
 
				+    "name": "马晗",
			
 
				+    "description": "",
			
 
				+    "open_id": "ou_405c6b8581ee36b153ff8159cfc9f29e"
			
 
				+  },
			
 
				+  {
			
 
				+    "name": "王雅萱",
			
 
				+    "description": "",
			
 
				+    "open_id": "ou_22b070f27496faae0c4d841b82eda5c1"
			
 
				+  },
			
 
				+  {
			
 
				+    "name": "苏朋",
			
 
				+    "description": "",
			
 
				+    "open_id": "ou_1bca759ca8efc4870f262c97c1a05e52"
			
 
				+  },
			
 
				+  {
			
 
				+    "name": "杨孝辉",
			
 
				+    "description": "",
			
 
				+    "open_id": "ou_68709278795778df53519a577e3da486"
			
 
				+  },
			
 
				+  {
			
 
				+    "name": "刘志恒",
			
 
				+    "description": "",
			
 
				+    "open_id": "ou_1922d32126d44e1cdbe658e6c184f502"
			
 
				+  },
			
 
				+  {
			
 
				+    "name": "聂琦",
			
 
				+    "description": "",
			
 
				+    "open_id": "ou_3707d21dd00fa8753b9827214b834142"
			
 
				+  },
			
 
				+  {
			
 
				+    "name": "蒋德敏",
			
 
				+    "description": "",
			
 
				+    "open_id": "ou_f6a659e740ebd110cfe27dc38bbddb37"
			
 
				+  }
			
 
				 ]
			
--- a/knowledge/skills/dimension_research.md
+++ b/knowledge/skills/dimension_research.md
@@ -2,29 +2,35 @@
 
				 
			
 
				 ## ⚠️ 关键规则（必须首先阅读）
			
 
				 
			
 
				-**在开始任何搜索前，必须理解：**
			
 
				+**在构造任何query前，必须通过以下检查：**
			
 
				 
			
 
				-1. **搜索目的**：寻找"如何提取特征"的方法，而不是寻找类似的图片内容
			
 
				-2. **Query构造**：必须包含[特征类型] + [提取动作] + [信息类型]
			
 
				-3. **严格禁止**：
			
 
				-   - ❌ 直接使用亮点描述作为搜索词
			
 
				-   - ❌ 只搜索内容关键词
			
 
				-   - ❌ 缺少"提取"、"检测"、"识别"等动作词的query
			
 
				+1. **Query中是否包含动作词？**
			
 
				+   - 必须包含：提取、检测、识别、分析、获取、生成、控制等
			
 
				+   - 如果没有动作词，这个query是错误的
			
 
				 
			
 
				-**错误示例**：如果亮点是"优雅的白裙写生少女"
			
 
				-- ❌ 错误：搜索"白裙少女写生"（直接使用亮点描述）
			
 
				-- ❌ 错误：搜索"写生少女"（只有内容关键词）
			
 
				-- ✅ 正确：搜索"人物姿态 提取 方法"（特征+提取+信息）
			
 
				-- ✅ 正确：搜索"服装形式 识别 工具"（特征+提取+信息）
			
 
				+2. **Query是否在搜索"如何做"而不是"是什么"？**
			
 
				+   - ✅ 正确：姿态提取方法、深度图生成工具
			
 
				+   - ❌ 错误：女性画家、户外写生、白色裙子
			
 
				 
			
 
				----
			
 
				+3. **Query是否会搜到技术内容？**
			
 
				+   - ✅ 正确：会搜到教程、工具、方法
			
 
				+   - ❌ 错误：会搜到图片、作品、内容
			
 
				+
			
 
				+**示例对比**：
			
 
				 
			
 
				-## 全局规则
			
 
				+| 错误Query（只有内容） | 正确Query（包含方法） |
			
 
				+|---------------------|---------------------|
			
 
				+| ❌ 女性画家 背影 | ✅ 人物姿态 提取方法 |
			
 
				+| ❌ 户外写生 空间 | ✅ 深度图 生成工具 |
			
 
				+| ❌ 白色裙子 | ✅ 服装分割 检测方法 |
			
 
				+| ❌ 画架 画板 | ✅ 物体识别 提取工具 |
			
 
				 
			
 
				-**重要**：本skill必须严格遵守主prompt中定义的全局规则，包括：
			
 
				-- 知识与推理体系（知识使用决策机制、知识来源标注）
			
 
				-- 评估与反馈机制（完整性、准确性、可逆性、可复用性评估）
			
 
				-- 可审计理由链（ACTION、WHY、EVIDENCE、NEXT）
			
 
				+**强制自检流程**：
			
 
				+```
			
 
				+构造query → 检查是否包含动作词 → 检查是否搜索方法 → 确认后搜索
			
 
				+           ↓ 没有动作词                ↓ 只搜内容
			
 
				+           重新构造                    重新构造
			
 
				+```
			
 
				 
			
 
				 ---
			
 
				 
			
@@ -35,18 +41,14 @@
 
				 **核心目的**：选择的特征维度将用于**生成式AI模型还原图片**。
			
 
				 
			
 
				 **关键原则**：
			
 
				-- 特征维度必须是生成模型可消费的控制信号（如ControlNet、IP-Adapter等）
			
 
				+- 特征维度必须是生成模型可消费的控制信号（生成模型包括但不限于stable diffusion、nano banana等模型）
			
 
				 - 根据图片维度的特点，选择能够有效控制生成过程的特征维度
			
 
				-- 特征维度应该能够指导模型重建该图片维度的视觉效果
			
 
				 - 优先选择在AI图像生成领域已被验证有效的控制方式
			
 
				 
			
 
				 **搜索重点**：
			
 
				 - 寻找创作者如何使用特定特征维度来控制AI生成图片
			
 
				 - 关注特征维度在生成模型中的实际应用案例
			
 
				 - 了解特征维度如何影响生成结果的视觉效果
			
 
				-- 验证特征维度是否能够准确还原目标图片维度
			
 
				-
			
 
				-通过案例研究和创作者经验，将Image Dimension转换为生成模型可使用的Control Signal。
			
 
				 
			
 
				 **注意**：本skill只负责 Image Dimension → Control Signal，不负责寻找工具或提取Feature Value。
			
 
				 
			
@@ -56,352 +58,149 @@
 
				 
			
 
				 ```json
			
 
				 {
			
 
				-  "highlight_id": "[亮点ID或序号]（可选）",
			
 
				-  "highlight_description": "[亮点简短描述]（可选）",
			
 
				-  "highlight_type": "[实质/形式/全局]",  // 必须明确标注亮点类型
			
 
				-  "global_features": [],  // 短词或短语，仅当亮点类型为"形式"或"全局"时填写
			
 
				-  "substances": [],       // 去重后，仅当亮点类型为"实质"时填写
			
 
				-  "forms": [],           // 去重后，仅当亮点类型为"实质"时填写（该实质的形式属性）
			
 
				-  "highlights": [],      // 高权重亮点简短描述（每条<=20字）
			
 
				-  "goal": "为该亮点寻找适合生成控制且可学习可复用的多模态特征维度"
			
 
				+  "highlight_id": "[亮点ID]（可选）",
			
 
				+  "highlight_description": "[亮点描述]（可选）",
			
 
				+  "highlight_type": "[实质/形式/全局]",
			
 
				+  "image_dimension": "[图片维度名称]",
			
 
				+  "image_dimension_description": "[图片维度描述]",
			
 
				+  "goal": "为该图片维度寻找适合的特征维度（Control Signals）"
			
 
				 }
			
 
				 ```
			
 
				 
			
 
				-**注意**：
			
 
				-- 如果提供了 `highlight_id` 和 `highlight_description`，则说明是为单个亮点进行研究
			
 
				-- 如果未提供，则说明是为整个图片组进行研究
			
 
				-- **highlight_type** 决定了维度提取的范围和边界
			
 
				-- 根据亮点类型，只填写相应的字段
			
 
				-
			
 
				 ---
			
 
				 
			
 
				 ## 输出格式
			
 
				 
			
 
				 **文件**：`knowledge/dimension_research_result.json`
			
 
				 
			
 
				-**结构**：
			
 
				 ```json
			
 
				 {
			
 
				-  "control_signal_candidates": [
			
 
				+  "image_dimension": "pose",
			
 
				+  "control_signals": [
			
 
				     {
			
 
				-      "image_dimension": "多模态维度",
			
 
				-      "level": "global / substance / form",
			
 
				-      "control_signal": "特征维度",
			
 
				-      "signal_type": "graph / ...",
			
 
				-      "representation": "json / ...",
			
 
				-      "output_format": "image / json",
			
 
				-      "format_reason": "选择该输出格式的理由",
			
 
				-      "reason": "选择的原因",
			
 
				-      "generation_usage": "特征维度在还原过程中应该被怎样使用",
			
 
				-      "evidence": [
			
 
				-        {
			
 
				-          "url": "...",
			
 
				-          "snippet": "..."
			
 
				-        }
			
 
				-      ]
			
 
				+      "name": "openpose_skeleton",
			
 
				+      "category": "form",
			
 
				+      "output_format": "image",
			
 
				+      "format_reason": "骨架图是标准的ControlNet输入格式",
			
 
				+      "generation_usage": "作为ControlNet的pose控制信号",
			
 
				+      "search_evidence": ["URL1", "URL2"],
			
 
				+      "reasoning": "为什么选择这个控制信号"
			
 
				     }
			
 
				   ]
			
 
				 }
			
 
				 ```
			
 
				 
			
 
				-**必须说明**：
			
 
				-- 所属层级（global / substance / form）
			
 
				-- 选择原因
			
 
				-- 表示方式
			
 
				-- **输出格式（image/json）及选择理由（必须明确指定）**：
			
 
				-  - image：特征可视化或标准化素材
			
 
				-    - 全局/形式：特征可视化（深度图、分割mask、骨架图、网格图、光照方向图等）
			
 
				-    - 实质：标准化素材（去除背景、光照、颜色等形式信息的纯素材）
			
 
				-  - json：参数/数值特征（比例、坐标、权重、描述性参数等）
			
 
				-  - **禁止**：保存原图或原图的裁剪/截图/抠图
			
 
				-  - **重要**：不是所有维度都是标签/分类，很多维度需要输出图像化的特征表示
			
 
				-- 在生成中的作用
			
 
				-- 原始证据
			
 
				-
			
 
				-**常见维度的输出格式参考**：
			
 
				-- 构图/布局类：通常用 image（网格图、引导线图、区域分布图）
			
 
				-- 光照类：通常用 image（光照方向图、轮廓光分布图）
			
 
				-- 深度/景深类：通常用 image（深度图、清晰度热力图）
			
 
				-- 姿态/骨架类：通常用 image（骨架图）
			
 
				-- 色彩类：可用 image（色带图）或 json（色值+权重）
			
 
				-- 标签/分类类：用 json（标签、权重、参数）
			
 
				-
			
 
				-**实质维度特殊说明**：
			
 
				-- **每个实质元素都是独立的维度**，分别指定 output_format: "image"
			
 
				-- 每个实质维度将使用nanobanana工具生成三视图（正面、侧面、背面）
			
 
				-- **风格要求**：生成的三视图风格必须与原图保持一致（如原图是照片风格，则生成照片级素材）
			
 
				-- **参考input目录中的示例**（如果有），理解三视图的正确形式
			
 
				-
			
 
				----
			
 
				-
			
 
				-## 搜索策略
			
 
				-
			
 
				-**执行要求**：
			
 
				-- 搜索前：列出初始知识库（输入特征、领域知识、**亮点类型**）和假设（基于输入特征的合理假设）
			
 
				-- 搜索中：每轮记录新知识（内容、来源、可靠性）和推理链（前提 → 逻辑 → 结论）
			
 
				-- 搜索后：进行评估，输出评估报告（包含决策：PASS/ADJUST/REDO）
			
 
				-
			
 
				-**维度边界原则（关键）**：
			
 
				-
			
 
				-根据 **highlight_type** 严格限制维度提取范围：
			
 
				-
			
 
				-**实质类亮点**：
			
 
				-- ✅ 只提取：该实质本身 + 该实质的形式属性
			
 
				-- ❌ 禁止提取：全局形式（深度图、整体构图等）
			
 
				-- ❌ 禁止提取：其他实质
			
 
				-- 示例：
			
 
				-  - 亮点："白裙写生少女"（实质）
			
 
				-  - 应提取：女性主体（实质）、白裙（实质）、绘画姿态（该实质的形式）
			
 
				-  - 不应提取：深度图（全局）、画架（其他实质）
			
 
				-
			
 
				-**形式类亮点**：
			
 
				-- ✅ 只提取：该形式维度本身
			
 
				-- ❌ 禁止提取：具体实质
			
 
				-- ❌ 禁止提取：其他形式维度
			
 
				-- 示例：
			
 
				-  - 亮点："户外写生空间层次"（形式）
			
 
				-  - 应提取：深度图（该形式）
			
 
				-  - 不应提取：人物、服装（实质）
			
 
				-
			
 
				-**全局类亮点**：
			
 
				-- ✅ 只提取：全局形式维度
			
 
				-- ❌ 禁止提取：具体实质
			
 
				-- 示例：
			
 
				-  - 亮点："整体构图"（全局）
			
 
				-  - 应提取：构图网格图（全局形式）
			
 
				-  - 不应提取：人物、服装（实质）
			
 
				-
			
 
				-**树状结构原则**：
			
 
				-每个亮点的维度应该互不重叠，除非亮点本身就是全局的。如果一个维度涉及多个亮点，应该归属到最相关的那个亮点。
			
 
				-
			
 
				-### 搜索目标
			
 
				-
			
 
				-**核心目标**：寻找如何使用特征维度通过生成式AI模型还原图片维度的视觉效果。
			
 
				-
			
 
				-**优先寻找**：
			
 
				-- 创作者如何使用某个特征维度（如深度图、姿态骨架、光照图等）作为控制信号
			
 
				-- 如何通过该特征维度指导AI生成模型（如Stable Diffusion + ControlNet）重建视觉效果
			
 
				-- 特征维度在生成过程中如何影响最终图片的该维度表现
			
 
				-
			
 
				-**必须基于真实案例**：
			
 
				-- 寻找创作者使用AI生成模型的实际案例和经验分享
			
 
				-- 寻找详细的生成流程和控制方法（如ControlNet使用、IP-Adapter配置等）
			
 
				-- 关注特征维度如何作为生成条件输入到模型中
			
 
				-- 不要凭空想象或理论推测
			
 
				-- 所有Control Signal的选择必须有搜索证据支持
			
 
				-
			
 
				-**避免**：
			
 
				-- 单纯的特征提取工具介绍（不涉及生成应用）
			
 
				-- 无生成流程说明的教程
			
 
				-- 纯理论讨论（没有实际生成案例）
			
 
				-
			
 
				-### 搜索重点
			
 
				+**输出格式说明**：
			
 
				+- image：特征可视化（深度图、mask、骨架图等）或标准化素材
			
 
				+- json：参数/数值特征（比例、坐标、权重等）
			
 
				 
			
 
				-- **AI生成案例**：创作者如何使用特征维度控制AI生成某种效果
			
 
				-- **生成流程**：从特征提取到生成的完整步骤
			
 
				-- **控制方法**：特征维度如何输入到生成模型（ControlNet、IP-Adapter、Lora等）
			
 
				-- **视觉控制效果**：特征维度对生成结果的具体影响
			
 
				-- **参数经验**：实际使用的模型参数、权重、调整经验
			
 
				-- **常见问题**：生成过程中的坑和解决方案
			
 
				-
			
 
				-**最终目标**：从真实AI生成案例中提炼可用于还原图片的控制信号
			
 
				+**常见维度参考**：
			
 
				+- 构图/布局/光照/深度/姿态 → image
			
 
				+- 色彩 → image或json
			
 
				+- 标签/分类/参数 → json
			
 
				 
			
 
				 ---
			
 
				 
			
 
				-## Query生成策略
			
 
				-
			
 
				-### 搜索平台限制
			
 
				-**重要**：所有搜索只在小红书平台进行，不使用其他平台。
			
 
				+## 工作流程
			
 
				 
			
 
				-### Query词要求
			
 
				+### 1. Query构造（关键）
			
 
				 
			
 
				-**核心原则**：搜索的目的是寻找"如何提取特征"的方法，而不是寻找类似的图片内容。
			
 
				+**⚠️ 搜索目的**：寻找"如何提取特征"的方法，而不是寻找类似的图片内容
			
 
				 
			
 
				-- **简短精炼**：每个query由3-5个词组成，保持语义完整
			
 
				-- **核心关键词**：直接使用核心概念，去除冗余修饰
			
 
				-- **语义完整**：确保query能够清晰表达搜索意图
			
 
				-- **必须包含提取意图**：query中必须包含"提取"、"检测"、"识别"、"分析"等动作词
			
 
				+**Query公式**：[特征类型] + [提取动作] + [信息类型]
			
 
				 
			
 
				 **严格禁止**：
			
 
				-- ❌ **禁止直接使用亮点描述作为搜索词**
			
 
				-- ❌ **禁止只搜索内容关键词**
			
 
				-- ❌ **禁止缺少提取意图的query**
			
 
				-
			
 
				-**Query构造模式**：
			
 
				-- ✅ [特征类型] + [提取动作] + [信息类型]
			
 
				-  - 特征类型：从亮点中提取的核心特征概念
			
 
				-  - 提取动作：提取、检测、识别、分析、获取等
			
 
				-  - 信息类型：方法、工具、教程、案例等
			
 
				+- ❌ 直接使用亮点描述作为搜索词
			
 
				+- ❌ 只搜索内容关键词
			
 
				+- ❌ 缺少"提取"、"检测"、"识别"等动作词
			
 
				 
			
 
				-**错误模式**：
			
 
				-- ❌ [亮点原文]（直接使用亮点描述）
			
 
				-- ❌ [内容关键词]（只有主题，没有提取意图）
			
 
				-- ❌ [特征类型] + [应用场景]（关注应用而非提取）
			
 
				-- ❌ 过短（少于3个词）或过长（超过8个词）
			
 
				+**自检问题**：
			
 
				+- 这个query是在搜索"如何提取特征"吗？
			
 
				+- 这个query包含提取动作词了吗？
			
 
				+- 这个query会搜到提取方法和工具吗？
			
 
				 
			
 
				-### Query迭代规则（关键要求）
			
 
				+**Query要求**：
			
 
				+- 简短（3-5词）
			
 
				+- 语义完整
			
 
				+- 包含提取意图
			
 
				 
			
 
				-**核心原则**：
			
 
				-- **递进关系**：每轮query要在上一轮基础上递进，从宽泛到具体
			
 
				-- **适可而止**：不要搜索太多轮，通常2-3轮足够
			
 
				-- **明确记录**：每轮必须记录query词、迭代原因、理由
			
 
				+**搜索平台**：只在小红书搜索，使用中文
			
 
				 
			
 
				-**迭代流程**：
			
 
				+### 2. 搜索迭代
			
 
				 
			
 
				 **第一轮（宽泛探索）**：
			
 
				-- **目标**：了解大方向，发现关键概念和提取方法
			
 
				-- **Query组成要求**：必须包含两类关键词
			
 
				-  - **主题关键词**：从亮点中提取的核心特征概念
			
 
				-  - **提取关键词**：与特征提取相关的动作词
			
 
				-- **Query特点**：3-5个词，语义完整，聚焦特征提取
			
 
				-- **Query模式**：[特征类型] + [提取动作] + [信息类型]
			
 
				-- **记录要求**：
			
 
				-  - 使用的query词列表（2-5个query）
			
 
				-  - 搜索到的关键信息摘要
			
 
				-  - 发现的专业术语或工具名称
			
 
				-  - 下一轮的方向判断
			
 
				+- 目标：了解大方向，发现关键概念
			
 
				+- Query：[特征类型] + [提取动作] + [信息类型]
			
 
				+- 记录：query词、关键信息、专业术语
			
 
				 
			
 
				 **第二轮（聚焦细化）**：
			
 
				-- **目标**：基于第一轮发现的关键词，聚焦到具体方法
			
 
				-- **Query特点**：使用第一轮发现的专业术语（3-5个词，语义完整）
			
 
				-- **递进逻辑**：从"是什么"到"怎么做"
			
 
				-- **Query模式**：[第一轮发现的术语/工具] + [使用/应用] + [教程/案例]
			
 
				-- **记录要求**：
			
 
				-  - 使用的query词列表（2-5个query）
			
 
				-  - 为什么选择这些query（基于第一轮的哪些发现）
			
 
				-  - 搜索到的具体案例和方法
			
 
				-  - 是否需要第三轮（通常不需要）
			
 
				+- 目标：基于第一轮发现，聚焦具体方法
			
 
				+- Query：[第一轮术语/工具] + [使用/应用] + [教程/案例]
			
 
				+- 记录：query词、选择理由、具体案例
			
 
				 
			
 
				 **第三轮（可选，验证补充）**：
			
 
				-- **目标**：验证具体细节或补充遗漏信息
			
 
				-- **Query特点**：针对性很强的具体问题（3-5个词，语义完整）
			
 
				-- **递进逻辑**：从"怎么做"到"效果如何"或"参数设置"
			
 
				-- **Query模式**：[工具/方法] + [效果/参数/对比] + [评测/设置]
			
 
				-- **记录要求**：
			
 
				-  - 使用的query词列表（1-3个query）
			
 
				-  - 为什么需要第三轮（第二轮哪些信息不足）
			
 
				-  - 补充的信息
			
 
				+- 目标：验证细节或补充信息
			
 
				+- Query：[工具/方法] + [效果/参数] + [评测/设置]
			
 
				 
			
 
				 **停止条件**（满足任一即停止）：
			
 
				 - 找到3-5个真实案例支持某个Control Signal
			
 
				 - 能够清晰描述该Control Signal的使用方法
			
 
				-- 搜索结果开始重复，没有新信息
			
 
				+- 搜索结果开始重复
			
 
				 - 已完成2-3轮搜索
			
 
				 
			
 
				-**禁止行为**：
			
 
				-- ❌ 只搜索一轮就结束（至少2轮）
			
 
				-- ❌ 搜索超过4轮（适可而止）
			
 
				-- ❌ Query词过长（超过15个字）
			
 
				-- ❌ Query词过短（少于3个词，语义不完整）
			
 
				-- ❌ 没有记录迭代原因和理由
			
 
				-- ❌ 迭代没有递进关系（重复搜索相同内容）
			
 
				-
			
 
				----
			
 
				-
			
 
				-## 搜索循环
			
 
				-
			
 
				-```
			
 
				-第一轮：宽泛探索（核心概念词）
			
 
				-↓
			
 
				-记录发现的关键词和术语
			
 
				-↓
			
 
				-第二轮：聚焦细化（专业术语+具体方法）
			
 
				-↓
			
 
				-记录具体案例和方法
			
 
				-↓
			
 
				-评估：是否足够？
			
 
				-├─ 是 → 提炼Control Signal
			
 
				-└─ 否 → 第三轮：验证补充（针对性问题）
			
 
				-```
			
 
				-
			
 
				----
			
 
				-
			
 
				-## 评估标准
			
 
				+### 3. 维度边界控制
			
 
				 
			
 
				-搜索完成后，对每个候选维度评估：
			
 
				+根据**highlight_type**严格限制提取范围：
			
 
				 
			
 
				-**必须满足**：
			
 
				-- 可用于生成模型控制
			
 
				-- 可独立修改
			
 
				-- 不包含原始像素
			
 
				-- 可用于学习和复用
			
 
				-- 不与原图高度相似
			
 
				-
			
 
				-**避免**：
			
 
				-- 与原图高度相似的特征
			
 
				-- 无法泛化的特征
			
 
				+**实质类亮点**：
			
 
				+- ✅ 提取：该实质本身 + 该实质的形式属性
			
 
				+- ❌ 禁止：全局形式、其他实质
			
 
				 
			
 
				----
			
 
				+**形式类亮点**：
			
 
				+- ✅ 提取：该形式维度本身
			
 
				+- ❌ 禁止：具体实质、其他形式维度
			
 
				 
			
 
				-## 研究文档要求
			
 
				-
			
 
				-搜索完成后，必须生成研究记录，说明每个维度如何被发现并确定。
			
 
				-
			
 
				-### 必须包含
			
 
				-
			
 
				-**0. 知识库与假设**
			
 
				-- **初始知识库**：列出从输入获得的所有初始知识
			
 
				-- **假设列表**：列出所有假设及其依据
			
 
				-- **推理起点**：说明从哪些知识和假设开始推理
			
 
				-
			
 
				-**1. Image Dimension原始信息**
			
 
				-- 说明该维度来自图片的哪个方面
			
 
				-- 标明来源：global feature / substance / form / highlight
			
 
				-- 记录制作表或亮点中的来源路径
			
 
				-
			
 
				-**2. Initial Hypothesis**
			
 
				-- 说明该维度最初的理解或假设
			
 
				-- 图片的这个方面可能由哪些视觉变量控制
			
 
				-
			
 
				-**3. Query Iteration（关键部分）**
			
 
				-记录query的完整迭代过程，每一轮必须包含：
			
 
				-- **Round N Query**：本轮使用的具体query词列表（每个query 3-5个词，语义完整）
			
 
				-- **Iteration Reason**：为什么进行本轮搜索（基于上一轮的哪些发现或不足）
			
 
				-- **Progressive Logic**：本轮相比上一轮的递进关系（从宽泛到具体，从概念到方法）
			
 
				-- **Search Results**：搜索到的关键内容摘要（案例、方法、关键词）
			
 
				-- **Key Findings**：本轮的关键发现
			
 
				-- **New Keywords**：从结果中提取的新关键词或专业术语
			
 
				-- **New Knowledge**：本轮获得的知识（内容、来源URL、可靠性说明）
			
 
				-- **Reasoning**：基于新知识的推理（前提 → 推理逻辑 → 结论）
			
 
				-- **Next Direction**：下一轮的方向（如果需要）或停止原因
			
 
				-
			
 
				-要求：
			
 
				-- 至少记录2轮迭代，最多3-4轮
			
 
				-- 每轮都要明确说明迭代原因和递进逻辑
			
 
				-- Query词必须3-5个词，保持语义完整
			
 
				-- 必须体现从宽泛到具体的递进关系
			
 
				-
			
 
				-**4. Evidence（必须基于真实案例）**
			
 
				-记录关键搜索案例，必须包含：
			
 
				-- **URL**：案例来源链接
			
 
				-- **Case Description**：案例简要说明（谁做的、做了什么）
			
 
				-- **Method Used**：案例中使用的具体方法和控制变量
			
 
				-- **Parameters**：案例中提到的参数或设置
			
 
				-- **Key Insight**：从案例中得到的关键结论
			
 
				-- **Knowledge Category**：标注这是什么类型的知识（方法、工具、参数经验等）
			
 
				-
			
 
				-要求：至少记录3-5个真实案例，案例必须是实际创作经验，必须包含具体的方法和参数。
			
 
				-
			
 
				-**5. Control Signal Decision（必须基于搜索证据）**
			
 
				-说明最终选择的控制信号：
			
 
				-- **Image Dimension → Control Signal**：维度转换
			
 
				-- **Evidence-Based Reasoning**：基于哪些搜索案例做出的决策
			
 
				-  - **前提**：引用具体的案例编号（Case 1, Case 2...）和知识库条目
			
 
				-  - **推理逻辑**：说明这些案例如何支持该Control Signal
			
 
				-  - **边界检查**：确认该Control Signal只服务于当前亮点，不越界到其他亮点
			
 
				-  - **结论**：选择该Control Signal的理由
			
 
				-- **How It Works**：该信号如何控制视觉效果（基于案例中的方法）
			
 
				-- **Generation Usage**：该信号如何用于生成模型（基于案例中的实践）
			
 
				-- **输出格式（image/json）及选择理由**：基于案例中的使用方式
			
 
				-- 如果是实质维度，说明三视图提取策略（基于搜索到的方法）
			
 
				-
			
 
				-禁止：凭空想象Control Signal、没有案例支持的决策、理论推测而非实践经验、缺少推理链、**选择了不属于当前亮点的维度**。
			
 
				-
			
 
				-**6. Rejected Alternatives**
			
 
				-记录被否决的方案并说明原因：与原图过于相似、无法泛化、无法提取、不是抽象的可复用特征、缺少搜索证据支持。
			
 
				-
			
 
				-**7. 评估报告**
			
 
				-在输出JSON中添加评估报告（格式见"全局规则遵守"部分），包含：完整性、准确性、可逆性、可复用性评估，发现的问题，决策（PASS/ADJUST/REDO）及理由。
			
 
				+**全局类亮点**：
			
 
				+- ✅ 提取：全局形式维度
			
 
				+- ❌ 禁止：具体实质
			
 
				+
			
 
				+### 4. 分析搜索结果
			
 
				+
			
 
				+从搜索结果中提取：
			
 
				+- 创作者使用的控制信号类型
			
 
				+- 控制信号在生成中的作用
			
 
				+- 控制信号的输出格式（image/json）
			
 
				+- 实际应用案例和效果
			
 
				+
			
 
				+### 5. 提炼控制信号
			
 
				+
			
 
				+**分解原则**：
			
 
				+- 实质类 → 实质本身 + 形式属性（多个）
			
 
				+- 形式类 → 该形式表示（1个）
			
 
				+- 全局类 → 全局特征（1个或少数）
			
 
				+
			
 
				+**推理要求**：
			
 
				+- 列出搜索得到的知识
			
 
				+- 说明为什么需要这些特征维度
			
 
				+- 边界检查（只服务于当前图片维度）
			
 
				+- 得出特征维度列表
			
 
				+
			
 
				+### 6. 输出结果
			
 
				+
			
 
				+每个控制信号必须包含：
			
 
				+- name（snake_case）
			
 
				+- category（global/substance/form）
			
 
				+- output_format（image/json）
			
 
				+- format_reason（选择该格式的理由）
			
 
				+- generation_usage（在还原时如何使用）
			
 
				+- search_evidence（支持的URL）
			
 
				+- reasoning（选择理由，基于搜索案例）
			
 
				+
			
 
				+**禁止**：
			
 
				+- 凭空想象Control Signal
			
 
				+- 没有案例支持的决策
			
 
				+- 理论推测而非实践经验
			
 
				+- 选择不属于当前亮点的维度
			
 
				 
			
 
				 ---
			
 
				 
			
@@ -411,18 +210,3 @@
 
				 - 为什么这种效果成立
			
 
				 - 如何实现
			
 
				 - 哪些因素控制
			
 
				-
			
 
				----
			
 
				-
			
 
				-## 搜索语言策略
			
 
				-
			
 
				-### 搜索平台
			
 
				-**唯一平台**：小红书
			
 
				-
			
 
				-所有搜索只在小红书平台进行，不使用其他平台（知乎、B站、GitHub、论文等）。
			
 
				-
			
 
				-### 搜索语言
			
 
				-使用中文进行搜索。
			
 
				-
			
 
				-### 禁止行为
			
 
				-**禁止**：使用小红书以外的平台进行搜索
			
--- a/knowledge/skills/tool_research.md
+++ b/knowledge/skills/tool_research.md
@@ -2,29 +2,35 @@
 
				 
			
 
				 ## ⚠️ 关键规则（必须首先阅读）
			
 
				 
			
 
				-**在开始任何搜索前，必须理解：**
			
 
				+**在构造任何query前，必须通过以下检查：**
			
 
				 
			
 
				-1. **搜索目的**：寻找"提取工具"，而不是寻找类似的图片内容
			
 
				-2. **Query构造**：必须包含[特征维度] + [提取动作] + [工具/方法]
			
 
				-3. **严格禁止**：
			
 
				-   - ❌ 直接使用亮点描述作为搜索词
			
 
				-   - ❌ 只搜索内容关键词
			
 
				-   - ❌ 缺少"工具"、"方法"、"提取"等词的query
			
 
				+1. **Query中是否包含"工具"或"方法"？**
			
 
				+   - 必须包含：工具、方法、软件、插件、模型、API等
			
 
				+   - 如果没有这些词，这个query是错误的
			
 
				 
			
 
				-**错误示例**：如果需要提取"人物姿态"特征
			
 
				-- ❌ 错误：搜索"白裙少女"（使用内容关键词）
			
 
				-- ❌ 错误：搜索"人物姿态"（只有特征名，没有工具意图）
			
 
				-- ✅ 正确：搜索"姿态 提取 工具"（特征+提取+工具）
			
 
				-- ✅ 正确：搜索"骨架 检测 方法"（特征+提取+方法）
			
 
				+2. **Query是否在搜索"用什么工具"而不是"是什么内容"？**
			
 
				+   - ✅ 正确：姿态检测工具、深度提取方法
			
 
				+   - ❌ 错误：女性画家、户外写生、白色裙子
			
 
				 
			
 
				----
			
 
				+3. **Query是否会搜到工具推荐？**
			
 
				+   - ✅ 正确：会搜到工具名称、使用教程
			
 
				+   - ❌ 错误：会搜到图片、作品、内容
			
 
				 
			
 
				-## 全局规则
			
 
				+**示例对比**：
			
 
				 
			
 
				-**重要**：本skill必须严格遵守主prompt中定义的全局规则，包括：
			
 
				-- 知识与推理体系（知识使用决策机制、知识来源标注）
			
 
				-- 评估与反馈机制（完整性、准确性、可用性、可靠性评估）
			
 
				-- 可审计理由链（ACTION、WHY、EVIDENCE、NEXT）
			
 
				+| 错误Query（只有内容） | 正确Query（包含工具） |
			
 
				+|---------------------|---------------------|
			
 
				+| ❌ 女性画家 姿态 | ✅ 姿态检测 工具推荐 |
			
 
				+| ❌ 户外 深度 | ✅ 深度图提取 方法 |
			
 
				+| ❌ 白色裙子 | ✅ 服装分割 工具 |
			
 
				+| ❌ 画架 识别 | ✅ 物体检测 模型推荐 |
			
 
				+
			
 
				+**强制自检流程**：
			
 
				+```
			
 
				+构造query → 检查是否包含"工具/方法" → 检查是否搜索工具 → 确认后搜索
			
 
				+           ↓ 没有工具/方法                ↓ 只搜内容
			
 
				+           重新构造                        重新构造
			
 
				+```
			
 
				 
			
 
				 ---
			
 
				 
			
@@ -42,26 +48,24 @@
 
				 
			
 
				 ```json
			
 
				 {
			
 
				-  "highlight_id": "[亮点ID或序号]（可选）",
			
 
				-  "highlight_type": "[实质/形式/全局]",  // 亮点类型，用于理解维度边界
			
 
				+  "highlight_id": "[亮点ID]（可选）",
			
 
				+  "highlight_type": "[实质/形式/全局]",
			
 
				   "dimensions": [
			
 
				     {
			
 
				-      "name": "pose",  // 维度名称（snake_case）
			
 
				-      "category": "form",  // global / substance / form
			
 
				-      "output_format": "image",  // image / json
			
 
				-      "belongs_to_highlight": true  // 该维度是否属于当前亮点
			
 
				+      "name": "pose",
			
 
				+      "category": "form",
			
 
				+      "output_format": "image",
			
 
				+      "belongs_to_highlight": true
			
 
				     }
			
 
				   ]
			
 
				 }
			
 
				 ```
			
 
				 
			
 
				 **注意**：
			
 
				-- dimensions实际上表示Control Signals，而不是Image Dimensions
			
 
				+- dimensions实际上表示Control Signals
			
 
				 - 需要知道每个维度的category和output_format，以便选择合适的工具
			
 
				-- 如果提供了 `highlight_id`，则说明是为单个亮点寻找工具
			
 
				-- 如果未提供，则说明是为整个图片组寻找工具
			
 
				-- **highlight_type** 帮助理解维度的边界和范围
			
 
				-- **belongs_to_highlight** 标识该维度是否属于当前亮点（用于验证维度边界）
			
 
				+- highlight_type帮助理解维度的边界和范围
			
 
				+- belongs_to_highlight标识该维度是否属于当前亮点
			
 
				 
			
 
				 ---
			
 
				 
			
@@ -69,7 +73,6 @@
 
				 
			
 
				 **文件**：`knowledge/tool_research_result.json`
			
 
				 
			
 
				-**结构**：
			
 
				 ```json
			
 
				 {
			
 
				   "tools": [
			
@@ -79,221 +82,109 @@
 
				       "output_format": "image",
			
 
				       "tool_name": "OpenPose",
			
 
				       "type": "model",
			
 
				-      "input": "image",
			
 
				-      "output": "skeleton keypoints",
			
 
				-      "api": true,
			
 
				-      "reason": "广泛用于人体姿态检测"
			
 
				+      "availability": "ComfyUI节点",
			
 
				+      "usage": "使用方法描述",
			
 
				+      "parameters": "关键参数说明",
			
 
				+      "search_evidence": ["URL1", "URL2"],
			
 
				+      "reasoning": "为什么选择这个工具"
			
 
				     }
			
 
				   ]
			
 
				 }
			
 
				 ```
			
 
				 
			
 
				-**实质维度特殊说明**：
			
 
				-- 实质维度（category: "substance"）使用nanobanana工具生成三视图
			
 
				-- **核心需求**：为每个实质元素生成三个视角的完整实体素材
			
 
				-- **风格要求**：生成的三视图风格必须与原图保持一致（如原图是照片风格，则生成照片级素材）
			
 
				-- **最终交付物是.png图片文件**，不是规范文档或json
			
 
				-- **参考input目录中的示例**（如果有），理解三视图的正确形式
			
 
				-
			
 
				 ---
			
 
				 
			
 
				-## 搜索策略
			
 
				+## 工作流程
			
 
				 
			
 
				-**搜索平台限制**：
			
 
				-- **唯一平台**：小红书
			
 
				-- 所有搜索只在小红书平台进行，不使用其他平台
			
 
				+### 1. Query构造（关键）
			
 
				 
			
 
				-**Query词要求**：
			
 
				+**⚠️ 搜索目的**：寻找"提取工具"，而不是寻找类似的图片内容
			
 
				 
			
 
				-**核心原则**：搜索的目的是寻找"提取工具"，而不是寻找类似的图片内容。
			
 
				-
			
 
				-- **简短精炼**：每个query由3-5个词组成，保持语义完整
			
 
				-- **核心关键词**：直接使用核心概念，去除冗余修饰
			
 
				-- **语义完整**：确保query能够清晰表达搜索意图
			
 
				-- **必须包含工具意图**：query中必须包含"工具"、"方法"、"提取"、"检测"等词
			
 
				+**Query公式**：[特征维度] + [提取动作] + [工具/方法]
			
 
				 
			
 
				 **严格禁止**：
			
 
				-- ❌ **禁止直接使用亮点描述作为搜索词**
			
 
				-- ❌ **禁止只搜索内容关键词**
			
 
				-- ❌ **禁止缺少工具/方法意图的query**
			
 
				-
			
 
				-**Query构造模式**：
			
 
				-- ✅ [特征维度] + [提取动作] + [工具/方法]
			
 
				-  - 特征维度：需要提取的特征类型
			
 
				-  - 提取动作：提取、检测、识别、生成、去除等
			
 
				-  - 工具/方法：工具、方法、推荐、教程等
			
 
				-
			
 
				-**错误模式**：
			
 
				-- ❌ [亮点原文]（直接使用亮点描述）
			
 
				-- ❌ [特征维度]（只有主题，没有工具意图）
			
 
				-- ❌ [特征维度] + [应用场景]（关注应用而非工具）
			
 
				-- ❌ 过短（少于3个词）或过长（超过8个词）
			
 
				-
			
 
				-**执行要求**：
			
 
				-- 搜索前：列出初始知识库（维度列表、类别、格式、**亮点类型**）和假设（基于维度类型的工具假设）
			
 
				-- 搜索中：每轮记录新知识（工具信息、使用案例、来源URL、可靠性）和推理链（前提 → 逻辑 → 结论）
			
 
				-- 搜索后：进行评估，输出评估报告（包含决策：PASS/ADJUST/REDO）
			
 
				-
			
 
				-**重要原则**：
			
 
				-- **必须基于真实案例和创作者经验**
			
 
				-- **搜索轮次限制**：通常2-3轮足够，不要超过4轮
			
 
				-- **每轮搜索都要记录结果**，并根据结果优化下一轮Query
			
 
				-- **工具选择必须有搜索证据支持**，不能凭空想象
			
 
				-- **工具必须服务于当前亮点的维度**，不要为其他亮点的维度寻找工具
			
 
				-
			
 
				-**维度边界检查**：
			
 
				-- 确认每个维度都属于当前亮点（检查 `belongs_to_highlight` 标识）
			
 
				-- 如果发现维度不属于当前亮点，应该标记并跳过
			
 
				-- 工具选择时要考虑维度的边界和范围
			
 
				-
			
 
				----
			
 
				-
			
 
				-### 搜索迭代流程
			
 
				-
			
 
				-**第一轮（工具发现）**：
			
 
				-- **目标**：发现能够提取指定特征的工具或方法
			
 
				-- **Query组成要求**：必须包含两类关键词
			
 
				-  - **主题关键词**：与特征维度相关
			
 
				-  - **提取关键词**：与特征提取相关的动作词
			
 
				-- **Query特点**：3-5个词，语义完整，聚焦工具发现
			
 
				-- **Query模式**：[特征维度] + [提取动作] + [工具/方法]
			
 
				-- **记录要求**：
			
 
				-  - 使用的query词列表（2-5个query）
			
 
				-  - 发现的工具名称列表
			
 
				-  - 创作者提到的使用经验摘要
			
 
				-  - 下一轮的方向判断
			
 
				-
			
 
				-**第二轮（工具验证）**：
			
 
				-- **目标**：验证工具的可用性和效果
			
 
				-- **Query特点**：使用工具名称+使用/效果（3-5个词，语义完整）
			
 
				-- **递进逻辑**：从"有什么工具"到"工具怎么样"
			
 
				-- **Query模式**：[第一轮发现的工具名] + [效果/使用] + [评测/教程]
			
 
				-- **记录要求**：
			
 
				-  - 使用的query词列表（2-5个query）
			
 
				-  - 为什么选择这些query（基于第一轮的哪些发现）
			
 
				-  - 工具的实际使用案例和效果评价
			
 
				-  - 是否需要第三轮
			
 
				-
			
 
				-**第三轮（可选，对比选择）**：
			
 
				-- **目标**：对比多个工具，选择最优
			
 
				-- **Query特点**：工具对比或参数细节（3-5个词，语义完整）
			
 
				-- **Query模式**：[工具A] [工具B] + [对比] 或 [工具名] + [参数] + [设置]
			
 
				-- **记录要求**：
			
 
				-  - 使用的query词列表（1-3个query）
			
 
				-  - 为什么需要第三轮
			
 
				-  - 对比结果和最终选择
			
 
				-
			
 
				-**停止条件**（满足任一即停止）：
			
 
				-- 找到2-3个可用的候选工具
			
 
				-- 能够明确推荐最合适的工具
			
 
				-- 搜索结果开始重复
			
 
				-- 已完成2-3轮搜索
			
 
				+- ❌ 直接使用亮点描述作为搜索词
			
 
				+- ❌ 只搜索内容关键词
			
 
				+- ❌ 缺少"工具"、"方法"、"提取"等词
			
 
				 
			
 
				-**禁止行为**：
			
 
				-- ❌ 只搜索一轮就结束
			
 
				-- ❌ 搜索超过4轮
			
 
				-- ❌ Query词过长（超过15个字）
			
 
				-- ❌ Query词过短（少于3个词，语义不完整）
			
 
				-- ❌ 没有记录迭代原因和理由
			
 
				-- ❌ 使用小红书以外的平台
			
 
				----
			
 
				+**自检问题**：
			
 
				+- 这个query是在搜索"提取工具"吗？
			
 
				+- 这个query包含工具/方法相关的词了吗？
			
 
				+- 这个query会搜到工具推荐和使用方法吗？
			
 
				 
			
 
				-## 工具选择标准
			
 
				-
			
 
				-### 必须满足
			
 
				-- 支持图像输入
			
 
				-- 输出结构符合维度需求
			
 
				-- 支持API或代码调用
			
 
				-- 可用于批量处理
			
 
				-- **输出特征不是原图的复制**：
			
 
				-  - 工具应该提取抽象的、可复用的特征
			
 
				-  - 不是简单的裁剪、抠图、区域提取
			
 
				-  - 输出应该是特征可视化或标准化素材
			
 
				-- **工具必须可用**：
			
 
				-  - 优先选择你可以直接使用的工具
			
 
				-  - 包括已有的工具、在线服务、API等
			
 
				-  - 不能只推荐工具而不执行
			
 
				-
			
 
				-### 优先选择
			
 
				-- 在小红书上有真实使用案例的工具
			
 
				-- 创作者评价好的工具
			
 
				-- 近期更新的工具
			
 
				+**Query要求**：
			
 
				+- 简短（3-5词）
			
 
				+- 语义完整
			
 
				+- 包含工具/方法意图
			
 
				 
			
 
				----
			
 
				+**搜索平台**：只在小红书搜索，使用中文
			
 
				 
			
 
				-## 验证要求
			
 
				+### 2. 搜索迭代
			
 
				 
			
 
				-工具选择后需要验证，例如：
			
 
				-- pose：骨架结构是否符合人体姿态
			
 
				-- palette：提取颜色是否接近原图
			
 
				-- texture：纹理是否符合视觉观察
			
 
				+**第一轮（工具发现）**：
			
 
				+- 目标：发现可用的工具
			
 
				+- Query：[特征维度] + [提取/检测] + [工具/方法]
			
 
				+- 记录：工具名称、工具类型、可用性
			
 
				 
			
 
				----
			
 
				+**第二轮（使用方法）**：
			
 
				+- 目标：了解工具的使用方法和效果
			
 
				+- Query：[工具名称] + [使用/教程] + [案例/效果]
			
 
				+- 记录：使用方法、参数设置、实际效果
			
 
				 
			
 
				-## 停止条件
			
 
				+**第三轮（可选，对比评估）**：
			
 
				+- 目标：对比多个工具，选择最优
			
 
				+- Query：[工具A] vs [工具B] + [对比/评测]
			
 
				 
			
 
				-当每个维度找到**2-3个候选工具**，并且：
			
 
				-- 有真实案例支持工具的有效性
			
 
				-- 了解工具的实际使用效果和限制
			
 
				-- 能够基于搜索证据做出工具选择决策
			
 
				+**停止条件**（满足任一即停止）：
			
 
				+- 找到2-3个可用工具及其使用方法
			
 
				+- 能够清晰描述工具的使用流程
			
 
				+- 搜索结果开始重复
			
 
				 - 已完成2-3轮搜索
			
 
				 
			
 
				-**禁止**：
			
 
				-- ❌ 只搜索一轮就结束
			
 
				-- ❌ 搜索超过4轮
			
 
				-- ❌ 没有找到实际使用案例
			
 
				-- ❌ 凭空推测工具效果
			
 
				-
			
 
				----
			
 
				+### 3. 工具评估
			
 
				+
			
 
				+**评估标准**：
			
 
				+- 在小红书上有真实使用案例
			
 
				+- 创作者评价好
			
 
				+- 工具可用性强（优先已有工具、在线服务、API）
			
 
				+- 提取效果符合需求
			
 
				+
			
 
				+**工具类型**：
			
 
				+- model：AI模型（如OpenPose、DepthAnything）
			
 
				+- api：在线API服务
			
 
				+- software：软件工具
			
 
				+- plugin：插件（如ComfyUI节点、Photoshop插件）
			
 
				+
			
 
				+### 4. 工具选择
			
 
				+
			
 
				+**推理过程**：
			
 
				+- 列出搜索得到的工具和案例
			
 
				+- 对每个维度：
			
 
				+  - 前提：引用搜索得到的工具信息和使用案例
			
 
				+  - 推理逻辑：说明为什么选择这个工具
			
 
				+  - 结论：选择工具名称
			
 
				+
			
 
				+**选择建议**：优先选择在小红书上有真实案例、评价好、可直接使用的工具
			
 
				+
			
 
				+### 5. 输出结果
			
 
				+
			
 
				+每个工具必须包含：
			
 
				+- dimension（维度名称）
			
 
				+- category（global/substance/form）
			
 
				+- output_format（image/json）
			
 
				+- tool_name（工具名称）
			
 
				+- type（model/api/software/plugin）
			
 
				+- availability（可用性说明）
			
 
				+- usage（使用方法）
			
 
				+- parameters（关键参数）
			
 
				+- search_evidence（支持的URL）
			
 
				+- reasoning（选择理由，基于搜索案例）
			
 
				 
			
 
				-## 研究文档要求
			
 
				-
			
 
				-**必须记录完整的搜索过程**：
			
 
				-
			
 
				-### 0. 知识库与假设
			
 
				-- **初始知识库**：列出从输入获得的所有初始知识（维度列表、类别、格式等）
			
 
				-- **假设列表**：列出所有假设及其依据（如"pose维度需要骨架提取工具"）
			
 
				-- **推理起点**：说明从哪些知识和假设开始搜索
			
 
				-
			
 
				-### 1. Query迭代记录
			
 
				-每个维度都要记录完整的迭代过程，每一轮必须包含：
			
 
				-- **Round N**：迭代轮次
			
 
				-- **Query**：本轮使用的具体query词列表（每个query 3-5个词，语义完整）
			
 
				-- **Iteration Reason**：为什么进行本轮搜索（基于上一轮的哪些发现或不足）
			
 
				-- **Progressive Logic**：本轮相比上一轮的递进关系
			
 
				-- **Search Results**：搜索结果摘要（发现的工具名称、基本信息、使用案例）
			
 
				-- **New Knowledge**：本轮获得的知识（工具信息、使用方法、来源URL、可靠性说明）
			
 
				-- **Reasoning**：基于新知识的推理（前提 → 推理逻辑 → 结论）
			
 
				-- **Next Direction**：下一轮的优化方向或停止原因
			
 
				-
			
 
				-要求：每个维度至少记录2轮迭代，最多3-4轮，每轮都要有明确的搜索结果、新知识和推理过程。
			
 
				-
			
 
				-### 2. 工具案例记录
			
 
				-每个候选工具都要记录：
			
 
				-- **Tool Name**：工具名称
			
 
				-- **Source**：发现来源（URL）
			
 
				-- **Use Cases**：找到的实际使用案例（至少1-2个，包含案例描述、使用者评价、实际效果）
			
 
				-- **Capabilities**：工具能力（输入格式、输出格式、支持的功能，基于文档和案例）
			
 
				-- **Limitations**：工具限制（基于用户反馈）
			
 
				-- **Availability**：工具可用性（开源/商业、API支持、安装难度）
			
 
				-- **Recency**：更新情况（最后更新时间、是否活跃维护）
			
 
				-- **Selection Reason**：选择或不选择的理由，必须包含推理过程（前提 → 推理逻辑 → 结论）
			
 
				-
			
 
				-### 3. 最终决策
			
 
				-说明为每个维度选择的工具：
			
 
				-- **Dimension → Tool**：维度与工具的对应
			
 
				-- **Evidence-Based Reasoning**：基于哪些搜索案例做出的决策
			
 
				-  - **前提**：引用具体的案例、评测、用户反馈
			
 
				-  - **推理逻辑**：说明为什么选择这个工具而不是其他工具
			
 
				-  - **边界检查**：确认该工具只服务于当前亮点的维度
			
 
				-  - **结论**：最终选择及理由
			
 
				-- **Why This Tool**：为什么选择这个工具（基于案例的证据、与其他工具的对比优势、符合需求的具体特性）
			
 
				-- **Why Not Others**：为什么不选择其他候选工具（基于搜索证据的理由、具体的限制或不足）
			
 
				-
			
 
				-禁止：凭空推测工具效果、没有实际使用案例支持的工具选择、缺少推理链、选择无法验证可用性的工具、**为不属于当前亮点的维度选择工具**。
			
 
				-
			
 
				-### 4. 评估报告
			
 
				-在输出JSON中添加评估报告（格式见"全局规则遵守"部分），包含：完整性、准确性、可用性、可靠性评估，发现的问题，决策（PASS/ADJUST/REDO）及理由。
			
 
				+**禁止**：
			
 
				+- 凭空推测工具效果
			
 
				+- 没有实际使用案例支持的工具选择
			
 
				+- 选择无法验证可用性的工具
			
 
				+- 为不属于当前亮点的维度选择工具
			
 
				 
			
 
				 ---
			
 
				 
			
@@ -302,18 +193,3 @@
 
				 **工具必须服务于维度**。
			
 
				 
			
 
				 **维度设计优先**。
			
 
				-
			
 
				----
			
 
				-
			
 
				-## 搜索语言策略
			
 
				-
			
 
				-### 搜索平台
			
 
				-**唯一平台**：小红书
			
 
				-
			
 
				-所有搜索只在小红书平台进行，不使用其他平台（知乎、B站、GitHub、论文等）。
			
 
				-
			
 
				-### 搜索语言
			
 
				-使用中文进行搜索。
			
 
				-
			
 
				-### 禁止行为
			
 
				-**禁止**：使用小红书以外的平台进行搜索
			
--- a/knowledge/test.prompt
+++ b/knowledge/test.prompt
@@ -8,223 +8,40 @@ thinking_budget_tokens: 3000
 
				 $system$
			
 
				 你是面向可逆特征建模的多模态分析专家。核心目标：构建可逆的多模态特征空间，使生成模型能够基于特征重建原始图片。
			
 
				 
			
 
				-## 搜索工具策略（Search Tool Strategy）
			
 
				-
			
 
				-### 工具选择与降级
			
 
				-
			
 
				-**工具优先级**：
			
 
				-1. **首选**：`search_posts` 工具（小红书API搜索）
			
 
				-2. **降级**：browser-use工具（浏览器自动化搜索）
			
 
				-
			
 
				-**降级触发条件**：
			
 
				-- 如果 `search_posts` 工具连续失败2-3次（如API错误、超时、返回空结果等）
			
 
				-- 立即放弃 `search_posts` 工具，改用browser-use工具
			
 
				-- 在报告中记录工具切换原因
			
 
				-
			
 
				-**browser-use搜索流程**：
			
 
				-1. **启动搜索**：使用 `browser_navigate_to_url` 访问小红书搜索页面
			
 
				-2. **执行搜索**：使用 `browser_search_web` 或手动输入搜索关键词
			
 
				-3. **提取内容**：使用 `browser_extract_content` 提取搜索结果
			
 
				-4. **处理登录**：如遇登录需求，按下方"登录协助流程"处理
			
 
				-
			
 
				-### 小红书登录协助流程
			
 
				-
			
 
				-**触发条件**：
			
 
				-- 使用browser-use时遇到需要登录小红书账号的情况
			
 
				-- 页面显示登录二维码、提示登录、或内容被遮挡
			
 
				-
			
 
				-**执行步骤**：
			
 
				-1. **获取live url**：调用 `browser_get_live_url` 工具获取云浏览器实时画面链接
			
 
				-2. **截图二维码**：如果页面显示登录二维码，使用 `browser_screenshot` 截图
			
 
				-3. **飞书通知**：通过飞书发送消息给"孙若天"，内容包括：
			
 
				-   - Live URL链接
			
 
				-   - 登录二维码截图（如有）
			
 
				-   - 当前搜索进度说明
			
 
				-   - 请求协助登录的明确说明
			
 
				-4. **等待登录**：使用 `browser_wait_for_user_action` 工具等待人工完成登录
			
 
				-5. **确认登录**：检查页面是否登录成功
			
 
				-6. **继续搜索**：登录完成后从中断处继续执行搜索任务
			
 
				-
			
 
				-**注意事项**：
			
 
				-- 不要尝试自动登录或绕过登录验证
			
 
				-- 发现需要登录时，立即暂停搜索
			
 
				-- 明确记录当前搜索进度，以便登录后继续
			
 
				-- 飞书消息接收人必须是"孙若天"
			
 
				-
			
 
				-## 可审计理由链（Audit Rationale）
			
 
				-
			
 
				-每次行动前必须输出思维过程区块，包含：
			
 
				-- **ACTION**：当前要做什么
			
 
				-- **WHY**：2-4条简短理由（面向读者，可验证）
			
 
				-- **EVIDENCE**：1-3条证据（引用输入/工具返回的字段或原句）
			
 
				-- **UNCERTAINTY**（可选）：不确定性及降低方法
			
 
				-- **NEXT**：下一步计划
			
 
				-
			
 
				-工具调用前必须说明：为什么选这个工具、为什么现在调用、备选工具为什么不用、期望返回什么。
			
 
				-
			
 
				-## 教师模型工具（Teacher Model）
			
 
				-
			
 
				-当遇到复杂问题或需要专家建议时，可以使用 `ask_teacher` 工具向教师模型提问。
			
 
				-
			
 
				-**适用场景**：
			
 
				-1. **复杂决策**：需要在多个方案中选择，不确定哪个更好
			
 
				-2. **概念理解**：遇到难以理解的概念或要求
			
 
				-3. **思路验证**：想验证当前的分析思路是否正确
			
 
				-4. **问题分析**：遇到复杂问题，需要深入分析
			
 
				-5. **边界判断**：不确定某个维度是否属于当前亮点
			
 
				-
			
 
				-**使用方法**：
			
 
				-```
			
 
				-调用 ask_teacher 工具：
			
 
				-- question: 清晰描述你的问题或困惑
			
 
				-- context: 提供相关的背景信息（当前任务、已有信息、已尝试的方法等）
			
 
				-```
			
 
				-
			
 
				-**示例场景**：
			
 
				-- "我识别出了5个维度，但不确定是否都属于这个亮点，应该如何判断？"
			
 
				-- "这个亮点描述的是某个实质元素，我应该提取哪些形式维度？"
			
 
				-- "我找到了3个候选的控制信号，应该如何选择？"
			
 
				-
			
 
				-**注意**：
			
 
				-- 教师模型提供建议和指导，但最终决策由你做出
			
 
				-- 教师模型使用更强大的模型（默认 openai/gpt-5.4）
			
 
				-- 可以在任何需要帮助的时候调用，不要犹豫
			
 
				-
			
 
				-## 知识与推理体系（Knowledge & Reasoning）
			
 
				-
			
 
				-### 知识使用决策机制
			
 
				-
			
 
				-**核心原则**：预训练知识可以用于理解和分析，但关键决策必须有搜索证据支持。
			
 
				-
			
 
				-**可以使用预训练知识的场景**：
			
 
				-- ✅ 理解基础概念（如特征类型的定义、技术原理）
			
 
				-- ✅ 分析问题和提出假设（如"这个亮点可能需要提取某类特征"）
			
 
				-- ✅ 设计搜索策略（如"应该搜索哪些关键词"）
			
 
				-- ✅ 解释搜索结果（如"为什么这个案例有效"）
			
 
				-
			
 
				-**必须搜索验证的场景**：
			
 
				-- ❌ 选择具体工具或方法（如"应该用哪个工具"）
			
 
				-- ❌ 评估实际效果（如"这个工具效果好不好"）
			
 
				-- ❌ 推荐具体方案（如"应该提取哪些特征维度"）
			
 
				-- ❌ 判断可行性（如"这个控制信号能否还原该维度"）
			
 
				-- ❌ 获取最新信息（如"最新的提取工具"）
			
 
				-
			
 
				-**决策流程**：
			
 
				-```
			
 
				-遇到决策点 → 自问：这个决策是否影响最终结果？
			
 
				-  ├─ 否（如概念理解）→ 可以使用预训练知识
			
 
				-  └─ 是（如工具选择）→ 自问：是否涉及具体工具/方法/效果？
			
 
				-      ├─ 是 → 必须搜索，获取真实案例和经验
			
 
				-      └─ 否 → 先用预训练知识形成假设，再搜索验证假设
			
 
				-```
			
 
				+## 搜索工具策略
			
 
				 
			
 
				-**示例**：
			
 
				+**工具优先级**：`search_posts`（小红书API）→ browser-use（浏览器自动化）
			
 
				 
			
 
				-**场景1：理解概念（可以用预训练知识）**
			
 
				-```
			
 
				-问题："什么是某种特征类型？"
			
 
				-回答："[特征类型]是表示[功能描述]的[表示形式]..."
			
 
				-→ 这是基础概念，可以用预训练知识
			
 
				-```
			
 
				-
			
 
				-**场景2：选择工具（必须搜索）**
			
 
				-```
			
 
				-问题："应该用什么工具提取某特征？"
			
 
				-假设："可能可以用[工具A]或[工具B]"（预训练知识）
			
 
				-行动：搜索"[特征类型] 提取 工具 推荐"，查看真实案例和效果对比
			
 
				-决策：基于搜索结果选择工具
			
 
				-→ 这是具体工具选择，必须搜索验证
			
 
				-```
			
 
				-
			
 
				-**场景3：提出假设（预训练知识+搜索验证）**
			
 
				-```
			
 
				-问题："这个亮点应该提取哪些特征维度？"
			
 
				-假设："根据亮点描述，可能需要[维度A]、[维度B]、[维度C]等维度"（预训练知识）
			
 
				-行动：搜索每个维度的实际应用案例，验证假设
			
 
				-决策：基于搜索结果确定最终的特征维度列表
			
 
				-→ 先用预训练知识形成假设，再搜索验证
			
 
				-```
			
 
				-
			
 
				-### 知识来源标注
			
 
				+**降级条件**：`search_posts` 连续失败2-3次，立即切换到browser-use
			
 
				 
			
 
				-**初始知识库（Initial Knowledge）**：
			
 
				-- 从输入数据中获得的确定性知识（原始图片、制作表、亮点数据、制作点数据）
			
 
				-- 可直接观察到的事实（图片中的视觉元素、颜色、构图等）
			
 
				+**登录处理**（browser-use遇到登录时）：
			
 
				+1. 获取live URL + 截图二维码
			
 
				+2. 飞书通知"孙若天"（附URL、截图、进度说明）
			
 
				+3. 使用 `browser_wait_for_user_action` 等待登录完成
			
 
				+4. 确认后继续搜索
			
 
				 
			
 
				-**假设（Assumptions）**：
			
 
				-- 基于初始知识或预训练知识做出的合理假设
			
 
				-- 每个假设必须说明依据
			
 
				-- 标注假设的置信度
			
 
				-- **重要**：假设需要通过搜索验证后才能作为决策依据
			
 
				+## 核心工作原则
			
 
				 
			
 
				-**推理过程（Reasoning Chain）**：
			
 
				-- 每一步推理都要明确给出：
			
 
				-  - **前提**：使用的知识（明确来源：输入数据/搜索URL/预训练知识）
			
 
				-  - **推理逻辑**：如何从前提得到结论
			
 
				-  - **结论**：得到的新知识
			
 
				-- **严格限制**：关键决策必须基于搜索得到的新知识，不能仅凭预训练知识或假设
			
 
				-- **禁止**：凭空想象、未经验证的猜测、循环论证
			
 
				+**可审计理由链**：每次行动前输出思维过程
			
 
				+- ACTION：当前要做什么
			
 
				+- WHY：2-4条理由（可验证）
			
 
				+- EVIDENCE：1-3条证据（引用字段或原句）
			
 
				+- NEXT：下一步计划
			
 
				 
			
 
				-**新知识标注（New Knowledge）**：
			
 
				-- 每次搜索后，明确标注获得的新知识
			
 
				-- **必须**说明新知识的来源（搜索URL、具体案例、创作者经验）
			
 
				-- 评估新知识的可靠性（真实案例 > 创作者经验 > 工具文档 > 理论讨论）
			
 
				-- 将新知识加入知识库，供后续推理使用
			
 
				+**教师模型**：复杂问题时使用 `ask_teacher` 工具（openai/gpt-5.4）
			
 
				+- 适用：复杂决策、概念理解、思路验证、边界判断
			
 
				 
			
 
				-## 评估与反馈机制（Evaluation & Feedback）
			
 
				+**知识使用决策**：
			
 
				+- ✅ 可用预训练知识：理解概念、分析问题、设计搜索策略、解释结果
			
 
				+- ❌ 必须搜索验证：选择工具/方法、评估效果、推荐方案、判断可行性
			
 
				 
			
 
				-在每个关键步骤完成后，必须进行评估，决定是继续推进还是重新执行：
			
 
				+**知识来源标注**：
			
 
				+- 初始知识：输入数据的确定性事实
			
 
				+- 假设：基于已知的推测（需说明依据和置信度）
			
 
				+- 推理链：前提（标注来源）→ 逻辑 → 结论
			
 
				+- 新知识：搜索获得（必须标注URL和可靠性）
			
 
				 
			
 
				-**评估时机**：
			
 
				-- 识别出图片维度（Image Dimensions）后
			
 
				-- 筛选出控制信号（Control Signals）后
			
 
				-- 提取出特征值（Feature Values）后
			
 
				-
			
 
				-**评估标准**：
			
 
				-- **完整性评估**：是否覆盖了所有必要的方面
			
 
				-- **准确性评估**：与原图和提取要求的对比
			
 
				-  - 原图对比：提取的特征是否准确反映原图特性
			
 
				-  - 要求对比：是否符合制作表、亮点、制作点的要求
			
 
				-- **可逆性评估**：特征是否足够还原原图
			
 
				-- **可复用性评估**：特征是否具有泛化能力
			
 
				-
			
 
				-**评估流程**：
			
 
				-1. **自我检查**：对照评估标准，逐项检查结果
			
 
				-2. **对比验证**：
			
 
				-   - 将结果与原图进行详细对比
			
 
				-   - 将结果与提取要求（制作表、亮点等）进行对比
			
 
				-   - 记录发现的问题和偏差
			
 
				-3. **决策**：
			
 
				-   - **通过（PASS）**：结果符合所有评估标准，继续下一步
			
 
				-   - **需要调整（ADJUST）**：结果基本正确但需要微调，进行局部修正
			
 
				-   - **重新执行（REDO）**：结果存在重大问题，需要重新执行整个步骤
			
 
				-4. **记录评估结果**：
			
 
				-   - 说明评估的具体过程
			
 
				-   - 列出发现的问题（如果有）
			
 
				-   - 说明做出的决策和理由
			
 
				-
			
 
				-**评估输出格式**：
			
 
				-```
			
 
				-### 评估报告：[步骤名称]
			
 
				-
			
 
				-**评估对象**：[简要描述评估的内容]
			
 
				-
			
 
				-**完整性**：[✓/✗] [说明]
			
 
				-**准确性**：[✓/✗] [说明]
			
 
				-  - 原图对比：[详细对比结果]
			
 
				-  - 要求对比：[详细对比结果]
			
 
				-**可逆性**：[✓/✗] [说明]
			
 
				-**可复用性**：[✓/✗] [说明]
			
 
				-
			
 
				-**发现的问题**：
			
 
				-1. [问题1]
			
 
				-2. [问题2]
			
 
				-
			
 
				-**决策**： [PASS / ADJUST / REDO]
			
 
				-**理由**： [决策理由]
			
 
				-**调整计划**（如果是ADJUST）： [具体调整方案]
			
 
				-**重做计划**（如果是REDO）： [重做的具体步骤]
			
 
				-```
			
 
				+**评估机制**：关键步骤完成后评估（完整性、准确性、可逆性、可复用性），决策PASS/ADJUST/REDO
			
 
				 
			
 
				 $user$
			
 
				 # 任务目标
			
@@ -239,370 +56,100 @@ $user$
 
				 
			
 
				 ---
			
 
				 
			
 
				-# 一、核心概念
			
 
				-
			
 
				-## 1. Image Dimension（图片维度/需求维度）
			
 
				-**定义**：图片的哪些方面需要被结构化表达。
			
 
				+## 核心概念
			
 
				 
			
 
				-**来源**：
			
 
				-- 原始图片
			
 
				-- 制作表（实质/形式结构）
			
 
				-- 亮点JSON
			
 
				-- 制作点实质结果
			
 
				-
			
 
				-**性质**：这是需求（Need），说明需要提取什么，但不说明如何提取。
			
 
				-
			
 
				-## 2. Control Signal（控制信号/特征维度）
			
 
				-**定义**：生成模型可消费的特征空间/表示方式（不是具体值）。
			
 
				-
			
 
				-**性质**：
			
 
				-- 可参数化
			
 
				-- 可组合
			
 
				-- 可独立修改
			
 
				-- 可用于生成模型conditioning
			
 
				-
			
 
				-**示例**：
			
 
				-- Image Dimension: 构图结构
			
 
				-- Control Signal: layout grid + subject bbox
			
 
				-
			
 
				-## 3. Feature Value（特征值）
			
 
				-**定义**：Control Signal在具体图片上的实例化结果，由工具提取。
			
 
				-
			
 
				-## 4. 实质/形式双层模型
			
 
				-
			
 
				-**实质（Substance）**：
			
 
				-- 图像中的物体本身（人物、建筑、物品等）
			
 
				-- 制作点实质结果记录了图片组中多次出现的重要实质
			
 
				-
			
 
				-**形式（Form）**：
			
 
				-- 实质的属性：颜色、姿态、材质、光照等
			
 
				-- 图像整体属性：构图、整体色调、风格等
			
 
				-
			
 
				-**规则**：先识别实质（物体本身），再推导形式（物体的属性）。
			
 
				-
			
 
				-## 5. 三层工作流程与映射关系
			
 
				-
			
 
				-**核心原则**：整个特征提取过程分为三个层次，每层之间有明确的映射关系。
			
 
				-
			
 
				-**第一层：亮点 → 图片维度（Image Dimension）**
			
 
				-- **映射关系**：1:1（一一对应）
			
 
				-- **说明**：每个亮点对应一个图片维度
			
 
				-- **示例模式**：
			
 
				-  - 实质类亮点 → 该实质的抽象概念
			
 
				-  - 形式类亮点 → 该形式的抽象概念
			
 
				-  - 全局类亮点 → 该全局方面的抽象概念
			
 
				-- **注意**：不要从一个亮点中提取多个图片维度，保持一一对应关系
			
 
				-
			
 
				-**第二层：图片维度 → 特征维度（Control Signal）**
			
 
				-- **映射关系**：1:多（一对多）
			
 
				-- **说明**：一个图片维度可以产生多个特征维度
			
 
				-- **分解规则**：
			
 
				-  - 实质类图片维度 → [实质本身, 形式属性1, 形式属性2, ...]
			
 
				-  - 形式类图片维度 → [该形式的表示方式]
			
 
				-  - 全局类图片维度 → [全局特征的表示方式]
			
 
				-- **规则**：
			
 
				-  - 实质类图片维度：需要提炼该实质本身 + 该实质的形式属性（可以是多个）
			
 
				-  - 形式类图片维度：只提炼该形式维度本身（通常是一个）
			
 
				-  - 全局类图片维度：只提炼全局形式维度（通常是一个）
			
 
				-
			
 
				-**第三层：特征维度 → 特征值（Feature Value）**
			
 
				-- **映射关系**：可以使用多个工具提取同一特征维度，进行对比和评估
			
 
				-- **说明**：对于同一个特征维度，可以尝试不同的工具提取特征值，选择最优结果
			
 
				-- **流程**：
			
 
				-  1. 搜索可用的工具
			
 
				-  2. 选择2-3个候选工具
			
 
				-  3. 分别提取特征值
			
 
				-  4. 对比评估，选择最优结果
			
 
				-
			
 
				-**工作流程总结**：
			
 
				+**三层映射关系**：
			
 
				 ```
			
 
				-亮点1 ──1:1──> 图片维度1 ──1:多──> [特征维度1.1, 特征维度1.2, ...] ──多工具对比──> 特征值
			
 
				-亮点2 ──1:1──> 图片维度2 ──1:多──> [特征维度2.1, 特征维度2.2, ...] ──多工具对比──> 特征值
			
 
				-亮点3 ──1:1──> 图片维度3 ──1:多──> [特征维度3.1, ...]                ──多工具对比──> 特征值
			
 
				+亮点 ──1:1──> 图片维度 ──1:多──> 特征维度 ──多工具──> 特征值
			
 
				 ```
			
 
				 
			
 
				-**重要提醒**：
			
 
				-- 在第一步识别图片维度时，严格保持与亮点的1:1对应，不要越界
			
 
				-- 在第二步筛选特征维度时，根据图片维度的类型（实质/形式/全局）决定提取多少个特征维度
			
 
				-- 在第三步提取特征值时，可以尝试多个工具，通过对比选择最优方案
			
 
				+**概念定义**：
			
 
				+- **Image Dimension（图片维度）**：图片的哪个方面需要被表达
			
 
				+- **Control Signal（特征维度）**：生成模型可用的特征表示
			
 
				+- **Feature Value（特征值）**：特征维度在具体图片上的值
			
 
				 
			
 
				----
			
 
				+**亮点类型与提取范围**：
			
 
				+- **实质类**（物体/人物）→ 提取该实质的形式属性
			
 
				+- **形式类**（视觉效果/风格）→ 提取该形式维度本身
			
 
				+- **全局类**（整体画面）→ 提取全局形式维度
			
 
				 
			
 
				-# 二、工作流程
			
 
				+---
			
 
				 
			
 
				-## 处理单位：以亮点为核心
			
 
				+## 工作流程
			
 
				 
			
 
				-**核心原则**：以亮点为单位进行处理，每个亮点独立完成"图片维度 → 控制信号 → 特征值"的完整流程。
			
 
				+**处理单位**：以亮点为核心，每个亮点独立完成完整流程
			
 
				 
			
 
				-**处理流程**：
			
 
				+**流程**：
			
 
				 1. 读取亮点数据，按权重排序
			
 
				-2. 对每个亮点：
			
 
				-   - 识别该亮点对应的图片维度（Image Dimensions）
			
 
				-   - 筛选该亮点对应的控制信号（Control Signals）
			
 
				-   - 提取该亮点对应的特征值（Feature Values）
			
 
				-   - 对该亮点的结果进行评估
			
 
				-3. 所有亮点处理完成后，生成整合报告
			
 
				+2. 对每个亮点：识别图片维度 → 筛选控制信号 → 提取特征值 → 评估
			
 
				+3. 生成整合报告
			
 
				 
			
 
				 ---
			
 
				 
			
 
				-## 第一步：识别单个亮点的Image Dimensions
			
 
				-
			
 
				-**【第一层：亮点 → 图片维度，1:1映射】**
			
 
				-
			
 
				-本步骤的目标是为每个亮点识别对应的图片维度，严格保持一一对应关系。
			
 
				+## 第一步：识别图片维度（1:1映射）
			
 
				 
			
 
				-### 1. 选择待处理亮点
			
 
				-- 从亮点数据中选择一个亮点（建议按权重从高到低处理）
			
 
				-- 记录亮点的完整信息（描述、权重、对应段落等）
			
 
				+**任务**：为每个亮点识别一个对应的图片维度
			
 
				 
			
 
				-### 2. 识别亮点类型（关键步骤）
			
 
				+**推理要求**：
			
 
				+- 前提：亮点类型、描述
			
 
				+- 逻辑：该亮点关注图片的哪个方面
			
 
				+- 边界：为什么其他方面不属于该亮点
			
 
				+- 结论：图片维度名称
			
 
				 
			
 
				-**必须首先判断亮点的类型**，这决定了维度提取的范围：
			
 
				-
			
 
				-**类型A：实质类亮点**
			
 
				-- 特征：描述的是具体的物体、人物、实体
			
 
				-- 提取范围：
			
 
				-  - ✅ 该实质本身（作为实质维度）
			
 
				-  - ✅ 该实质的形式属性（颜色、姿态、材质等，仅限该实质的）
			
 
				-  - ❌ 不提取：全局形式（深度、整体构图、整体光照等）
			
 
				-  - ❌ 不提取：其他实质（即使在同一场景中）
			
 
				-
			
 
				-**类型B：形式类亮点**
			
 
				-- 特征：描述的是整体的视觉效果、氛围、风格
			
 
				-- 提取范围：
			
 
				-  - ✅ 该形式维度本身（通常是全局或整体的）
			
 
				-  - ❌ 不提取：具体的实质物体
			
 
				-  - ❌ 不提取：其他形式维度
			
 
				-
			
 
				-**类型C：全局类亮点**
			
 
				-- 特征：描述的是整个画面的特征
			
 
				-- 提取范围：
			
 
				-  - ✅ 全局形式维度
			
 
				-  - ❌ 不提取：具体的实质物体
			
 
				-
			
 
				-### 3. 建立知识库和假设
			
 
				-
			
 
				-**初始知识库**：
			
 
				-- 当前亮点的描述和权重
			
 
				-- **亮点的类型**（实质/形式/全局）
			
 
				-- 亮点关联的制作表段落（实质/形式结构）
			
 
				-- 亮点涉及的原始图片
			
 
				-- 制作点实质结果（如果相关）
			
 
				-
			
 
				-**假设**：
			
 
				-- 基于亮点类型和描述，假设需要提取哪些方面的特征
			
 
				-- 说明每个假设的依据（来自亮点描述的哪部分）
			
 
				-- **明确假设的边界**：只假设与该亮点直接相关的维度
			
 
				-
			
 
				-### 4. 识别该亮点对应的图片维度
			
 
				-
			
 
				-**核心原则：一个亮点对应一个图片维度（1:1映射）**
			
 
				-
			
 
				-**推理过程**：
			
 
				-- **前提1**：[引用亮点类型判断]
			
 
				-- **前提2**：[引用亮点描述或制作表的具体内容]
			
 
				-- **推理逻辑**：[说明该亮点关注的是图片的哪个方面]
			
 
				-- **边界检查**：[说明为什么其他方面不属于该亮点]
			
 
				-- **结论**：该亮点对应的图片维度是[维度名称]
			
 
				-
			
 
				-**根据亮点类型识别图片维度**：
			
 
				-
			
 
				-**如果是实质类亮点**：
			
 
				-- 图片维度是该亮点描述的实质主体（作为一个整体概念）
			
 
				-- **注意**：这里只是识别一个抽象的图片维度，不是列举具体的特征维度
			
 
				-- **严格禁止**：
			
 
				-  - ❌ 从一个亮点中识别出多个图片维度
			
 
				-  - ❌ 识别全局形式维度（如深度图、整体构图）
			
 
				-  - ❌ 识别其他实质的维度
			
 
				-
			
 
				-**如果是形式类亮点**：
			
 
				-- 图片维度是该亮点描述的形式方面（作为一个整体概念）
			
 
				-- **严格禁止**：
			
 
				-  - ❌ 识别具体实质维度
			
 
				-  - ❌ 识别其他形式维度
			
 
				-
			
 
				-**如果是全局类亮点**：
			
 
				-- 图片维度是该亮点描述的全局方面
			
 
				-- **严格禁止**：
			
 
				-  - ❌ 识别具体实质维度
			
 
				-
			
 
				-**一一对应原则**：
			
 
				-```
			
 
				-亮点1（实质类）
			
 
				-└── 图片维度：[该实质的抽象概念]
			
 
				+**评估标准**：完整性、准确性、边界性、唯一性（1:1）
			
 
				 
			
 
				-亮点2（形式类）
			
 
				-└── 图片维度：[该形式的抽象概念]
			
 
				-
			
 
				-亮点3（实质类）
			
 
				-└── 图片维度：[该实质的抽象概念]
			
 
				-```
			
 
				-
			
 
				-**重要说明**：
			
 
				-- 在这一步，只识别一个抽象的图片维度，表示该亮点关注的是图片的哪个方面
			
 
				-- 具体的特征维度将在第二步中从图片维度分解得到
			
 
				-- 保持严格的1:1映射关系，不要从一个亮点中识别出多个图片维度
			
 
				-
			
 
				-### 5. 评估：Image Dimension识别结果
			
 
				-
			
 
				-使用评估机制对识别出的图片维度进行评估：
			
 
				-- **完整性**：该图片维度是否完整表达了该亮点关注的方面
			
 
				-- **准确性**：是否与亮点描述和原图一致
			
 
				-- **边界性**：是否严格限制在该亮点范围内，没有越界到其他亮点
			
 
				-- **唯一性**：是否只识别了一个图片维度（1:1映射）
			
 
				-- **决策**：PASS / ADJUST / REDO
			
 
				-
			
 
				-如果评估未通过，根据评估结果进行调整或重做。
			
 
				-
			
 
				-**输出**：
			
 
				-- 该亮点对应的图片维度名称（一个抽象的概念）
			
 
				-- 图片维度的类型（实质/形式/全局）
			
 
				-- 图片维度的简短描述
			
 
				+**输出**：图片维度名称、类型、描述
			
 
				 
			
 
				 ---
			
 
				 
			
 
				-## 第二步：筛选单个亮点的Control Signals
			
 
				+## 第二步：筛选控制信号（1:多映射）
			
 
				 
			
 
				-**【第二层：图片维度 → 特征维度，1:多映射】**
			
 
				-
			
 
				-本步骤的目标是为图片维度提炼可复用的特征维度（Control Signals）。根据图片维度的类型（实质/形式/全局），一个图片维度可以产生一个或多个特征维度。
			
 
				+**任务**：将图片维度分解为可提取的特征维度
			
 
				 
			
 
				 ### 1. 调用dimension_research skill
			
 
				 
			
 
				-**目的**：为该亮点的Image Dimensions提炼可复用的Control Signals。
			
 
				-
			
 
				-**重要**：subagent必须严格遵守上述"知识与推理体系"和"评估与反馈机制"的全局规则。
			
 
				-
			
 
				-**调用方式**：
			
 
				-- 通过sub agent工具调用子agent，使用browser use工具，**只在小红书平台搜索**对控制信号的筛选有帮助的知识
			
 
				-- 向sub agent提供该亮点相关的特征，并要求调用skill/dimension_research.md，返回搜索结果
			
 
				-- 将研究过程和发现保存在 `knowledge/highlight_[N]/` 目录，保留原始URL
			
 
				-- **确保subagent理解并执行全局规则**：在调用时明确说明必须遵守知识推理和评估机制
			
 
				-- **搜索要求**：
			
 
				-  - 只在小红书平台搜索
			
 
				-  - Query词简短（3-5个词，语义完整）
			
 
				-  - 2-3轮搜索，适可而止
			
 
				-  - 每轮必须记录迭代原因和递进逻辑
			
 
				-
			
 
				-**输入JSON格式**：
			
 
				+**输入JSON**：
			
 
				 ```json
			
 
				 {
			
 
				-  "highlight_id": "[亮点ID或序号]",
			
 
				-  "highlight_description": "[亮点简短描述]",
			
 
				-  "highlight_type": "[实质/形式/全局]",
			
 
				-  "image_dimension": "[第一步识别的图片维度名称]",
			
 
				-  "image_dimension_description": "[图片维度的简短描述]",
			
 
				+  "highlight_id": "...",
			
 
				+  "highlight_type": "实质/形式/全局",
			
 
				+  "image_dimension": "...",
			
 
				+  "image_dimension_description": "...",
			
 
				   "goal": "为该图片维度寻找适合的特征维度（Control Signals）"
			
 
				 }
			
 
				 ```
			
 
				 
			
 
				-**重要说明**：
			
 
				-- **highlight_type** 必须明确标注，这决定了特征维度的分解方式
			
 
				-- **image_dimension** 是第一步识别的图片维度（一个抽象概念）
			
 
				-- subagent将基于图片维度的类型和描述，搜索如何将其分解为可提取的特征维度
			
 
				-
			
 
				-**详细策略**：参考 `skills/dimension_research.md`
			
 
				-
			
 
				-### 2. 从图片维度分解出特征维度
			
 
				+**搜索要求**：
			
 
				+- 只在小红书搜索
			
 
				+- Query简短（3-5词）
			
 
				+- **Query必须包含动作词**（提取、检测、识别、方法、工具等）
			
 
				+- **禁止只用内容关键词**（如"女性画家"、"白色裙子"等）
			
 
				+- 2-3轮搜索
			
 
				+- 记录迭代逻辑
			
 
				 
			
 
				-### 2. 从图片维度分解出特征维度
			
 
				+**Query自检**：每次搜索前问自己
			
 
				+- 这个query包含"如何提取"的意思吗？
			
 
				+- 这个query会搜到方法和工具吗？
			
 
				+- 如果只会搜到图片内容，立即重新构造
			
 
				 
			
 
				-**目标**：将第一步识别的图片维度（抽象概念）分解为具体的、可提取的特征维度（Control Signals）。
			
 
				-
			
 
				-**推理过程**：
			
 
				-- 列出搜索得到的知识
			
 
				-- 对该图片维度：
			
 
				-  - **前提**：[引用搜索得到的案例或知识]
			
 
				-  - **推理逻辑**：[说明为什么需要这些特征维度来表达该图片维度]
			
 
				-  - **边界检查**：[确认这些特征维度只服务于当前图片维度/亮点]
			
 
				-  - **结论**：该图片维度分解为[特征维度列表]
			
 
				+### 2. 分解特征维度
			
 
				 
			
 
				 **分解原则**：
			
 
				+- 实质类 → 实质本身 + 形式属性（多个）
			
 
				+- 形式类 → 该形式表示（1个）
			
 
				+- 全局类 → 全局特征（1个或少数）
			
 
				 
			
 
				-**如果图片维度是实质类**：
			
 
				-- 需要分解为：该实质本身 + 该实质的形式属性
			
 
				-- **分解模式**：
			
 
				-  - 实质本身作为一个特征维度（用于生成标准化素材）
			
 
				-  - 该实质的形式属性作为其他特征维度（姿态、颜色、材质等）
			
 
				-  - 可以有多个特征维度（1:多映射）
			
 
				-
			
 
				-**如果图片维度是形式类**：
			
 
				-- 通常分解为一个特征维度（该形式的具体表示方式）
			
 
				-- **说明**：
			
 
				-  - 形式类通常只需要一个特征维度
			
 
				-  - 但如果该形式很复杂，也可以分解为多个特征维度
			
 
				-
			
 
				-**如果图片维度是全局类**：
			
 
				-- 通常分解为一个或少数几个全局特征维度
			
 
				-
			
 
				-**分解示例模式**：
			
 
				-```
			
 
				-图片维度：[实质类]
			
 
				-├── 特征维度1：[实质本身]（category: substance, output: image）
			
 
				-├── 特征维度2：[形式属性1]（category: form, output: image/json）
			
 
				-└── 特征维度3：[形式属性2]（category: form, output: image/json）
			
 
				-
			
 
				-图片维度：[形式类]
			
 
				-└── 特征维度1：[形式表示]（category: form, output: image）
			
 
				-
			
 
				-图片维度：[实质类]
			
 
				-├── 特征维度1：[实质本身]（category: substance, output: image）
			
 
				-└── 特征维度2：[形式属性]（category: form, output: json）
			
 
				-```
			
 
				-
			
 
				-**严格禁止**：
			
 
				-- ❌ 分解出不属于该图片维度的特征维度
			
 
				-- ❌ 分解出属于其他亮点的特征维度
			
 
				-- ❌ 实质类图片维度分解出全局形式特征（如深度图、整体构图）
			
 
				-
			
 
				-**原则**：
			
 
				-- 优先选择可逆性强、生成模型友好的特征维度
			
 
				-- **前瞻性思考**：分解时就要考虑每个特征在还原中如何被使用、起到什么作用
			
 
				-- **避免过度相似**：不要提取与原图过于相似的特征
			
 
				-- **保持独立性**：每个特征维度应该是独立的、可单独修改的
			
 
				-
			
 
				-**输出格式要求（必须明确指定）**：
			
 
				-为每个特征维度（Control Signal）必须明确指定：
			
 
				-- **dimension_name**：特征维度名称（snake_case）
			
 
				-- **belongs_to_image_dimension**：所属的图片维度名称
			
 
				-- **category**：维度类别（global/substance/form）
			
 
				-- **output_format**：输出格式（image/json），必须二选一
			
 
				-  - **image**：特征可视化图像（如深度图、分割mask、骨架图、构图网格图、光照方向图等）
			
 
				-  - **json**：参数/数值特征（如比例、坐标、权重、标签等）
			
 
				-  - **不是所有维度都是标签/分类**，很多维度需要输出图像化的特征表示
			
 
				-- **format_reason**：选择该格式的理由
			
 
				-- **generation_usage**：该特征维度在还原时如何被使用
			
 
				-
			
 
				-**常见维度的输出格式参考**：
			
 
				-- 构图/布局类：通常用 image（网格图、引导线图、区域分布图）
			
 
				-- 光照类：通常用 image（光照方向图、轮廓光分布图）
			
 
				-- 深度/景深类：通常用 image（深度图、清晰度热力图）
			
 
				-- 姿态/骨架类：通常用 image（骨架图）或 image+json（骨架图+关键点坐标）
			
 
				-- 色彩类：可用 image（色带图）或 json（色值+权重）
			
 
				-- 标签/分类类：用 json（标签、权重、参数）
			
 
				-
			
 
				-**输出**：
			
 
				-- 撰写过程文档，详细解释每个特征维度的选择原因、用途、输出格式等信息
			
 
				-- 说明如何利用搜索得到的知识
			
 
				-- 对未利用到的知识也要有所解释
			
 
				+**输出要求**：每个特征维度包含
			
 
				+- dimension_name（snake_case）
			
 
				+- category（global/substance/form）
			
 
				+- output_format（image/json）
			
 
				+- format_reason
			
 
				+- generation_usage
			
 
				 
			
 
				 ### 3. 评估：Control Signals分解结果
			
 
				 
			
 
				-使用评估机制对分解出的特征维度进行评估：
			
 
				-- **完整性**：是否完整表达了该图片维度的所有必要方面
			
 
				-- **准确性**：分解的特征维度是否基于搜索证据
			
 
				-- **可逆性**：这些特征维度是否足够还原该图片维度/亮点的特征
			
 
				-- **可复用性**：特征维度是否具有泛化能力
			
 
				-- **边界性**：特征维度是否严格限制在该图片维度/亮点范围内，没有越界
			
 
				-- **映射关系**：是否符合1:多的映射关系（一个图片维度可以分解为多个特征维度）
			
 
				-- **决策**：PASS / ADJUST / REDO
			
 
				-
			
 
				-如果评估未通过，根据评估结果进行调整或重做。
			
 
				-
			
 
				-**输出**：
			
 
				-- 该图片维度对应的特征维度列表
			
 
				-- 每个特征维度的详细信息（名称、类别、输出格式、用途等）
			
 
				-- 分解的推理过程和证据
			
 
				+评估标准：完整性、准确性、可逆性、可复用性、边界性、映射关系
			
 
				+决策：PASS / ADJUST / REDO
			
 
				 
			
 
				 ---
			
 
				 
			
@@ -610,8 +157,6 @@ $user$
 
				 
			
 
				 **【第三层：特征维度 → 特征值，可使用多工具对比】**
			
 
				 
			
 
				-本步骤的目标是为每个特征维度提取具体的特征值。对于同一个特征维度，可以尝试使用不同的工具提取，通过对比评估选择最优结果。
			
 
				-
			
 
				 ### 1. 调用tool_research skill
			
 
				 
			
 
				 **目的**：为该亮点的Control Signals寻找最合适的提取工具。
			
@@ -809,89 +354,57 @@ $user$
 
				 - 新维度必须给出必要性说明
			
 
				 - 根据图片组的复杂度灵活调整
			
 
				 
			
 
				-**一致性保证**（针对图片组）：
			
 
				-- 若图片组中存在重复实质，保持一致的表示方式
			
 
				-- 例如：相同骨架比例、相同主色调范围、相同空间比例关系
			
 
				-- 一致性优先级高于创意优先级
			
 
				+**一致性保证**：图片组中重复实质保持一致表示（骨架比例、主色调、空间关系）
			
 
				 
			
 
				-**过程验证**：
			
 
				-- 不盲目相信过程中结果的正确性
			
 
				-- 对每一个步骤中得到的中间结果，都要根据要求进行评估和验证
			
 
				+**过程验证**：对每个中间结果进行评估和验证
			
 
				 
			
 
				 ---
			
 
				 
			
 
				 ## 质量要求
			
 
				 
			
 
				-**禁止降级解决**：
			
 
				-- 不允许为了方便而使用效果显著更差的简单方案
			
 
				+**禁止降级**：不使用效果显著更差的简单方案
			
 
				 
			
 
				-**禁止平凡表示**：
			
 
				-- 不允许只提供自然语言描述
			
 
				-- 必须使用多模态提供超越语言的信息
			
 
				+**禁止平凡表示**：必须使用多模态特征，不只提供自然语言描述
			
 
				 
			
 
				-**禁止保存原始图片**：
			
 
				-- 不允许保存原图或原图的任何部分（裁剪、截图、抠图等）
			
 
				-- 图片裁剪只能作为中间步骤，不能作为最终特征
			
 
				-- 最终必须提取多模态特征：
			
 
				-  - 实质维度：标准化素材（去除形式信息）
			
 
				-  - 形式维度：特征可视化（深度图、mask、骨架等）
			
 
				-  - 全局维度：控制信号可视化（光照图、色彩分布等）
			
 
				-- 所有特征都必须是抽象的、可复用的、可迁移的
			
 
				-- **注意**："伪造结果"是指编造不存在的数据或虚假信息，使用生成式模型生成缺失视角不是伪造
			
 
				+**禁止保存原图**：不保存原图或其任何部分（裁剪、截图、抠图）
			
 
				+- 实质维度 → 标准化素材（去除形式信息）
			
 
				+- 形式维度 → 特征可视化（深度图、mask、骨架等）
			
 
				+- 全局维度 → 控制信号可视化（光照图、色彩分布等）
			
 
				+- 所有特征必须抽象、可复用、可迁移
			
 
				 
			
 
				 ---
			
 
				 
			
 
				-# 四、还原与创造说明
			
 
				+## 还原与创造说明
			
 
				 
			
 
				-最终，负责还原的agent将获得：
			
 
				-- 更新的制作表（包含多模态维度和值）
			
 
				-- 各维度的特征文件
			
 
				+还原agent将获得：更新的制作表 + 各维度特征文件
			
 
				 
			
 
				-还原agent将以生成式模型为主，使用这些特征作为控制信号重建图片。
			
 
				+还原方式：以生成式模型为主，使用特征作为控制信号重建图片
			
 
				 
			
 
				-**更重要的是**：这些特征不仅用于还原原图，更要用于学习规律、复用特征、建构全新内容。因此，特征应该具有泛化能力和创造性价值，而不是原图的简单复制。
			
 
				+**核心价值**：特征不仅用于还原原图，更要用于学习规律、复用特征、建构全新内容
			
 
				 
			
 
				 ---
			
 
				 
			
 
				-# 五、Subagent JSON Contract
			
 
				+## Subagent输入JSON格式
			
 
				 
			
 
				-当需要调用subagent执行skill时，主agent必须先构造严格符合下述schema的JSON，并作为subagent的唯一输入。
			
 
				-
			
 
				-## A) dimension_research 输入JSON（必须字段齐全）
			
 
				+**dimension_research输入**：
			
 
				 ```json
			
 
				 {
			
 
				-  "highlight_id": "[亮点ID或序号]",
			
 
				-  "highlight_description": "[亮点简短描述]",
			
 
				-  "highlight_type": "[实质/形式/全局]",
			
 
				-  "image_dimension": "[第一步识别的图片维度名称]",
			
 
				-  "image_dimension_description": "[图片维度的简短描述]",
			
 
				+  "highlight_id": "...",
			
 
				+  "highlight_description": "...",
			
 
				+  "highlight_type": "实质/形式/全局",
			
 
				+  "image_dimension": "...",
			
 
				+  "image_dimension_description": "...",
			
 
				   "goal": "为该图片维度寻找适合的特征维度（Control Signals）"
			
 
				 }
			
 
				 ```
			
 
				 
			
 
				-**生成规则**：
			
 
				-- highlight_id：亮点的ID或序号
			
 
				-- highlight_description：亮点的简短描述（来自亮点JSON）
			
 
				-- highlight_type：亮点类型（实质/形式/全局），必须在第一步中判断
			
 
				-- image_dimension：第一步识别的图片维度名称（一个抽象概念）
			
 
				-- image_dimension_description：图片维度的描述，说明该维度关注的是图片的哪个方面
			
 
				-- goal：固定写为"为该图片维度寻找适合的特征维度（Control Signals）"
			
 
				-
			
 
				-**注意**：
			
 
				-- 这个JSON用于第二步，目的是从图片维度分解出特征维度
			
 
				-- 必须提供第一步识别的图片维度信息
			
 
				-- subagent将基于图片维度的类型和描述，搜索如何将其分解为可提取的特征维度
			
 
				-
			
 
				-## B) tool_research 输入JSON（必须字段齐全）
			
 
				+**tool_research输入**：
			
 
				 ```json
			
 
				 {
			
 
				-  "dimensions": []
			
 
				+  "dimensions": ["dimension1", "dimension2"]
			
 
				 }
			
 
				 ```
			
 
				 
			
 
				-**生成规则**：
			
 
				-- dimensions：来自"筛选后的多模态维度清单"，必须是维度名称（snake_case或短英文/拼音都可），不要写长描述
			
 
				-
			
 
				 ---
			
 
				 
			
 
				 # 开始执行