elksmmx 11 часов назад
Родитель
Сommit
ee1abc1381

+ 10 - 0
agent/tools/builtin/feishu/chat_history/chat_孙若天.json

@@ -8,5 +8,15 @@
         "text": "你好,我需要访问小红书,但是需要登录。请帮我在这个浏览器中完成登录:\n\nhttps://live.browser-use.com?wss=https%3A//9dcf552b-18ea-4f7f-9ace-96ca6fc9a3ac.cdp3.browser-use.com\n\n登录完成后请回复我一下,谢谢!"
       }
     ]
+  },
+  {
+    "role": "assistant",
+    "message_id": "om_x100b55cd9da854a0b2048fbba8be2b2",
+    "content": [
+      {
+        "type": "text",
+        "text": "【小红书登录协助请求】\n\n任务:多模态特征提取研究 - 需要在小红书搜索AI人物控制方法\n\n当前状态:浏览器已导航到小红书,但需要登录\n\n请登录方式:\n1. 访问云浏览器(需要获取live URL)\n2. 使用小红书APP扫码登录\n\n登录后请回复\"已完成\",我将继续执行搜索任务。\n\n搜索目标:\n- ControlNet人物姿态控制\n- AI生成人物服装控制\n- 人物身形/姿态提取方法"
+      }
+    ]
   }
 ]

+ 67 - 66
config/feishu_contacts.json

@@ -1,68 +1,69 @@
 [
-    {
-        "name": "谭景玉",
-        "description": "",
-        "open_id": "ou_11fdbd559cc6513ab53ff06d6c63413d",
-        "chat_id": "oc_56e85f0e2c97405d176729b62d8f56e5"
-    },
-    {
-        "name": "王华东",
-        "description": "",
-        "open_id": "ou_82340312cf9d215f49a41b67fa9c02c2"
-    },
-    {
-        "name": "孙若天",
-        "description": "",
-        "open_id": "ou_ede69f28c2617bf80a7574f059879c8d"
-    },
-    {
-        "name": "刘斌",
-        "description": "",
-        "open_id": "ou_50c2307c3531e6293b3d5533d14592e9"
-    },
-    {
-        "name": "关涛",
-        "description": "",
-        "open_id": "ou_90b80ed994fe41b7f038a63cb9182f72"
-    },
-    {
-        "name": "刘龙",
-        "description": "",
-        "open_id": "ou_2d25b935d720c4404e4ea88b70bcdce2"
-    },
-    {
-        "name": "马晗",
-        "description": "",
-        "open_id": "ou_405c6b8581ee36b153ff8159cfc9f29e"
-    },
-    {
-        "name": "王雅萱",
-        "description": "",
-        "open_id": "ou_22b070f27496faae0c4d841b82eda5c1"
-    },
-    {
-        "name": "苏朋",
-        "description": "",
-        "open_id": "ou_1bca759ca8efc4870f262c97c1a05e52"
-    },
-    {
-        "name": "杨孝辉",
-        "description": "",
-        "open_id": "ou_68709278795778df53519a577e3da486"
-    },
-    {
-        "name": "刘志恒",
-        "description": "",
-        "open_id": "ou_1922d32126d44e1cdbe658e6c184f502"
-    },
-    {
-        "name": "聂琦",
-        "description": "",
-        "open_id": "ou_3707d21dd00fa8753b9827214b834142"
-    },
-    {
-        "name": "蒋德敏",
-        "description": "",
-        "open_id": "ou_f6a659e740ebd110cfe27dc38bbddb37"
-    }
+  {
+    "name": "谭景玉",
+    "description": "",
+    "open_id": "ou_11fdbd559cc6513ab53ff06d6c63413d",
+    "chat_id": "oc_56e85f0e2c97405d176729b62d8f56e5"
+  },
+  {
+    "name": "王华东",
+    "description": "",
+    "open_id": "ou_82340312cf9d215f49a41b67fa9c02c2"
+  },
+  {
+    "name": "孙若天",
+    "description": "",
+    "open_id": "ou_ede69f28c2617bf80a7574f059879c8d",
+    "chat_id": "oc_98019f9a0419b46a215ca604b04c5cc6"
+  },
+  {
+    "name": "刘斌",
+    "description": "",
+    "open_id": "ou_50c2307c3531e6293b3d5533d14592e9"
+  },
+  {
+    "name": "关涛",
+    "description": "",
+    "open_id": "ou_90b80ed994fe41b7f038a63cb9182f72"
+  },
+  {
+    "name": "刘龙",
+    "description": "",
+    "open_id": "ou_2d25b935d720c4404e4ea88b70bcdce2"
+  },
+  {
+    "name": "马晗",
+    "description": "",
+    "open_id": "ou_405c6b8581ee36b153ff8159cfc9f29e"
+  },
+  {
+    "name": "王雅萱",
+    "description": "",
+    "open_id": "ou_22b070f27496faae0c4d841b82eda5c1"
+  },
+  {
+    "name": "苏朋",
+    "description": "",
+    "open_id": "ou_1bca759ca8efc4870f262c97c1a05e52"
+  },
+  {
+    "name": "杨孝辉",
+    "description": "",
+    "open_id": "ou_68709278795778df53519a577e3da486"
+  },
+  {
+    "name": "刘志恒",
+    "description": "",
+    "open_id": "ou_1922d32126d44e1cdbe658e6c184f502"
+  },
+  {
+    "name": "聂琦",
+    "description": "",
+    "open_id": "ou_3707d21dd00fa8753b9827214b834142"
+  },
+  {
+    "name": "蒋德敏",
+    "description": "",
+    "open_id": "ou_f6a659e740ebd110cfe27dc38bbddb37"
+  }
 ]

+ 122 - 338
examples/find knowledge/skills/dimension_research.md

@@ -2,29 +2,35 @@
 
 ## ⚠️ 关键规则(必须首先阅读)
 
-**在开始任何搜索前,必须理解:**
+**在构造任何query前,必须通过以下检查:**
 
-1. **搜索目的**:寻找"如何提取特征"的方法,而不是寻找类似的图片内容
-2. **Query构造**:必须包含[特征类型] + [提取动作] + [信息类型]
-3. **严格禁止**:
-   - ❌ 直接使用亮点描述作为搜索词
-   - ❌ 只搜索内容关键词
-   - ❌ 缺少"提取"、"检测"、"识别"等动作词的query
+1. **Query中是否包含动作词?**
+   - 必须包含:提取、检测、识别、分析、获取、生成、控制等
+   - 如果没有动作词,这个query是错误的
 
-**错误示例**:如果亮点是"优雅的白裙写生少女"
-- ❌ 错误:搜索"白裙少女写生"(直接使用亮点描述)
-- ❌ 错误:搜索"写生少女"(只有内容关键词)
-- ✅ 正确:搜索"人物姿态 提取 方法"(特征+提取+信息)
-- ✅ 正确:搜索"服装形式 识别 工具"(特征+提取+信息)
+2. **Query是否在搜索"如何做"而不是"是什么"?**
+   - ✅ 正确:姿态提取方法、深度图生成工具
+   - ❌ 错误:女性画家、户外写生、白色裙子
 
----
+3. **Query是否会搜到技术内容?**
+   - ✅ 正确:会搜到教程、工具、方法
+   - ❌ 错误:会搜到图片、作品、内容
+
+**示例对比**:
 
-## 全局规则
+| 错误Query(只有内容) | 正确Query(包含方法) |
+|---------------------|---------------------|
+| ❌ 女性画家 背影 | ✅ 人物姿态 提取方法 |
+| ❌ 户外写生 空间 | ✅ 深度图 生成工具 |
+| ❌ 白色裙子 | ✅ 服装分割 检测方法 |
+| ❌ 画架 画板 | ✅ 物体识别 提取工具 |
 
-**重要**:本skill必须严格遵守主prompt中定义的全局规则,包括:
-- 知识与推理体系(知识使用决策机制、知识来源标注)
-- 评估与反馈机制(完整性、准确性、可逆性、可复用性评估)
-- 可审计理由链(ACTION、WHY、EVIDENCE、NEXT)
+**强制自检流程**:
+```
+构造query → 检查是否包含动作词 → 检查是否搜索方法 → 确认后搜索
+           ↓ 没有动作词                ↓ 只搜内容
+           重新构造                    重新构造
+```
 
 ---
 
@@ -35,18 +41,14 @@
 **核心目的**:选择的特征维度将用于**生成式AI模型还原图片**。
 
 **关键原则**:
-- 特征维度必须是生成模型可消费的控制信号(如ControlNet、IP-Adapter等
+- 特征维度必须是生成模型可消费的控制信号(生成模型包括但不限于stable diffusion、nano banana等模型
 - 根据图片维度的特点,选择能够有效控制生成过程的特征维度
-- 特征维度应该能够指导模型重建该图片维度的视觉效果
 - 优先选择在AI图像生成领域已被验证有效的控制方式
 
 **搜索重点**:
 - 寻找创作者如何使用特定特征维度来控制AI生成图片
 - 关注特征维度在生成模型中的实际应用案例
 - 了解特征维度如何影响生成结果的视觉效果
-- 验证特征维度是否能够准确还原目标图片维度
-
-通过案例研究和创作者经验,将Image Dimension转换为生成模型可使用的Control Signal。
 
 **注意**:本skill只负责 Image Dimension → Control Signal,不负责寻找工具或提取Feature Value。
 
@@ -56,352 +58,149 @@
 
 ```json
 {
-  "highlight_id": "[亮点ID或序号](可选)",
-  "highlight_description": "[亮点简短描述](可选)",
-  "highlight_type": "[实质/形式/全局]",  // 必须明确标注亮点类型
-  "global_features": [],  // 短词或短语,仅当亮点类型为"形式"或"全局"时填写
-  "substances": [],       // 去重后,仅当亮点类型为"实质"时填写
-  "forms": [],           // 去重后,仅当亮点类型为"实质"时填写(该实质的形式属性)
-  "highlights": [],      // 高权重亮点简短描述(每条<=20字)
-  "goal": "为该亮点寻找适合生成控制且可学习可复用的多模态特征维度"
+  "highlight_id": "[亮点ID](可选)",
+  "highlight_description": "[亮点描述](可选)",
+  "highlight_type": "[实质/形式/全局]",
+  "image_dimension": "[图片维度名称]",
+  "image_dimension_description": "[图片维度描述]",
+  "goal": "为该图片维度寻找适合的特征维度(Control Signals)"
 }
 ```
 
-**注意**:
-- 如果提供了 `highlight_id` 和 `highlight_description`,则说明是为单个亮点进行研究
-- 如果未提供,则说明是为整个图片组进行研究
-- **highlight_type** 决定了维度提取的范围和边界
-- 根据亮点类型,只填写相应的字段
-
 ---
 
 ## 输出格式
 
 **文件**:`knowledge/dimension_research_result.json`
 
-**结构**:
 ```json
 {
-  "control_signal_candidates": [
+  "image_dimension": "pose",
+  "control_signals": [
     {
-      "image_dimension": "多模态维度",
-      "level": "global / substance / form",
-      "control_signal": "特征维度",
-      "signal_type": "graph / ...",
-      "representation": "json / ...",
-      "output_format": "image / json",
-      "format_reason": "选择该输出格式的理由",
-      "reason": "选择的原因",
-      "generation_usage": "特征维度在还原过程中应该被怎样使用",
-      "evidence": [
-        {
-          "url": "...",
-          "snippet": "..."
-        }
-      ]
+      "name": "openpose_skeleton",
+      "category": "form",
+      "output_format": "image",
+      "format_reason": "骨架图是标准的ControlNet输入格式",
+      "generation_usage": "作为ControlNet的pose控制信号",
+      "search_evidence": ["URL1", "URL2"],
+      "reasoning": "为什么选择这个控制信号"
     }
   ]
 }
 ```
 
-**必须说明**:
-- 所属层级(global / substance / form)
-- 选择原因
-- 表示方式
-- **输出格式(image/json)及选择理由(必须明确指定)**:
-  - image:特征可视化或标准化素材
-    - 全局/形式:特征可视化(深度图、分割mask、骨架图、网格图、光照方向图等)
-    - 实质:标准化素材(去除背景、光照、颜色等形式信息的纯素材)
-  - json:参数/数值特征(比例、坐标、权重、描述性参数等)
-  - **禁止**:保存原图或原图的裁剪/截图/抠图
-  - **重要**:不是所有维度都是标签/分类,很多维度需要输出图像化的特征表示
-- 在生成中的作用
-- 原始证据
-
-**常见维度的输出格式参考**:
-- 构图/布局类:通常用 image(网格图、引导线图、区域分布图)
-- 光照类:通常用 image(光照方向图、轮廓光分布图)
-- 深度/景深类:通常用 image(深度图、清晰度热力图)
-- 姿态/骨架类:通常用 image(骨架图)
-- 色彩类:可用 image(色带图)或 json(色值+权重)
-- 标签/分类类:用 json(标签、权重、参数)
-
-**实质维度特殊说明**:
-- **每个实质元素都是独立的维度**,分别指定 output_format: "image"
-- 每个实质维度将使用nanobanana工具生成三视图(正面、侧面、背面)
-- **风格要求**:生成的三视图风格必须与原图保持一致(如原图是照片风格,则生成照片级素材)
-- **参考input目录中的示例**(如果有),理解三视图的正确形式
-
----
-
-## 搜索策略
-
-**执行要求**:
-- 搜索前:列出初始知识库(输入特征、领域知识、**亮点类型**)和假设(基于输入特征的合理假设)
-- 搜索中:每轮记录新知识(内容、来源、可靠性)和推理链(前提 → 逻辑 → 结论)
-- 搜索后:进行评估,输出评估报告(包含决策:PASS/ADJUST/REDO)
-
-**维度边界原则(关键)**:
-
-根据 **highlight_type** 严格限制维度提取范围:
-
-**实质类亮点**:
-- ✅ 只提取:该实质本身 + 该实质的形式属性
-- ❌ 禁止提取:全局形式(深度图、整体构图等)
-- ❌ 禁止提取:其他实质
-- 示例:
-  - 亮点:"白裙写生少女"(实质)
-  - 应提取:女性主体(实质)、白裙(实质)、绘画姿态(该实质的形式)
-  - 不应提取:深度图(全局)、画架(其他实质)
-
-**形式类亮点**:
-- ✅ 只提取:该形式维度本身
-- ❌ 禁止提取:具体实质
-- ❌ 禁止提取:其他形式维度
-- 示例:
-  - 亮点:"户外写生空间层次"(形式)
-  - 应提取:深度图(该形式)
-  - 不应提取:人物、服装(实质)
-
-**全局类亮点**:
-- ✅ 只提取:全局形式维度
-- ❌ 禁止提取:具体实质
-- 示例:
-  - 亮点:"整体构图"(全局)
-  - 应提取:构图网格图(全局形式)
-  - 不应提取:人物、服装(实质)
-
-**树状结构原则**:
-每个亮点的维度应该互不重叠,除非亮点本身就是全局的。如果一个维度涉及多个亮点,应该归属到最相关的那个亮点。
-
-### 搜索目标
-
-**核心目标**:寻找如何使用特征维度通过生成式AI模型还原图片维度的视觉效果。
-
-**优先寻找**:
-- 创作者如何使用某个特征维度(如深度图、姿态骨架、光照图等)作为控制信号
-- 如何通过该特征维度指导AI生成模型(如Stable Diffusion + ControlNet)重建视觉效果
-- 特征维度在生成过程中如何影响最终图片的该维度表现
-
-**必须基于真实案例**:
-- 寻找创作者使用AI生成模型的实际案例和经验分享
-- 寻找详细的生成流程和控制方法(如ControlNet使用、IP-Adapter配置等)
-- 关注特征维度如何作为生成条件输入到模型中
-- 不要凭空想象或理论推测
-- 所有Control Signal的选择必须有搜索证据支持
-
-**避免**:
-- 单纯的特征提取工具介绍(不涉及生成应用)
-- 无生成流程说明的教程
-- 纯理论讨论(没有实际生成案例)
-
-### 搜索重点
+**输出格式说明**:
+- image:特征可视化(深度图、mask、骨架图等)或标准化素材
+- json:参数/数值特征(比例、坐标、权重等)
 
-- **AI生成案例**:创作者如何使用特征维度控制AI生成某种效果
-- **生成流程**:从特征提取到生成的完整步骤
-- **控制方法**:特征维度如何输入到生成模型(ControlNet、IP-Adapter、Lora等)
-- **视觉控制效果**:特征维度对生成结果的具体影响
-- **参数经验**:实际使用的模型参数、权重、调整经验
-- **常见问题**:生成过程中的坑和解决方案
-
-**最终目标**:从真实AI生成案例中提炼可用于还原图片的控制信号
+**常见维度参考**:
+- 构图/布局/光照/深度/姿态 → image
+- 色彩 → image或json
+- 标签/分类/参数 → json
 
 ---
 
-## Query生成策略
-
-### 搜索平台限制
-**重要**:所有搜索只在小红书平台进行,不使用其他平台。
+## 工作流程
 
-### Query词要求
+### 1. Query构造(关键)
 
-**核心原则**:搜索的目的是寻找"如何提取特征"的方法,而不是寻找类似的图片内容
+**⚠️ 搜索目的**:寻找"如何提取特征"的方法,而不是寻找类似的图片内容
 
-- **简短精炼**:每个query由3-5个词组成,保持语义完整
-- **核心关键词**:直接使用核心概念,去除冗余修饰
-- **语义完整**:确保query能够清晰表达搜索意图
-- **必须包含提取意图**:query中必须包含"提取"、"检测"、"识别"、"分析"等动作词
+**Query公式**:[特征类型] + [提取动作] + [信息类型]
 
 **严格禁止**:
-- ❌ **禁止直接使用亮点描述作为搜索词**
-- ❌ **禁止只搜索内容关键词**
-- ❌ **禁止缺少提取意图的query**
-
-**Query构造模式**:
-- ✅ [特征类型] + [提取动作] + [信息类型]
-  - 特征类型:从亮点中提取的核心特征概念
-  - 提取动作:提取、检测、识别、分析、获取等
-  - 信息类型:方法、工具、教程、案例等
+- ❌ 直接使用亮点描述作为搜索词
+- ❌ 只搜索内容关键词
+- ❌ 缺少"提取"、"检测"、"识别"等动作词
 
-**错误模式**:
-- ❌ [亮点原文](直接使用亮点描述)
-- ❌ [内容关键词](只有主题,没有提取意图)
-- ❌ [特征类型] + [应用场景](关注应用而非提取)
-- ❌ 过短(少于3个词)或过长(超过8个词)
+**自检问题**:
+- 这个query是在搜索"如何提取特征"吗?
+- 这个query包含提取动作词了吗?
+- 这个query会搜到提取方法和工具吗?
 
-### Query迭代规则(关键要求)
+**Query要求**:
+- 简短(3-5词)
+- 语义完整
+- 包含提取意图
 
-**核心原则**:
-- **递进关系**:每轮query要在上一轮基础上递进,从宽泛到具体
-- **适可而止**:不要搜索太多轮,通常2-3轮足够
-- **明确记录**:每轮必须记录query词、迭代原因、理由
+**搜索平台**:只在小红书搜索,使用中文
 
-**迭代流程**:
+### 2. 搜索迭代
 
 **第一轮(宽泛探索)**:
-- **目标**:了解大方向,发现关键概念和提取方法
-- **Query组成要求**:必须包含两类关键词
-  - **主题关键词**:从亮点中提取的核心特征概念
-  - **提取关键词**:与特征提取相关的动作词
-- **Query特点**:3-5个词,语义完整,聚焦特征提取
-- **Query模式**:[特征类型] + [提取动作] + [信息类型]
-- **记录要求**:
-  - 使用的query词列表(2-5个query)
-  - 搜索到的关键信息摘要
-  - 发现的专业术语或工具名称
-  - 下一轮的方向判断
+- 目标:了解大方向,发现关键概念
+- Query:[特征类型] + [提取动作] + [信息类型]
+- 记录:query词、关键信息、专业术语
 
 **第二轮(聚焦细化)**:
-- **目标**:基于第一轮发现的关键词,聚焦到具体方法
-- **Query特点**:使用第一轮发现的专业术语(3-5个词,语义完整)
-- **递进逻辑**:从"是什么"到"怎么做"
-- **Query模式**:[第一轮发现的术语/工具] + [使用/应用] + [教程/案例]
-- **记录要求**:
-  - 使用的query词列表(2-5个query)
-  - 为什么选择这些query(基于第一轮的哪些发现)
-  - 搜索到的具体案例和方法
-  - 是否需要第三轮(通常不需要)
+- 目标:基于第一轮发现,聚焦具体方法
+- Query:[第一轮术语/工具] + [使用/应用] + [教程/案例]
+- 记录:query词、选择理由、具体案例
 
 **第三轮(可选,验证补充)**:
-- **目标**:验证具体细节或补充遗漏信息
-- **Query特点**:针对性很强的具体问题(3-5个词,语义完整)
-- **递进逻辑**:从"怎么做"到"效果如何"或"参数设置"
-- **Query模式**:[工具/方法] + [效果/参数/对比] + [评测/设置]
-- **记录要求**:
-  - 使用的query词列表(1-3个query)
-  - 为什么需要第三轮(第二轮哪些信息不足)
-  - 补充的信息
+- 目标:验证细节或补充信息
+- Query:[工具/方法] + [效果/参数] + [评测/设置]
 
 **停止条件**(满足任一即停止):
 - 找到3-5个真实案例支持某个Control Signal
 - 能够清晰描述该Control Signal的使用方法
-- 搜索结果开始重复,没有新信息
+- 搜索结果开始重复
 - 已完成2-3轮搜索
 
-**禁止行为**:
-- ❌ 只搜索一轮就结束(至少2轮)
-- ❌ 搜索超过4轮(适可而止)
-- ❌ Query词过长(超过15个字)
-- ❌ Query词过短(少于3个词,语义不完整)
-- ❌ 没有记录迭代原因和理由
-- ❌ 迭代没有递进关系(重复搜索相同内容)
-
----
-
-## 搜索循环
-
-```
-第一轮:宽泛探索(核心概念词)
-↓
-记录发现的关键词和术语
-↓
-第二轮:聚焦细化(专业术语+具体方法)
-↓
-记录具体案例和方法
-↓
-评估:是否足够?
-├─ 是 → 提炼Control Signal
-└─ 否 → 第三轮:验证补充(针对性问题)
-```
-
----
-
-## 评估标准
+### 3. 维度边界控制
 
-搜索完成后,对每个候选维度评估
+根据**highlight_type**严格限制提取范围:
 
-**必须满足**:
-- 可用于生成模型控制
-- 可独立修改
-- 不包含原始像素
-- 可用于学习和复用
-- 不与原图高度相似
-
-**避免**:
-- 与原图高度相似的特征
-- 无法泛化的特征
+**实质类亮点**:
+- ✅ 提取:该实质本身 + 该实质的形式属性
+- ❌ 禁止:全局形式、其他实质
 
----
+**形式类亮点**:
+- ✅ 提取:该形式维度本身
+- ❌ 禁止:具体实质、其他形式维度
 
-## 研究文档要求
-
-搜索完成后,必须生成研究记录,说明每个维度如何被发现并确定。
-
-### 必须包含
-
-**0. 知识库与假设**
-- **初始知识库**:列出从输入获得的所有初始知识
-- **假设列表**:列出所有假设及其依据
-- **推理起点**:说明从哪些知识和假设开始推理
-
-**1. Image Dimension原始信息**
-- 说明该维度来自图片的哪个方面
-- 标明来源:global feature / substance / form / highlight
-- 记录制作表或亮点中的来源路径
-
-**2. Initial Hypothesis**
-- 说明该维度最初的理解或假设
-- 图片的这个方面可能由哪些视觉变量控制
-
-**3. Query Iteration(关键部分)**
-记录query的完整迭代过程,每一轮必须包含:
-- **Round N Query**:本轮使用的具体query词列表(每个query 3-5个词,语义完整)
-- **Iteration Reason**:为什么进行本轮搜索(基于上一轮的哪些发现或不足)
-- **Progressive Logic**:本轮相比上一轮的递进关系(从宽泛到具体,从概念到方法)
-- **Search Results**:搜索到的关键内容摘要(案例、方法、关键词)
-- **Key Findings**:本轮的关键发现
-- **New Keywords**:从结果中提取的新关键词或专业术语
-- **New Knowledge**:本轮获得的知识(内容、来源URL、可靠性说明)
-- **Reasoning**:基于新知识的推理(前提 → 推理逻辑 → 结论)
-- **Next Direction**:下一轮的方向(如果需要)或停止原因
-
-要求:
-- 至少记录2轮迭代,最多3-4轮
-- 每轮都要明确说明迭代原因和递进逻辑
-- Query词必须3-5个词,保持语义完整
-- 必须体现从宽泛到具体的递进关系
-
-**4. Evidence(必须基于真实案例)**
-记录关键搜索案例,必须包含:
-- **URL**:案例来源链接
-- **Case Description**:案例简要说明(谁做的、做了什么)
-- **Method Used**:案例中使用的具体方法和控制变量
-- **Parameters**:案例中提到的参数或设置
-- **Key Insight**:从案例中得到的关键结论
-- **Knowledge Category**:标注这是什么类型的知识(方法、工具、参数经验等)
-
-要求:至少记录3-5个真实案例,案例必须是实际创作经验,必须包含具体的方法和参数。
-
-**5. Control Signal Decision(必须基于搜索证据)**
-说明最终选择的控制信号:
-- **Image Dimension → Control Signal**:维度转换
-- **Evidence-Based Reasoning**:基于哪些搜索案例做出的决策
-  - **前提**:引用具体的案例编号(Case 1, Case 2...)和知识库条目
-  - **推理逻辑**:说明这些案例如何支持该Control Signal
-  - **边界检查**:确认该Control Signal只服务于当前亮点,不越界到其他亮点
-  - **结论**:选择该Control Signal的理由
-- **How It Works**:该信号如何控制视觉效果(基于案例中的方法)
-- **Generation Usage**:该信号如何用于生成模型(基于案例中的实践)
-- **输出格式(image/json)及选择理由**:基于案例中的使用方式
-- 如果是实质维度,说明三视图提取策略(基于搜索到的方法)
-
-禁止:凭空想象Control Signal、没有案例支持的决策、理论推测而非实践经验、缺少推理链、**选择了不属于当前亮点的维度**。
-
-**6. Rejected Alternatives**
-记录被否决的方案并说明原因:与原图过于相似、无法泛化、无法提取、不是抽象的可复用特征、缺少搜索证据支持。
-
-**7. 评估报告**
-在输出JSON中添加评估报告(格式见"全局规则遵守"部分),包含:完整性、准确性、可逆性、可复用性评估,发现的问题,决策(PASS/ADJUST/REDO)及理由。
+**全局类亮点**:
+- ✅ 提取:全局形式维度
+- ❌ 禁止:具体实质
+
+### 4. 分析搜索结果
+
+从搜索结果中提取:
+- 创作者使用的控制信号类型
+- 控制信号在生成中的作用
+- 控制信号的输出格式(image/json)
+- 实际应用案例和效果
+
+### 5. 提炼控制信号
+
+**分解原则**:
+- 实质类 → 实质本身 + 形式属性(多个)
+- 形式类 → 该形式表示(1个)
+- 全局类 → 全局特征(1个或少数)
+
+**推理要求**:
+- 列出搜索得到的知识
+- 说明为什么需要这些特征维度
+- 边界检查(只服务于当前图片维度)
+- 得出特征维度列表
+
+### 6. 输出结果
+
+每个控制信号必须包含:
+- name(snake_case)
+- category(global/substance/form)
+- output_format(image/json)
+- format_reason(选择该格式的理由)
+- generation_usage(在还原时如何使用)
+- search_evidence(支持的URL)
+- reasoning(选择理由,基于搜索案例)
+
+**禁止**:
+- 凭空想象Control Signal
+- 没有案例支持的决策
+- 理论推测而非实践经验
+- 选择不属于当前亮点的维度
 
 ---
 
@@ -411,18 +210,3 @@
 - 为什么这种效果成立
 - 如何实现
 - 哪些因素控制
-
----
-
-## 搜索语言策略
-
-### 搜索平台
-**唯一平台**:小红书
-
-所有搜索只在小红书平台进行,不使用其他平台(知乎、B站、GitHub、论文等)。
-
-### 搜索语言
-使用中文进行搜索。
-
-### 禁止行为
-**禁止**:使用小红书以外的平台进行搜索

+ 113 - 237
examples/find knowledge/skills/tool_research.md

@@ -2,29 +2,35 @@
 
 ## ⚠️ 关键规则(必须首先阅读)
 
-**在开始任何搜索前,必须理解:**
+**在构造任何query前,必须通过以下检查:**
 
-1. **搜索目的**:寻找"提取工具",而不是寻找类似的图片内容
-2. **Query构造**:必须包含[特征维度] + [提取动作] + [工具/方法]
-3. **严格禁止**:
-   - ❌ 直接使用亮点描述作为搜索词
-   - ❌ 只搜索内容关键词
-   - ❌ 缺少"工具"、"方法"、"提取"等词的query
+1. **Query中是否包含"工具"或"方法"?**
+   - 必须包含:工具、方法、软件、插件、模型、API等
+   - 如果没有这些词,这个query是错误的
 
-**错误示例**:如果需要提取"人物姿态"特征
-- ❌ 错误:搜索"白裙少女"(使用内容关键词)
-- ❌ 错误:搜索"人物姿态"(只有特征名,没有工具意图)
-- ✅ 正确:搜索"姿态 提取 工具"(特征+提取+工具)
-- ✅ 正确:搜索"骨架 检测 方法"(特征+提取+方法)
+2. **Query是否在搜索"用什么工具"而不是"是什么内容"?**
+   - ✅ 正确:姿态检测工具、深度提取方法
+   - ❌ 错误:女性画家、户外写生、白色裙子
 
----
+3. **Query是否会搜到工具推荐?**
+   - ✅ 正确:会搜到工具名称、使用教程
+   - ❌ 错误:会搜到图片、作品、内容
 
-## 全局规则
+**示例对比**:
 
-**重要**:本skill必须严格遵守主prompt中定义的全局规则,包括:
-- 知识与推理体系(知识使用决策机制、知识来源标注)
-- 评估与反馈机制(完整性、准确性、可用性、可靠性评估)
-- 可审计理由链(ACTION、WHY、EVIDENCE、NEXT)
+| 错误Query(只有内容) | 正确Query(包含工具) |
+|---------------------|---------------------|
+| ❌ 女性画家 姿态 | ✅ 姿态检测 工具推荐 |
+| ❌ 户外 深度 | ✅ 深度图提取 方法 |
+| ❌ 白色裙子 | ✅ 服装分割 工具 |
+| ❌ 画架 识别 | ✅ 物体检测 模型推荐 |
+
+**强制自检流程**:
+```
+构造query → 检查是否包含"工具/方法" → 检查是否搜索工具 → 确认后搜索
+           ↓ 没有工具/方法                ↓ 只搜内容
+           重新构造                        重新构造
+```
 
 ---
 
@@ -42,26 +48,24 @@
 
 ```json
 {
-  "highlight_id": "[亮点ID或序号](可选)",
-  "highlight_type": "[实质/形式/全局]",  // 亮点类型,用于理解维度边界
+  "highlight_id": "[亮点ID](可选)",
+  "highlight_type": "[实质/形式/全局]",
   "dimensions": [
     {
-      "name": "pose",  // 维度名称(snake_case)
-      "category": "form",  // global / substance / form
-      "output_format": "image",  // image / json
-      "belongs_to_highlight": true  // 该维度是否属于当前亮点
+      "name": "pose",
+      "category": "form",
+      "output_format": "image",
+      "belongs_to_highlight": true
     }
   ]
 }
 ```
 
 **注意**:
-- dimensions实际上表示Control Signals,而不是Image Dimensions
+- dimensions实际上表示Control Signals
 - 需要知道每个维度的category和output_format,以便选择合适的工具
-- 如果提供了 `highlight_id`,则说明是为单个亮点寻找工具
-- 如果未提供,则说明是为整个图片组寻找工具
-- **highlight_type** 帮助理解维度的边界和范围
-- **belongs_to_highlight** 标识该维度是否属于当前亮点(用于验证维度边界)
+- highlight_type帮助理解维度的边界和范围
+- belongs_to_highlight标识该维度是否属于当前亮点
 
 ---
 
@@ -69,7 +73,6 @@
 
 **文件**:`knowledge/tool_research_result.json`
 
-**结构**:
 ```json
 {
   "tools": [
@@ -79,221 +82,109 @@
       "output_format": "image",
       "tool_name": "OpenPose",
       "type": "model",
-      "input": "image",
-      "output": "skeleton keypoints",
-      "api": true,
-      "reason": "广泛用于人体姿态检测"
+      "availability": "ComfyUI节点",
+      "usage": "使用方法描述",
+      "parameters": "关键参数说明",
+      "search_evidence": ["URL1", "URL2"],
+      "reasoning": "为什么选择这个工具"
     }
   ]
 }
 ```
 
-**实质维度特殊说明**:
-- 实质维度(category: "substance")使用nanobanana工具生成三视图
-- **核心需求**:为每个实质元素生成三个视角的完整实体素材
-- **风格要求**:生成的三视图风格必须与原图保持一致(如原图是照片风格,则生成照片级素材)
-- **最终交付物是.png图片文件**,不是规范文档或json
-- **参考input目录中的示例**(如果有),理解三视图的正确形式
-
 ---
 
-## 搜索策略
+## 工作流程
 
-**搜索平台限制**:
-- **唯一平台**:小红书
-- 所有搜索只在小红书平台进行,不使用其他平台
+### 1. Query构造(关键)
 
-**Query词要求**:
+**⚠️ 搜索目的**:寻找"提取工具",而不是寻找类似的图片内容
 
-**核心原则**:搜索的目的是寻找"提取工具",而不是寻找类似的图片内容。
-
-- **简短精炼**:每个query由3-5个词组成,保持语义完整
-- **核心关键词**:直接使用核心概念,去除冗余修饰
-- **语义完整**:确保query能够清晰表达搜索意图
-- **必须包含工具意图**:query中必须包含"工具"、"方法"、"提取"、"检测"等词
+**Query公式**:[特征维度] + [提取动作] + [工具/方法]
 
 **严格禁止**:
-- ❌ **禁止直接使用亮点描述作为搜索词**
-- ❌ **禁止只搜索内容关键词**
-- ❌ **禁止缺少工具/方法意图的query**
-
-**Query构造模式**:
-- ✅ [特征维度] + [提取动作] + [工具/方法]
-  - 特征维度:需要提取的特征类型
-  - 提取动作:提取、检测、识别、生成、去除等
-  - 工具/方法:工具、方法、推荐、教程等
-
-**错误模式**:
-- ❌ [亮点原文](直接使用亮点描述)
-- ❌ [特征维度](只有主题,没有工具意图)
-- ❌ [特征维度] + [应用场景](关注应用而非工具)
-- ❌ 过短(少于3个词)或过长(超过8个词)
-
-**执行要求**:
-- 搜索前:列出初始知识库(维度列表、类别、格式、**亮点类型**)和假设(基于维度类型的工具假设)
-- 搜索中:每轮记录新知识(工具信息、使用案例、来源URL、可靠性)和推理链(前提 → 逻辑 → 结论)
-- 搜索后:进行评估,输出评估报告(包含决策:PASS/ADJUST/REDO)
-
-**重要原则**:
-- **必须基于真实案例和创作者经验**
-- **搜索轮次限制**:通常2-3轮足够,不要超过4轮
-- **每轮搜索都要记录结果**,并根据结果优化下一轮Query
-- **工具选择必须有搜索证据支持**,不能凭空想象
-- **工具必须服务于当前亮点的维度**,不要为其他亮点的维度寻找工具
-
-**维度边界检查**:
-- 确认每个维度都属于当前亮点(检查 `belongs_to_highlight` 标识)
-- 如果发现维度不属于当前亮点,应该标记并跳过
-- 工具选择时要考虑维度的边界和范围
-
----
-
-### 搜索迭代流程
-
-**第一轮(工具发现)**:
-- **目标**:发现能够提取指定特征的工具或方法
-- **Query组成要求**:必须包含两类关键词
-  - **主题关键词**:与特征维度相关
-  - **提取关键词**:与特征提取相关的动作词
-- **Query特点**:3-5个词,语义完整,聚焦工具发现
-- **Query模式**:[特征维度] + [提取动作] + [工具/方法]
-- **记录要求**:
-  - 使用的query词列表(2-5个query)
-  - 发现的工具名称列表
-  - 创作者提到的使用经验摘要
-  - 下一轮的方向判断
-
-**第二轮(工具验证)**:
-- **目标**:验证工具的可用性和效果
-- **Query特点**:使用工具名称+使用/效果(3-5个词,语义完整)
-- **递进逻辑**:从"有什么工具"到"工具怎么样"
-- **Query模式**:[第一轮发现的工具名] + [效果/使用] + [评测/教程]
-- **记录要求**:
-  - 使用的query词列表(2-5个query)
-  - 为什么选择这些query(基于第一轮的哪些发现)
-  - 工具的实际使用案例和效果评价
-  - 是否需要第三轮
-
-**第三轮(可选,对比选择)**:
-- **目标**:对比多个工具,选择最优
-- **Query特点**:工具对比或参数细节(3-5个词,语义完整)
-- **Query模式**:[工具A] [工具B] + [对比] 或 [工具名] + [参数] + [设置]
-- **记录要求**:
-  - 使用的query词列表(1-3个query)
-  - 为什么需要第三轮
-  - 对比结果和最终选择
-
-**停止条件**(满足任一即停止):
-- 找到2-3个可用的候选工具
-- 能够明确推荐最合适的工具
-- 搜索结果开始重复
-- 已完成2-3轮搜索
+- ❌ 直接使用亮点描述作为搜索词
+- ❌ 只搜索内容关键词
+- ❌ 缺少"工具"、"方法"、"提取"等词
 
-**禁止行为**:
-- ❌ 只搜索一轮就结束
-- ❌ 搜索超过4轮
-- ❌ Query词过长(超过15个字)
-- ❌ Query词过短(少于3个词,语义不完整)
-- ❌ 没有记录迭代原因和理由
-- ❌ 使用小红书以外的平台
----
+**自检问题**:
+- 这个query是在搜索"提取工具"吗?
+- 这个query包含工具/方法相关的词了吗?
+- 这个query会搜到工具推荐和使用方法吗?
 
-## 工具选择标准
-
-### 必须满足
-- 支持图像输入
-- 输出结构符合维度需求
-- 支持API或代码调用
-- 可用于批量处理
-- **输出特征不是原图的复制**:
-  - 工具应该提取抽象的、可复用的特征
-  - 不是简单的裁剪、抠图、区域提取
-  - 输出应该是特征可视化或标准化素材
-- **工具必须可用**:
-  - 优先选择你可以直接使用的工具
-  - 包括已有的工具、在线服务、API等
-  - 不能只推荐工具而不执行
-
-### 优先选择
-- 在小红书上有真实使用案例的工具
-- 创作者评价好的工具
-- 近期更新的工具
+**Query要求**:
+- 简短(3-5词)
+- 语义完整
+- 包含工具/方法意图
 
----
+**搜索平台**:只在小红书搜索,使用中文
 
-## 验证要求
+### 2. 搜索迭代
 
-工具选择后需要验证,例如
-- pose:骨架结构是否符合人体姿态
-- palette:提取颜色是否接近原图
-- texture:纹理是否符合视觉观察
+**第一轮(工具发现)**:
+- 目标:发现可用的工具
+- Query:[特征维度] + [提取/检测] + [工具/方法]
+- 记录:工具名称、工具类型、可用性
 
----
+**第二轮(使用方法)**:
+- 目标:了解工具的使用方法和效果
+- Query:[工具名称] + [使用/教程] + [案例/效果]
+- 记录:使用方法、参数设置、实际效果
 
-## 停止条件
+**第三轮(可选,对比评估)**:
+- 目标:对比多个工具,选择最优
+- Query:[工具A] vs [工具B] + [对比/评测]
 
-当每个维度找到**2-3个候选工具**,并且:
-- 有真实案例支持工具的有效性
-- 了解工具的实际使用效果和限制
-- 能够基于搜索证据做出工具选择决策
+**停止条件**(满足任一即停止):
+- 找到2-3个可用工具及其使用方法
+- 能够清晰描述工具的使用流程
+- 搜索结果开始重复
 - 已完成2-3轮搜索
 
-**禁止**:
-- ❌ 只搜索一轮就结束
-- ❌ 搜索超过4轮
-- ❌ 没有找到实际使用案例
-- ❌ 凭空推测工具效果
-
----
+### 3. 工具评估
+
+**评估标准**:
+- 在小红书上有真实使用案例
+- 创作者评价好
+- 工具可用性强(优先已有工具、在线服务、API)
+- 提取效果符合需求
+
+**工具类型**:
+- model:AI模型(如OpenPose、DepthAnything)
+- api:在线API服务
+- software:软件工具
+- plugin:插件(如ComfyUI节点、Photoshop插件)
+
+### 4. 工具选择
+
+**推理过程**:
+- 列出搜索得到的工具和案例
+- 对每个维度:
+  - 前提:引用搜索得到的工具信息和使用案例
+  - 推理逻辑:说明为什么选择这个工具
+  - 结论:选择工具名称
+
+**选择建议**:优先选择在小红书上有真实案例、评价好、可直接使用的工具
+
+### 5. 输出结果
+
+每个工具必须包含:
+- dimension(维度名称)
+- category(global/substance/form)
+- output_format(image/json)
+- tool_name(工具名称)
+- type(model/api/software/plugin)
+- availability(可用性说明)
+- usage(使用方法)
+- parameters(关键参数)
+- search_evidence(支持的URL)
+- reasoning(选择理由,基于搜索案例)
 
-## 研究文档要求
-
-**必须记录完整的搜索过程**:
-
-### 0. 知识库与假设
-- **初始知识库**:列出从输入获得的所有初始知识(维度列表、类别、格式等)
-- **假设列表**:列出所有假设及其依据(如"pose维度需要骨架提取工具")
-- **推理起点**:说明从哪些知识和假设开始搜索
-
-### 1. Query迭代记录
-每个维度都要记录完整的迭代过程,每一轮必须包含:
-- **Round N**:迭代轮次
-- **Query**:本轮使用的具体query词列表(每个query 3-5个词,语义完整)
-- **Iteration Reason**:为什么进行本轮搜索(基于上一轮的哪些发现或不足)
-- **Progressive Logic**:本轮相比上一轮的递进关系
-- **Search Results**:搜索结果摘要(发现的工具名称、基本信息、使用案例)
-- **New Knowledge**:本轮获得的知识(工具信息、使用方法、来源URL、可靠性说明)
-- **Reasoning**:基于新知识的推理(前提 → 推理逻辑 → 结论)
-- **Next Direction**:下一轮的优化方向或停止原因
-
-要求:每个维度至少记录2轮迭代,最多3-4轮,每轮都要有明确的搜索结果、新知识和推理过程。
-
-### 2. 工具案例记录
-每个候选工具都要记录:
-- **Tool Name**:工具名称
-- **Source**:发现来源(URL)
-- **Use Cases**:找到的实际使用案例(至少1-2个,包含案例描述、使用者评价、实际效果)
-- **Capabilities**:工具能力(输入格式、输出格式、支持的功能,基于文档和案例)
-- **Limitations**:工具限制(基于用户反馈)
-- **Availability**:工具可用性(开源/商业、API支持、安装难度)
-- **Recency**:更新情况(最后更新时间、是否活跃维护)
-- **Selection Reason**:选择或不选择的理由,必须包含推理过程(前提 → 推理逻辑 → 结论)
-
-### 3. 最终决策
-说明为每个维度选择的工具:
-- **Dimension → Tool**:维度与工具的对应
-- **Evidence-Based Reasoning**:基于哪些搜索案例做出的决策
-  - **前提**:引用具体的案例、评测、用户反馈
-  - **推理逻辑**:说明为什么选择这个工具而不是其他工具
-  - **边界检查**:确认该工具只服务于当前亮点的维度
-  - **结论**:最终选择及理由
-- **Why This Tool**:为什么选择这个工具(基于案例的证据、与其他工具的对比优势、符合需求的具体特性)
-- **Why Not Others**:为什么不选择其他候选工具(基于搜索证据的理由、具体的限制或不足)
-
-禁止:凭空推测工具效果、没有实际使用案例支持的工具选择、缺少推理链、选择无法验证可用性的工具、**为不属于当前亮点的维度选择工具**。
-
-### 4. 评估报告
-在输出JSON中添加评估报告(格式见"全局规则遵守"部分),包含:完整性、准确性、可用性、可靠性评估,发现的问题,决策(PASS/ADJUST/REDO)及理由。
+**禁止**:
+- 凭空推测工具效果
+- 没有实际使用案例支持的工具选择
+- 选择无法验证可用性的工具
+- 为不属于当前亮点的维度选择工具
 
 ---
 
@@ -302,18 +193,3 @@
 **工具必须服务于维度**。
 
 **维度设计优先**。
-
----
-
-## 搜索语言策略
-
-### 搜索平台
-**唯一平台**:小红书
-
-所有搜索只在小红书平台进行,不使用其他平台(知乎、B站、GitHub、论文等)。
-
-### 搜索语言
-使用中文进行搜索。
-
-### 禁止行为
-**禁止**:使用小红书以外的平台进行搜索

+ 103 - 590
examples/find knowledge/test.prompt

@@ -8,223 +8,40 @@ thinking_budget_tokens: 3000
 $system$
 你是面向可逆特征建模的多模态分析专家。核心目标:构建可逆的多模态特征空间,使生成模型能够基于特征重建原始图片。
 
-## 搜索工具策略(Search Tool Strategy)
-
-### 工具选择与降级
-
-**工具优先级**:
-1. **首选**:`search_posts` 工具(小红书API搜索)
-2. **降级**:browser-use工具(浏览器自动化搜索)
-
-**降级触发条件**:
-- 如果 `search_posts` 工具连续失败2-3次(如API错误、超时、返回空结果等)
-- 立即放弃 `search_posts` 工具,改用browser-use工具
-- 在报告中记录工具切换原因
-
-**browser-use搜索流程**:
-1. **启动搜索**:使用 `browser_navigate_to_url` 访问小红书搜索页面
-2. **执行搜索**:使用 `browser_search_web` 或手动输入搜索关键词
-3. **提取内容**:使用 `browser_extract_content` 提取搜索结果
-4. **处理登录**:如遇登录需求,按下方"登录协助流程"处理
-
-### 小红书登录协助流程
-
-**触发条件**:
-- 使用browser-use时遇到需要登录小红书账号的情况
-- 页面显示登录二维码、提示登录、或内容被遮挡
-
-**执行步骤**:
-1. **获取live url**:调用 `browser_get_live_url` 工具获取云浏览器实时画面链接
-2. **截图二维码**:如果页面显示登录二维码,使用 `browser_screenshot` 截图
-3. **飞书通知**:通过飞书发送消息给"孙若天",内容包括:
-   - Live URL链接
-   - 登录二维码截图(如有)
-   - 当前搜索进度说明
-   - 请求协助登录的明确说明
-4. **等待登录**:使用 `browser_wait_for_user_action` 工具等待人工完成登录
-5. **确认登录**:检查页面是否登录成功
-6. **继续搜索**:登录完成后从中断处继续执行搜索任务
-
-**注意事项**:
-- 不要尝试自动登录或绕过登录验证
-- 发现需要登录时,立即暂停搜索
-- 明确记录当前搜索进度,以便登录后继续
-- 飞书消息接收人必须是"孙若天"
-
-## 可审计理由链(Audit Rationale)
-
-每次行动前必须输出思维过程区块,包含:
-- **ACTION**:当前要做什么
-- **WHY**:2-4条简短理由(面向读者,可验证)
-- **EVIDENCE**:1-3条证据(引用输入/工具返回的字段或原句)
-- **UNCERTAINTY**(可选):不确定性及降低方法
-- **NEXT**:下一步计划
-
-工具调用前必须说明:为什么选这个工具、为什么现在调用、备选工具为什么不用、期望返回什么。
-
-## 教师模型工具(Teacher Model)
-
-当遇到复杂问题或需要专家建议时,可以使用 `ask_teacher` 工具向教师模型提问。
-
-**适用场景**:
-1. **复杂决策**:需要在多个方案中选择,不确定哪个更好
-2. **概念理解**:遇到难以理解的概念或要求
-3. **思路验证**:想验证当前的分析思路是否正确
-4. **问题分析**:遇到复杂问题,需要深入分析
-5. **边界判断**:不确定某个维度是否属于当前亮点
-
-**使用方法**:
-```
-调用 ask_teacher 工具:
-- question: 清晰描述你的问题或困惑
-- context: 提供相关的背景信息(当前任务、已有信息、已尝试的方法等)
-```
-
-**示例场景**:
-- "我识别出了5个维度,但不确定是否都属于这个亮点,应该如何判断?"
-- "这个亮点描述的是某个实质元素,我应该提取哪些形式维度?"
-- "我找到了3个候选的控制信号,应该如何选择?"
-
-**注意**:
-- 教师模型提供建议和指导,但最终决策由你做出
-- 教师模型使用更强大的模型(默认 openai/gpt-5.4)
-- 可以在任何需要帮助的时候调用,不要犹豫
-
-## 知识与推理体系(Knowledge & Reasoning)
-
-### 知识使用决策机制
-
-**核心原则**:预训练知识可以用于理解和分析,但关键决策必须有搜索证据支持。
-
-**可以使用预训练知识的场景**:
-- ✅ 理解基础概念(如特征类型的定义、技术原理)
-- ✅ 分析问题和提出假设(如"这个亮点可能需要提取某类特征")
-- ✅ 设计搜索策略(如"应该搜索哪些关键词")
-- ✅ 解释搜索结果(如"为什么这个案例有效")
-
-**必须搜索验证的场景**:
-- ❌ 选择具体工具或方法(如"应该用哪个工具")
-- ❌ 评估实际效果(如"这个工具效果好不好")
-- ❌ 推荐具体方案(如"应该提取哪些特征维度")
-- ❌ 判断可行性(如"这个控制信号能否还原该维度")
-- ❌ 获取最新信息(如"最新的提取工具")
-
-**决策流程**:
-```
-遇到决策点 → 自问:这个决策是否影响最终结果?
-  ├─ 否(如概念理解)→ 可以使用预训练知识
-  └─ 是(如工具选择)→ 自问:是否涉及具体工具/方法/效果?
-      ├─ 是 → 必须搜索,获取真实案例和经验
-      └─ 否 → 先用预训练知识形成假设,再搜索验证假设
-```
+## 搜索工具策略
 
-**示例**:
+**工具优先级**:`search_posts`(小红书API)→ browser-use(浏览器自动化)
 
-**场景1:理解概念(可以用预训练知识)**
-```
-问题:"什么是某种特征类型?"
-回答:"[特征类型]是表示[功能描述]的[表示形式]..."
-→ 这是基础概念,可以用预训练知识
-```
-
-**场景2:选择工具(必须搜索)**
-```
-问题:"应该用什么工具提取某特征?"
-假设:"可能可以用[工具A]或[工具B]"(预训练知识)
-行动:搜索"[特征类型] 提取 工具 推荐",查看真实案例和效果对比
-决策:基于搜索结果选择工具
-→ 这是具体工具选择,必须搜索验证
-```
-
-**场景3:提出假设(预训练知识+搜索验证)**
-```
-问题:"这个亮点应该提取哪些特征维度?"
-假设:"根据亮点描述,可能需要[维度A]、[维度B]、[维度C]等维度"(预训练知识)
-行动:搜索每个维度的实际应用案例,验证假设
-决策:基于搜索结果确定最终的特征维度列表
-→ 先用预训练知识形成假设,再搜索验证
-```
-
-### 知识来源标注
+**降级条件**:`search_posts` 连续失败2-3次,立即切换到browser-use
 
-**初始知识库(Initial Knowledge)**:
-- 从输入数据中获得的确定性知识(原始图片、制作表、亮点数据、制作点数据)
-- 可直接观察到的事实(图片中的视觉元素、颜色、构图等)
+**登录处理**(browser-use遇到登录时):
+1. 获取live URL + 截图二维码
+2. 飞书通知"孙若天"(附URL、截图、进度说明)
+3. 使用 `browser_wait_for_user_action` 等待登录完成
+4. 确认后继续搜索
 
-**假设(Assumptions)**:
-- 基于初始知识或预训练知识做出的合理假设
-- 每个假设必须说明依据
-- 标注假设的置信度
-- **重要**:假设需要通过搜索验证后才能作为决策依据
+## 核心工作原则
 
-**推理过程(Reasoning Chain)**:
-- 每一步推理都要明确给出:
-  - **前提**:使用的知识(明确来源:输入数据/搜索URL/预训练知识)
-  - **推理逻辑**:如何从前提得到结论
-  - **结论**:得到的新知识
-- **严格限制**:关键决策必须基于搜索得到的新知识,不能仅凭预训练知识或假设
-- **禁止**:凭空想象、未经验证的猜测、循环论证
+**可审计理由链**:每次行动前输出思维过程
+- ACTION:当前要做什么
+- WHY:2-4条理由(可验证)
+- EVIDENCE:1-3条证据(引用字段或原句)
+- NEXT:下一步计划
 
-**新知识标注(New Knowledge)**:
-- 每次搜索后,明确标注获得的新知识
-- **必须**说明新知识的来源(搜索URL、具体案例、创作者经验)
-- 评估新知识的可靠性(真实案例 > 创作者经验 > 工具文档 > 理论讨论)
-- 将新知识加入知识库,供后续推理使用
+**教师模型**:复杂问题时使用 `ask_teacher` 工具(openai/gpt-5.4)
+- 适用:复杂决策、概念理解、思路验证、边界判断
 
-## 评估与反馈机制(Evaluation & Feedback)
+**知识使用决策**:
+- ✅ 可用预训练知识:理解概念、分析问题、设计搜索策略、解释结果
+- ❌ 必须搜索验证:选择工具/方法、评估效果、推荐方案、判断可行性
 
-在每个关键步骤完成后,必须进行评估,决定是继续推进还是重新执行:
+**知识来源标注**:
+- 初始知识:输入数据的确定性事实
+- 假设:基于已知的推测(需说明依据和置信度)
+- 推理链:前提(标注来源)→ 逻辑 → 结论
+- 新知识:搜索获得(必须标注URL和可靠性)
 
-**评估时机**:
-- 识别出图片维度(Image Dimensions)后
-- 筛选出控制信号(Control Signals)后
-- 提取出特征值(Feature Values)后
-
-**评估标准**:
-- **完整性评估**:是否覆盖了所有必要的方面
-- **准确性评估**:与原图和提取要求的对比
-  - 原图对比:提取的特征是否准确反映原图特性
-  - 要求对比:是否符合制作表、亮点、制作点的要求
-- **可逆性评估**:特征是否足够还原原图
-- **可复用性评估**:特征是否具有泛化能力
-
-**评估流程**:
-1. **自我检查**:对照评估标准,逐项检查结果
-2. **对比验证**:
-   - 将结果与原图进行详细对比
-   - 将结果与提取要求(制作表、亮点等)进行对比
-   - 记录发现的问题和偏差
-3. **决策**:
-   - **通过(PASS)**:结果符合所有评估标准,继续下一步
-   - **需要调整(ADJUST)**:结果基本正确但需要微调,进行局部修正
-   - **重新执行(REDO)**:结果存在重大问题,需要重新执行整个步骤
-4. **记录评估结果**:
-   - 说明评估的具体过程
-   - 列出发现的问题(如果有)
-   - 说明做出的决策和理由
-
-**评估输出格式**:
-```
-### 评估报告:[步骤名称]
-
-**评估对象**:[简要描述评估的内容]
-
-**完整性**:[✓/✗] [说明]
-**准确性**:[✓/✗] [说明]
-  - 原图对比:[详细对比结果]
-  - 要求对比:[详细对比结果]
-**可逆性**:[✓/✗] [说明]
-**可复用性**:[✓/✗] [说明]
-
-**发现的问题**:
-1. [问题1]
-2. [问题2]
-
-**决策**: [PASS / ADJUST / REDO]
-**理由**: [决策理由]
-**调整计划**(如果是ADJUST): [具体调整方案]
-**重做计划**(如果是REDO): [重做的具体步骤]
-```
+**评估机制**:关键步骤完成后评估(完整性、准确性、可逆性、可复用性),决策PASS/ADJUST/REDO
 
 $user$
 # 任务目标
@@ -239,370 +56,100 @@ $user$
 
 ---
 
-# 一、核心概念
-
-## 1. Image Dimension(图片维度/需求维度)
-**定义**:图片的哪些方面需要被结构化表达。
+## 核心概念
 
-**来源**:
-- 原始图片
-- 制作表(实质/形式结构)
-- 亮点JSON
-- 制作点实质结果
-
-**性质**:这是需求(Need),说明需要提取什么,但不说明如何提取。
-
-## 2. Control Signal(控制信号/特征维度)
-**定义**:生成模型可消费的特征空间/表示方式(不是具体值)。
-
-**性质**:
-- 可参数化
-- 可组合
-- 可独立修改
-- 可用于生成模型conditioning
-
-**示例**:
-- Image Dimension: 构图结构
-- Control Signal: layout grid + subject bbox
-
-## 3. Feature Value(特征值)
-**定义**:Control Signal在具体图片上的实例化结果,由工具提取。
-
-## 4. 实质/形式双层模型
-
-**实质(Substance)**:
-- 图像中的物体本身(人物、建筑、物品等)
-- 制作点实质结果记录了图片组中多次出现的重要实质
-
-**形式(Form)**:
-- 实质的属性:颜色、姿态、材质、光照等
-- 图像整体属性:构图、整体色调、风格等
-
-**规则**:先识别实质(物体本身),再推导形式(物体的属性)。
-
-## 5. 三层工作流程与映射关系
-
-**核心原则**:整个特征提取过程分为三个层次,每层之间有明确的映射关系。
-
-**第一层:亮点 → 图片维度(Image Dimension)**
-- **映射关系**:1:1(一一对应)
-- **说明**:每个亮点对应一个图片维度
-- **示例模式**:
-  - 实质类亮点 → 该实质的抽象概念
-  - 形式类亮点 → 该形式的抽象概念
-  - 全局类亮点 → 该全局方面的抽象概念
-- **注意**:不要从一个亮点中提取多个图片维度,保持一一对应关系
-
-**第二层:图片维度 → 特征维度(Control Signal)**
-- **映射关系**:1:多(一对多)
-- **说明**:一个图片维度可以产生多个特征维度
-- **分解规则**:
-  - 实质类图片维度 → [实质本身, 形式属性1, 形式属性2, ...]
-  - 形式类图片维度 → [该形式的表示方式]
-  - 全局类图片维度 → [全局特征的表示方式]
-- **规则**:
-  - 实质类图片维度:需要提炼该实质本身 + 该实质的形式属性(可以是多个)
-  - 形式类图片维度:只提炼该形式维度本身(通常是一个)
-  - 全局类图片维度:只提炼全局形式维度(通常是一个)
-
-**第三层:特征维度 → 特征值(Feature Value)**
-- **映射关系**:可以使用多个工具提取同一特征维度,进行对比和评估
-- **说明**:对于同一个特征维度,可以尝试不同的工具提取特征值,选择最优结果
-- **流程**:
-  1. 搜索可用的工具
-  2. 选择2-3个候选工具
-  3. 分别提取特征值
-  4. 对比评估,选择最优结果
-
-**工作流程总结**:
+**三层映射关系**:
 ```
-亮点1 ──1:1──> 图片维度1 ──1:多──> [特征维度1.1, 特征维度1.2, ...] ──多工具对比──> 特征值
-亮点2 ──1:1──> 图片维度2 ──1:多──> [特征维度2.1, 特征维度2.2, ...] ──多工具对比──> 特征值
-亮点3 ──1:1──> 图片维度3 ──1:多──> [特征维度3.1, ...]                ──多工具对比──> 特征值
+亮点 ──1:1──> 图片维度 ──1:多──> 特征维度 ──多工具──> 特征值
 ```
 
-**重要提醒**:
-- 在第一步识别图片维度时,严格保持与亮点的1:1对应,不要越界
-- 在第二步筛选特征维度时,根据图片维度的类型(实质/形式/全局)决定提取多少个特征维度
-- 在第三步提取特征值时,可以尝试多个工具,通过对比选择最优方案
+**概念定义**:
+- **Image Dimension(图片维度)**:图片的哪个方面需要被表达
+- **Control Signal(特征维度)**:生成模型可用的特征表示
+- **Feature Value(特征值)**:特征维度在具体图片上的值
 
----
+**亮点类型与提取范围**:
+- **实质类**(物体/人物)→ 提取该实质的形式属性
+- **形式类**(视觉效果/风格)→ 提取该形式维度本身
+- **全局类**(整体画面)→ 提取全局形式维度
 
-# 二、工作流程
+---
 
-## 处理单位:以亮点为核心
+## 工作流程
 
-**核心原则**:以亮点为单位进行处理,每个亮点独立完成"图片维度 → 控制信号 → 特征值"的完整流程。
+**处理单位**:以亮点为核心,每个亮点独立完成完整流程
 
-**处理流程**:
+**流程**:
 1. 读取亮点数据,按权重排序
-2. 对每个亮点:
-   - 识别该亮点对应的图片维度(Image Dimensions)
-   - 筛选该亮点对应的控制信号(Control Signals)
-   - 提取该亮点对应的特征值(Feature Values)
-   - 对该亮点的结果进行评估
-3. 所有亮点处理完成后,生成整合报告
+2. 对每个亮点:识别图片维度 → 筛选控制信号 → 提取特征值 → 评估
+3. 生成整合报告
 
 ---
 
-## 第一步:识别单个亮点的Image Dimensions
-
-**【第一层:亮点 → 图片维度,1:1映射】**
-
-本步骤的目标是为每个亮点识别对应的图片维度,严格保持一一对应关系。
+## 第一步:识别图片维度(1:1映射)
 
-### 1. 选择待处理亮点
-- 从亮点数据中选择一个亮点(建议按权重从高到低处理)
-- 记录亮点的完整信息(描述、权重、对应段落等)
+**任务**:为每个亮点识别一个对应的图片维度
 
-### 2. 识别亮点类型(关键步骤)
+**推理要求**:
+- 前提:亮点类型、描述
+- 逻辑:该亮点关注图片的哪个方面
+- 边界:为什么其他方面不属于该亮点
+- 结论:图片维度名称
 
-**必须首先判断亮点的类型**,这决定了维度提取的范围:
-
-**类型A:实质类亮点**
-- 特征:描述的是具体的物体、人物、实体
-- 提取范围:
-  - ✅ 该实质本身(作为实质维度)
-  - ✅ 该实质的形式属性(颜色、姿态、材质等,仅限该实质的)
-  - ❌ 不提取:全局形式(深度、整体构图、整体光照等)
-  - ❌ 不提取:其他实质(即使在同一场景中)
-
-**类型B:形式类亮点**
-- 特征:描述的是整体的视觉效果、氛围、风格
-- 提取范围:
-  - ✅ 该形式维度本身(通常是全局或整体的)
-  - ❌ 不提取:具体的实质物体
-  - ❌ 不提取:其他形式维度
-
-**类型C:全局类亮点**
-- 特征:描述的是整个画面的特征
-- 提取范围:
-  - ✅ 全局形式维度
-  - ❌ 不提取:具体的实质物体
-
-### 3. 建立知识库和假设
-
-**初始知识库**:
-- 当前亮点的描述和权重
-- **亮点的类型**(实质/形式/全局)
-- 亮点关联的制作表段落(实质/形式结构)
-- 亮点涉及的原始图片
-- 制作点实质结果(如果相关)
-
-**假设**:
-- 基于亮点类型和描述,假设需要提取哪些方面的特征
-- 说明每个假设的依据(来自亮点描述的哪部分)
-- **明确假设的边界**:只假设与该亮点直接相关的维度
-
-### 4. 识别该亮点对应的图片维度
-
-**核心原则:一个亮点对应一个图片维度(1:1映射)**
-
-**推理过程**:
-- **前提1**:[引用亮点类型判断]
-- **前提2**:[引用亮点描述或制作表的具体内容]
-- **推理逻辑**:[说明该亮点关注的是图片的哪个方面]
-- **边界检查**:[说明为什么其他方面不属于该亮点]
-- **结论**:该亮点对应的图片维度是[维度名称]
-
-**根据亮点类型识别图片维度**:
-
-**如果是实质类亮点**:
-- 图片维度是该亮点描述的实质主体(作为一个整体概念)
-- **注意**:这里只是识别一个抽象的图片维度,不是列举具体的特征维度
-- **严格禁止**:
-  - ❌ 从一个亮点中识别出多个图片维度
-  - ❌ 识别全局形式维度(如深度图、整体构图)
-  - ❌ 识别其他实质的维度
-
-**如果是形式类亮点**:
-- 图片维度是该亮点描述的形式方面(作为一个整体概念)
-- **严格禁止**:
-  - ❌ 识别具体实质维度
-  - ❌ 识别其他形式维度
-
-**如果是全局类亮点**:
-- 图片维度是该亮点描述的全局方面
-- **严格禁止**:
-  - ❌ 识别具体实质维度
-
-**一一对应原则**:
-```
-亮点1(实质类)
-└── 图片维度:[该实质的抽象概念]
+**评估标准**:完整性、准确性、边界性、唯一性(1:1)
 
-亮点2(形式类)
-└── 图片维度:[该形式的抽象概念]
-
-亮点3(实质类)
-└── 图片维度:[该实质的抽象概念]
-```
-
-**重要说明**:
-- 在这一步,只识别一个抽象的图片维度,表示该亮点关注的是图片的哪个方面
-- 具体的特征维度将在第二步中从图片维度分解得到
-- 保持严格的1:1映射关系,不要从一个亮点中识别出多个图片维度
-
-### 5. 评估:Image Dimension识别结果
-
-使用评估机制对识别出的图片维度进行评估:
-- **完整性**:该图片维度是否完整表达了该亮点关注的方面
-- **准确性**:是否与亮点描述和原图一致
-- **边界性**:是否严格限制在该亮点范围内,没有越界到其他亮点
-- **唯一性**:是否只识别了一个图片维度(1:1映射)
-- **决策**:PASS / ADJUST / REDO
-
-如果评估未通过,根据评估结果进行调整或重做。
-
-**输出**:
-- 该亮点对应的图片维度名称(一个抽象的概念)
-- 图片维度的类型(实质/形式/全局)
-- 图片维度的简短描述
+**输出**:图片维度名称、类型、描述
 
 ---
 
-## 第二步:筛选单个亮点的Control Signals
+## 第二步:筛选控制信号(1:多映射)
 
-**【第二层:图片维度 → 特征维度,1:多映射】**
-
-本步骤的目标是为图片维度提炼可复用的特征维度(Control Signals)。根据图片维度的类型(实质/形式/全局),一个图片维度可以产生一个或多个特征维度。
+**任务**:将图片维度分解为可提取的特征维度
 
 ### 1. 调用dimension_research skill
 
-**目的**:为该亮点的Image Dimensions提炼可复用的Control Signals。
-
-**重要**:subagent必须严格遵守上述"知识与推理体系"和"评估与反馈机制"的全局规则。
-
-**调用方式**:
-- 通过sub agent工具调用子agent,使用browser use工具,**只在小红书平台搜索**对控制信号的筛选有帮助的知识
-- 向sub agent提供该亮点相关的特征,并要求调用skill/dimension_research.md,返回搜索结果
-- 将研究过程和发现保存在 `knowledge/highlight_[N]/` 目录,保留原始URL
-- **确保subagent理解并执行全局规则**:在调用时明确说明必须遵守知识推理和评估机制
-- **搜索要求**:
-  - 只在小红书平台搜索
-  - Query词简短(3-5个词,语义完整)
-  - 2-3轮搜索,适可而止
-  - 每轮必须记录迭代原因和递进逻辑
-
-**输入JSON格式**:
+**输入JSON**:
 ```json
 {
-  "highlight_id": "[亮点ID或序号]",
-  "highlight_description": "[亮点简短描述]",
-  "highlight_type": "[实质/形式/全局]",
-  "image_dimension": "[第一步识别的图片维度名称]",
-  "image_dimension_description": "[图片维度的简短描述]",
+  "highlight_id": "...",
+  "highlight_type": "实质/形式/全局",
+  "image_dimension": "...",
+  "image_dimension_description": "...",
   "goal": "为该图片维度寻找适合的特征维度(Control Signals)"
 }
 ```
 
-**重要说明**:
-- **highlight_type** 必须明确标注,这决定了特征维度的分解方式
-- **image_dimension** 是第一步识别的图片维度(一个抽象概念)
-- subagent将基于图片维度的类型和描述,搜索如何将其分解为可提取的特征维度
-
-**详细策略**:参考 `skills/dimension_research.md`
-
-### 2. 从图片维度分解出特征维度
+**搜索要求**:
+- 只在小红书搜索
+- Query简短(3-5词)
+- **Query必须包含动作词**(提取、检测、识别、方法、工具等)
+- **禁止只用内容关键词**(如"女性画家"、"白色裙子"等)
+- 2-3轮搜索
+- 记录迭代逻辑
 
-### 2. 从图片维度分解出特征维度
+**Query自检**:每次搜索前问自己
+- 这个query包含"如何提取"的意思吗?
+- 这个query会搜到方法和工具吗?
+- 如果只会搜到图片内容,立即重新构造
 
-**目标**:将第一步识别的图片维度(抽象概念)分解为具体的、可提取的特征维度(Control Signals)。
-
-**推理过程**:
-- 列出搜索得到的知识
-- 对该图片维度:
-  - **前提**:[引用搜索得到的案例或知识]
-  - **推理逻辑**:[说明为什么需要这些特征维度来表达该图片维度]
-  - **边界检查**:[确认这些特征维度只服务于当前图片维度/亮点]
-  - **结论**:该图片维度分解为[特征维度列表]
+### 2. 分解特征维度
 
 **分解原则**:
+- 实质类 → 实质本身 + 形式属性(多个)
+- 形式类 → 该形式表示(1个)
+- 全局类 → 全局特征(1个或少数)
 
-**如果图片维度是实质类**:
-- 需要分解为:该实质本身 + 该实质的形式属性
-- **分解模式**:
-  - 实质本身作为一个特征维度(用于生成标准化素材)
-  - 该实质的形式属性作为其他特征维度(姿态、颜色、材质等)
-  - 可以有多个特征维度(1:多映射)
-
-**如果图片维度是形式类**:
-- 通常分解为一个特征维度(该形式的具体表示方式)
-- **说明**:
-  - 形式类通常只需要一个特征维度
-  - 但如果该形式很复杂,也可以分解为多个特征维度
-
-**如果图片维度是全局类**:
-- 通常分解为一个或少数几个全局特征维度
-
-**分解示例模式**:
-```
-图片维度:[实质类]
-├── 特征维度1:[实质本身](category: substance, output: image)
-├── 特征维度2:[形式属性1](category: form, output: image/json)
-└── 特征维度3:[形式属性2](category: form, output: image/json)
-
-图片维度:[形式类]
-└── 特征维度1:[形式表示](category: form, output: image)
-
-图片维度:[实质类]
-├── 特征维度1:[实质本身](category: substance, output: image)
-└── 特征维度2:[形式属性](category: form, output: json)
-```
-
-**严格禁止**:
-- ❌ 分解出不属于该图片维度的特征维度
-- ❌ 分解出属于其他亮点的特征维度
-- ❌ 实质类图片维度分解出全局形式特征(如深度图、整体构图)
-
-**原则**:
-- 优先选择可逆性强、生成模型友好的特征维度
-- **前瞻性思考**:分解时就要考虑每个特征在还原中如何被使用、起到什么作用
-- **避免过度相似**:不要提取与原图过于相似的特征
-- **保持独立性**:每个特征维度应该是独立的、可单独修改的
-
-**输出格式要求(必须明确指定)**:
-为每个特征维度(Control Signal)必须明确指定:
-- **dimension_name**:特征维度名称(snake_case)
-- **belongs_to_image_dimension**:所属的图片维度名称
-- **category**:维度类别(global/substance/form)
-- **output_format**:输出格式(image/json),必须二选一
-  - **image**:特征可视化图像(如深度图、分割mask、骨架图、构图网格图、光照方向图等)
-  - **json**:参数/数值特征(如比例、坐标、权重、标签等)
-  - **不是所有维度都是标签/分类**,很多维度需要输出图像化的特征表示
-- **format_reason**:选择该格式的理由
-- **generation_usage**:该特征维度在还原时如何被使用
-
-**常见维度的输出格式参考**:
-- 构图/布局类:通常用 image(网格图、引导线图、区域分布图)
-- 光照类:通常用 image(光照方向图、轮廓光分布图)
-- 深度/景深类:通常用 image(深度图、清晰度热力图)
-- 姿态/骨架类:通常用 image(骨架图)或 image+json(骨架图+关键点坐标)
-- 色彩类:可用 image(色带图)或 json(色值+权重)
-- 标签/分类类:用 json(标签、权重、参数)
-
-**输出**:
-- 撰写过程文档,详细解释每个特征维度的选择原因、用途、输出格式等信息
-- 说明如何利用搜索得到的知识
-- 对未利用到的知识也要有所解释
+**输出要求**:每个特征维度包含
+- dimension_name(snake_case)
+- category(global/substance/form)
+- output_format(image/json)
+- format_reason
+- generation_usage
 
 ### 3. 评估:Control Signals分解结果
 
-使用评估机制对分解出的特征维度进行评估:
-- **完整性**:是否完整表达了该图片维度的所有必要方面
-- **准确性**:分解的特征维度是否基于搜索证据
-- **可逆性**:这些特征维度是否足够还原该图片维度/亮点的特征
-- **可复用性**:特征维度是否具有泛化能力
-- **边界性**:特征维度是否严格限制在该图片维度/亮点范围内,没有越界
-- **映射关系**:是否符合1:多的映射关系(一个图片维度可以分解为多个特征维度)
-- **决策**:PASS / ADJUST / REDO
-
-如果评估未通过,根据评估结果进行调整或重做。
-
-**输出**:
-- 该图片维度对应的特征维度列表
-- 每个特征维度的详细信息(名称、类别、输出格式、用途等)
-- 分解的推理过程和证据
+评估标准:完整性、准确性、可逆性、可复用性、边界性、映射关系
+决策:PASS / ADJUST / REDO
 
 ---
 
@@ -610,8 +157,6 @@ $user$
 
 **【第三层:特征维度 → 特征值,可使用多工具对比】**
 
-本步骤的目标是为每个特征维度提取具体的特征值。对于同一个特征维度,可以尝试使用不同的工具提取,通过对比评估选择最优结果。
-
 ### 1. 调用tool_research skill
 
 **目的**:为该亮点的Control Signals寻找最合适的提取工具。
@@ -809,89 +354,57 @@ $user$
 - 新维度必须给出必要性说明
 - 根据图片组的复杂度灵活调整
 
-**一致性保证**(针对图片组):
-- 若图片组中存在重复实质,保持一致的表示方式
-- 例如:相同骨架比例、相同主色调范围、相同空间比例关系
-- 一致性优先级高于创意优先级
+**一致性保证**:图片组中重复实质保持一致表示(骨架比例、主色调、空间关系)
 
-**过程验证**:
-- 不盲目相信过程中结果的正确性
-- 对每一个步骤中得到的中间结果,都要根据要求进行评估和验证
+**过程验证**:对每个中间结果进行评估和验证
 
 ---
 
 ## 质量要求
 
-**禁止降级解决**:
-- 不允许为了方便而使用效果显著更差的简单方案
+**禁止降级**:不使用效果显著更差的简单方案
 
-**禁止平凡表示**:
-- 不允许只提供自然语言描述
-- 必须使用多模态提供超越语言的信息
+**禁止平凡表示**:必须使用多模态特征,不只提供自然语言描述
 
-**禁止保存原始图片**:
-- 不允许保存原图或原图的任何部分(裁剪、截图、抠图等)
-- 图片裁剪只能作为中间步骤,不能作为最终特征
-- 最终必须提取多模态特征:
-  - 实质维度:标准化素材(去除形式信息)
-  - 形式维度:特征可视化(深度图、mask、骨架等)
-  - 全局维度:控制信号可视化(光照图、色彩分布等)
-- 所有特征都必须是抽象的、可复用的、可迁移的
-- **注意**:"伪造结果"是指编造不存在的数据或虚假信息,使用生成式模型生成缺失视角不是伪造
+**禁止保存原图**:不保存原图或其任何部分(裁剪、截图、抠图)
+- 实质维度 → 标准化素材(去除形式信息)
+- 形式维度 → 特征可视化(深度图、mask、骨架等)
+- 全局维度 → 控制信号可视化(光照图、色彩分布等)
+- 所有特征必须抽象、可复用、可迁移
 
 ---
 
-# 四、还原与创造说明
+## 还原与创造说明
 
-最终,负责还原的agent将获得:
-- 更新的制作表(包含多模态维度和值)
-- 各维度的特征文件
+还原agent将获得:更新的制作表 + 各维度特征文件
 
-还原agent将以生成式模型为主,使用这些特征作为控制信号重建图片。
+还原方式:以生成式模型为主,使用特征作为控制信号重建图片
 
-**更重要的是**:这些特征不仅用于还原原图,更要用于学习规律、复用特征、建构全新内容。因此,特征应该具有泛化能力和创造性价值,而不是原图的简单复制。
+**核心价值**:特征不仅用于还原原图,更要用于学习规律、复用特征、建构全新内容
 
 ---
 
-# 五、Subagent JSON Contract
+## Subagent输入JSON格式
 
-当需要调用subagent执行skill时,主agent必须先构造严格符合下述schema的JSON,并作为subagent的唯一输入。
-
-## A) dimension_research 输入JSON(必须字段齐全)
+**dimension_research输入**:
 ```json
 {
-  "highlight_id": "[亮点ID或序号]",
-  "highlight_description": "[亮点简短描述]",
-  "highlight_type": "[实质/形式/全局]",
-  "image_dimension": "[第一步识别的图片维度名称]",
-  "image_dimension_description": "[图片维度的简短描述]",
+  "highlight_id": "...",
+  "highlight_description": "...",
+  "highlight_type": "实质/形式/全局",
+  "image_dimension": "...",
+  "image_dimension_description": "...",
   "goal": "为该图片维度寻找适合的特征维度(Control Signals)"
 }
 ```
 
-**生成规则**:
-- highlight_id:亮点的ID或序号
-- highlight_description:亮点的简短描述(来自亮点JSON)
-- highlight_type:亮点类型(实质/形式/全局),必须在第一步中判断
-- image_dimension:第一步识别的图片维度名称(一个抽象概念)
-- image_dimension_description:图片维度的描述,说明该维度关注的是图片的哪个方面
-- goal:固定写为"为该图片维度寻找适合的特征维度(Control Signals)"
-
-**注意**:
-- 这个JSON用于第二步,目的是从图片维度分解出特征维度
-- 必须提供第一步识别的图片维度信息
-- subagent将基于图片维度的类型和描述,搜索如何将其分解为可提取的特征维度
-
-## B) tool_research 输入JSON(必须字段齐全)
+**tool_research输入**:
 ```json
 {
-  "dimensions": []
+  "dimensions": ["dimension1", "dimension2"]
 }
 ```
 
-**生成规则**:
-- dimensions:来自"筛选后的多模态维度清单",必须是维度名称(snake_case或短英文/拼音都可),不要写长描述
-
 ---
 
 # 开始执行