# Skill: dimension_research ## ⚠️ 关键规则(必须首先阅读) **在构造任何query前,必须通过以下检查:** 1. **Query中是否包含动作词?** - 必须包含:提取、检测、识别、分析、获取、生成、控制等 - 如果没有动作词,这个query是错误的 2. **Query是否在搜索"如何做"而不是"是什么"?** - ✅ 正确:姿态提取方法、深度图生成工具 - ❌ 错误:女性画家、户外写生、白色裙子 3. **Query是否会搜到技术内容?** - ✅ 正确:会搜到教程、工具、方法 - ❌ 错误:会搜到图片、作品、内容 **示例对比**: | 错误Query(只有内容) | 正确Query(包含方法) | |---------------------|---------------------| | ❌ 女性画家 背影 | ✅ 人物姿态 提取方法 | | ❌ 户外写生 空间 | ✅ 深度图 生成工具 | | ❌ 白色裙子 | ✅ 服装分割 检测方法 | | ❌ 画架 画板 | ✅ 物体识别 提取工具 | **强制自检流程**: ``` 构造query → 检查是否包含动作词 → 检查是否搜索方法 → 确认后搜索 ↓ 没有动作词 ↓ 只搜内容 重新构造 重新构造 ``` --- ## 目标 为**Image Dimensions(图片维度)**提炼适合的**Control Signals(控制信号/特征维度)**。 **核心目的**:选择的特征维度将用于**生成式AI模型还原图片**。 **关键原则**: - 特征维度必须是生成模型可消费的控制信号(生成模型包括但不限于stable diffusion、nano banana等模型) - 根据图片维度的特点,选择能够有效控制生成过程的特征维度 - 优先选择在AI图像生成领域已被验证有效的控制方式 **搜索重点**: - 寻找创作者如何使用特定特征维度来控制AI生成图片 - 关注特征维度在生成模型中的实际应用案例 - 了解特征维度如何影响生成结果的视觉效果 **注意**:本skill只负责 Image Dimension → Control Signal,不负责寻找工具或提取Feature Value。 --- ## 输入格式 ```json { "highlight_id": "[亮点ID](可选)", "highlight_description": "[亮点描述](可选)", "highlight_type": "[实质/形式/全局]", "image_dimension": "[图片维度名称]", "image_dimension_description": "[图片维度描述]", "goal": "为该图片维度寻找适合的特征维度(Control Signals)" } ``` --- ## 输出格式 **文件**:`knowledge/dimension_research_result.json` ```json { "image_dimension": "pose", "control_signals": [ { "name": "openpose_skeleton", "category": "form", "output_format": "image", "format_reason": "骨架图是标准的ControlNet输入格式", "generation_usage": "作为ControlNet的pose控制信号", "search_evidence": ["URL1", "URL2"], "reasoning": "为什么选择这个控制信号" } ] } ``` **输出格式说明**: - image:特征可视化(深度图、mask、骨架图等)或标准化素材 - json:参数/数值特征(比例、坐标、权重等) **常见维度参考**: - 构图/布局/光照/深度/姿态 → image - 色彩 → image或json - 标签/分类/参数 → json --- ## 工作流程 ### 1. Query构造(关键) **⚠️ 搜索目的**:寻找"如何提取特征"的方法,而不是寻找类似的图片内容 **Query公式**:[特征类型] + [提取动作] + [信息类型] **严格禁止**: - ❌ 直接使用亮点描述作为搜索词 - ❌ 只搜索内容关键词 - ❌ 缺少"提取"、"检测"、"识别"等动作词 **自检问题**: - 这个query是在搜索"如何提取特征"吗? - 这个query包含提取动作词了吗? - 这个query会搜到提取方法和工具吗? **Query要求**: - 简短(3-5词) - 语义完整 - 包含提取意图 **搜索平台**:只在小红书搜索,使用中文 ### 2. 搜索迭代 **第一轮(宽泛探索)**: - 目标:了解大方向,发现关键概念 - Query:[特征类型] + [提取动作] + [信息类型] - 记录:query词、关键信息、专业术语 **第二轮(聚焦细化)**: - 目标:基于第一轮发现,聚焦具体方法 - Query:[第一轮术语/工具] + [使用/应用] + [教程/案例] - 记录:query词、选择理由、具体案例 **第三轮(可选,验证补充)**: - 目标:验证细节或补充信息 - Query:[工具/方法] + [效果/参数] + [评测/设置] **停止条件**(满足任一即停止): - 找到3-5个真实案例支持某个Control Signal - 能够清晰描述该Control Signal的使用方法 - 搜索结果开始重复 - 已完成2-3轮搜索 ### 3. 维度边界控制 根据**highlight_type**严格限制提取范围: **实质类亮点**: - ✅ 提取:该实质本身 + 该实质的形式属性 - ❌ 禁止:全局形式、其他实质 **形式类亮点**: - ✅ 提取:该形式维度本身 - ❌ 禁止:具体实质、其他形式维度 **全局类亮点**: - ✅ 提取:全局形式维度 - ❌ 禁止:具体实质 ### 4. 分析搜索结果 从搜索结果中提取: - 创作者使用的控制信号类型 - 控制信号在生成中的作用 - 控制信号的输出格式(image/json) - 实际应用案例和效果 ### 5. 提炼控制信号 **分解原则**: - 实质类 → 实质本身 + 形式属性(多个) - 形式类 → 该形式表示(1个) - 全局类 → 全局特征(1个或少数) **推理要求**: - 列出搜索得到的知识 - 说明为什么需要这些特征维度 - 边界检查(只服务于当前图片维度) - 得出特征维度列表 ### 6. 输出结果 每个控制信号必须包含: - name(snake_case) - category(global/substance/form) - output_format(image/json) - format_reason(选择该格式的理由) - generation_usage(在还原时如何使用) - search_evidence(支持的URL) - reasoning(选择理由,基于搜索案例) **禁止**: - 凭空想象Control Signal - 没有案例支持的决策 - 理论推测而非实践经验 - 选择不属于当前亮点的维度 --- ## 停止条件 当搜索结果能够解释以下问题时停止: - 为什么这种效果成立 - 如何实现 - 哪些因素控制