pre_upload_list.json 63 KB

123456789101112131415161718192021222324252627282930313233343536373839404142434445464748495051525354555657585960616263646566676869707172737475767778798081828384858687888990919293949596979899100101102103104105106107108109110111112113114115116117118119120121122123124125126127128129130131132133134135136137138139140141142143144145146147148149150151152153154155156157158159160161162163164165166167168169170171172173174175176177178179180181182183184185186187188189190191192193194195196197198199200201202203204205206207208209210211212213214215216217218219220221222223224225226227228229230231232233234235236237238239240241242243244245246247248249250251252253254255256257258259260261262263264265266267268269270271272273274275276277278279280281282283284285286287288289290291292293294295296297298299300301302303304305306307308309310311312313314315316317318319320321322323324325326327328329330331332333334335336337338339340341342343344345346347348349350351352353354355356357358359360361362363364365366367368369370371372373374375376377378379380381382383384385386387388389390391392393394395396397398399400401402403404405406407408409410411412413414415416417418419420421422423424425426427428429430431432433434435436437438439440441442443
  1. {
  2. "knowledge": [
  3. {
  4. "id": "knowledge-20260412-005446-88f1",
  5. "task": "nano_banana 工具图片传递方式:本地路径需先上传到 OSS",
  6. "content": "当使用 nano_banana 工具进行图像生成时,如果直接传入本地相对路径(如 examples/xxx.png)会报 HTTP 503 错误,提示「images[].data 看起来是文件路径但文件不存在」。正确做法是:先调用 image_uploader 工具将本地图片上传到 OSS 获取 CDN URL,再将 CDN URL 传入 nano_banana 的 image_urls 参数。案例:本次 img_2 生成任务中,第一次调用 nano_banana 直接传相对路径失败,改用 image_uploader 上传 character_ref_back.png 和 img_1_restored_v1.png 获取 CDN URL 后成功生成。",
  7. "types": ["experience"],
  8. "tags": {
  9. "intent": "图像生成",
  10. "state": "nano_banana",
  11. "tool": "image_uploader"
  12. },
  13. "score": 4,
  14. "source": {"category": "research"}
  15. },
  16. {
  17. "id": "knowledge-20260412-005446-bc40",
  18. "task": "nano_banana 多图融合保持人物一致性的有效方法",
  19. "content": "当需要保持与前序生成结果的人物一致性时,使用 nano_banana 工具的多图融合功能是有效方案。具体做法:在 image_urls 数组中同时传入底图(人物参考)和前序生成结果图,prompt 中明确描述需要保持的特征(如服装款式、发型等)。案例:img_2 生成时传入 character_ref_back.png(底图)和 img_1_restored_v1.png(前序结果),成功保持了白裙 V 字露背设计和棕色长发的一致性,评估得分 8.5/10,服装维度 8/10。",
  20. "types": ["experience"],
  21. "tags": {
  22. "intent": "人物一致性",
  23. "state": "nano_banana",
  24. "technique": "多图融合"
  25. },
  26. "score": 4,
  27. "source": {"category": "research"}
  28. },
  29. {
  30. "id": "knowledge-20260411-172350-toolhub-500-toollist-fallback",
  31. "task": "toolhub_search 返回 500 错误时的替代方案",
  32. "content": "当 toolhub_search 返回 HTTP 500 错误时,可以使用 tool_list 工具获取可用工具列表。\n\n场景:ToolHub 服务健康检查通过(toolhub_health 返回 ok),但 toolhub_search 返回 500 Internal Server Error。\n\n解决方案:\n```python\n# toolhub_search 失败时\ntools = tool_list(limit=50) # 获取前 50 个工具\n# 从 results 数组中查找目标工具\n```\n\ntool_list 返回的工具包含:id, name, introduction, input, output, status 等字段,可用于查找合适的工具。\n\n案例:img_4 v2 任务中,toolhub_search 返回 500 错误,改用 tool_list 成功找到 nano_banana、flux_generate、seedream_generate 等图像生成工具。",
  33. "types": ["experience"],
  34. "tags": {
  35. "intent": "工具查找",
  36. "state": "toolhub",
  37. "tool": "tool_list"
  38. },
  39. "score": 4,
  40. "source": {"category": "execution"}
  41. },
  42. {
  43. "id": "knowledge-20260411-172350-nano-banana-multi-image-workflow",
  44. "task": "多图参考的图像生成工作流(nano_banana)",
  45. "content": "使用 nano_banana 进行多图融合意象生图的工作流:\n\n**适用场景**:需要同时参考多张图片(人物、背景、道具等)进行融合生成\n\n**步骤**:\n1. 使用 image_uploader 将所有参考图上传到 CDN,获取 cdn_url\n2. 调用 nano_banana,在 image_urls 数组中传入所有 CDN URL\n3. 在 prompt 中描述期望的融合效果\n\n**参数配置**:\n```json\n{\n \"prompt\": \"详细描述期望的融合效果\",\n \"image_urls\": [\"人物图 CDN\", \"背景图 CDN\", \"道具图 CDN\", ...],\n \"aspect_ratio\": \"3:4\",\n \"image_size\": \"2K\",\n \"response_modalities\": [\"IMAGE\"]\n}\n```\n\n**优势**:\n- 原生支持多图融合,无需手动拼接\n- 跨模态意象重组能力强\n- 适合复杂场景的参考图融合\n\n**案例**:img_4 v2 任务中,传入 4 张参考图(人物侧身、绿色背景、前序结果、调色板),成功生成融合多元素的高质量图像,评分 8.5/10。",
  46. "types": ["strategy"],
  47. "tags": {
  48. "intent": "图像生成",
  49. "state": "nano_banana",
  50. "workflow": "多图融合"
  51. },
  52. "score": 5,
  53. "source": {"category": "execution"}
  54. },
  55. {
  56. "id": "knowledge-20260411-161039-toolhub-500-strategy",
  57. "task": "ToolHub 搜索服务 500 错误时的应对策略",
  58. "content": "当 toolhub_search 返回 500 Internal Server Error 时,不要立即放弃,可以直接尝试调用已知工具 ID 的 toolhub_call。原因:toolhub_search 是查询工具列表的服务,而 toolhub_call 是直接调用工具的服务,两者可能部署在不同端点,搜索服务故障时工具调用服务可能仍然正常。\n\n案例:本次 img_3 生成任务中,toolhub_search() 连续两次返回 500 错误,但直接调用 toolhub_call(tool_id='nano_banana', params={...}) 成功执行并返回结果。",
  59. "types": ["experience"],
  60. "tags": {
  61. "intent": "图像生成",
  62. "state": "ToolHub 服务异常"
  63. },
  64. "score": 4,
  65. "source": {"category": "research"}
  66. },
  67. {
  68. "id": "knowledge-20260411-161039-image-downloader-save",
  69. "task": "图片文件保存的可靠方案:使用 image_downloader 替代 bash_command",
  70. "content": "当需要将 ToolHub 生成的图片保存到指定路径时,如果 bash_command 的 cp/mv 命令失败(可能由于路径格式、权限或环境问题),可以使用 image_downloader 从 CDN URL 下载到目标路径。\n\n具体做法:\n1. 从 toolhub_call 返回结果中获取 cdn_urls[0](永久 CDN 链接)\n2. 调用 image_downloader(url=cdn_url, save_path=目标路径)\n3. 支持相对路径和绝对路径,自动创建目录\n\n案例:本次任务中,bash_command('cp outputs/.../xxx.jpg examples/.../img_3_restored_v1.png') 失败,改用 image_downloader(url='https://res.cybertogether.net/toolhub_images/...', save_path='examples/production_restore/output_origin/img_3_restored_v1.png') 成功保存。",
  71. "types": ["experience"],
  72. "tags": {
  73. "intent": "文件保存",
  74. "state": "bash_command 失败"
  75. },
  76. "score": 4,
  77. "source": {"category": "research"}
  78. },
  79. {
  80. "id": "knowledge-20260410-170301-workflow-variant-steps-format",
  81. "task": "工作流分析结果整合:能力模块变体步骤格式转换规范",
  82. "content": "## 背景\n在整合工作流分析结果时,能力模块(capability_modules)中的变体(variants)需要将 steps 数组从字符串格式转换为对象格式,以提供更丰富的步骤描述和元数据。\n\n## 格式转换规则\n\n### 原始格式\n```json\n\"steps\": [\"步骤 1 描述\", \"步骤 2 描述\", \"步骤 3 描述\"]\n```\n\n### 目标格式\n```json\n\"typical_steps\": [\n {\"step\": \"步骤 1 描述\", \"detail\": \"步骤 1 的详细说明\"},\n {\"step\": \"步骤 2 描述\", \"detail\": \"步骤 2 的详细说明\"},\n {\"step\": \"步骤 3 描述\", \"detail\": \"步骤 3 的详细说明\"}\n]\n```\n\n### 转换规则\n1. **字段名变更**:将 `\"steps\"` 改为 `\"typical_steps\"`\n2. **结构转换**:每个步骤字符串拆分为 `{step, detail}` 对象\n3. **step 字段**:保留原步骤描述(简洁动宾结构,20 字以内)\n4. **detail 字段**:补充该步骤的具体操作说明或目的\n\n## detail 字段编写指南\n\n### 类型 1:操作说明型\n描述具体执行的操作、使用的工具或参数\n- 示例:`\"使用 Nano Banana Pro 上传双参考图(正面 + 侧面),启用锁脸功能\"`\n- 示例:`\"在 ComfyUI 中加载 Face LoRA 模型,设置权重为 0.8\"`\n\n### 类型 2:目的说明型\n说明该步骤的目的或解决的问题\n- 示例:`\"解决单一参考图导致的身份漂移问题,提供多角度一致性基准\"`\n- 示例:`\"确保生成的角色在不同视角下保持面部特征一致\"`\n\n### 类型 3:参数说明型\n列出关键参数设置或配置选项\n- 示例:`\"设置皮肤纹理强度 0.7,毛孔细节参数 0.6,降噪值 0.4-0.6\"`\n- 示例:`\"采样器:DPM++ 2M SDE Karras,迭代步数:30,CFG Scale:7\"`\n\n## provenance 元数据构建\n\n每个工作流(wf_XXX)需要构建 provenance 字段记录来源元数据:\n\n```json\n\"provenance\": {\n \"source_channel\": \"来源渠道(如'Markdown 报告'、'小红书'、'YouTube')\",\n \"source_name\": \"原始报告名称或视频标题\",\n \"category\": \"所属分类(如'人物肖像'、'场景构建'、'纹理效果')\"\n}\n```\n\n### 字段说明\n- **source_channel**:数据来源渠道\n - 可选值:`\"Markdown 报告\"`, `\"小红书\"`, `\"X (Twitter)\"`, `\"YouTube\"`, `\"知乎\"`, `\"GitHub\"`\n- **source_name**:原始资料名称\n - 示例:`\"02_portrait_closeup_workflow_research_report.md\"`\n - 示例:`\"AI Filmmaking: The Ultimate Guide to Cinematic Lighting\"`\n- **category**:工作流所属分类\n - 可选值:`\"人物肖像\"`, `\"场景构建\"`, `\"光影控制\"`, `\"纹理效果\"`, `\"视频生成\"`, `\"后期处理\"`\n\n## 完整变体定义示例\n\n```json\n{\n \"variant_id\": \"cm_001_v2\",\n \"variant_name\": \"双图参考方案\",\n \"capability_module\": \"cm_001\",\n \"typical_steps\": [\n {\n \"step\": \"上传双参考图\",\n \"detail\": \"使用 Nano Banana Pro 上传正面和侧面两张参考图,确保光线和角度互补\"\n },\n {\n \"step\": \"锁定身份特征\",\n \"detail\": \"启用锁脸功能,设置...",
  83. "types": ["strategy"],
  84. "tags": {
  85. "domain": "工作流分析",
  86. "stage": "结果整合",
  87. "format": "JSON",
  88. "related_modules": ["cm_001", "cm_002"],
  89. "related_workflows": ["wf_001", "wf_002", "wf_003", "wf_005"]
  90. },
  91. "score": 4,
  92. "source": {"category": "research"},
  93. "relations": {
  94. "related_knowledge": [
  95. "knowledge-20260410-165050-ai-portrait-workflow-variants.json:AI 人像工作流能力模块变体分析(已有 typical_steps 格式实例)",
  96. "knowledge-20260410-165547-ai-workflow-capability-modules.json:AI 图像生成工作流能力模块体系(16 个能力模块)",
  97. "knowledge-20260410-wf-002:工作流意图分析输出格式规范(intent 输出格式)"
  98. ],
  99. "capability_modules": ["cm_001", "cm_002"],
  100. "workflows": ["wf_001", "wf_002", "wf_003", "wf_005"]
  101. },
  102. "status": "pending_upload",
  103. "buffer_file": "knowledge-20260410-170301-workflow-variant-steps-format.json"
  104. },
  105. {
  106. "task": "工作流意图聚类分析方法论",
  107. "content": "## 核心流程\n1. **意图归纳**:将工作流的技术步骤归纳为意图级描述(20 字以内,动宾结构)\n2. **语义聚类**:对跨工作流的意图列表做语义聚类,发现品类无关的能力模块\n3. **变体发现**:在一个能力模块内发现不同实现变体\n4. **粗工序总结**:对一个品类的工作流总结因果性编排思路\n\n## 聚类原则\n- **忠实于数据**:不臆造不存在于原始步骤中的意图或工具\n- **意图粒度判断**:根据上下文判断合并粒度,目标是让不同工作流可比较\n- **品类无关命名**:能力模块名称 4-8 字,品类无关(如\"定义风格\"而非\"电商风格定义\")\n- **语义相近归并**:如\"定义视觉风格\"/\"注入美学风格\"/\"建立风格参考体系\" → \"定义风格\"\n\n## 能力模块示例(16 个)\n1. 准备参考素材:收集或生成用于后续创作的参考图像、纹理、角色基础等素材\n2. 定义角色特征:设定人物面部特征、表情状态、身份一致性等角色属性\n3. 构建场景环境:创建或合成场景背景、虚拟环境、空间布局\n4. 配置光影效果:设置光源方向、灯光类型、明暗对比等光照条件\n5. 控制姿态构图:控制人物姿态、画面构图、视角、摄影参数\n6. 应用风格控制:应用风格迁移、保持视觉一致性、注入特定美学风格\n7. 执行内容生成:执行核心的图像、视频、渲染生成操作\n8. 修复细节瑕疵:对局部区域进行重绘、修复瑕疵、优化细节\n9. 增强图像质量:提升图像分辨率、质量增强、最终精修\n10. 配置控制技术:配置 ControlNet、深度图、姿态图等控制条件\n11. 后期合成处理:抠图、选区创建、图像合成、图层处理\n12. 视频后期处理:视频剪辑、颜色分级、特效增强\n13. 处理纹理效果:添加纹理、颗粒、质感、色调等视觉效果\n14. 生成参考图表:生成角色参考表、多视角图、多表情图等参考资料\n15. 配置工作流:配置工具节点、构建流程、设置参数\n16. 创建纹理布局:创建四方连续、渐变网格、矢量图形等纹理布局\n\n## 输出格式\n每个能力模块包含:模块 ID(cm_001 起)、模块名称、描述、包含的意图列表(带来源工作流 ID)",
  108. "types": ["strategy"],
  109. "tags": {
  110. "domain": "工作流分析",
  111. "method": "语义聚类",
  112. "application": "AI 创作工作流"
  113. },
  114. "score": 5,
  115. "source": {"category": "research"},
  116. "_note": "系统化的工作流意图聚类方法论,补充现有'工作流意图分析输出格式规范'和'工作流意图归纳的粒度判断原则',提供完整的 4 步核心流程和 16 个能力模块示例"
  117. },
  118. {
  119. "task": "AI 人像背景虚化技术参数(补充)",
  120. "content": "## 核心摄影参数\n- **镜头焦距**:85mm(人像标准镜头)\n- **光圈值**:f/1.4 - f/1.8(极浅景深)\n\n## 提示词关键词库\n- shallow depth of field\n- extremely shallow depth of field\n- bokeh\n- background blur\n- 85mm lens\n- f/1.8 aperture\n\n## 后期工具\n- Photoshop Lens Blur:创建主体选区后应用 Lens Blur 效果,设置虚化强度、光圈形状、焦距参数\n- DxO Photolab 9 Bokeh:自动主体检测后应用 Bokeh 效果\n\n## 实现方式\n1. **生成时控制**:在提示词中指定摄影参数(85mm lens, f/1.8 aperture, shallow depth of field)\n2. **后期添加**:使用专业工具添加虚化效果\n\n## 适用工作流\n- 冬夜情绪人像(6 步工作流,第 6 步质感要求:浅景深,明显背景虚化,轻微胶片颗粒)\n- 时尚杂志封面(3 步工作流:上传人脸参考→输入提示词含 85mm 镜头/f/1.8 光圈/浅景深→生成 8K 画质)\n- Nano Banana 2 工作室肖像\n- Seedream 4.5 极端特写\n- 参考图一致性肖像\n- 背景虚化后期工作流",
  121. "types": ["tool"],
  122. "tags": {
  123. "source": "02_portrait_closeup_workflow_research_report.md",
  124. "domain": "AI 生图",
  125. "intent": "背景虚化",
  126. "tools": "Photoshop,DxO,Stable Diffusion,Nano Banana,Seedream"
  127. },
  128. "score": 5,
  129. "source": {"category": "research"},
  130. "_note": "与已有 strategy 类型知识'AI 人像背景虚化效果实现方法汇总'互补,补充具体参数值和适用工作流列表"
  131. },
  132. {
  133. "task": "AI 人像皮肤质感修复技术(补充)",
  134. "content": "## 问题背景\nAI 生成的人像常有塑料感皮肤、缺乏毛孔细节\n\n## 核心解决方案\n**工具**:Enhancor.ai Skin Realism + Portrait Upscaler\n\n## 处理流程\n1. 生成基础人像(Midjourney / Flux Pro Ultra / Google Imagen 4)\n2. 裁剪人脸区域(可选,将人脸裁剪至更近特写)\n3. 使用 Skin Realism 修复皮肤质感\n - 设置皮肤纹理强度\n - 设置毛孔细节参数\n4. 眼部修复(可选)\n5. 超分辨率放大(2x-4x)\n\n## 提示词关键词(减少后期需求)\n**正向**:\n- realistic skin texture with visible pores and natural imperfections\n- no plastic smoothing\n- dewy smooth\n- fine hair strand separation\n- subtle catchlights in eyes\n\n**负面**:\n- plastic skin\n- airbrushed\n- oversmoothed\n- matte skin\n\n## 适用场景\n- 商业人像摄影\n- 广告牌级别输出\n- 高端工作室肖像",
  135. "types": ["tool"],
  136. "tags": {
  137. "source": "02_portrait_closeup_workflow_research_report.md",
  138. "domain": "AI 生图",
  139. "intent": "皮肤质感修复",
  140. "tools": "Enhancor.ai,Midjourney,Flux Pro Ultra"
  141. },
  142. "score": 5,
  143. "source": {"category": "research"},
  144. "_note": "与已有 strategy 类型知识'AI 人像皮肤质感修复工作流(Enhancor + 多模型)'互补,内容结构更紧凑,适合作为 tool 类型快速查阅"
  145. },
  146. {
  147. "task": "AI 电影制作 20 种电影级灯光提示词工作流",
  148. "content": "## 工作流概述\n**来源视频**: \"AI Filmmaking: The Ultimate Guide to Cinematic Lighting (20 Prompts)\" - Dom the AI Tutor\n**适用场景**: 快速创建各种电影级灯光效果,适合初学者\n**复杂度**: 低\n\n## 20 种灯光类型\n\n| Step | 灯光类型 | 效果描述 | 关键参数 |\n|------|----------|----------|----------|\n| 1 | Butterfly Lighting | 派拉蒙光,正面高位光源 | 正面高位 |\n| 2 | Rembrandt Lighting | 三角阴影,45 度侧光 | 45 度侧光 |\n| 3 | Golden Hour | 日落光辉,暖色调自然光 | 暖色调 |\n| 4 | Blue Hour | 黄昏神秘感,冷色调环境光 | 冷色调 |\n| 5 | Volumetric Lighting | 上帝光/丁达尔效应 | 体积光参数 |\n| 6 | Lunar Glow | 镜面反射,皮肤高光 | Specular Reflection |\n| 7 | Cyberpunk Bi-Color | 双色霓虹对比 (蓝/粉) | Bi-Color Neon |\n| 8 | TV Glow | 电子环境光,屏幕光模拟 | 屏幕光 |\n| 9 | High-Key Lighting | 高调干净布光,低对比度 | 低对比度 |\n| 10 | Rim Light | 光环分离,背光/轮廓光 | 背光 |\n| 11 | Gobo Projection | 百叶窗/图案投影 | 投影模板 |\n| 12 | Under Lighting | 底光,低位光源,反派效果 | 低位光源 |\n| 13 | Firework Reflections | 动态色彩,多色反射 | 多色反射 |\n| 14 | Book Light | 奢华柔光,书灯/柔光箱 | 柔光箱 |\n| 15 | Negative Fill | 负补光,吸光板控制阴影 | 吸光板 |\n| 16 | Cameo Lighting | 虚空隔离,全黑背景 + 聚光 | 全黑背景 |\n| 17 | Silhouette Lighting | 剪影,逆光剪影 | 逆光 |\n| 18 | Mixed Temperature | Hero Glow 混合温度效果 | 冷暖对比 |\n| 19 | Soft Light | 柔和漫射光 | 漫射 |\n| 20 | Dramatic Light | 高对比度戏剧性光 | 高对比度 |\n\n## 提示词组合公式\n```\n[主体描述] + [灯光类型] + [色温设定] + [时间/氛围] + [相机参数] + [风格修饰]\n\n示例:\nA dramatic portrait, Rembrandt lighting with 45° side light, \nwarm 3000K color temperature, golden hour atmosphere, \n85mm lens f/1.8, cinematic film grain, chiaroscuro effect\n```",
  149. "types": ["strategy"],
  150. "tags": {
  151. "source": "YouTube-Dom the AI Tutor",
  152. "domain": "AI 生图",
  153. "effect": "电影级灯光",
  154. "video_id": "RCHw0PtE92M"
  155. },
  156. "score": 5,
  157. "source": {"category": "research"}
  158. },
  159. {
  160. "task": "Qwen Image 多角度重打光工作流 (ComfyUI)",
  161. "content": "## 工作流概述\n**来源视频**: \"Relight Images with Qwen Image LoRA: Multi-Angle Lighting in ComfyUI\" - Code Crafters Corner\n**适用场景**: 对已有图像进行精确的多角度重新打光\n**复杂度**: 高\n\n## 工作流步骤\n\n| Step | 输入 | 输出 | 工具/模型/参数 |\n|------|------|------|----------------|\n| 1 | 原始图像 (真实或 AI 生成) | 待处理图像 | Qwen Image Edit 2509 Workflow |\n| 2 | 灯光方向选择 | 10 种相机角度之一 | Multi-Angle Lighting LoRA |\n| 3 | 蒙版 (可选) | 选择性重打光区域 | Affinity Photo/外部蒙版工具 |\n| 4 | 灯光颜色提示 | 彩色光照效果 | Color Prompt |\n| 5 | 第二张图像 (可选) | 亮度映射图 | Luminance Map (黑白图像) |\n| 6 | 提示词结构 | 特定灯光方向 | 10 种相机角度选项 |\n| 7 | Ksampler 设置 | 速度与质量平衡 | Lightning LoRA 参数 |\n| 8 | 工作流整合 | 最终重打光图像 | Custom ComfyUI Workflow |\n\n## 10 种相机角度灯光选项\n1. **Front Light (正面光)**: 均匀照亮主体\n2. **Side Light (侧光)**: 创建强烈明暗对比\n3. **Back Light (背光)**: 创建轮廓光和剪影效果\n4. **Top Light (顶光)**: 从上向下照射\n5. **Bottom Light (底光)**: 戏剧性反派效果\n6. **45° Angle (45 度角光)**: 经典人像布光\n7. **Rim Light (边缘光)**: 主体边缘光晕\n8. **Ambient Light (环境光)**: 柔和漫射光\n9. **Dramatic Light (戏剧性光)**: 高对比度光影\n10. **Soft Light (柔和光)**: 低对比度柔光\n\n## 关键技术\n- **选择性重打光**: 使用蒙版精确控制光照区域\n- **亮度映射**: 使用第二张黑白图像引导光照分布\n- **多角度控制**: 10 种预设相机角度灯光,可组合使用",
  162. "types": ["strategy"],
  163. "tags": {
  164. "source": "YouTube-Code Crafters Corner",
  165. "domain": "AI 生图",
  166. "tool": "Qwen Image",
  167. "effect": "多角度重打光"
  168. },
  169. "score": 5,
  170. "source": {"category": "research"}
  171. },
  172. {
  173. "task": "AI 渲染引擎工作流 (3D 转 AI 渲染)",
  174. "content": "## 工作流概述\n**来源视频**: \"We Built an AI Render Engine for FREE\" - Mickmumpitz\n**适用场景**: 需要物理精确的光影效果,如体积光、折射、反射\n**复杂度**: 高\n\n## 工作流步骤\n\n| Step | 输入 | 输出 | 工具/模型/参数 |\n|------|------|------|----------------|\n| 1 | 3D 场景 (Blender) | 深度图 + 轮廓通道 | Blender Export Passes |\n| 2 | 深度图 + 轮廓 | 风格参考帧 | Z-Image Turbo |\n| 3 | 风格参考 | 一致的视频序列 | SkyReels V3 R2V + Wan VACE |\n| 4 | ControlNet 引导 | 遵循 3D 几何的 AI 生成 | ControlNet Parameters |\n| 5 | 模型合并 | 真实纹理 + 光照 + 烟雾 + 水效 | Inner-Reflections Model Merge |\n| 6 | 参考图像切换 | 视觉风格即时变化 | Reference Swap |\n| 7 | 多参考合并 | 完全创意控制 | Multiple Reference Merge |\n| 8 | 批量渲染 (高级) | 无限长度风格一致视频 | Batch Rendering + Segment Blending |\n\n## 工具列表\n- **ComfyUI**: 工作流框架\n- **Blender**: 3D 场景创建和渲染通道导出\n- **SkyReels V3 R2V**: 视频生成\n- **Wan VACE**: 视频模型\n- **Inner-Reflections Model Merge**: 模型合并技术\n- **Z-Image Turbo**: 风格参考生成\n\n## 灯光相关技术\n- **体积光模拟**: AI 添加烟雾中的丁达尔效应\n- **光线折射**: 水效果中的光线弯曲和色散\n- **动态光照**: 爆炸碎片中的实时光照变化\n- **真实反射**: 基于物理的反射和折射效果",
  175. "types": ["strategy"],
  176. "tags": {
  177. "source": "YouTube-Mickmumpitz",
  178. "domain": "AI 生图",
  179. "tool": "Blender+ComfyUI",
  180. "effect": "物理光影模拟"
  181. },
  182. "score": 5,
  183. "source": {"category": "research"}
  184. },
  185. {
  186. "task": "在 AI 生图工序调研任务中,如何高效进行多渠道广度扫描与汇总",
  187. "content": "当需要调研特定生图需求的多步工序(Workflow)时,应该采用「多渠道并行调研 + 统一汇总」策略(原因:单一渠道信息有限,多渠道可覆盖不同平台和语言的工作流,提高调研全面性)。具体方法:\n\n1. **关键词构造**:将业务能力需求转换为 AI 生图工序/工作流搜索词,关键词应偏向寻找「教程」「工作流」「全套方案」,而非单一软件名。准备 3-5 个关键词覆盖不同表述。\n\n2. **并行渠道调研**:默认使用小红书、X/Twitter、YouTube 三个渠道,为每个渠道启动独立的 research 子 agent,任务描述需明确:\n - 每个关键词搜索 20 条结果\n - 只提取多步工序(Workflow),严格拆解步骤(包含输入、输出、工具)\n - 输出结构化格式(Step 序号、输入、输出、使用的工具/模型/参数)\n\n3. **知识汇总**:调研完成后使用 knowledge_search 或 ask_knowledge 查询已保存的知识,整合多渠道数据输出结构化报告。\n\n案例:本次「光影对比场景图」调研,5 个关键词×3 渠道,共保存 11 条高价值知识,最终汇总输出 9 个完整工作流的调研报告。",
  188. "types": ["experience"],
  189. "tags": {
  190. "intent": "工序调研",
  191. "state": "多渠道并行",
  192. "domain": "AI 生图"
  193. },
  194. "score": 5,
  195. "source": {"category": "execution"}
  196. },
  197. {
  198. "task": "AI 人像背景虚化效果实现方法汇总",
  199. "content": "## 方法 1:提示词控制(生成时)\n**适用工具**:Nano Banana 2、Seedream 4.5、Grok Imagine Pro、Stable Diffusion、Midjourney\n**核心参数**:\n- 镜头:85mm lens\n- 光圈:f/1.4、f/1.8\n- 景深:shallow depth of field、extremely shallow depth of field\n- 虚化:soft bokeh blur、background bokeh、blurring background completely\n**示例提示词**:`85mm lens, f/1.8 aperture, shallow depth of field, background bokeh, photorealistic`\n\n## 方法 2:后期处理(生成后)\n**工具 1:Photoshop Lens Blur**\n步骤:1) 导入人像图片;2) 创建主体选区(智能选区);3) 应用 Lens Blur 效果,设置虚化强度、光圈形状、焦距参数;4) 微调边缘过渡(蒙版羽化)\n\n**工具 2:DxO Photolab 9 Bokeh**\n步骤:1) 导入图片;2) 自动主体检测;3) 应用 Bokeh 效果,调整虚化参数\n\n## 方法 3:专业工作流\n**冬夜情绪人像工作流**(6 步):场景→人物→姿态→构图(中近景半身)→光线→质感(浅景深,明显背景虚化,轻微胶片颗粒)\n\n**时尚杂志封面工作流**(3 步):上传人脸参考→输入提示词(85mm 镜头、f/1.8 光圈、浅景深、背景虚化)→生成(8K 画质、电影级专业影棚灯光)",
  200. "types": ["strategy"],
  201. "tags": {
  202. "domain": "AI 生图",
  203. "effect": "背景虚化",
  204. "source": "小红书/X/YouTube 调研"
  205. },
  206. "score": 5,
  207. "source": {"category": "research"}
  208. },
  209. {
  210. "task": "AI 人像面部表情自然化工作流集合",
  211. "content": "## 工作流 1:灵动感表情写真(nano-banana)\n**步骤**:\n1. 选择合适的底图:避开证件照式死板正脸,选择有自然神态的底图(有\"肌肉记忆\")\n2. 使用锁脸技术:上传底图,启用 nano-banana 锁脸功能,面部特征锁定\n3. 注入灵动感:调整神态参数,添加微表情描述\n**适用场景**:表情自然的人像写真、避免面瘫效果\n\n## 工作流 2:AI 九宫格表情包(NanoBanana/即梦 3.0pro)\n**步骤**:\n1. 准备参考图片:主体图(想要变身的人物)+ 参考图(表情参考)\n2. 输入提示词:生成 3×3 照片网格,保持面部、发型、服装一致,输出 9 张不同表情\n3. 生成表情包:参数保持真实人物脸部特写,不要卡通化\n**输出**:9 张不同表情的九宫格表情包\n\n## 工作流 3:Canva AI Face Expression(快速多表情)\n**步骤**:\n1. 上传基础照片:单张人物照片(正面、清晰面部)\n2. 选择目标表情:预设表情(微笑、惊讶、严肃、开心等)\n3. 批量生成:重复选择不同表情,批量处理\n**优势**:快速、无需提示词、预设表情模板\n\n## 工作流 4:Seedream 4.5 极端特写休息肖像\n**关键表情参数**:eyes closed (peaceful, resting)、mouth slightly parted (relaxed, vulnerable)、clean dewy 'no-makeup' style\n**负面提示**:open eyes、heavy makeup、stiff pose\n\n## 提示词控制技巧(增强表情自然度)\n**正向提示词**:\n- direct steady eye contact(直接稳定的眼神接触)\n- subtle catchlights in eyes(眼中微妙的反光)\n- calm introspective expression(平静的内省表情)\n- slightly parted lips relaxed(微微张开的放松嘴唇)\n- closed eyes with visible lashes(闭眼可见睫毛)\n\n**负面提示词**:\n- stiff pose(僵硬姿势)\n- looking at camera(当需要避免直视时)\n\n## 适用场景\n表情包制作、YouTube 缩略图、社交媒体内容、情绪人像写真",
  212. "types": ["strategy"],
  213. "tags": {
  214. "domain": "AI 生图",
  215. "effect": "面部表情",
  216. "source": "02_portrait_closeup_workflow_research_report.md",
  217. "tools": "nano-banana,NanoBanana,Canva AI,即梦,Seedream"
  218. },
  219. "score": 5,
  220. "source": {"category": "research"}
  221. },
  222. {
  223. "task": "AI 人像皮肤质感修复工作流(Enhancor + 多模型)",
  224. "content": "## 问题背景\nAI 生成的人像常出现\"塑料皮肤\"问题(过度平滑、无毛孔细节、不真实)\n\n## 完整工作流\n**步骤 1:生成基础人像图片**\n- 工具:Midjourney / Google Imagen 4 (via Whisk) / Reeve / Flux Pro Ultra\n- 输入:近景人像提示词,如'close-up portrait, photorealistic, DSLR, 85mm'\n- 输出:AI 生成的基础人像图片(可能存在塑料皮肤问题)\n\n**步骤 2:裁剪人脸区域(如需要)**\n- 工具:图像裁剪工具\n- 输入:基础人像图片,将人脸区域裁剪至更近的特写\n- 输出:裁剪后的人脸特写图片\n\n**步骤 3:修复 AI 塑料皮肤质感**\n- 工具:Enhancor.ai (Skin Realism + Portrait Upscaler)\n- 输入:AI 生成的人像图片,设置皮肤纹理强度、毛孔细节参数\n- 输出:具有真实皮肤纹理、毛孔细节的人像图片\n- 关键参数:皮肤纹理强度、毛孔细节\n\n**步骤 4:修复眼部瑕疵(可选)**\n- 工具:Enhancor.ai 眼部修复功能\n- 输入:修复后的人像图片,指定眼部区域\n- 输出:眼部细节完美的人像图片\n\n**步骤 5:超分辨率放大**\n- 工具:Enhancor.ai Portrait Upscaler\n- 输入:修复后的人像图片,选择放大倍数(如 4x)\n- 输出:billboard 级别的高分辨率人像图片\n\n## 提示词技巧\n添加以下提示词可减少后期修复需求:\n- realistic skin texture with visible pores and natural imperfections\n- no plastic smoothing\n- dewy, smooth, feeling soft like velvet or hydrated silk\n- soft specular highlights physically reflecting off the nose tip, cheekbone, and lower lip\n- fine hair strand separation",
  225. "types": ["strategy"],
  226. "tags": {
  227. "domain": "AI 生图",
  228. "effect": "皮肤质感",
  229. "source": "YouTube 调研",
  230. "tool": "Enhancor.ai"
  231. },
  232. "score": 5,
  233. "source": {"category": "research"}
  234. },
  235. {
  236. "task": "Stable Diffusion ControlNet 多单元协同光影控制工作流",
  237. "content": "## 工作流程\n\n### Step 1: 准备输入素材\n- 输入:建筑渲染图(白模/素模)或产品/人像原图\n- 输入:参考图(城市夜景照片或光影素材图)\n- 输入:光束图(黑白光影素材,尺寸需与原图保持一致)\n\n### Step 2: ControlNet 单元配置\n\n**ControlNet 单元 0 - Lineart(线稿) 模式**\n- 预处理器:lineart_realistic\n- 模型:control_v11p_sd15_lineart\n- 控制权重:1\n- 引导介入时机:0\n- 引导终止时机:1\n- 控制模式:ControlNet is more important\n\n**ControlNet 单元 1 - Reference(参考) 模式**\n- 预处理器:reference_only\n- 控制权重:1\n- 引导介入时机:0\n- 引导终止时机:1\n- 用途:风格迁移,保持参考图光影氛围\n\n**ControlNet 单元 2 - Shuffle(随机洗牌) 模式**\n- 模型:control_v11e_sd15_shuffle_fp16\n- 控制权重:0.3(避免过度影响原图)\n- 引导介入时机:0\n- 引导终止时机:0.7\n- 用途:色彩分布控制\n\n**ControlNet 单元 3 - Depth(深度) 模式(可选)**\n- 预处理器:depth_zoe\n- 模型:control_v11f1p_sd15_depth\n- 控制权重:1\n- Starting Step: 0, Ending Step: 1\n\n### Step 3: 提示词配置\n\n**正向提示词(光影核心关键词)**\n- Volumetric lighting(体积光)\n- Rim lighting(边缘光)\n- Sunlight(阳光)\n- Backlight(逆光)\n- Tyndall light / God rays / Light beams(丁达尔光)\n- Crepuscular rays(黄昏光线)\n- Soft light(柔和光线)\n- Dimly lit(昏暗光线)\n- depth of field, bokeh(景深、散景)\n\n**反向提示词**\n- lowres, bad anatomy, bad hands, text, watermark, error, missing fingers, extra digit, fewer digits, cropped, worst quality, low quality, normal quality, username, blurry, extra limbs\n\n### Step 4: 采样参数设置\n- 采样方法:DPM++ 2M SDE Karras 或 DPM + 2M\n- 迭代步数:30\n- 高清修复:开启\n- 重绘幅度:0.7-0.8(过高会丢失原图细节)\n- 分辨率:512×768 → 1024×1536(高清修复后)\n- CFG Scale:7\n\n### Step 5: ADetailer 面部保护(人像场景必选)\n- 启用 After Detailer\n- 模型:face_yolov8n.pt\n- 用途:防止人物面部出现畸变\n\n### Step 6: 生成输出\n- 点击生成按钮自动合成\n- 输出:光影增强图(原图与光束图形成很好的结合)\n\n## 避坑指南\n1. ControlNet 权重设置:Shuffle 模式建议权重 0.3,避免过度影响原图\n2. ADetailer 面部保护:人像光影合成时务必开启,防止面部畸变\n3. 高清修复参数:重绘幅度建议 0.7-0.8,过高会丢失原图细节\n4. 光束图尺寸:必须与原图保持一致,否则合成效果不佳\n5. VAE 连接:切勿忘记连接模型 VAE,否则无法正确解码",
  238. "types": ["strategy"],
  239. "tags": {
  240. "domain": "AI 生图",
  241. "source": "小红书调研",
  242. "technique": "光影控制,体积光,丁达尔效应",
  243. "tool": "Stable Diffusion, ControlNet"
  244. },
  245. "score": 5,
  246. "source": {"category": "research"}
  247. },
  248. {
  249. "task": "IC-Light 重新照明工作流(ControlNet 作者新项目)",
  250. "content": "## 项目信息\n- Github 链接:https://github.com/lllyasviel/IC-Light\n- 用途:控制图像光照的重新照明项目\n\n## 模型变体\n\n### iclight_sd15_fc.safetensors(默认推荐)\n- 条件:文本 + 前景\n- 特点:默认的重新照明模型,以文本和前景为条件\n- 可以使用初始潜伏来影响重新照明\n- 用户研究中表现稍优于其他模型\n\n### iclight_sd15_fcon.safetensors\n- 条件:文本 + 前景\n- 特点:与 iclight_sd15_fc 相同,但使用偏移噪声进行训练\n- 注意:默认模型是没有偏移噪声的模型\n\n### iclight_sd15_fbc.safetensors\n- 条件:文本 + 前景 + 背景\n- 特点:以文本、前景和背景为条件的重新照明模型\n\n## ComfyUI IC-Light 工作流配置\n\n### 光源控制参数\n- 位置_X 和 位置_Y:控制光源位置\n- shape_width 和 shape_height:控制光源大小\n- 控制光源是通过遮罩来实现的(没有 DEMO 中的可选光源方向参数)\n\n### Lighting Preference(光照偏好)\n- None(无)\n- Left Light(左光)\n- Right Light(右光)\n- Top Light(顶光)\n- Bottom Light(底光)\n\n### Lighting Quick List(快速光照预设)\n- sunshine from window(窗外阳光)\n- neon light, city(霓虹灯、城市)\n- sunset over sea(海上日落)\n- golden time(黄金时刻)\n- sci-fi RGB glowing, cyberpunk(科幻 RGB 发光、赛博朋克)\n- natural lighting(自然光)\n- warm atmosphere, at home, bedroom(温暖氛围、居家、卧室)\n- magic lit(魔法光照)\n- evil, gothic, yharnam(邪恶、哥特、亚楠)\n- light and shadow(光影)\n\n## 使用方法\n1. 上传前景图(抠图后的人物/产品)\n2. 选择光照偏好或快速预设\n3. 输入文本提示词描述场景氛围\n4. 生成重新照明结果",
  251. "types": ["strategy", "tool"],
  252. "tags": {
  253. "domain": "AI 生图",
  254. "source": "小红书调研,Github",
  255. "technique": "重新照明,光影控制",
  256. "tool": "IC-Light, ControlNet, ComfyUI"
  257. },
  258. "score": 5,
  259. "source": {"category": "research"}
  260. },
  261. {
  262. "task": "AI 生图光影关键词工程库",
  263. "content": "## 光影核心关键词分类\n\n### 体积光/光束类\n| 英文关键词 | 中文 | 效果描述 | 适用场景 |\n|-----------|------|---------|---------|\n| Volumetric lighting | 体积光 | 召唤出空灵的光束 | 森林、室内、雾气场景 |\n| Tyndall light | 丁达尔光 | 光束穿透空气形成光路 | 森林、窗边、清晨/傍晚 |\n| God rays | 耶稣光/上帝光 | 神圣感光束 | 宗教场景、森林 |\n| Light beams | 光束 | 明显的光线路径 | 通用 |\n| Crepuscular rays | 黄昏光线/曙暮光 | 戏剧性的光束 | 宗教感、神圣场景 |\n\n### 光源方向类\n| 英文关键词 | 中文 | 效果描述 | 适用场景 |\n|-----------|------|---------|---------|\n| Sunlight | 阳光 | 黄金时刻的温暖光线 | 户外、自然场景 |\n| Backlight | 逆光 | 光源置于主体后方,强调轮廓 | 剪影、轮廓强调 |\n| Rim lighting | 边缘光 | 为主体勾勒柔和光环 | 人像、产品轮廓强调 |\n| Soft light | 柔和光线 | 温馨柔和环境 | 人像、产品摄影 |\n| Dimly lit | 昏暗光线 | 神秘和微妙的氛围 | 悬疑、情绪场景 |\n| Hard light | 硬光 | 强烈的明暗对比 | 戏剧性场景 |\n\n### 氛围质感类\n| 英文关键词 | 中文 | 效果描述 |\n|-----------|------|---------|\n| depth of field | 景深 | 背景虚化效果 |\n| bokeh | 散景 | 光斑效果 |\n| golden hour | 黄金时刻 | 温暖柔和的光线 |\n| blue hour | 蓝色时刻 | 冷色调氛围 |\n| foggy | 有雾的 | 增加空气感 |\n| misty | 薄雾的 | 柔化光线 |\n| dusty | 有灰尘的 | 增强体积光效果 |\n\n### 电影感光影类\n| 英文关键词 | 中文 | 效果描述 |\n|-----------|------|---------|\n| Cinematic lighting | 电影级布光 | 专业电影质感 |\n| Dramatic lighting | 戏剧性布光 | 强烈明暗对比 |\n| Rembrandt lighting | 伦勃朗光 | 经典人像布光 |\n| Butterfly lighting | 蝴蝶光 | 人像经典布光 |\n| Contour light | 轮廓光 | 强调主体轮廓 |\n\n## 提示词组合公式\n\n**基础公式**:\n`[主体描述] + [光影关键词] + [氛围关键词] + [技术参数]`\n\n**示例**:\n`portrait of a woman, volumetric lighting, god rays through window, golden hour, depth of field, bokeh, cinematic lighting, 8k, photorealistic`\n\n**丁达尔效应专用**:\n`forest scene, tyndall light, light beams through trees, morning mist, dusty air, volumetric fog, sun rays, ethereal atmosphere`\n\n**体积光专用**:\n`interior scene, volumetric lighting, light shafts from window, atmospheric haze, god rays, cinematic, dramatic shadows`\n\n## 场景搭配建议\n- 森林场景:搭配 `foggy`, `misty`, `dusty`, `morning`, `sunrise` 增强丁达尔效果\n- 室内场景:搭配 `window light`, `atmospheric haze`, `volumetric fog`\n- 人像场景:搭配 `rim lighting`, `soft light`, `golden hour`, `backlight`\n- 产品场景:搭配 `studio lighting`, `softbox`, `reflect lig...",
  264. "types": ["tool"],
  265. "tags": {
  266. "domain": "AI 生图",
  267. "source": "小红书调研",
  268. "technique": "提示词工程,光影关键词",
  269. "tool": "Stable Diffusion, Midjourney"
  270. },
  271. "score": 5,
  272. "source": {"category": "research"}
  273. },
  274. {
  275. "task": "ComfyUI 基础文生图/图生图工作流搭建",
  276. "content": "## 基础文生图流程搭建\n\n### Step 1: 创建 K 采样器节点\n- 操作:右键 → 新建节点 → 采样 → K 采样器\n- 核心参数:\n - 步数:25-40(通常 25 步比较快,40 步质量更高)\n - CFG:7(默认值)\n - 采样器:euler\n - 调度器:normal\n - 降噪:1.0(文生图默认)\n\n### Step 2: 选择模型\n- 操作:拖动 K 采样器「模型」输入端的紫色圆点松开 → 选择 Checkpoint 加载器 (简易)\n- 模型示例:SD-1.5/Guofeng3_v34.safetensors\n\n### Step 3: 创建正向条件\n- 操作:拖动 K 采样器「正面条件」输入端 → 选择 CLIP 文本编码器\n- 输入:所有正向提示词(包含光影关键词)\n\n### Step 4: 创建负向条件\n- 方法一:点选 CLIP 文本编码器 → Ctrl+C → 点空白处 → Ctrl+V\n- 方法二:点选 CLIP 文本编码器 → 按住 Alt 键拖动(复制节点)\n- 方法三:鼠标左键双击空白处 → 搜索「clip 文本编码器」\n- 输入:反向提示词\n\n### Step 5: 选择 Latent(潜在空间)\n- 操作:拖拽选择「空 Latent」节点\n- 参数设置:\n - 宽度:512\n - 高度:512\n - 批次大小:1\n- 说明:SD 训练的图片是 512*512,压缩后像素为 64*64,机器在潜在空间进行训练和运算\n\n### Step 6: VAE 解码\n- 操作:拖拽 K 采样器右边的 Latent → 选择 VAE 解码\n- 重要:VAE 千万别忘记连接模型 VAE\n- 用途:将图像从潜在空间解码成真实空间的图像\n\n### Step 7: 预览或保存图像\n- 操作:拖拽 VAE 解码节点图像按钮 → 选择预览图像或保存图像\n\n### Step 8: 生成图片\n- 操作:按 Ctrl + Enter\n\n## 基础图生图流程搭建\n\n### Step 1: 加载图像\n- 操作:右键 → 新建节点 → 图像 → 加载图像\n- 选择:Upload 上传图片\n- 说明:加载的图像是真实空间的图像,需要转化为潜在空间的图像\n\n### Step 2: VAE 编码器\n- 操作:拖动加载图像节点的图像按钮 → 选择 VAE 编码\n- 连接:将 VAE 与模型 VAE 连接,右侧 Latent 与 K 采样器 Latent 连接\n\n### Step 3: 降噪参数设置\n- 位置:K 采样器最后一个参数「降噪」\n- 说明:相当于重绘幅度\n- 数值:越低和上传的图像越相似\n- 推荐值:0.4 到 0.6\n\n## 核心概念说明\n\n### 潜在空间(Latent Space)vs 真实空间(Pixel Space)\n- 真实空间:我们看到的完整图片(如 512*512 像素)\n- 潜在空间:压缩后的表示(如 64*64 像素)\n- 工作流程:真实空间 → Encoder → 潜在空间 → 合成信息 → Decoder → 真实空间\n\n### K 采样器核心作用\n- 任何生成流程的核心节点\n- 结合输入的条件(模型、正向条件、负向条件、Latent)进行最终的处理和融合\n\n### 降噪参数(Denoising)\n- 文生图:固定为 1.0\n- 图生图:0.4-0.6(控制重绘强度)\n- 数值越低,输出与输入图像越相似",
  277. "types": ["strategy"],
  278. "tags": {
  279. "domain": "AI 生图",
  280. "source": "小红书调研",
  281. "technique": "工作流搭建,节点式编辑",
  282. "tool": "ComfyUI, Stable Diffusion"
  283. },
  284. "score": 4,
  285. "source": {"category": "research"}
  286. },
  287. {
  288. "task": "ComfyUI 纹理融合与无缝贴图生成工作流",
  289. "content": "## 工具\n- ComfyUI\n- IPAdapter_plus 节点\n- SDXL 模型 (albedobaseXL_v21.safetensors)\n- Hyper LoRA (Hyper-SDXL-8steps-lora.safetensors)\n- CR Seamless Checker 节点\n- TextureViewer 节点 (基于 threejs)\n\n## 工作流步骤\n\n### 步骤 1: 风格融合生成\n- 输入:两张纹理图片 (A 图和 B 图)\n- 工具:IPAdapter_plus 节点 (2 个)\n- 处理:\n - 使用两个 IPAdapter 编码节点分别处理 A 图和 B 图\n - 权重设置:A 图 1.20, B 图 1.00\n - 使用 IPAdapter 合并嵌入组 (concat 方法)\n- 输出:融合后的纹理潜空间\n\n### 步骤 2: 拼图处理\n- 输入:生成的纹理图像\n- 工具:Efficiency Nodes 图像覆盖节点 (4 个)\n- 处理:\n - 将图像分割成 4 个象限\n - 重新排列拼成 2x2 网格\n - 创建四方连续布局\n- 输出:拼接后的四方连续图 (含接缝)\n\n### 步骤 3: 消除接缝\n- 输入:拼接图 + alpha 遮罩贴图\n- 工具:VAE 编码/解码、Fococus 局部重绘节点、K 采样器\n- 处理:\n - 加载 alpha 贴图作为遮罩\n - 对接缝区域进行局部重绘\n - 遮罩延展值:6\n- 输出:无缝纹理图\n\n### 步骤 4: 输出颜色贴图\n- 输入:无缝纹理\n- 工具:图像裁剪、缩放、覆盖节点\n- 处理:裁剪中心区域 1020x1020\n- 输出:最终颜色贴图\n\n### 步骤 5: 3D 预览\n- 工具:TextureViewer 节点\n- 功能:在球体/立方体上预览贴图效果\n- 参数:Roughness, Metalness, IOR 等材质属性可调\n\n## 关键技巧\n⚠️ 使用 Hyper LoRA 可加快生成速度至 8 步\n⚠️ IPAdapter 权重决定融合比例,可调整风格倾向\n⚠️ 无缝检查使用 CR Seamless Checker 节点 (2x2 或 4x4 网格)\n⚠️ 可添加 3D 展示模块实时预览效果\n\n## 应用场景\n- 服装面料纹理设计\n- 建筑材质贴图\n- 游戏/影视 PBR 材质\n- 平面装饰图案",
  290. "types": ["strategy"],
  291. "tags": {
  292. "source": "知乎",
  293. "domain": "AI 绘画",
  294. "tool": "ComfyUI",
  295. "technique": "纹理融合"
  296. },
  297. "score": 5,
  298. "source": {"category": "research"}
  299. },
  300. {
  301. "task": "ComfyUI SDXL 生成 PBR 贴图完整工作流",
  302. "content": "## 工具\n- ComfyUI\n- SDXL Lightning 8 步模型\n- MTB Nodes (Deep Bump 节点)\n- WAS Node Suite (色阶调整)\n- comfy-plasma 节点\n- CR Seamless Checker 节点\n- RealESRGAN 放大模型\n\n## 工作流步骤\n\n### 步骤 1: 文生图生成基础纹理\n- 输入:中文提示词 (如\"生锈铁皮\")\n- 工具:Checkpoint 加载器、翻译节点、SDXL Prompt Styler\n- 提示词模板:\n - 正向:texture [对象] top down close-up\n - 反向:ugly, deformed, noisy, blurry, hard lighting, strong shadows\n- 参数:1024x1024, 8 步,euler 采样器\n- 输出:基础纹理图\n\n### 步骤 2: 拼图 (创建四方连续)\n- 输入:生成的纹理图 (1024x1024)\n- 工具:Efficiency Nodes 图像覆盖节点 (4 个)\n- 处理:\n - 将原图分割成 4 个 512x512 象限\n - 重新排列:左上→右下,右上→左下,左下→右上,右下→左上\n - 拼成 2048x2048 的四方连续布局\n- 输出:拼接图 (含明显接缝)\n\n### 步骤 3: 消除接缝\n- 输入:拼接图 + alpha 贴图遮罩\n- 工具:VAE 编码/解码、K 采样器、加载图像遮罩节点\n- 处理:\n - 使用十字形 alpha 遮罩覆盖接缝区域\n - 对遮罩区域进行局部重绘\n - 降噪值:1.00\n- 输出:无缝纹理图\n\n### 步骤 4: 输出颜色贴图\n- 输入:无缝纹理\n- 工具:图像裁剪、缩放节点\n- 处理:裁剪中心 1020x1020 区域,缩放至 1024x1024\n- 输出:color-map (颜色贴图)\n\n### 步骤 5: 生成 PBR 通道贴图\n- 输入:颜色贴图\n- 工具:Deep Bump (mtb) 节点、WAS Node Suite、comfy-plasma\n- 输出通道:\n - Normal Map (法线贴图)\n - Height Map (高度图)\n - Roughness Map (粗糙度图)\n - Metallic Map (金属度图)\n - AO Map (环境光遮蔽)\n- 参数调整:对比度 0.60-0.80,亮度 0.85-1.15,黑色阶 0.0-15.6,白色阶 150.0-175.0\n\n### 步骤 6: 可选放大\n- 工具:放大模型加载器 (RealESRGAN_x2.pth)、图像通过模型放大\n- 输出:2K 高清贴图\n\n### 步骤 7: 质量检查\n- 工具:CR Seamless Checker (4x4 网格)、Image Chooser、TextureViewer\n- 输出:质量验证\n\n## 关键技巧\n⚠️ 必须使用 SDXL texture 风格才能生成符合贴图要求的图像\n⚠️ 使用 Lightning 8 步模型可大幅提升生成速度\n⚠️ 接缝处理使用十字形 alpha 遮罩,遮罩延展值设为 6\n⚠️ PBR 通道生成需调整对比度、锐度、色阶以获得最佳效果\n\n## 应用场景\n- 游戏材质制作\n- 3D 渲染场景\n- 建筑可视化\n- 产品渲染",
  303. "types": ["strategy"],
  304. "tags": {
  305. "source": "知乎",
  306. "domain": "AI 绘画",
  307. "tool": "ComfyUI",
  308. "technique": "PBR 贴图"
  309. },
  310. "score": 5,
  311. "source": {"category": "research"}
  312. },
  313. {
  314. "task": "ComfyUI Flux.1 日系复古胶片质感 LoRA 训练工作流",
  315. "content": "## 工具\n- ComfyUI\n- Flux.1 模型 (black-forest-labs/FLUX.1)\n- 胶片质感 LoRA\n- AI-Toolkit (OSTRIS)\n- Qwen-VL-Max (图像理解打标)\n- rgthree 节点 (后处理管理)\n\n## 工作流步骤\n\n### 步骤 1: 数据集准备\n- 输入:日系复古摄影作品 (胶片写真、电影截图)\n- 处理:\n - 收集 50-100 张经典日系复古摄影作品\n - 去除水印\n - 统一尺寸 (建议 512-768)\n - 确保素材符合\"低饱和、有颗粒、氛围松弛\"特点\n- 输出:训练数据集文件夹\n\n### 步骤 2: 图像打标\n- 输入:训练图片\n- 工具:ComfyUI + Qwen-VL-Max\n- 提示词模板:\n ```\n 从设计大师角度,描述图片,描述内容包括:\n 0. 画面主主体\n 1. 服装、服饰\n 2. 发型、发色、饰物\n 3. 表情\n 4. 动作\n 5. 背景或场景\n 6. 氛围、气氛\n 7. 拍摄角度、拍摄手法\n ```\n- 输出:每张图片对应的.txt 标签文件\n\n### 步骤 3: 标签处理\n- 输入:图片 + 标签文本\n- 工具:ComfyUI 自定义脚本节点\n- 处理:\n - 使用 Text Concatenate 节点拼接标签\n - 添加固定前缀:\"nostalgic, grain, lending it a nostalgic, analog quality that elevates its emotional resonance.\"\n - 清理空白字符\n - 保存为 .txt 文件\n- 输出:格式化标签文件\n\n### 步骤 4: LoRA 训练\n- 输入:数据集 + 标签文件\n- 工具:AI-Toolkit (OSTRIS)\n- 参数配置:\n - 模型:FLUX.1\n - 训练目标:LoRA\n - 线性层维度:32\n - 训练步数:3000\n - 批量大小:1 (24GB 显存)\n - 学习率:0.0001\n - 优化器:AdamW8Bit\n - 保存间隔:250\n - 触发词:my_style (自定义)\n- 输出:训练好的 LoRA 模型 (.safetensors)\n\n### 步骤 5: 文生图生成\n- 输入:提示词 + 训练好的 LoRA\n- 工具:ComfyUI + Flux Krea 工作流\n- 提示词格式:\n ```\n nostalgic, [场景描述], film grain, film texture, \n muted color grading, desaturated tones, \n soft color grading, slight vignetting\n ```\n- 参数:分辨率 1024x1024,采样器 FlowMatch,步数 25,引导强度 4\n- 输出:日系复古风格图像\n\n### 步骤 6: 后处理 (可选)\n- 工具:rgthree 节点组\n- 处理:\n - ICLight:光照统一\n - Detailer:脸部/手部细节修复 (Seg 分块大小 512)\n - AuraSR:4x 超分辨率放大\n- 输出:最终高清图像\n\n## Flux.1 胶片质感 LoRA 触发词\n```\nfilmfotos, film grain, reversal film photography\n```\n\n## 关键技巧\n⚠️ 打标要用\"摄影师的语言\"描述,而非泛泛的\"复古\"\n⚠️ 训练数据必须保证\"摄影纯度\",统一为低饱和、有颗粒、氛围松弛的日系特点\n⚠️ 输入分辨率建议 1024,太小 (512) 会导致小元素无法识别\n⚠️ LoRA 训练步数 3000 步为宜,保存间隔 250 步可保留多个检查点\n⚠️ 日系风格核心:不是精致完美,而是\"不刻意\"的生活温度感\n\n## 应用场景\n- 日系人像摄影\n- 复古街拍\n- 胶片质感写真\n- 怀旧风格海报",
  316. "types": ["strategy"],
  317. "tags": {
  318. "source": "知乎",
  319. "domain": "AI 绘画",
  320. "tool": "ComfyUI",
  321. "technique": "LoRA 训练"
  322. },
  323. "score": 5,
  324. "source": {"category": "research"}
  325. },
  326. {
  327. "task": "Photoshop 颗粒感效果 5 种制作方法",
  328. "content": "## 方法一:渐变 + 溶解模式 (推荐)\n\n**适用场景**:有疏密变化的颗粒效果\n\n**步骤**:\n1. 选中需要添加颗粒的区域 (创建选区)\n2. 前景色选择比背景稍亮的颜色\n3. 使用渐变工具,选择\"前景色到透明\"预设\n4. 在选区内拖动产生渐变\n5. 将图层混合模式改为\"溶解\"\n6. 使用柔和橡皮擦擦去边缘生硬部分\n\n**关键参数**:\n- 溶解模式的颗粒密度与透明度相关\n- 透明度越高,颗粒越少\n- 可创建由密到疏的渐变颗粒效果\n\n## 方法二:颗粒画笔绘制\n\n**适用场景**:各种颗粒效果,可控性最强\n\n**步骤**:\n1. 新建图层\n2. 选择颗粒画笔:\n - PS 内置:喷枪柔边低密度粒状、Kyle 喷溅笔刷\n - 或下载第三方颗粒笔刷\n3. 调整画笔参数:\n - 大小:200 像素 (根据画面调整)\n - 混合模式:正常/叠加/滤色\n - 不透明度:30-50%\n - 流量:15-30%\n4. 在需要的位置绘制\n5. 可结合橡皮擦反复调整\n\n**技巧**:\n- 使用数位板更容易控制力度\n- 可创建多个图层分别绘制不同区域的颗粒\n- 配合蒙版精细控制颗粒分布\n\n## 方法三:添加杂色滤镜\n\n**适用场景**:均匀的颗粒效果\n\n**步骤**:\n1. 方法 A (直接应用):\n - 选择滤镜 → 杂色 → 添加杂色\n - 数量:10-20%\n - 分布:高斯分布\n - 勾选\"单色\"\n \n2. 方法 B (非破坏性,推荐):\n - 新建图层,填充黑色\n - 滤镜 → 杂色 → 添加杂色\n - 数量:15-25%\n - 勾选\"单色\"\n - 图层混合模式改为\"滤色\"\n - 调整图层透明度控制颗粒密度\n - 可添加蒙版局部控制\n\n**优点**:操作简单快速\n**缺点**:颗粒分布太均匀,修改不便\n\n## 方法四:图案叠加\n\n**适用场景**:需要特定纹理质感\n\n**步骤**:\n1. 选中需要添加颗粒的图层\n2. 点击图层面板下方 fx → 图案叠加\n3. 选择颗粒纹理图案:\n - PS 自带:灰色花岗岩花纹纸\n - 或载入\"灰度纸\"图案库\n4. 参数设置:\n - 混合模式:正片叠底 (去掉白色背景)\n - 不透明度:50-60%\n - 缩放:80-100%\n\n**优点**:可叠加真实纸张纹理\n**缺点**:需要预先准备纹理素材\n\n## 方法五:AI 渐变网格 + 颗粒 (Illustrator)\n\n**适用场景**:渐变弥散噪点背景图\n\n**步骤**:\n1. 找一张喜欢配色的图片,拖入 AI\n2. 对象 → 创建渐变网格\n - 行数:4-6\n - 列数:4-6\n - 外观:平淡色\n - 高光:100%\n3. 效果 → 纹理 → 颗粒\n - 强度:24-50\n - 对比度:50-65\n - 颗粒类型:常规/点刻\n4. 完成后可用白箭头工具拖动网格点调整渐变\n\n## 即梦 AI 复古电影提示词模板\n```\n中国少女脸部特写,黄昏城市背景中长发随风飘动,\n背光拍摄展现自然皮肤纹理,王家卫电影美学,\n莱卡胶片滤镜,粗颗粒噪点效果,暖调日落光线穿透发丝,\n浅景深构图,磨砂质感画面,复古电影海报风格,\n皮肤毛孔细节增强,环境淡烟雾渲染\n```\n**参数**:即梦 图片 2.0 Pro,9:16 比例\n\n## 关键技巧总结\n⚠️ 溶解模式:透明度决定颗粒密度,适合渐变颗粒\n⚠️ 画笔绘制:最灵活可控,适合局部精细颗粒\n⚠️ 添加杂色:最快但最均匀,建议用独立图层方便后期调整\n⚠️ 图案叠加:可叠加真实纹理,质感最丰富\n⚠️ AI 渐变网格:快速制作柔和渐变噪点背景\n⚠️ 颗粒应叠加在高光和阴影处,增强立体感\n⚠️ 靠近边缘的地方颗粒密集,过渡要自然",
  329. "types": ["strategy"],
  330. "tags": {
  331. "source": "知乎",
  332. "domain": "平面设计",
  333. "tool": "Photoshop",
  334. "technique": "颗粒效果"
  335. },
  336. "score": 5,
  337. "source": {"category": "research"}
  338. },
  339. {
  340. "id": "knowledge-20260411-162604-prompt-consistency",
  341. "task": "在图生图任务中保持人物一致性的 Prompt 技巧",
  342. "content": "当需要在多张图之间保持人物一致性(发型、服装款式)时,应该在 prompt 中使用明确具体的描述词,而不是依赖模型自动保持。\n\n**关键技巧**:\n1. 发型:使用具体描述如\"half-up curly ponytail(半马尾卷发)\"而非简单的\"long hair\"\n2. 服装:明确指定款式细节如\"sleeveless white dress (backless V-neck design, A-line skirt)\"而非\"white dress\"\n3. 参考前序结果:在 prompt 中加入与已生成图片一致的关键特征描述\n\n**案例**:img_2 v1 生成时 prompt 只写了\"flowing white dress\",导致发型从半马尾卷发变为盘发、服装从无袖变为长袖。v2 迭代时在 prompt 中明确指定\"sleeveless\"、\"backless V-neck\"、\"half-up curly ponytail\"后,成功与 img_1 保持一致。\n\n**适用场景**:多图系列创作、角色一致性要求高的项目",
  343. "types": ["experience"],
  344. "tags": {
  345. "intent": "人物一致性控制",
  346. "state": "prompt 优化",
  347. "domain": "image_generation"
  348. },
  349. "score": 5,
  350. "source": {"category": "execution"}
  351. },
  352. {
  353. "id": "knowledge-20260411-162604-nano-banana-usage",
  354. "task": "nano_banana 工具图生图的正确用法",
  355. "content": "nano_banana 是首选的图像生成工具,支持文生图和图生图两种模式。\n\n**图生图参数**:\n- `image_url`: 传入本地文件路径(如\"examples/xxx/reference.png\"),工具会自动上传到 OSS 并替换为 CDN URL\n- `prompt`: 完整的英文 prompt,可包含 Midjourney 风格参数如--ar 3:4 --v 7.0 --stylize 300\n- `output_path`: 期望的输出路径(但实际保存在临时目录,需手动复制)\n\n**返回值**:\n- `cdn_urls`: 永久 CDN 链接列表\n- `saved_files`: 实际保存的本地路径(临时目录)\n\n**注意事项**:\n1. 只传本地路径,严禁自行构造 HTTP/HTTPS 链接\n2. 生成后需手动将文件复制到指定输出路径\n3. 输出文件使用版本号命名(v1, v2, v3...),不覆盖已有文件",
  356. "types": ["experience"],
  357. "tags": {
  358. "intent": "图生图执行",
  359. "state": "nano_banana",
  360. "domain": "tool_usage"
  361. },
  362. "score": 4,
  363. "source": {"category": "execution"}
  364. },
  365. {
  366. "id": "knowledge-20260411-162604-generation-log",
  367. "task": "图像生成任务的日志记录规范",
  368. "content": "每次生成任务完成后,必须追加记录到 generation_log.md,便于追踪迭代历史。\n\n**记录格式**:\n```\n## 任务:[img_X vX 还原 - 优化说明]\n\n### 素材验证\n- 列出所有参考素材及存在状态\n\n### 生成参数\n- 使用工具、完整 Prompt、Negative Prompt、关键参数、分辨率\n\n### 生成结果\n- 输出路径(含版本号)、生成耗时、版本说明\n\n### 验证结果\n- 逐项检查:姿态、景深、人物一致性、道具完整性、手部细节等\n- 整体评估:通过/需调整 + 总分\n\n### 评估详情\n- 各维度打分(0-10)\n\n### 改进建议\n- 后续优化方向\n\n### 阻塞/风险\n- 遇到的问题\n```\n\n**版本管理**:\n- 首次生成:img_X_restored_v1.png\n- 迭代优化:img_X_restored_v2.png、v3.png...\n- 最终定稿:img_X_restored_final.png",
  369. "types": ["experience"],
  370. "tags": {
  371. "intent": "任务记录",
  372. "state": "日志管理",
  373. "domain": "workflow"
  374. },
  375. "score": 4,
  376. "source": {"category": "execution"}
  377. },
  378. {
  379. "id": "knowledge-20260412-005900-nano-banana-cdn-upload",
  380. "task": "在调用 ToolHub nano_banana 工具时,图片传递需要手动上传到 OSS 获取 CDN URL",
  381. "content": "当使用 ToolHub 的 nano_banana 工具进行图像生成时,不能直接传本地文件路径(如 examples/xxx/image.png),因为 ToolHub 服务运行在远程服务器上,无法访问调用方的本地文件系统。\n\n正确做法:\n1. 先调用 image_uploader 工具将本地图片上传到 OSS\n2. 获取返回的 cdn_url(如 https://res.cybertogether.net/toolhub_images/xxx.png)\n3. 将 cdn_url 传入 toolhub_call 的 image_urls 参数\n\n案例:生成 img_3 时,最初直接传本地路径 character_ref_kneel.png 导致 HTTP 503 错误「文件不存在」,改用 image_uploader 上传后获取 CDN URL 再调用 nano_banana 成功生成。\n\n注意:虽然部分 ToolHub 工具文档声称支持自动上传本地路径,但 nano_banana 实际不支持此功能,需手动处理。",
  382. "types": ["experience"],
  383. "tags": {
  384. "intent": "图像生成",
  385. "state": "nano_banana",
  386. "tool": "toolhub_call"
  387. },
  388. "score": 5,
  389. "source": {"category": "execution"}
  390. },
  391. {
  392. "id": "knowledge-20260412-005900-nano-banana-multi-image-consistency",
  393. "task": "在图像生成任务中,使用 nano_banana 进行多图融合保持人物一致性的方法",
  394. "content": "当需要保持多张生成图的人物一致性时(如系列图 img_1~img_5),使用 nano_banana 工具的多图融合功能:\n\n1. 在 image_urls 数组中传入多张参考图:\n - 底图(当前姿态的 character_ref_*.png)\n - 前序生成结果(如 img_1_restored_v1.png 用于链式一致性)\n2. 在 prompt 中明确描述需要保持的特征(如 white V-neck backless maxi dress, brown long hair)\n3. 使用 aspect_ratio 参数控制输出比例(如 3:4)\n\n案例:img_3 生成时传入 character_ref_kneel.png(跪坐姿态底图)和 img_1_restored_v1.png(前序结果),成功保持了白裙款式、发型、体态的一致性,评估得分 8.5/10。\n\n优势:nano_banana 基于 Gemini 多模态模型,对多图特征融合理解能力强,比传统 IP-Adapter 更灵活。",
  395. "types": ["experience"],
  396. "tags": {
  397. "intent": "人物一致性",
  398. "state": "nano_banana",
  399. "technique": "多图融合"
  400. },
  401. "score": 4,
  402. "source": {"category": "execution"}
  403. },
  404. {
  405. "id": "knowledge-20260412-005900-image-gen-workflow-standard",
  406. "task": "图像生成任务的标准化执行流程",
  407. "content": "完整的图像生成任务应遵循以下流程:\n\n1. **素材验证**:使用 read_file 检查所有参考素材文件存在且可读\n2. **源信息读取**:读取制作表 JSON 和通用创作文件,提取细节描述融入 prompt\n3. **ToolHub 检查**:调用 toolhub_health 确认服务可用,toolhub_search 查找合适工具\n4. **图片上传**:使用 image_uploader 将本地图片转为 CDN URL\n5. **执行生成**:调用 toolhub_call 执行生成,记录完整参数\n6. **结果验证**:使用 evaluate_image 进行自动化评估(单图 6 维度/多图 5 维度一致性)\n7. **日志记录**:追加 generation_log.md,包含素材验证、生成参数、验证结果、评估详情\n\n案例:img_3 任务按此流程执行,从素材验证到日志记录全程可追溯,评估 8.5/10 通过。\n\n关键点:每次生成都必须记录完整参数便于迭代优化;评估结果低于 7 分需调整配置重新生成。",
  408. "types": ["experience"],
  409. "tags": {
  410. "intent": "图像生成流程",
  411. "state": "workflow",
  412. "domain": "production"
  413. },
  414. "score": 4,
  415. "source": {"category": "execution"}
  416. },
  417. {
  418. "id": "knowledge-20260412-011232-toolhub-image-upload",
  419. "task": "ToolHub 工具图片参数传递方式",
  420. "content": "当调用 ToolHub 工具(如 nano_banana)需要传入图片时,不能直接传相对路径(如 examples/xxx.png),否则会报 HTTP 503 错误:「images[].data 看起来是文件路径但文件不存在」。正确做法是:先使用 image_uploader 工具将本地图片上传到 OSS 获取 CDN URL,然后将 CDN URL 传入工具的 image_urls 参数。案例:img_5 生成任务中,最初直接传相对路径给 nano_banana 失败,改用 image_uploader 上传 4 张参考图获取 CDN URL 后成功生成。",
  421. "types": ["experience"],
  422. "tags": {
  423. "intent": "图像生成",
  424. "state": "toolhub",
  425. "tool": "nano_banana"
  426. },
  427. "score": 5,
  428. "source": {"category": "execution"}
  429. },
  430. {
  431. "id": "knowledge-20260412-011232-material-fallback-strategy",
  432. "task": "素材缺失时的灵活替代策略",
  433. "content": "当任务指定的参考素材文件不存在时,不要直接报错或跳过,应该:1)使用 glob_files 检查同目录下是否有相似文件;2)评估替代文件是否满足核心需求;3)如可用则使用替代文件并在日志中标注。案例:img_5 任务指定 palette_impasto_img5_v2.png 不存在,检查目录发现 palette_impasto_img1_v2.png,两者都是 Impasto 质感调色板参考,替代后生成效果仍达 8.5 分。",
  434. "types": ["experience"],
  435. "tags": {
  436. "intent": "图像生成",
  437. "state": "素材验证"
  438. },
  439. "score": 4,
  440. "source": {"category": "execution"}
  441. }
  442. ]
  443. }