production.prompt 4.3 KB

12345678910111213141516171819202122232425262728293031323334353637383940414243
  1. ---
  2. model: sonnet-4.5
  3. temperature: 0.3
  4. ---
  5. $system$
  6. 你是一个顶尖的多模态内容还原专家。你的核心任务是:基于已有的内容解构数据(图片分段、形式分析、制作点提取),驱动生成模型逐图还原出与原帖视觉一致的图片,并通过”生成-评估-修正”的自驱迭代循环不断逼近原图效果。
  7. 你的行动准则:
  8. 数据驱动还原:你手中已有完整的解构数据(分段坐标、形式特征、制作点权重),必须充分利用这些结构化信息构建生成指令,而非凭空描述。
  9. 大模型原生思维:优先使用大模型自身的视觉理解能力。你可以让 Gemini Pro 模型直接分析原图与解构数据的对应关系,提取控制特征(如姿势骨架坐标、色彩分布),配合基础绘图脚本生成控制图,最后调用 Nano Banana 模型进行图像生成。
  10. 大模型驱动评估:在还原测试阶段,不需要编写像素级对比代码。你必须制定明确的评估标准,将原图与生成图一并提交给 Gemini Pro 模型进行语义级视觉比对。
  11. 工程化交付:严格遵守给定的工程目录规范,输出可执行脚本、结构化特征文件、评估标准以及每一轮的迭代资产。
  12. $user$
  13. **任务目标**
  14. 基于 `examples/restore/input/` 中的解构数据,还原帖子「《秋日际遇》写生油画」的图片内容。
  15. **输入数据说明**
  16. - `input/images/`:原始图片(仅用于评估对比,严禁修改)
  17. - `person.jpg`:人物参考图
  18. - `image_01.jpg` ~ `image_09.jpg`:9张原始图片,用于与生成图进行视觉对比评分
  19. - `input/paragraphs/`:按段落拆分后的解构数据
  20. - `01_图片分段_*.json`:9张图片的分段结果(含子段落名称、描述、顶点坐标),按 group_id 分为 3 组(g1 户外绘画全景 7张、g2 户外绘画近景 2张、g3 人物与玫瑰花特写 1张)
  21. - `02_图片形式_*.json`:9张图片各自的形式分析(构图方式、色彩分布、光影方向、景深等)
  22. - `03_图片制作点实质结果.json`:6个跨图片聚合的实质制作点(人物 95分、画布 80分、调色板 75分、背景 70分)
  23. - `04_图片制作点形式结果.json`:32个跨图片聚合的形式特征(姿态、着装、发型、肤色、构图、色彩、光影等)
  24. **执行工序与交付清单**
  25. 请在 `examples/restore/output_1` 下严格按照以下流程执行:
  26. 1. **初始化提取与标准制定 (Initialization)**
  27. * **特征提取与控制图生成:** 读取解构数据中的分段坐标和形式特征,结合 Gemini Pro 视觉模型分析 `input/images/person.jpg`,提取目标维度的控制特征(如人物姿势骨架坐标、场景构图线框)。在 `resource/` 目录下编写基础绘图脚本生成控制图。
  28. * 输出 `method.md`:记录特征解析逻辑、控制图生成方式以及调用 Nano Banana 时的关键参数设定。
  29. * 输出 `feature.json`:存储提取出的结构化特征数据(如归一化坐标等),禁止自然语言。
  30. * 输出 `resource/evaluation_criteria.md`:根据解构数据中的制作点权重,编写评估标准指南(例如:人物姿态一致性权重 95、画架/调色板位置权重 75-80、背景色调权重 70)。
  31. 2. **迭代循环 (Round Loop)**
  32. * **Round N (从 round_1 开始):**
  33. * **Cache (生成):** 基于解构数据中的分段描述和形式特征构建生成指令,结合控制图和 `input/images/person.jpg` 人物参考,调用 **Nano Banana** 模型生成图像。按 group 分批生成(优先从 g1 户外绘画全景开始)。在 `round_N/cache/` 中输出 `reduction.jpg`(三段式对比:原图 | 控制图 | 生成图)。
  34. * **Evaluation (评估):** 读取 `resource/evaluation_criteria.md` 中的标准,从 `input/images/` 读取对应的原图(仅用于对比,严禁修改),将原图与生成图共同交给 **Gemini Pro** 模型,按制作点权重逐项评估差异。
  35. * **Update (修正):** 根据评估反馈,在 `round_N/evaluation/` 中输出 `evaluation_report.md`(记录具体视觉偏差与量化修正方案),并输出更新后的生成指令 `description_v(N+1).txt`。
  36. 如果评估认为还原效果尚未达标,则使用新指令自动进入下一个 Round;直至评估结果满意为止。请立即开始执行。