摘要: 介绍文生图迭代优化的标准五步法:基础提示→问题分析→单变量修改→再生成对比→参数精调固定Seed,附提示词库建设框架与常见陷阱解决方案对照表。
Kevin
大模型能力在不断提升,类似OpenClaw这样的个人助手类智能体越来越流行,但是对于大多数普通用户来说,依然需要以来提示词工程来帮助自己完成任务,本系列文章重温一下提示词工程:包括文生图、文本内容生成类的提示词技巧
从本章开始介绍文生的高级技巧
6.5 迭代优化流程
标准五步迭代法
Step 1:基础提示 → 生成 4 张(建立基准)
Step 2:分析结果 → 识别主要问题(构图?光影?风格漂移?)
Step 3:针对性修改 → 一次只改一个变量(控制变量原则)
Step 4:再次生成 → 与前版本对比选择
Step 5:微调参数 → Seed 固定 + 参数精调 → 最终输出
迭代记录建议格式
【项目名称】城市夜景插画
V1:city at night, illustration
❌ 问题:风格不统一,无主体焦点
V2:neon-lit city street at night, cyberpunk illustration, rain reflection
✅ 改进:添加了风格和氛围词
❌ 问题:人物比例失调
V3:[V2提示] --no deformed anatomy, bad proportions
✅ 改进:加入负向提示修正人体
⚙️ 参数:--ar 16:9 --stylize 500
V4:[V3提示] + cinematic composition, rule of thirds
✅ 最终版本:效果达预期
📌 固定 Seed:2847361
6.6 提示词库建设
📁 提示词库/
├── 📁 主体/
│ ├── 人物.md # 年龄、性别、种族、表情、动作、服装
│ ├── 动物.md # 种类、形态、动作、环境
│ └── 物体.md # 材质、状态、光感
├── 📁 场景/
│ ├── 自然.md # 时间、天气、季节、地形
│ ├── 城市.md # 建筑风格、时代、氛围
│ └── 室内.md # 空间类型、装饰风格、光源
├── 📁 风格/
│ ├── 艺术流派.md # 印象派、包豪斯、新艺术运动...
│ ├── 摄影.md # 镜头、光影、胶片类型
│ └── 3D渲染.md # 渲染引擎风格、材质、场景
├── 📁 负向提示/
│ ├── 通用质量.md # 适用于所有场景
│ ├── 人像专用.md # 解剖问题修正
│ └── 商业图专用.md # 水印、文字、干扰元素
└── 📁 模板/
├── 肖像模板.md # 可直接填空使用
├── 风景模板.md
├── 产品模板.md
└── 概念艺术模板.md
模板示例(肖像)
[性别/年龄] [种族特征], [表情], [服装风格],
[光影类型] lighting, [背景描述],
[摄影/艺术风格], [镜头类型], [质量词]
--ar [比例] --stylize [值]
负向提示:
bad anatomy, deformed hands, extra fingers, asymmetric eyes,
watermark, text, lowres, blurry
6.7 效率工具推荐
工具类型
推荐工具
适用场景
提示构建器
http://
PromptBuilder.cc
,Lexica
可视化构建提示词、获取灵感参考
提示优化器
PromptPerfect
自动优化提示词质量
社区资源
Civitai,PromptHero
浏览他人成功提示词、学习范例
参数管理
ComfyUI(工作流),AUTOMATIC1111
Seed / 权重 / 批次等参数管理
版本记录
Notion,Obsidian
个人提示词库管理、版本记录
6.8 常见陷阱与解决方案
陷阱
症状
解决方案
过度描述
模型困惑、画面杂乱
精简到 6~10 个核心信息点
风格冲突
画面风格混乱
确立主导风格,删除次要风格词
忽略负向提示
反复出现相同错误
建立个人常用负向词库并系统化使用
参数极端化
效果异常(过于随机或僵硬)
使用推荐区间,逐步调整
期望一次成功
挫败感、放弃迭代
接受迭代为核心工作流,3~5 轮是正常节奏
跨模型照搬提示
效果大幅下降
适配各模型的语言偏好,参考跨平台适配表
负向与正向冲突
模型行为混乱
检查负向词是否与正向主体相矛盾
忽略宽高比
构图被裁切或变形
生成前先确认 --ar 或图像尺寸设置
(完)
| 需求 | 输入 | 实现 | 输出 | |||||||||||||||||||||
|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
| # | 目的 | 作用 | 实质 | 形式 | 类型 | 变量名 | 值 | 来源 | 外部工具 | 动作 | 指令 | 配置 | 运行 | 备注 | 逻辑控制 | 特性 | 实质 | 形式 | 类型 | 变量名 | 值 | 去处 | ||
| s1 | 从 指令 起草基础 提示词,用 (AI生图工具) 生成 4 张 图集 建立基准 | 主体生成 | /表象/视觉/实体/物品/影像物品/艺术创作 | /架构/策略/互动方式/受众互动/指令引导/定向指令 | 程序控制类型/指令/描述 | 创作目标 | 城市夜景插画 | ← 工序输入 | (AI 生图工具) | 生成/元素生成 | 基础提示 → 生成 4 张(建立基准) | 控制变量原则全程适用:每次迭代只改一个变量;可参考 6.6 提示词库对应模板起草初稿 | - | 随机 | /理念/知识/商业/前沿技术/AI智能/AI应用 | /架构/修辞/描写刻画/细节描绘/场景描写 | 程序控制类型/指令/提示词 | 初始提示词 | city at night, illustration | → s2 | ||||
| /表象/视觉/空间/空间场所/城乡空间/城市空间 /表象/视觉/实体/物品/影像物品/艺术创作 | /呈现/视觉/视觉制作/构图编排/版面设计/版面结构 | 内容类型/半成品/原子/样图 | 初代图集 | <4张基准图 — 城市夜景插画初版,风格不统一,无主体焦点> | → s2.1 | |||||||||||||||||||
| ▼ s2 | 多轮 遍历:分析→修改→生成,直到 提示词 效果达预期 | /理念/知识/商业/前沿技术/AI智能/AI应用 | /架构/修辞/描写刻画/细节描绘/场景描写 | 程序控制类型/指令/提示词 | 初始提示词 | city at night, illustration | ← s1.初始提示词 | - | 遍历 | - | /理念/知识/商业/前沿技术/AI智能/AI应用 | /架构/修辞/描写刻画/细节描绘/场景描写 | 程序控制类型/指令/提示词 | 优化提示词 | [V3提示] + cinematic composition, rule of thirds --ar 16:9 --stylize 500 | → s3 | ||||||||
| /表象/视觉/空间/空间场所/城乡空间/城市空间 /表象/视觉/实体/物品/影像物品/艺术创作 | /呈现/视觉/视觉制作/构图编排/版面设计/版面结构 | 内容类型/半成品/原子/样图 | 初代图集 | <4张城市夜景插画基准图> | ← s1.初代图集 | /表象/视觉/空间/空间场所/城乡空间/城市空间 /表象/视觉/实体/物品/影像物品/艺术创作 | /呈现/视觉/视觉制作/构图编排/版面设计/版面结构 | 内容类型/半成品/原子/样图 | 优选图集 | <经多轮迭代后选定的最优城市夜景插画图集> | → s3 | |||||||||||||
| /理念/知识/商业/前沿技术/AI智能/AI应用 | /架构/逻辑/信息编排逻辑/条目列举/分段结构/流程递进 | 迭代记录 | 迭代记录 | 【城市夜景插画】 V1:city at night, illustration ❌ 问题:风格不统一,无主体焦点 V2:neon-lit city street at night, cyberpunk illustration, rain reflection ✅ 改进:添加了风格和氛围词 ❌ 问题:人物比例失调 V3:[V2提示] --no deformed anatomy, bad proportions ✅ 改进:加入负向提示修正人体 ⚙️ 参数:--ar 16:9 --stylize 500 V4:[V3提示] + cinematic composition, rule of thirds ✅ 最终版本:效果达预期 📌 固定 Seed:2847361 | → (人工维护) | |||||||||||||||||||
| └ s2.1 | human 分析 图集,识别主要问题,输出 问题诊断 | 预处理 | /表象/视觉/空间/空间场所/城乡空间/城市空间 /表象/视觉/实体/物品/影像物品/艺术创作 | /呈现/视觉/视觉制作/构图编排/版面设计/版面结构 | 内容类型/半成品/原子/样图 | 当前图集 | <当前迭代轮次的生成图集;首轮为初代图集,后续为上一轮新版图集> | ← s1.初代图集 (首轮) / ← s2.3.新版图集 (后续) | human | 提取/化学提取/反推 | 分析结果 → 识别主要问题(构图?光影?风格漂移?) | 对照 6.8 常见陷阱清单:过度描述/风格冲突/忽略负向提示/参数极端化/负向正向冲突/忽略宽高比等 | - | 人工 | /理念/知识/思想/概念范畴/认知思辨/推理论证 | /架构/逻辑/信息编排逻辑/归纳论证/分析解读/评价判断 | 程序控制类型/评估/评语 | 问题诊断 | 风格不统一,无主体焦点(V1 轮诊断) | → s2.2 | ||||
| └ s2.2 | human 按控制变量原则将 问题诊断 转化为对 提示词 的单变量修改,输出 提示词 | 预处理 | /理念/知识/商业/前沿技术/AI智能/AI应用 | /架构/修辞/描写刻画/细节描绘/场景描写 | 程序控制类型/指令/提示词 | 当前提示词 | city at night, illustration(首轮;后续为上一轮修改后提示词) | ← s1.初始提示词 (首轮) / ← s2.2.修改后提示词 (后续) | human | 修改/变/替换 | 针对性修改 → 一次只改一个变量(控制变量原则) | 参考 6.6 提示词库对应类目补充词条;6.8 典型解法:精简到6~10个核心信息点/确立主导风格/加负向提示词/检查正负向冲突 | - | 人工 | /理念/知识/商业/前沿技术/AI智能/AI应用 | /架构/修辞/描写刻画/细节描绘/场景描写 | 程序控制类型/指令/提示词 | 修改后提示词 | neon-lit city street at night, cyberpunk illustration, rain reflection | → s2.3 | ||||
| /理念/知识/思想/概念范畴/认知思辨/推理论证 | /架构/逻辑/信息编排逻辑/归纳论证/分析解读/评价判断 | 程序控制类型/评估/评语 | 问题诊断 | 风格不统一,无主体焦点(V1 轮) | ← s2.1.问题诊断 | |||||||||||||||||||
| └ s2.3 | (AI生图工具) 按 提示词 生成 4 张候选,human 对比选出最优 候选图 | 主体生成 | /理念/知识/商业/前沿技术/AI智能/AI应用 | /架构/修辞/描写刻画/细节描绘/场景描写 | 程序控制类型/指令/提示词 | 修改后提示词 | neon-lit city street at night, cyberpunk illustration, rain reflection | ← s2.2.修改后提示词 | (AI 生图工具) | 生成/元素生成 | 再次生成 → 与前版本对比选择 | 默认生成 4 张对比候选;参数参考当前配置(如 --ar 16:9 --stylize 500) | @采样(n=4, pick=人工) | 若对比后效果未达预期则回 s2.1 继续下一轮;3~5 轮是正常节奏,不要期望一次成功;6.8陷阱:跨模型照搬效果大幅下降,需适配模型语言偏好 | - | 随机 | /表象/视觉/空间/空间场所/城乡空间/城市空间 /表象/视觉/实体/物品/影像物品/艺术创作 | /呈现/视觉/视觉制作/构图编排/版面设计/版面结构 | 内容类型/半成品/原子/样图 | 新版图集 | <本轮生成的 4 张候选图(V2 轮次)> | → s2.1 (下一轮) | ||
| /表象/视觉/空间/空间场所/城乡空间/城市空间 /表象/视觉/实体/物品/影像物品/艺术创作 | /呈现/视觉/视觉风格/视觉艺术风格/数字风格/AI风格 | 内容类型/半成品/原子/样图 | 选定候选图 | <人工从 4 张候选中选定的最优版本(V2 选定图)> | → s2 | |||||||||||||||||||
| s3 | 精调参数并固定 Seed,将 提示词 锁定为稳定可复现的 提示词 与 生成图 | 主体生成 | /理念/知识/商业/前沿技术/AI智能/AI应用 | /架构/修辞/描写刻画/细节描绘/场景描写 | 程序控制类型/指令/提示词 | 优化提示词 | [V3提示] + cinematic composition, rule of thirds | ← s2.优化提示词 | (AI 生图工具) | 生成/元素生成 | 微调参数 → Seed 固定 + 参数精调 → 最终输出 | Seed 锁定(示例: 2847361);精调参数如 --ar 16:9 --stylize 500 | Seed 固定后可无限复现相同随机分布;幂等性是最终质量的锁定机制。根据 6.8 陷阱表:参数极端化时使用推荐区间,逐步调整 | - | 幂等 | /理念/知识/商业/前沿技术/AI智能/AI应用 | /架构/修辞/描写刻画/细节描绘/场景描写 | 程序控制类型/指令/提示词 | 最终提示词 | [V3提示] + cinematic composition, rule of thirds --ar 16:9 --stylize 500 | → 返回 提示词 | |||
| /表象/视觉/空间/空间场所/城乡空间/城市空间 /表象/视觉/实体/物品/影像物品/艺术创作 | /呈现/视觉/视觉风格/视觉艺术风格/数字风格/AI风格 | 内容类型/半成品/原子/样图 | 选定候选图 | <迭代循环中人工选定的最优候选图,用作精调阶段效果参照> | ← s2.优选图集 | 程序控制类型/参数/生成参数 | 固定Seed | Seed: 2847361 | → 存档 | |||||||||||||||
| /表象/视觉/空间/空间场所/城乡空间/城市空间 /表象/视觉/实体/物品/影像物品/艺术创作 | /呈现/视觉/视觉风格/视觉艺术风格/数字风格/AI风格 | 内容类型/成品/成品图 | 最终图像 | <Seed 2847361 锁定后的城市夜景插画最终稳定版本(V4 效果,可无限复现)> | → 存档 | |||||||||||||||||||
| ↩ | 返回 提示词 | |||||||||||||||||||||||