原文: 文生图高级提示技巧(十七): 提示词最佳实践
zhihu · Kevin · 2026-04-25

摘要: 介绍文生图迭代优化的标准五步法:基础提示→问题分析→单变量修改→再生成对比→参数精调固定Seed,附提示词库建设框架与常见陷阱解决方案对照表。


Kevin

大模型能力在不断提升,类似OpenClaw这样的个人助手类智能体越来越流行,但是对于大多数普通用户来说,依然需要以来提示词工程来帮助自己完成任务,本系列文章重温一下提示词工程:包括文生图、文本内容生成类的提示词技巧

从本章开始介绍文生的高级技巧

6.5 迭代优化流程

标准五步迭代法

Step 1:基础提示 → 生成 4 张(建立基准)

Step 2:分析结果 → 识别主要问题(构图?光影?风格漂移?)

Step 3:针对性修改 → 一次只改一个变量(控制变量原则)

Step 4:再次生成 → 与前版本对比选择

Step 5:微调参数 → Seed 固定 + 参数精调 → 最终输出

迭代记录建议格式

【项目名称】城市夜景插画

V1:city at night, illustration

❌ 问题:风格不统一,无主体焦点

V2:neon-lit city street at night, cyberpunk illustration, rain reflection

✅ 改进:添加了风格和氛围词

❌ 问题:人物比例失调

V3:[V2提示] --no deformed anatomy, bad proportions

✅ 改进:加入负向提示修正人体

⚙️ 参数:--ar 16:9 --stylize 500

V4:[V3提示] + cinematic composition, rule of thirds

✅ 最终版本:效果达预期

📌 固定 Seed:2847361

6.6 提示词库建设

📁 提示词库/

├── 📁 主体/

│ ├── 人物.md # 年龄、性别、种族、表情、动作、服装

│ ├── 动物.md # 种类、形态、动作、环境

│ └── 物体.md # 材质、状态、光感

├── 📁 场景/

│ ├── 自然.md # 时间、天气、季节、地形

│ ├── 城市.md # 建筑风格、时代、氛围

│ └── 室内.md # 空间类型、装饰风格、光源

├── 📁 风格/

│ ├── 艺术流派.md # 印象派、包豪斯、新艺术运动...

│ ├── 摄影.md # 镜头、光影、胶片类型

│ └── 3D渲染.md # 渲染引擎风格、材质、场景

├── 📁 负向提示/

│ ├── 通用质量.md # 适用于所有场景

│ ├── 人像专用.md # 解剖问题修正

│ └── 商业图专用.md # 水印、文字、干扰元素

└── 📁 模板/

├── 肖像模板.md # 可直接填空使用

├── 风景模板.md

├── 产品模板.md

└── 概念艺术模板.md

模板示例(肖像)

[性别/年龄] [种族特征], [表情], [服装风格],

[光影类型] lighting, [背景描述],

[摄影/艺术风格], [镜头类型], [质量词]

--ar [比例] --stylize [值]

负向提示:

bad anatomy, deformed hands, extra fingers, asymmetric eyes,

watermark, text, lowres, blurry

6.7 效率工具推荐

工具类型

推荐工具

适用场景

提示构建器

http://

PromptBuilder.cc

,Lexica

可视化构建提示词、获取灵感参考

提示优化器

PromptPerfect

自动优化提示词质量

社区资源

Civitai,PromptHero

浏览他人成功提示词、学习范例

参数管理

ComfyUI(工作流),AUTOMATIC1111

Seed / 权重 / 批次等参数管理

版本记录

Notion,Obsidian

个人提示词库管理、版本记录

6.8 常见陷阱与解决方案

陷阱

症状

解决方案

过度描述

模型困惑、画面杂乱

精简到 6~10 个核心信息点

风格冲突

画面风格混乱

确立主导风格,删除次要风格词

忽略负向提示

反复出现相同错误

建立个人常用负向词库并系统化使用

参数极端化

效果异常(过于随机或僵硬)

使用推荐区间,逐步调整

期望一次成功

挫败感、放弃迭代

接受迭代为核心工作流,3~5 轮是正常节奏

跨模型照搬提示

效果大幅下降

适配各模型的语言偏好,参考跨平台适配表

负向与正向冲突

模型行为混乱

检查负向词是否与正向主体相矛盾

忽略宽高比

构图被裁切或变形

生成前先确认 --ar 或图像尺寸设置

(完)

需求 # 目的 作用
输入 实质 形式 类型 变量名 来源
实现 外部工具 动作 指令 配置 运行 备注 逻辑控制 特性
输出 实质 形式 类型 变量名 去处
高亮推断 点击列名 ↔ 显示/隐藏 · 点击组名 ↔ 整组切换 · 「推」角标 hover 看推断理由
工序 文生图提示词迭代优化 #目的: 对任意图像创作目标,通过五步迭代法逐步收敛提示词质量,得到稳定可复现的最终提示词与固定种子 类别: 产物创造 #平台: zhihu · #作者: Kevin · case: C_zhihu_20313114
输入
指令 创作目标 — 图像创作主题,如「城市夜景插画」
资源 (跨 case 长期资产)
知识类型/知识库 提示词库 — 按主体/场景/风格/负向提示/模板五类分目录组织的提示词文件库(6.6节结构)
返回
程序控制类型/指令/提示词
需求 输入 实现 输出
# 目的 作用 实质 形式 类型 变量名 来源 外部工具 动作 指令 配置 运行 备注 逻辑控制 特性 实质 形式 类型 变量名 去处
s1
指令 起草基础 提示词,用 (AI生图工具) 生成 4 张 图集 建立基准
主体生成/表象/视觉/实体/物品/影像物品/艺术创作/架构/策略/互动方式/受众互动/指令引导/定向指令程序控制类型/指令/描述创作目标城市夜景插画← 工序输入(AI 生图工具)生成/元素生成
基础提示 → 生成 4 张(建立基准)
控制变量原则全程适用:每次迭代只改一个变量;可参考 6.6 提示词库对应模板起草初稿
-随机/理念/知识/商业/前沿技术/AI智能/AI应用/架构/修辞/描写刻画/细节描绘/场景描写程序控制类型/指令/提示词初始提示词city at night, illustration→ s2
/表象/视觉/空间/空间场所/城乡空间/城市空间 /表象/视觉/实体/物品/影像物品/艺术创作/呈现/视觉/视觉制作/构图编排/版面设计/版面结构内容类型/半成品/原子/样图初代图集<4张基准图 — 城市夜景插画初版,风格不统一,无主体焦点>→ s2.1
s2
多轮 遍历:分析→修改→生成,直到 提示词 效果达预期
/理念/知识/商业/前沿技术/AI智能/AI应用/架构/修辞/描写刻画/细节描绘/场景描写程序控制类型/指令/提示词初始提示词city at night, illustration← s1.初始提示词-遍历-/理念/知识/商业/前沿技术/AI智能/AI应用/架构/修辞/描写刻画/细节描绘/场景描写程序控制类型/指令/提示词优化提示词[V3提示] + cinematic composition, rule of thirds --ar 16:9 --stylize 500→ s3
/表象/视觉/空间/空间场所/城乡空间/城市空间 /表象/视觉/实体/物品/影像物品/艺术创作/呈现/视觉/视觉制作/构图编排/版面设计/版面结构内容类型/半成品/原子/样图初代图集<4张城市夜景插画基准图>← s1.初代图集/表象/视觉/空间/空间场所/城乡空间/城市空间 /表象/视觉/实体/物品/影像物品/艺术创作/呈现/视觉/视觉制作/构图编排/版面设计/版面结构内容类型/半成品/原子/样图优选图集<经多轮迭代后选定的最优城市夜景插画图集>→ s3
/理念/知识/商业/前沿技术/AI智能/AI应用/架构/逻辑/信息编排逻辑/条目列举/分段结构/流程递进迭代记录迭代记录【城市夜景插画】 V1:city at night, illustration ❌ 问题:风格不统一,无主体焦点 V2:neon-lit city street at night, cyberpunk illustration, rain reflection ✅ 改进:添加了风格和氛围词 ❌ 问题:人物比例失调 V3:[V2提示] --no deformed anatomy, bad proportions ✅ 改进:加入负向提示修正人体 ⚙️ 参数:--ar 16:9 --stylize 500 V4:[V3提示] + cinematic composition, rule of thirds ✅ 最终版本:效果达预期 📌 固定 Seed:2847361→ (人工维护)
└ s2.1
human 分析 图集,识别主要问题,输出 问题诊断
预处理/表象/视觉/空间/空间场所/城乡空间/城市空间 /表象/视觉/实体/物品/影像物品/艺术创作/呈现/视觉/视觉制作/构图编排/版面设计/版面结构内容类型/半成品/原子/样图当前图集<当前迭代轮次的生成图集;首轮为初代图集,后续为上一轮新版图集>← s1.初代图集 (首轮) / ← s2.3.新版图集 (后续)human提取/化学提取/反推
分析结果 → 识别主要问题(构图?光影?风格漂移?)
对照 6.8 常见陷阱清单:过度描述/风格冲突/忽略负向提示/参数极端化/负向正向冲突/忽略宽高比等
-人工/理念/知识/思想/概念范畴/认知思辨/推理论证/架构/逻辑/信息编排逻辑/归纳论证/分析解读/评价判断程序控制类型/评估/评语问题诊断风格不统一,无主体焦点(V1 轮诊断)→ s2.2
└ s2.2
human 按控制变量原则将 问题诊断 转化为对 提示词 的单变量修改,输出 提示词
预处理/理念/知识/商业/前沿技术/AI智能/AI应用/架构/修辞/描写刻画/细节描绘/场景描写程序控制类型/指令/提示词当前提示词city at night, illustration(首轮;后续为上一轮修改后提示词)← s1.初始提示词 (首轮) / ← s2.2.修改后提示词 (后续)human修改/变/替换
针对性修改 → 一次只改一个变量(控制变量原则)
参考 6.6 提示词库对应类目补充词条;6.8 典型解法:精简到6~10个核心信息点/确立主导风格/加负向提示词/检查正负向冲突
-人工/理念/知识/商业/前沿技术/AI智能/AI应用/架构/修辞/描写刻画/细节描绘/场景描写程序控制类型/指令/提示词修改后提示词neon-lit city street at night, cyberpunk illustration, rain reflection→ s2.3
/理念/知识/思想/概念范畴/认知思辨/推理论证/架构/逻辑/信息编排逻辑/归纳论证/分析解读/评价判断程序控制类型/评估/评语问题诊断风格不统一,无主体焦点(V1 轮)← s2.1.问题诊断
└ s2.3
(AI生图工具)提示词 生成 4 张候选,human 对比选出最优 候选图
主体生成/理念/知识/商业/前沿技术/AI智能/AI应用/架构/修辞/描写刻画/细节描绘/场景描写程序控制类型/指令/提示词修改后提示词neon-lit city street at night, cyberpunk illustration, rain reflection← s2.2.修改后提示词(AI 生图工具)生成/元素生成
再次生成 → 与前版本对比选择
默认生成 4 张对比候选;参数参考当前配置(如 --ar 16:9 --stylize 500)
@采样(n=4, pick=人工)
若对比后效果未达预期则回 s2.1 继续下一轮;3~5 轮是正常节奏,不要期望一次成功;6.8陷阱:跨模型照搬效果大幅下降,需适配模型语言偏好
-随机/表象/视觉/空间/空间场所/城乡空间/城市空间 /表象/视觉/实体/物品/影像物品/艺术创作/呈现/视觉/视觉制作/构图编排/版面设计/版面结构内容类型/半成品/原子/样图新版图集<本轮生成的 4 张候选图(V2 轮次)>→ s2.1 (下一轮)
/表象/视觉/空间/空间场所/城乡空间/城市空间 /表象/视觉/实体/物品/影像物品/艺术创作/呈现/视觉/视觉风格/视觉艺术风格/数字风格/AI风格内容类型/半成品/原子/样图选定候选图<人工从 4 张候选中选定的最优版本(V2 选定图)>→ s2
s3
精调参数并固定 Seed,将 提示词 锁定为稳定可复现的 提示词生成图
主体生成/理念/知识/商业/前沿技术/AI智能/AI应用/架构/修辞/描写刻画/细节描绘/场景描写程序控制类型/指令/提示词优化提示词[V3提示] + cinematic composition, rule of thirds← s2.优化提示词(AI 生图工具)生成/元素生成
微调参数 → Seed 固定 + 参数精调 → 最终输出
Seed 锁定(示例: 2847361);精调参数如 --ar 16:9 --stylize 500
Seed 固定后可无限复现相同随机分布;幂等性是最终质量的锁定机制。根据 6.8 陷阱表:参数极端化时使用推荐区间,逐步调整
-幂等/理念/知识/商业/前沿技术/AI智能/AI应用/架构/修辞/描写刻画/细节描绘/场景描写程序控制类型/指令/提示词最终提示词[V3提示] + cinematic composition, rule of thirds --ar 16:9 --stylize 500→ 返回 提示词
/表象/视觉/空间/空间场所/城乡空间/城市空间 /表象/视觉/实体/物品/影像物品/艺术创作/呈现/视觉/视觉风格/视觉艺术风格/数字风格/AI风格内容类型/半成品/原子/样图选定候选图<迭代循环中人工选定的最优候选图,用作精调阶段效果参照>← s2.优选图集程序控制类型/参数/生成参数固定SeedSeed: 2847361→ 存档
/表象/视觉/空间/空间场所/城乡空间/城市空间 /表象/视觉/实体/物品/影像物品/艺术创作/呈现/视觉/视觉风格/视觉艺术风格/数字风格/AI风格内容类型/成品/成品图最终图像<Seed 2847361 锁定后的城市夜景插画最终稳定版本(V4 效果,可无限复现)>→ 存档
返回 提示词