原文: Flux2图像反推教程!上传图片自动生成提示词+高清图
微信公众号 · gzh · 2026-04-30

摘要: ComfyUI工作流教程:用Flux2-Klein模型反推图像提示词,再用武祭(WuJi)系列模型生成并高清放大,一键完成风格复刻。


扔给AI一张图,它就把提示词吐出来了!这个工具太牛了

你有没有遇到过这种情况:看到一张超好看的图,想复刻类似的风格,但不知道用什么提示词。

现在有个办法可以解决这个问题——直接让AI帮你"反推"出提示词。

扔一张图进去,Flux2-Klein模型就能分析出这张图的特点,输出详细的提示词描述。然后用这些提示词配合图像生成模型,就能复刻类似风格,甚至做更多变化。

今天分享这个ComfyUI工作流,把图像反推和图像生成串起来,一键完成。

开始前的准备

需要安装的插件

这个工作流依赖武祭(WuJi)系列插件,提供图像生成、反推、放大等功能:

插件名称

说明

安装方式

ComfyUI-WUJI

武祭核心包,包含采样器、编辑器、清理器等

Manager搜索"WUJI"

ComfyUI-Rh-hidden-nodes

Flux2-Klein图像反推节点

Manager搜索"RH"

另外还需要基础插件 ComfyUI 的 LoadImage、CheckpointLoader、SaveImage 等标准节点。

需要下载的模型

模型名称

说明

放置路径

WuJi_Z-image-base多风格2603

武祭图像基础模型

ComfyUI/models/checkpoints/

模型可以从Civitai或抱脸下载。

放大模型(可选)

如果需要高清放大,工作流使用了 seedvr2_ema_3b 模型,放置在:

ComfyUI/models/upscale_models/

工作流怎么搭?

整个工作流有16个节点,分为4个部分:

第一步:图像反推(Flux2-Klein)

核心是 RHHiddenNodes 节点,它调用Flux2-Klein模型来分析图像。

输入端:

pwd:留空

ref_image_1:接入LoadImage节点的图片输出

输出端:

p0:输出反推的提示词字符串

ShowText 节点用来预览反推出的提示词内容,方便查看结果。

这一步的原理是:用Vision Transformer分析图像,提取出构图、风格、主体、氛围等特征,转换成文本描述。

第二步:加载生成模型

CheckpointLoaderSimple 节点加载武祭的基础模型:

ckpt_name:WuJi_Z-image-base多风格2603_.safetensors

模型输出三个分支:

MODEL:接入WujiSampler的模型输入

CLIP:接入WujiSuperEditor的clip输入

VAE:接入WujiSampler的VAE输入

第三步:超级编辑器整合

WujiSuperEditor 是整合提示词的核心节点:

参数

说明

clip

接入CLIP

vae

留空(自动使用checkpoint的VAE)

图像1-4

可接入多张参考图

提示词

可手动输入或接入反推结果

负向提示词

不想出现的内容

宽度/高度

输出尺寸,接入Int节点控制

艺术流派/摄影风格等

风格预设参数

输出的正向条件、负向条件、潜空间图像分别接入WujiSampler。

第四步:采样、清理、放大

WujiSampler 采样器参数:

参数

推荐值

说明

步数

8

采样步数,越高质量越慢

CFG

1

引导强度,1表示轻度引导

采样器

euler

推荐euler或euler_ancestral

调度器

simple

调度算法

去噪强度

1

完全去噪生成

WujiCleaner 清理器设置为"极限清理",去除生成中的瑕疵。

WujiUpscaler 放大器参数:

参数

推荐值

说明

放大模型

seedvr2_ema_3b

高质量放大模型

最短边尺寸

1080

放大到最短边1080像素

颜色校对

lab

推荐lab色彩空间

最后 SaveImage 节点保存结果到

ComfyUI/output/

目录。

节点连接表

图像反推连接

起点节点

终点节点

说明

LoadImage #2

RHHiddenNodes #16

图片输入反推节点

RHHiddenNodes #16

ShowText #8

显示反推结果

模型加载连接

起点节点

终点节点

说明

CheckpointLoader #9

WujiSampler #3

模型输出

CheckpointLoader #9

WujiSuperEditor #4

CLIP输出

尺寸控制连接

起点节点

终点节点

说明

Int #11

WujiSuperEditor #4

宽度720

Int #12

WujiSuperEditor #4

高度1024

图像生成连接

起点节点

终点节点

说明

WujiSuperEditor #4

WujiSampler #3

正负向条件+潜空间

WujiSampler #3

WujiCleaner #7

输出图像

WujiCleaner #7

WujiUpscaler #5

清理后放大

WujiUpscaler #5

SaveImage #6

保存最终结果

参数怎么调效果最好?

采样参数

场景

步数

CFG

去噪强度

快速测试

4-6

1

1

推荐设置

8-12

1-2

1

高质量输出

16-20

2-3

1

图像尺寸

比例

宽度

高度

适合场景

竖屏

720

1024

手机壁纸、头像

横屏

1024

720

桌面壁纸、横版内容

方图

1024

1024

社交媒体封面

提示词反推技巧

尽量选择构图清晰、主体明确的图片

二次元/动漫风格效果通常更好

反推结果可以手动修改增删

结合手动输入微调效果

常见问题

Q:反推出来的提示词不准怎么办?

A:这是正常现象,AI反推只能提取大概特征。可以把反推结果作为基础,手动调整关键词来精确控制。

Q:生成的图和原图差异大怎么办?

A:可以适当提高采样步数,或者把反推提示词直接复制到正向提示词输入框里,而不是依赖自动连接。

Q:放大速度太慢怎么办?

A:seedvr2_ema_3b 是比较慢的模型,如果追求速度可以换成 Real-ESRGAN 等轻量级放大模型。

Q:怎么复刻特定风格?

A:选择同风格的多张参考图,把反推提示词汇总整理,再加上风格关键词(如 "cyberpunk", "watercolor" 等)。

Q:提示词显示乱码怎么办?

A:这是正常编码显示问题,不影响实际使用。如果想看清晰内容,拖一个任意Text节点连接反推输出。

Q:武祭模型在哪下载?

A:可以在抱脸(HuggingFace)或Civitai搜索"WuJi",作者通常会提供下载链接。

适合哪些场景?

场景

操作方式

风格复刻

反推+手动微调提示词

风格迁移

反推原图提示词+新参考图

批量生成

反推一个风格,生成多张变体

提示词学习

通过反推结果学习优质图的提示词写法

总的来说,这是一个把"图生提示词"和"提示词生图"串起来的工作流。可以用来学习优秀作品的提示词写法,也可以作为风格探索的辅助工具。

试试看把喜欢的图扔进去,看看AI会给你什么样的提示词。

有任何问题欢迎留言。

需求 # 目的 作用 实质 形式
输入 类型 来源
实现 外部工具 动作 指令
输出 类型 去处
高亮推断 点击列名 ↔ 显示/隐藏 · 点击组名 ↔ 整组切换 · 「推」角标 hover 看推断理由
工序 图像反推+高清图生成工作流 #目的: 上传参考图,用Flux2-Klein反推其提示词,再驱动武祭模型生成同风格高清图 类别: 产物创造 #平台: 微信公众号 · #作者: gzh · case: A_gzh_11ddd2df
输入
内容类型/素材/化学变化/参考图 待反推图片 — 用户提供的、待分析风格的参考图片
返回
内容类型/成品/成品图
需求 输入 实现 输出
# 目的 作用 实质 形式 类型 来源 外部工具 动作 指令 类型 去处
s1
RHHiddenNodes 反推 参考图,得到图像特征的 提示词
预处理图片内容类型/素材/化学变化/参考图<待分析风格的参考图>← 工序输入RHHiddenNodes提取/化学提取/反推用 Vision Transformer 分析图像的构图、风格、主体、氛围等特征,输出文字提示词描述(pwd 留空)程序控制类型/指令/提示词s1o1 <占位>(原文未提供具体反推结果示例提示词,由模型据输入图动态生成)→ s3
s2
CheckpointLoaderSimple 调取 模型权重 文件,得到 模型权重CLIP权重VAE权重
预准备程序控制类型/参数/模型权重WuJi_Z-image-base多风格2603_.safetensorsCheckpointLoaderSimple获取/查询/调取加载 WuJi_Z-image-base多风格2603_.safetensors,输出 MODEL / CLIP / VAE 三个分支程序控制类型/参数/模型权重s2o1 <占位>(原文未提供,为 WuJi_Z-image-base多风格2603 的二进制 MODEL 扩散权重文件)→ s4
CLIP权重s2o2 <占位>(原文未提供,为 WuJi_Z-image-base多风格2603 的二进制 CLIP 文本编码器权重文件)→ s3
VAE权重s2o3 <占位>(原文未提供,为 WuJi_Z-image-base多风格2603 的二进制 VAE 权重文件)→ s4
s3
WujiSuperEditor提示词参考图 结构生成 正向条件向量负向条件向量潜空间图像
预处理程序控制类型/指令/提示词<占位>(原文未提供具体反推结果示例提示词,由模型据输入图动态生成)← s1o1WujiSuperEditor生成/关系生成/结构生成整合反推提示词与参考图 CLIP 条件,宽度接 Int #11 =720、高度接 Int #12 =1024;vae 留空;配合风格预设生成正/负向条件向量与潜空间图像正向条件向量s3o1 <占位>(原文未提供,为 CLIP 编码输出的正向条件向量张量)→ s4
CLIP权重<占位>(原文未提供,为 WuJi_Z-image-base多风格2603 的二进制 CLIP 文本编码器权重文件)← s2o2负向条件向量s3o2 <占位>(原文未提供,为 CLIP 编码输出的负向条件向量张量)→ s4
内容类型/素材/化学变化/参考图<待分析风格的参考图>← 工序输入潜空间图像s3o3 <占位>(原文未提供,为 VAE 编码输出的潜空间图像张量)→ s4
程序控制类型/参数/规格参数图像尺寸 比例 宽度 高度 适合场景 竖屏 720 1024 手机壁纸、头像 横屏 1024 720 桌面壁纸、横版内容 方图 1024 1024 社交媒体封面
风格参数<占位>(原文未提供具体风格预设参数值,由用户在 WujiSuperEditor 节点界面选择艺术流派/摄影风格等)
s4
WujiSampler生成参数 元素生成 底图
主体生成图片程序控制类型/参数/模型权重<占位>(原文未提供,为 WuJi_Z-image-base多风格2603 的二进制 MODEL 扩散权重文件)← s2o1WujiSampler生成/元素生成步数=8,CFG=1,采样器=euler,调度器=simple,去噪强度=1内容类型/半成品/原子/底图s4o1 <WujiSampler 扩散采样输出的中间图像(含瑕疵,待清理)>→ s5
VAE权重<占位>(原文未提供,为 WuJi_Z-image-base多风格2603 的二进制 VAE 权重文件)← s2o3
正向条件向量<占位>(原文未提供,为 CLIP 编码输出的正向条件向量张量)← s3o1
负向条件向量<占位>(原文未提供,为 CLIP 编码输出的负向条件向量张量)← s3o2
潜空间图像<占位>(原文未提供,为 VAE 编码输出的潜空间图像张量)← s3o3
程序控制类型/参数/生成参数WujiSampler 采样器参数: 参数 推荐值 说明 步数 8 采样步数,越高质量越慢 CFG 1 引导强度,1表示轻度引导 采样器 euler 推荐euler或euler_ancestral 调度器 simple 调度算法 去噪强度
s5
WujiCleaner 增强 底图,极限清理瑕疵得到更干净的 底图
后期图片内容类型/半成品/原子/底图<WujiSampler 扩散采样输出的中间图像(含瑕疵,待清理)>← s4o1WujiCleaner修改/变/增强极限清理模式,去除生成中的瑕疵内容类型/半成品/原子/底图s5o1 <WujiCleaner 极限清理后去除瑕疵的图像>→ s6
s6
WujiUpscaler 增强 底图,超分放大到最短边 1080px 得到 成品图
后期图片内容类型/半成品/原子/底图<WujiCleaner 极限清理后去除瑕疵的图像>← s5o1WujiUpscaler修改/变/增强放大模型=seedvr2_ema_3b,最短边=1080px,颜色校对=lab 色彩空间内容类型/成品/成品图s6o1 <seedvr2_ema_3b 放大后的高清图像,最短边 1080px>→ s7
放大参数WujiUpscaler 放大器参数: 参数 推荐值 说明 放大模型 seedvr2_ema_3b 高质量放大模型 最短边尺寸 1080 放大到最短边1080像素 颜色校对 lab 推荐lab色彩空间
s7
SaveImage 存档 成品图,保存至 ComfyUI/output/ 目录
交付内容类型/成品/成品图<seedvr2_ema_3b 放大后的高清图像,最短边 1080px>← s6o1SaveImage存储/归档/存档保存到 ComfyUI/output/ 目录内容类型/成品/成品图s7o1 <保存到 ComfyUI/output/ 目录的最终高清图片文件>→ 返回 高清生成图