摘要: ComfyUI工作流教程:用Flux2-Klein模型反推图像提示词,再用武祭(WuJi)系列模型生成并高清放大,一键完成风格复刻。
扔给AI一张图,它就把提示词吐出来了!这个工具太牛了
你有没有遇到过这种情况:看到一张超好看的图,想复刻类似的风格,但不知道用什么提示词。
现在有个办法可以解决这个问题——直接让AI帮你"反推"出提示词。
扔一张图进去,Flux2-Klein模型就能分析出这张图的特点,输出详细的提示词描述。然后用这些提示词配合图像生成模型,就能复刻类似风格,甚至做更多变化。
今天分享这个ComfyUI工作流,把图像反推和图像生成串起来,一键完成。
开始前的准备
需要安装的插件
这个工作流依赖武祭(WuJi)系列插件,提供图像生成、反推、放大等功能:
插件名称
说明
安装方式
ComfyUI-WUJI
武祭核心包,包含采样器、编辑器、清理器等
Manager搜索"WUJI"
ComfyUI-Rh-hidden-nodes
Flux2-Klein图像反推节点
Manager搜索"RH"
另外还需要基础插件 ComfyUI 的 LoadImage、CheckpointLoader、SaveImage 等标准节点。
需要下载的模型
模型名称
说明
放置路径
WuJi_Z-image-base多风格2603
武祭图像基础模型
ComfyUI/models/checkpoints/
模型可以从Civitai或抱脸下载。
放大模型(可选)
如果需要高清放大,工作流使用了 seedvr2_ema_3b 模型,放置在:
ComfyUI/models/upscale_models/
工作流怎么搭?
整个工作流有16个节点,分为4个部分:
第一步:图像反推(Flux2-Klein)
核心是 RHHiddenNodes 节点,它调用Flux2-Klein模型来分析图像。
输入端:
pwd:留空
ref_image_1:接入LoadImage节点的图片输出
输出端:
p0:输出反推的提示词字符串
ShowText 节点用来预览反推出的提示词内容,方便查看结果。
这一步的原理是:用Vision Transformer分析图像,提取出构图、风格、主体、氛围等特征,转换成文本描述。
第二步:加载生成模型
CheckpointLoaderSimple 节点加载武祭的基础模型:
ckpt_name:WuJi_Z-image-base多风格2603_.safetensors
模型输出三个分支:
MODEL:接入WujiSampler的模型输入
CLIP:接入WujiSuperEditor的clip输入
VAE:接入WujiSampler的VAE输入
第三步:超级编辑器整合
WujiSuperEditor 是整合提示词的核心节点:
参数
说明
clip
接入CLIP
vae
留空(自动使用checkpoint的VAE)
图像1-4
可接入多张参考图
提示词
可手动输入或接入反推结果
负向提示词
不想出现的内容
宽度/高度
输出尺寸,接入Int节点控制
艺术流派/摄影风格等
风格预设参数
输出的正向条件、负向条件、潜空间图像分别接入WujiSampler。
第四步:采样、清理、放大
WujiSampler 采样器参数:
参数
推荐值
说明
步数
8
采样步数,越高质量越慢
CFG
1
引导强度,1表示轻度引导
采样器
euler
推荐euler或euler_ancestral
调度器
simple
调度算法
去噪强度
1
完全去噪生成
WujiCleaner 清理器设置为"极限清理",去除生成中的瑕疵。
WujiUpscaler 放大器参数:
参数
推荐值
说明
放大模型
seedvr2_ema_3b
高质量放大模型
最短边尺寸
1080
放大到最短边1080像素
颜色校对
lab
推荐lab色彩空间
最后 SaveImage 节点保存结果到
ComfyUI/output/
目录。
节点连接表
图像反推连接
起点节点
终点节点
说明
LoadImage #2
RHHiddenNodes #16
图片输入反推节点
RHHiddenNodes #16
ShowText #8
显示反推结果
模型加载连接
起点节点
终点节点
说明
CheckpointLoader #9
WujiSampler #3
模型输出
CheckpointLoader #9
WujiSuperEditor #4
CLIP输出
尺寸控制连接
起点节点
终点节点
说明
Int #11
WujiSuperEditor #4
宽度720
Int #12
WujiSuperEditor #4
高度1024
图像生成连接
起点节点
终点节点
说明
WujiSuperEditor #4
WujiSampler #3
正负向条件+潜空间
WujiSampler #3
WujiCleaner #7
输出图像
WujiCleaner #7
WujiUpscaler #5
清理后放大
WujiUpscaler #5
SaveImage #6
保存最终结果
参数怎么调效果最好?
采样参数
场景
步数
CFG
去噪强度
快速测试
4-6
1
1
推荐设置
8-12
1-2
1
高质量输出
16-20
2-3
1
图像尺寸
比例
宽度
高度
适合场景
竖屏
720
1024
手机壁纸、头像
横屏
1024
720
桌面壁纸、横版内容
方图
1024
1024
社交媒体封面
提示词反推技巧
尽量选择构图清晰、主体明确的图片
二次元/动漫风格效果通常更好
反推结果可以手动修改增删
结合手动输入微调效果
常见问题
Q:反推出来的提示词不准怎么办?
A:这是正常现象,AI反推只能提取大概特征。可以把反推结果作为基础,手动调整关键词来精确控制。
Q:生成的图和原图差异大怎么办?
A:可以适当提高采样步数,或者把反推提示词直接复制到正向提示词输入框里,而不是依赖自动连接。
Q:放大速度太慢怎么办?
A:seedvr2_ema_3b 是比较慢的模型,如果追求速度可以换成 Real-ESRGAN 等轻量级放大模型。
Q:怎么复刻特定风格?
A:选择同风格的多张参考图,把反推提示词汇总整理,再加上风格关键词(如 "cyberpunk", "watercolor" 等)。
Q:提示词显示乱码怎么办?
A:这是正常编码显示问题,不影响实际使用。如果想看清晰内容,拖一个任意Text节点连接反推输出。
Q:武祭模型在哪下载?
A:可以在抱脸(HuggingFace)或Civitai搜索"WuJi",作者通常会提供下载链接。
适合哪些场景?
场景
操作方式
风格复刻
反推+手动微调提示词
风格迁移
反推原图提示词+新参考图
批量生成
反推一个风格,生成多张变体
提示词学习
通过反推结果学习优质图的提示词写法
总的来说,这是一个把"图生提示词"和"提示词生图"串起来的工作流。可以用来学习优秀作品的提示词写法,也可以作为风格探索的辅助工具。
试试看把喜欢的图扔进去,看看AI会给你什么样的提示词。
有任何问题欢迎留言。
| 需求 | 输入 | 实现 | 输出 | ||||||||||
|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
| # | 目的 | 作用 | 实质 | 形式 | 类型 | 值 | 来源 | 外部工具 | 动作 | 指令 | 类型 | 值 | 去处 |
| s1 | 用 RHHiddenNodes 反推 参考图,得到图像特征的 提示词 | 预处理 | 图片 | 内容类型/素材/化学变化/参考图 | <待分析风格的参考图> | ← 工序输入 | RHHiddenNodes | 提取/化学提取/反推 | 用 Vision Transformer 分析图像的构图、风格、主体、氛围等特征,输出文字提示词描述(pwd 留空) | 程序控制类型/指令/提示词 | s1o1 <占位>(原文未提供具体反推结果示例提示词,由模型据输入图动态生成) | → s3 | |
| s2 | 用 CheckpointLoaderSimple 调取 模型权重 文件,得到 模型权重、CLIP权重 和 VAE权重 | 预准备 | 程序控制类型/参数/模型权重 | WuJi_Z-image-base多风格2603_.safetensors | CheckpointLoaderSimple | 获取/查询/调取 | 加载 WuJi_Z-image-base多风格2603_.safetensors,输出 MODEL / CLIP / VAE 三个分支 | 程序控制类型/参数/模型权重 | s2o1 <占位>(原文未提供,为 WuJi_Z-image-base多风格2603 的二进制 MODEL 扩散权重文件) | → s4 | |||
| CLIP权重 | s2o2 <占位>(原文未提供,为 WuJi_Z-image-base多风格2603 的二进制 CLIP 文本编码器权重文件) | → s3 | |||||||||||
| VAE权重 | s2o3 <占位>(原文未提供,为 WuJi_Z-image-base多风格2603 的二进制 VAE 权重文件) | → s4 | |||||||||||
| s3 | 用 WujiSuperEditor 以 提示词 和 参考图 结构生成 正向条件向量、负向条件向量 和 潜空间图像 | 预处理 | 程序控制类型/指令/提示词 | <占位>(原文未提供具体反推结果示例提示词,由模型据输入图动态生成) | ← s1o1 | WujiSuperEditor | 生成/关系生成/结构生成 | 整合反推提示词与参考图 CLIP 条件,宽度接 Int #11 =720、高度接 Int #12 =1024;vae 留空;配合风格预设生成正/负向条件向量与潜空间图像 | 正向条件向量 | s3o1 <占位>(原文未提供,为 CLIP 编码输出的正向条件向量张量) | → s4 | ||
| CLIP权重 | <占位>(原文未提供,为 WuJi_Z-image-base多风格2603 的二进制 CLIP 文本编码器权重文件) | ← s2o2 | 负向条件向量 | s3o2 <占位>(原文未提供,为 CLIP 编码输出的负向条件向量张量) | → s4 | ||||||||
| 内容类型/素材/化学变化/参考图 | <待分析风格的参考图> | ← 工序输入 | 潜空间图像 | s3o3 <占位>(原文未提供,为 VAE 编码输出的潜空间图像张量) | → s4 | ||||||||
| 程序控制类型/参数/规格参数 | 图像尺寸 比例 宽度 高度 适合场景 竖屏 720 1024 手机壁纸、头像 横屏 1024 720 桌面壁纸、横版内容 方图 1024 1024 社交媒体封面 | ||||||||||||
| 风格参数 | <占位>(原文未提供具体风格预设参数值,由用户在 WujiSuperEditor 节点界面选择艺术流派/摄影风格等) | ||||||||||||
| s4 | 用 WujiSampler 以 生成参数 元素生成 底图 | 主体生成 | 图片 | 程序控制类型/参数/模型权重 | <占位>(原文未提供,为 WuJi_Z-image-base多风格2603 的二进制 MODEL 扩散权重文件) | ← s2o1 | WujiSampler | 生成/元素生成 | 步数=8,CFG=1,采样器=euler,调度器=simple,去噪强度=1 | 内容类型/半成品/原子/底图 | s4o1 <WujiSampler 扩散采样输出的中间图像(含瑕疵,待清理)> | → s5 | |
| VAE权重 | <占位>(原文未提供,为 WuJi_Z-image-base多风格2603 的二进制 VAE 权重文件) | ← s2o3 | |||||||||||
| 正向条件向量 | <占位>(原文未提供,为 CLIP 编码输出的正向条件向量张量) | ← s3o1 | |||||||||||
| 负向条件向量 | <占位>(原文未提供,为 CLIP 编码输出的负向条件向量张量) | ← s3o2 | |||||||||||
| 潜空间图像 | <占位>(原文未提供,为 VAE 编码输出的潜空间图像张量) | ← s3o3 | |||||||||||
| 程序控制类型/参数/生成参数 | WujiSampler 采样器参数: 参数 推荐值 说明 步数 8 采样步数,越高质量越慢 CFG 1 引导强度,1表示轻度引导 采样器 euler 推荐euler或euler_ancestral 调度器 simple 调度算法 去噪强度 | ||||||||||||
| s5 | 用 WujiCleaner 增强 底图,极限清理瑕疵得到更干净的 底图 | 后期 | 图片 | 内容类型/半成品/原子/底图 | <WujiSampler 扩散采样输出的中间图像(含瑕疵,待清理)> | ← s4o1 | WujiCleaner | 修改/变/增强 | 极限清理模式,去除生成中的瑕疵 | 内容类型/半成品/原子/底图 | s5o1 <WujiCleaner 极限清理后去除瑕疵的图像> | → s6 | |
| s6 | 用 WujiUpscaler 增强 底图,超分放大到最短边 1080px 得到 成品图 | 后期 | 图片 | 内容类型/半成品/原子/底图 | <WujiCleaner 极限清理后去除瑕疵的图像> | ← s5o1 | WujiUpscaler | 修改/变/增强 | 放大模型=seedvr2_ema_3b,最短边=1080px,颜色校对=lab 色彩空间 | 内容类型/成品/成品图 | s6o1 <seedvr2_ema_3b 放大后的高清图像,最短边 1080px> | → s7 | |
| 放大参数 | WujiUpscaler 放大器参数: 参数 推荐值 说明 放大模型 seedvr2_ema_3b 高质量放大模型 最短边尺寸 1080 放大到最短边1080像素 颜色校对 lab 推荐lab色彩空间 | ||||||||||||
| s7 | 用 SaveImage 存档 成品图,保存至 ComfyUI/output/ 目录 | 交付 | 内容类型/成品/成品图 | <seedvr2_ema_3b 放大后的高清图像,最短边 1080px> | ← s6o1 | SaveImage | 存储/归档/存档 | 保存到 ComfyUI/output/ 目录 | 内容类型/成品/成品图 | s7o1 <保存到 ComfyUI/output/ 目录的最终高清图片文件> | → 返回 高清生成图 | ||