原文: 一句提示词,让AI秒读懂任何图片风格!比PS还好用
wechat-gzh · 繁星AI智能体 · 2026-05-15

摘要: 用结构化提示词驱动豆包将参考图视觉风格数据化为7维度JSON,再组合新主体描述驱动图像生成,实现换主体保风格的高效二创。


找参考图,是很多人做设计、做内容的第一步。

看到一张喜欢的图,想借鉴它的风格,怎么办?大多数人的做法是——截图发给AI,问"这张图好在哪里"。

结果呢?AI给你说一堆废话,根本用不上。

其实有个更聪明的做法。

一句提示词,就能把任何图片的视觉风格完整提取出来

,还能直接拿去二创,做成可复用的文生图模板。

今天就把这个方法完整拆给你看。

01

先搞清楚一个认知

PART

很多人觉得"图片风格"是一种感觉,说不清道不明。

但其实不是。

风格是可以被数据化的。颜色、构图、色调、特效、氛围……每一个维度都有具体的描述,组合在一起,就是这张图独一无二的"DNA"。

我们要做的,就是把这个DNA提取出来,然后换掉主体元素,生成属于自己的图。

02

第一步:选对AI工具

PART

要完成这件事,需要一个具备

高级视觉识别能力

的AI模型。

Midjourney、Gemini 3.0、即梦、豆包,都可以。

我用的是豆包,国内访问稳定,效果也够用。

网址:https://www.doubao.com

03

第二步:用这句提示词提取风格

PART

比如我想复刻下面这张图的风格——

把图片上传给豆包,同时发送这句提示词:

请以结构化的形式帮我提取图片的视觉风格,包含"颜色"、"排版"、"构图"、"特效"、"色调"、"表现手法"、"氛围"等,以Json格式输出

这里有三个关键点,值得说清楚。

结构化形式

:让AI按维度拆解,而不是给你一段模糊的描述。后续修改和二创时,你能精准定位要改哪里。

视觉风格 vs 元素

:风格是"油画感"、"赛博朋克"、"古典写实",元素是"猫"、"人物"、"背景"。提取风格,才能在换掉元素的同时保留整体气质。

Json格式

:AI对Json最熟悉,执行时产生幻觉的概率最低,输出也最稳定。

豆包给出的结果是这样的:

{

"颜色": "主色调为黑金搭配,辅以宝石红、绿、蓝点缀,肤色柔和细腻,服饰布料带有珠光幻彩",

"排版": "主体元素(人物 + 装饰黑猫)集中占据画面核心区域,元素布局紧凑且主次分明",

"构图": "近景特写构图,以人物侧脸为视觉中心,黑猫位于侧后方形成呼应,增强互动感",

"特效": "背景添加细碎星光光斑,服饰布料呈现珠光闪烁效果,光影过渡细腻带有质感强化",

"色调": "整体为浓郁暖色调,黑金配色凸显奢华质感,色彩饱和度高且层次丰富",

"表现手法": "采用写实风格的AI数字渲染,融合古埃及装饰元素(如猫神风格配饰)进行创作",

"氛围": "营造出神秘奢华的异域氛围,同时带有静谧优雅的质感"

}

你看,原本说不清楚的"感觉",现在变成了可以直接操作的数据。

这就是AI真正有价值的地方——把抽象的东西具体化。

04

第三步:拿去二创

PART

打开豆包的"图像生成"功能。

描述你想要的新内容,比如"美女把手放在阿努比斯头上",然后把刚才提取的Json风格数据一起发过去。

最终成品:

整体风格高度还原,但主体内容完全是新的。

这和直接用参考图生图的区别在于——

更灵活

。场景可以随意替换,风格却稳定保留。做素材、做模板、做系列内容,都能用上。

05

这个方法能用在哪

PART

做自媒体封面、电商主图、品牌视觉,都可以。

找到一张风格对的参考图,提取DNA,换掉主体,批量出图。

效率比手动调参高得多,也比反复跟AI描述"我想要那种感觉"靠谱得多。

顺便说一下,文章开头提到的钩子——

成品Coze工作流和AI工具包

,我都整理好了。

如果你对AI变现、公众号运营、自媒体副业感兴趣,也想在互联网找到一个稳定的收入来源,关注公众号即可领取:

2026年450+互联网搞钱玩法合集

:覆盖主流赛道,告别信息差,直接上手。

100+互联网创作免费工具

:多个领域,多个场景,助你提效。

200+Coze工作流合集

:模板可一键复制,直接用,不用从零搭。

多个AI实战案例

:冷门爆款赛道拆解,看完就能跑。

方法就这些,不复杂。

任何项目都需要一个过程,不是上来就能赚大钱的。但只要方向对、持续做,结果不会差。希望这篇分享,能帮你在AI这条路上少走弯路。

需求 # 目的 作用
输入 实质 形式 类型 变量名 来源
实现 外部工具 动作 指令 配置 运行 备注 逻辑控制 特性
输出 实质 形式 类型 变量名 去处
高亮推断 点击列名 ↔ 显示/隐藏 · 点击组名 ↔ 整组切换 · 「推」角标 hover 看推断理由
工序 图片视觉风格提取与二创生图 #目的: 将参考图的视觉风格数据化为结构化JSON,再与新主体描述组合驱动AI图像生成,实现换主体保风格的高效二创 类别: 产物创造 #平台: wechat-gzh · #作者: 繁星AI智能体 · case: B_gzh_e9677a53
输入
内容类型/素材/化学变化/参考图 参考图 — 要复刻风格的目标图片
程序控制类型/指令/提示词 新内容描述 — 新主体内容描述,如"美女把手放在阿努比斯头上"
返回
内容类型/成品/成品图
需求 输入 实现 输出
# 目的 作用 实质 形式 类型 变量名 来源 外部工具 动作 指令 配置 运行 备注 逻辑控制 特性 实质 形式 类型 变量名 去处
s1
豆包 反推 参考图 风格,得到 视觉风格JSON
预处理/表象/视觉/实体/人物/人物特征/形象呈现 /表象/视觉/实体/物品/影像物品/艺术创作/呈现/视觉/视觉制作/构图编排/空间布局/景别角度 /呈现/视觉/视觉制作/后期处理/图像合成处理/AI生成合成内容类型/素材/化学变化/参考图参考图<AI生成的古埃及风格女性近景特写:黑发女性,黑金装饰,黑猫位于侧后方,珠光幻彩服饰,神秘奢华异域氛围>← 工序输入豆包提取/化学提取/反推
请以结构化的形式帮我提取图片的视觉风格,包含"颜色"、"排版"、"构图"、"特效"、"色调"、"表现手法"、"氛围"等,以Json格式输出
Json格式输出降低幻觉率;提取的是风格DNA而非具体元素,后续可精准定位要修改的维度;提取结果可作为可复用的风格模板
-随机/表象/视觉/画面/后期/美学风格 /表象/视觉/画面/色彩/色彩风格/架构/逻辑/信息编排逻辑/条目列举/分段结构/规范框架视觉风格JSON风格JSON{"颜色":"主色调为黑金搭配,辅以宝石红、绿、蓝点缀,肤色柔和细腻,服饰布料带有珠光幻彩","排版":"主体元素(人物 + 装饰黑猫)集中占据画面核心区域,元素布局紧凑且主次分明","构图":"近景特写构图,以人物侧脸为视觉中心,黑猫位于侧后方形成呼应,增强互动感","特效":"背景添加细碎星光光斑,服饰布料呈现珠光闪烁效果,光影过渡细腻带有质感强化","色调":"整体为浓郁暖色调,黑金配色凸显奢华质感,色彩饱和度高且层次丰富","表现手法":"采用写实风格的AI数字渲染,融合古埃及装饰元素(如猫神风格配饰)进行创作","氛围":"营造出神秘奢华的异域氛围,同时带有静谧优雅的质感"}→ s2
s2
豆包 元素生成,把 提示词视觉风格JSON 生成 成品图
主体生成/表象/视觉/符号/文字符号/标注/提示引导/架构/修辞/修辞意象/句式辞格/韵律句式/特殊句式程序控制类型/指令/提示词新内容描述美女把手放在阿努比斯头上← 工序输入豆包生成/元素生成
帮我生成图片:"美女把手放在阿努比斯头上",视觉风格如下:{"颜色":"主色调为黑金搭配,辅以宝石红、绿、蓝点缀,肤色柔和细腻,服饰布料带有珠光幻彩","排版":"主体元素(人物 + 装饰黑猫)集中占据画面核心区域,元素布局紧凑且主次分明","构图":"近景特写构图,以人物侧脸为视觉中心,黑猫位于侧后方形成呼应,增强互动感","特效":"背景添加细碎星光光斑,服饰布料呈现珠光闪烁效果,光影过渡细腻带有质感强化","色调":"整体为浓郁暖色调,黑金配色凸显奢华质感,色彩饱和度高且层次丰富","表现手法":"采用写实风格的AI数字渲染,融合古埃及装饰元素(如猫神风格配饰)进行创作","氛围":"营造出神秘奢华的异域氛围,同时带有静谧优雅的质感"}
模型=Seedream 4.5
-随机/表象/视觉/实体/人物/人物特征/形象呈现 /表象/视觉/实体/物品/影像物品/艺术创作/呈现/视觉/视觉制作/构图编排/空间布局/景别角度 /呈现/视觉/视觉制作/后期处理/图像合成处理/AI生成合成 /呈现/视觉/视觉风格/视觉艺术风格/数字风格/AI风格内容类型/成品/成品图二创图<古埃及风格女性近景特写:女性将头靠在Anubis(阿努比斯)雕像头上,黑金色调,风格与参考图高度一致,神秘奢华异域氛围>→ 返回 成品图
/表象/视觉/画面/后期/美学风格 /表象/视觉/画面/色彩/色彩风格/架构/逻辑/信息编排逻辑/条目列举/分段结构/规范框架视觉风格JSON风格JSON{"颜色":"主色调为黑金搭配,辅以宝石红、绿、蓝点缀,肤色柔和细腻,服饰布料带有珠光幻彩","排版":"主体元素(人物 + 装饰黑猫)集中占据画面核心区域,元素布局紧凑且主次分明","构图":"近景特写构图,以人物侧脸为视觉中心,黑猫位于侧后方形成呼应,增强互动感","特效":"背景添加细碎星光光斑,服饰布料呈现珠光闪烁效果,光影过渡细腻带有质感强化","色调":"整体为浓郁暖色调,黑金配色凸显奢华质感,色彩饱和度高且层次丰富","表现手法":"采用写实风格的AI数字渲染,融合古埃及装饰元素(如猫神风格配饰)进行创作","氛围":"营造出神秘奢华的异域氛围,同时带有静谧优雅的质感"}← s1.风格JSON
返回 成品图