摘要: 用结构化提示词驱动豆包将参考图视觉风格数据化为7维度JSON,再组合新主体描述驱动图像生成,实现换主体保风格的高效二创。
找参考图,是很多人做设计、做内容的第一步。
看到一张喜欢的图,想借鉴它的风格,怎么办?大多数人的做法是——截图发给AI,问"这张图好在哪里"。
结果呢?AI给你说一堆废话,根本用不上。
其实有个更聪明的做法。
一句提示词,就能把任何图片的视觉风格完整提取出来
,还能直接拿去二创,做成可复用的文生图模板。
今天就把这个方法完整拆给你看。
01
先搞清楚一个认知
PART
很多人觉得"图片风格"是一种感觉,说不清道不明。
但其实不是。
风格是可以被数据化的。颜色、构图、色调、特效、氛围……每一个维度都有具体的描述,组合在一起,就是这张图独一无二的"DNA"。
我们要做的,就是把这个DNA提取出来,然后换掉主体元素,生成属于自己的图。
02
第一步:选对AI工具
PART
要完成这件事,需要一个具备
高级视觉识别能力
的AI模型。
Midjourney、Gemini 3.0、即梦、豆包,都可以。
我用的是豆包,国内访问稳定,效果也够用。
网址:https://www.doubao.com
03
第二步:用这句提示词提取风格
PART
比如我想复刻下面这张图的风格——
把图片上传给豆包,同时发送这句提示词:
请以结构化的形式帮我提取图片的视觉风格,包含"颜色"、"排版"、"构图"、"特效"、"色调"、"表现手法"、"氛围"等,以Json格式输出
这里有三个关键点,值得说清楚。
结构化形式
:让AI按维度拆解,而不是给你一段模糊的描述。后续修改和二创时,你能精准定位要改哪里。
视觉风格 vs 元素
:风格是"油画感"、"赛博朋克"、"古典写实",元素是"猫"、"人物"、"背景"。提取风格,才能在换掉元素的同时保留整体气质。
Json格式
:AI对Json最熟悉,执行时产生幻觉的概率最低,输出也最稳定。
豆包给出的结果是这样的:
{
"颜色": "主色调为黑金搭配,辅以宝石红、绿、蓝点缀,肤色柔和细腻,服饰布料带有珠光幻彩",
"排版": "主体元素(人物 + 装饰黑猫)集中占据画面核心区域,元素布局紧凑且主次分明",
"构图": "近景特写构图,以人物侧脸为视觉中心,黑猫位于侧后方形成呼应,增强互动感",
"特效": "背景添加细碎星光光斑,服饰布料呈现珠光闪烁效果,光影过渡细腻带有质感强化",
"色调": "整体为浓郁暖色调,黑金配色凸显奢华质感,色彩饱和度高且层次丰富",
"表现手法": "采用写实风格的AI数字渲染,融合古埃及装饰元素(如猫神风格配饰)进行创作",
"氛围": "营造出神秘奢华的异域氛围,同时带有静谧优雅的质感"
}
你看,原本说不清楚的"感觉",现在变成了可以直接操作的数据。
这就是AI真正有价值的地方——把抽象的东西具体化。
04
第三步:拿去二创
PART
打开豆包的"图像生成"功能。
描述你想要的新内容,比如"美女把手放在阿努比斯头上",然后把刚才提取的Json风格数据一起发过去。
最终成品:
整体风格高度还原,但主体内容完全是新的。
这和直接用参考图生图的区别在于——
更灵活
。场景可以随意替换,风格却稳定保留。做素材、做模板、做系列内容,都能用上。
05
这个方法能用在哪
PART
做自媒体封面、电商主图、品牌视觉,都可以。
找到一张风格对的参考图,提取DNA,换掉主体,批量出图。
效率比手动调参高得多,也比反复跟AI描述"我想要那种感觉"靠谱得多。
顺便说一下,文章开头提到的钩子——
成品Coze工作流和AI工具包
,我都整理好了。
如果你对AI变现、公众号运营、自媒体副业感兴趣,也想在互联网找到一个稳定的收入来源,关注公众号即可领取:
❶
2026年450+互联网搞钱玩法合集
:覆盖主流赛道,告别信息差,直接上手。
❷
100+互联网创作免费工具
:多个领域,多个场景,助你提效。
❸
200+Coze工作流合集
:模板可一键复制,直接用,不用从零搭。
❹
多个AI实战案例
:冷门爆款赛道拆解,看完就能跑。
方法就这些,不复杂。
任何项目都需要一个过程,不是上来就能赚大钱的。但只要方向对、持续做,结果不会差。希望这篇分享,能帮你在AI这条路上少走弯路。
| 需求 | 输入 | 实现 | 输出 | |||||||||||||||||||||
|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
| # | 目的 | 作用 | 实质 | 形式 | 类型 | 变量名 | 值 | 来源 | 外部工具 | 动作 | 指令 | 配置 | 运行 | 备注 | 逻辑控制 | 特性 | 实质 | 形式 | 类型 | 变量名 | 值 | 去处 | ||
| s1 | 用 豆包 反推 参考图 风格,得到 视觉风格JSON | 预处理 | /表象/视觉/实体/人物/人物特征/形象呈现 /表象/视觉/实体/物品/影像物品/艺术创作 | /呈现/视觉/视觉制作/构图编排/空间布局/景别角度 /呈现/视觉/视觉制作/后期处理/图像合成处理/AI生成合成 | 内容类型/素材/化学变化/参考图 | 参考图 | <AI生成的古埃及风格女性近景特写:黑发女性,黑金装饰,黑猫位于侧后方,珠光幻彩服饰,神秘奢华异域氛围> | ← 工序输入 | 豆包 | 提取/化学提取/反推 | 请以结构化的形式帮我提取图片的视觉风格,包含"颜色"、"排版"、"构图"、"特效"、"色调"、"表现手法"、"氛围"等,以Json格式输出 | Json格式输出降低幻觉率;提取的是风格DNA而非具体元素,后续可精准定位要修改的维度;提取结果可作为可复用的风格模板 | - | 随机 | /表象/视觉/画面/后期/美学风格 /表象/视觉/画面/色彩/色彩风格 | /架构/逻辑/信息编排逻辑/条目列举/分段结构/规范框架 | 视觉风格JSON | 风格JSON | {"颜色":"主色调为黑金搭配,辅以宝石红、绿、蓝点缀,肤色柔和细腻,服饰布料带有珠光幻彩","排版":"主体元素(人物 + 装饰黑猫)集中占据画面核心区域,元素布局紧凑且主次分明","构图":"近景特写构图,以人物侧脸为视觉中心,黑猫位于侧后方形成呼应,增强互动感","特效":"背景添加细碎星光光斑,服饰布料呈现珠光闪烁效果,光影过渡细腻带有质感强化","色调":"整体为浓郁暖色调,黑金配色凸显奢华质感,色彩饱和度高且层次丰富","表现手法":"采用写实风格的AI数字渲染,融合古埃及装饰元素(如猫神风格配饰)进行创作","氛围":"营造出神秘奢华的异域氛围,同时带有静谧优雅的质感"} | → s2 | ||||
| s2 | 用 豆包 元素生成,把 提示词 与 视觉风格JSON 生成 成品图 | 主体生成 | /表象/视觉/符号/文字符号/标注/提示引导 | /架构/修辞/修辞意象/句式辞格/韵律句式/特殊句式 | 程序控制类型/指令/提示词 | 新内容描述 | 美女把手放在阿努比斯头上 | ← 工序输入 | 豆包 | 生成/元素生成 | 帮我生成图片:"美女把手放在阿努比斯头上",视觉风格如下:{"颜色":"主色调为黑金搭配,辅以宝石红、绿、蓝点缀,肤色柔和细腻,服饰布料带有珠光幻彩","排版":"主体元素(人物 + 装饰黑猫)集中占据画面核心区域,元素布局紧凑且主次分明","构图":"近景特写构图,以人物侧脸为视觉中心,黑猫位于侧后方形成呼应,增强互动感","特效":"背景添加细碎星光光斑,服饰布料呈现珠光闪烁效果,光影过渡细腻带有质感强化","色调":"整体为浓郁暖色调,黑金配色凸显奢华质感,色彩饱和度高且层次丰富","表现手法":"采用写实风格的AI数字渲染,融合古埃及装饰元素(如猫神风格配饰)进行创作","氛围":"营造出神秘奢华的异域氛围,同时带有静谧优雅的质感"} | 模型=Seedream 4.5 | - | 随机 | /表象/视觉/实体/人物/人物特征/形象呈现 /表象/视觉/实体/物品/影像物品/艺术创作 | /呈现/视觉/视觉制作/构图编排/空间布局/景别角度 /呈现/视觉/视觉制作/后期处理/图像合成处理/AI生成合成 /呈现/视觉/视觉风格/视觉艺术风格/数字风格/AI风格 | 内容类型/成品/成品图 | 二创图 | <古埃及风格女性近景特写:女性将头靠在Anubis(阿努比斯)雕像头上,黑金色调,风格与参考图高度一致,神秘奢华异域氛围> | → 返回 成品图 | ||||
| /表象/视觉/画面/后期/美学风格 /表象/视觉/画面/色彩/色彩风格 | /架构/逻辑/信息编排逻辑/条目列举/分段结构/规范框架 | 视觉风格JSON | 风格JSON | {"颜色":"主色调为黑金搭配,辅以宝石红、绿、蓝点缀,肤色柔和细腻,服饰布料带有珠光幻彩","排版":"主体元素(人物 + 装饰黑猫)集中占据画面核心区域,元素布局紧凑且主次分明","构图":"近景特写构图,以人物侧脸为视觉中心,黑猫位于侧后方形成呼应,增强互动感","特效":"背景添加细碎星光光斑,服饰布料呈现珠光闪烁效果,光影过渡细腻带有质感强化","色调":"整体为浓郁暖色调,黑金配色凸显奢华质感,色彩饱和度高且层次丰富","表现手法":"采用写实风格的AI数字渲染,融合古埃及装饰元素(如猫神风格配饰)进行创作","氛围":"营造出神秘奢华的异域氛围,同时带有静谧优雅的质感"} | ← s1.风格JSON | |||||||||||||||||||
| ↩ | 返回 成品图 | |||||||||||||||||||||||