摘要: 零代码思路:把图片/视频上传给多模态AI提取视觉结构,再转为可直接用于生图或视频生成的提示词,会复制粘贴即可稳定复刻风格。
很多人在面对写提示词时就挠头,不是不会描述,而是不知道一张图到底好在哪里,比如颜色、构图、光影、质感怎么描述,属实做到金口难开。
今天就教你换一个思路,别再对着图片猜猜猜,而是交给
AI,让它帮你把图片“拆开看”。
下面就跟着我一块进行实操吧,流程十分简单:就是把你喜欢的图片或视频上传给
AI,让它先提取视觉结构,然后你再把这些结构转成可以直接用于生图或视频生成的提示词。更重要的是,你不需要看懂每一个专业词,你只要会复制、会微调,就能稳定复刻类似风格。
一、反推图片提示词
打开任意支持图片理解的
AI 工具,例如豆包、Gemini、
lovart
或其他多模态模型。
1、上传参考图片
上传你想参考的图片,然后输入提示词。
我这里随便在某书上找了一张目前比较火的古风图片进行实操。
在对话框输入这段提示词:
可直接复制的提示词
请以
JSON 结构化数据的形式,提取这张图片的视觉风格。请重点分析:颜色、构图、排版、主体、材质质感、光影、特效、画面氛围和适合复刻的关键词。输出要清晰、简洁,控制在500 字以内。
2、看懂 AI 分析的重点
AI 通常会输出一段类似代码的内容,里面会包含颜色、构图、质感、光影、特效等字段。但重点是:你不需要真的会写代码,只要明白这些字段分别代表什么。
JSON
{
"视觉风格分析": {
"颜色": {
"主色调": "淡雅绿色、米白色",
"辅助色": "粉色(花朵)、深棕色(木窗框)",
"色彩特征": "低饱和度、高明度、清新淡雅、春日感",
"色彩关系": "绿粉撞色、冷暖平衡"
},
"构图": {
"类型": "对角线构图",
"视角": "平视偏俯视",
"主体位置": "画面中心偏左,倚靠窗台",
"空间层次": "前景花枝、中景人物、后景虚化庭院"
},
"排版": {
"画幅比例": "9:16 竖构图",
"留白": "上方和右侧留白较多,营造呼吸感",
"视觉引导": "花枝自然框架引导视线至人物面部"
},
"主体": {
"人物": "年轻女性,古风造型",
"姿态": "慵懒侧卧,托腮,赤足",
"服饰": "薄纱绿色古风长裙,露肩设计",
"发饰": "编发盘发,白色小花点缀",
"神态": "温柔恬静,眼神清澈"
},
"材质质感": {
"服装": "轻盈薄纱,半透明质感",
"皮肤": "白皙细腻,自然光泽",
"木质": "深色木窗框,哑光质感",
"花朵": "柔软娇嫩,真实感"
},
"光影": {
"光源": "自然光,来自窗外",
"光质": "柔和散射光",
"明暗": "人物受光均匀,背景虚化柔和",
"氛围": "明亮通透,春日午后感"
},
"特效": {
"景深": "浅景深,背景虚化明显",
"光斑": "自然散景光斑",
"柔焦": "整体轻微柔焦,梦幻感"
},
"画面氛围": {
"情绪": "宁静、慵懒、浪漫",
"风格": "古风写真、仙侠剧照感",
"季节": "春日、花期",
"时间": "午后时光"
},
"复刻关键词": [
"古风少女",
"绿色薄纱汉服",
"木窗台侧卧",
"托腮姿态",
"花枝前景框架",
"浅景深",
"自然光",
"清新淡雅色调",
"春日庭院",
"编发花饰",
"9:16竖构图",
"柔和散景",
"低饱和度",
"电影感人像"
]
}
}
3、把结果交给生图模型
接下来打开你常用的生图工具,比如即梦、豆包、
Midjourney、
lovart
或其他模型。把刚才 AI 分析出来的结构化内容复制进去,再在前面加上你真正想生成的主体。
通用生图提示词模板
请帮我生成一张真实感人物图片,纯图片,不要文字,比例
9:16。请参考以下视觉风格结构,保留其颜色、构图、质感、光影和整体氛围:[粘贴 AI 分析出的结构化风格内容]
如果原参考图里有文字、
Logo 或水印,记得加一句:不要文字、不要 Logo、不要水印。这样生成结果会更干净,也更适合做封面、壁纸或角色图。
很快,复刻好的图片就出来了。
二、反推视频提示词
图片反推解决的是
画面长什么样子,但是视频反推还要多一步,那就是把视频拆成分镜。因为视频不只是风格,还有动作、镜头变化、声音、节奏和时长等。
1、首先我们准备要复刻的视频。
2、打开网址
https://modelscope.cn/studios/Qwen/Qwen3-VL-Demo/
视频反推提示词模板
请把这段视频拆分成不同分镜,并对每个分镜进行细致分析。每个分镜请包含:画面风格、主体特征、服装
/物品、动作描述、镜头变化、构图、光影、人物台词或旁白、背景音乐/音效、画质参数和时长。最后请生成一段可用于生成相似视频的完整提示词,格式为:[视频内容描述],[风格],[主体动作],[运镜],[声音],[画质参数]。
然后把参考视频上传到支持视频理解的模型里,让AI 按分镜拆解。重点不是让它总结剧情,而是让它分析每一段画面如何构成。
拿到结果之后,把每个分镜的提示词复制到视频模型里,比如
用Seedance2.0,然后
再根据模型支持的时长进行调整。5 秒视频就保留一个核心动作,10 秒以上再考虑多个镜头变化。
反推提示词的关键,不是让
AI 帮你“抄图”,而是让 AI 帮你把优秀画面的结构拆出来。颜色、构图、质感、光影、镜头和声音这些元素一旦被拆清楚,就能变成稳定可复用的创作模板。
简单的说:图片反推,是把风格拆成提示词;视频反推,是把镜头拆成分镜提示词。掌握这套方法后,你做封面、壁纸、角色设定、短视频分镜都会更快,也更容易得到接近目标的效果。
以上就是今天分享的全部内容。如果觉得对你有帮助,欢迎
点赞、收藏、关注
,你的支持是我持续更新的最大动力。
更多AI探索及案例:
华姐正在组建一个AI变现公益社群,每天都会分享最新的AI工具技巧、实战案例与变现思路,全程无广告、纯干货。感兴趣的朋友可以扫码添加下方微信,下方扫码
备注“AI”
拉你入群。
| 需求 | 输入 | 实现 | 输出 | |||||||||||||||||||||
|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
| # | 目的 | 作用 | 实质 | 形式 | 类型 | 变量名 | 值 | 来源 | 外部工具 | 动作 | 指令 | 配置 | 运行 | 备注 | 逻辑控制 | 特性 | 实质 | 形式 | 类型 | 变量名 | 值 | 去处 | ||
| s1 | 用Lovart对参考图反推,输出视觉风格JSON | 预处理 | /表象/视觉/实体/人物/人物特征/形象呈现 | /呈现/视觉/视觉制作/实景拍摄 /呈现/视觉/视觉风格/视觉艺术风格/国风传统 | 内容类型/素材/化学变化/参考图 | 参考图片 | <古风女性人物照:年轻女性倚靠深棕木窗台,薄纱绿色古风长裙露肩,编发盘发白花点缀,手托腮慵懒侧卧赤足;前景粉色花枝作自然框架;背景虚化庭院古建筑;对角线构图9:16竖幅,浅景深自然散光,春日午后氛围> | ← 工序输入 | Lovart | 提取/化学提取/反推 | 请以 JSON 结构化数据的形式,提取这张图片的视觉风格。请重点分析:颜色、构图、排版、主体、材质质感、光影、特效、画面氛围和适合复刻的关键词。输出要清晰、简洁,控制在500字以内。 | 工具选任意支持图片理解的多模态AI均可(豆包/Gemini/Lovart等);原文以Lovart演示 | - | 随机 | /表象/视觉/画面/后期/美学风格 | /架构/逻辑/信息编排逻辑/条目列举/逐条罗列/通用列举 | 视觉风格JSON | 视觉风格JSON | Lovart提取的视觉风格JSON——颜色:主色调淡雅绿色米白色;辅助色粉色花朵深棕色木窗框;色彩特征低饱和度高明度清新淡雅春日感;色彩关系绿粉撞色冷暖平衡。构图:对角线构图;平视偏俯视;主体画面中心偏左倚靠窗台;空间层次前景花枝中景人物后景虚化庭院。排版:9:16竖构图;上方右侧留白多营造呼吸感;花枝框架引导视线至面部。主体:年轻女性古风造型;慵懒侧卧托腮赤足;薄纱绿色古风长裙露肩设计;编发盘发白色小花点缀;温柔恬静眼神清澈。材质质感:服装轻盈薄纱半透明;皮肤白皙细腻自然光泽;深色哑光木窗框;花朵柔软娇嫩真实感。光影:自然光来自窗外;柔和散射光;人物受光均匀背景虚化柔和;明亮通透春日午后感。特效:浅景深背景虚化明显;自然散景光斑;整体轻微柔焦梦幻感。画面氛围:宁静慵懒浪漫;古风写真仙侠剧照感;春日花期;午后时光。复刻关键词:古风少女、绿色薄纱汉服、木窗台侧卧、托腮姿态、花枝前景框架、浅景深、自然光、清新淡雅色调、春日庭院、编发花饰、9:16竖构图、柔和散景、低饱和度、电影感人像。 | → s2 | ||||
| s2 | 用(生图工具)元素生成视觉风格JSON,得到成品图 | 主体生成 | /表象/视觉/画面/后期/美学风格 | /架构/逻辑/信息编排逻辑/条目列举/逐条罗列/通用列举 | 视觉风格JSON | 视觉风格JSON | Lovart提取的视觉风格JSON——颜色:主色调淡雅绿色米白色;辅助色粉色花朵深棕色木窗框;色彩特征低饱和度高明度清新淡雅春日感;色彩关系绿粉撞色冷暖平衡。构图:对角线构图;平视偏俯视;主体画面中心偏左倚靠窗台;空间层次前景花枝中景人物后景虚化庭院。排版:9:16竖构图;上方右侧留白多营造呼吸感;花枝框架引导视线至面部。主体:年轻女性古风造型;慵懒侧卧托腮赤足;薄纱绿色古风长裙露肩设计;编发盘发白色小花点缀;温柔恬静眼神清澈。材质质感:服装轻盈薄纱半透明;皮肤白皙细腻自然光泽;深色哑光木窗框;花朵柔软娇嫩真实感。光影:自然光来自窗外;柔和散射光;人物受光均匀背景虚化柔和;明亮通透春日午后感。特效:浅景深背景虚化明显;自然散景光斑;整体轻微柔焦梦幻感。画面氛围:宁静慵懒浪漫;古风写真仙侠剧照感;春日花期;午后时光。复刻关键词:古风少女、绿色薄纱汉服、木窗台侧卧、托腮姿态、花枝前景框架、浅景深、自然光、清新淡雅色调、春日庭院、编发花饰、9:16竖构图、柔和散景、低饱和度、电影感人像。 | ← s1.视觉风格JSON | (生图工具) | 生成/元素生成 | 请帮我生成一张真实感人物图片,纯图片,不要文字,比例 9:16。请参考以下视觉风格结构,保留其颜色、构图、质感、光影和整体氛围:[粘贴 AI 分析出的结构化风格内容] | 比例=9:16 | 在提示词前面加上想生成的主体描述;若参考图含文字/Logo/水印,额外加不要文字不要Logo不要水印 | - | 随机 | /表象/视觉/实体/人物/人物特征/形象呈现 | /呈现/视觉/视觉制作/后期处理/图像合成处理/AI生成合成 /呈现/视觉/视觉风格/视觉艺术风格/国风传统 | 内容类型/成品/成品图 | 复刻图片 | <AI生成的古风女性人物图:与参考图相似风格,绿色薄纱汉服,木窗前花枝框景,9:16竖构图,浅景深春日氛围> | → 返回 生成图 | |||
| ↩ | 返回 生成图 | |||||||||||||||||||||||
| 需求 | 输入 | 实现 | 输出 | |||||||||||||||||||||
|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
| # | 目的 | 作用 | 实质 | 形式 | 类型 | 变量名 | 值 | 来源 | 外部工具 | 动作 | 指令 | 配置 | 运行 | 备注 | 逻辑控制 | 特性 | 实质 | 形式 | 类型 | 变量名 | 值 | 去处 | ||
| s1 | 用Qwen3-VL-Demo解构参考视频,产出分镜分析 | 预处理 | /表象/视觉/实体/物品/影像物品/影视作品 | /呈现/视觉/视觉制作/实景拍摄 /呈现/视觉/视觉风格/视觉艺术风格/国风传统 | 内容类型/素材/化学变化/参考视频 | 参考视频 | <宫廷风格古装短剧视频文件(jmeng-2026-03-1....mp4,约11MB):含4个分镜(茶盏倾酒0.2s/烛火飞雪0.5s/红衣贵妃特写1.0s/白衣哭泣1.5s),古典宫廷实景,多角度特写+慢动作+台词> | ← 工序输入 | Qwen3-VL-Demo | 提取/化学提取/解构 | 请把这段视频拆分成不同分镜,并对每个分镜进行细致分析。每个分镜请包含:画面风格、主体特征、服装/物品、动作描述、镜头变化、构图、光影、人物台词或旁白、背景音乐/音效、画质参数和时长。最后请生成一段可用于生成相似视频的完整提示词,格式为:[视频内容描述],[风格],[主体动作],[运镜],[声音],[画质参数]。 | URL: https://modelscope.cn/studios/Qwen/Qwen3-VL-Demo/ ;重点是逐帧分析画面构成(不是总结剧情) | - | 随机 | /表象/视觉/画面/后期/美学风格 /表象/视觉/画面/镜头 | /架构/逻辑/信息编排逻辑/条目列举/分段结构/板块并列 | 分镜分析 | 分镜分析 | 分镜1 茶盏倾酒(0.2s):画面风格=古典宫廷风柔焦特写;主体=着红色金线龙袍女性仅手部入镜,手指纤细指甲修整整齐;动作=女子右手持杯手腕微颤,茶水从杯口泼洒而出形成弧形水花;镜头=特写→慢镜头拉近聚焦飞溅水珠轨迹;构图=左侧主体占画面1/3右侧突出动态水花;光影=暖黄主光来自左上打亮手部与茶盏水珠反光晶莹;台词=无;音效=瓷器碰撞声+水流泼洒哗啦声;画质=4K 60fps(慢动作) ISO200 f/2.8 色温3200K。提示词=[古典宫廷室内着红袍女性慢动作茶水泼洒弧形水花手部特写],[古典宫廷风暖黄柔光],[手腕微颤茶水从杯口泼出弧形水花],[特写→慢镜拉近聚焦飞溅水珠],[瓷器碰撞声+水流哗啦声],[4K 60fps ISO200 f/2.8 色温3200K]。 分镜2 烛火摇曳与飞雪(0.5s):画面风格=梦幻朦胧景深极浅神秘氛围;主体=模糊的烛光与飘落白色颗粒(似雪或花瓣);动作=白色颗粒从上至下飘落,烛光随气流轻微晃动;镜头=固定镜头焦点在前景飘落物背景完全虚化;构图=对角线构图颗粒贯穿画面烛光点缀右区;光影=暖黄烛光为唯一光源颗粒反射高光整体偏暗;台词=无;音效=风声轻拂+微弱铃铛叮当声;画质=4K 24fps ISO800 f/1.4 色温2800K。提示词=[梦幻宫廷室内白色颗粒从上至下飘落烛光摇曳背景虚化],[梦幻朦胧景深极浅暖暗调],[白色颗粒飘落烛光轻微晃动],[固定镜头前景颗粒虚化背景],[风声轻拂+铃铛叮当声],[4K 24fps ISO800 f/1.4 色温2800K]。 分镜3 红衣贵妃特写(1.0s):画面风格=精致工笔画风面部妆容浓烈强调权力威严;主体=中年女性丹凤眼柳叶眉唇色朱红表情冷峻;服饰=红色金线龙凤袍头戴蓝金凤凰冠垂挂珍珠红宝石流苏;动作=微微侧首目光锐利扫视前方嘴角微扬似冷笑;镜头=近景推至特写聚焦眼部与冠饰;构图=中心构图人物占满画面背景深褐色帷幕;光影=正面柔光打亮面部冠饰金属高光闪烁;台词=「你,可知罪?」(低沉女声);音效=环境寂静仅留呼吸声与衣料摩擦声;画质=4K 30fps ISO400 f/2.2 色温3500K。提示词=[宫廷室内红衣贵妃面部特写神情冷峻微扬嘴角],[精致工笔画风权力威严浓烈妆容],[微微侧首目光锐利扫视嘴角微扬冷笑],[近景推至特写聚焦眼部与冠饰],[台词你可知罪低沉女声+环境寂静],[4K 30fps ISO400 f/2.2 色温3500K]。 分镜4 白衣女子跪地哭泣(1.5s):画面风格=悲情戏剧风面部特写强化情绪张力;主体=年轻女性黑发湿濡遮脸泪痕斑驳眼神绝望;服饰=素白交领襦裙发间插白玉簪与小花饰;动作=低头垂泪泪水沿脸颊滑落肩部颤抖;镜头=特写→轻微晃动模拟呼吸节奏后拉至中景;构图=斜侧角度突出泪滴与湿润发丝背景烛光散景;光影=逆光勾勒轮廓面部阴影加深悲伤感烛光在泪珠上形成高光;台词=「求娘娘开恩...」(哽咽女声);音效=压抑抽泣声+远处钟声回响;画质=4K 24fps ISO600 f/2.0 色温3000K。提示词=[宫廷室内白衣女子跪地低头哭泣泪水滑落肩颤],[悲情戏剧风逆光轮廓],[低头垂泪泪水沿脸颊滑落肩部颤抖],[特写→轻微晃动后拉至中景],[哽咽女声求饶+压抑抽泣+远处钟声],[4K 24fps ISO600 f/2.0 色温3000K]。 | → s2 | ||||
| ▼ s2 | 遍历分镜序列,逐一生成视频片段 | /表象/视觉/画面/后期/美学风格 /表象/视觉/画面/镜头 | /架构/逻辑/信息编排逻辑/条目列举/分段结构/板块并列 | 分镜分析 | 分镜分析 | 分镜1 茶盏倾酒(0.2s):画面风格=古典宫廷风柔焦特写;主体=着红色金线龙袍女性仅手部入镜,手指纤细指甲修整整齐;动作=女子右手持杯手腕微颤,茶水从杯口泼洒而出形成弧形水花;镜头=特写→慢镜头拉近聚焦飞溅水珠轨迹;构图=左侧主体占画面1/3右侧突出动态水花;光影=暖黄主光来自左上打亮手部与茶盏水珠反光晶莹;台词=无;音效=瓷器碰撞声+水流泼洒哗啦声;画质=4K 60fps(慢动作) ISO200 f/2.8 色温3200K。提示词=[古典宫廷室内着红袍女性慢动作茶水泼洒弧形水花手部特写],[古典宫廷风暖黄柔光],[手腕微颤茶水从杯口泼出弧形水花],[特写→慢镜拉近聚焦飞溅水珠],[瓷器碰撞声+水流哗啦声],[4K 60fps ISO200 f/2.8 色温3200K]。 分镜2 烛火摇曳与飞雪(0.5s):画面风格=梦幻朦胧景深极浅神秘氛围;主体=模糊的烛光与飘落白色颗粒(似雪或花瓣);动作=白色颗粒从上至下飘落,烛光随气流轻微晃动;镜头=固定镜头焦点在前景飘落物背景完全虚化;构图=对角线构图颗粒贯穿画面烛光点缀右区;光影=暖黄烛光为唯一光源颗粒反射高光整体偏暗;台词=无;音效=风声轻拂+微弱铃铛叮当声;画质=4K 24fps ISO800 f/1.4 色温2800K。提示词=[梦幻宫廷室内白色颗粒从上至下飘落烛光摇曳背景虚化],[梦幻朦胧景深极浅暖暗调],[白色颗粒飘落烛光轻微晃动],[固定镜头前景颗粒虚化背景],[风声轻拂+铃铛叮当声],[4K 24fps ISO800 f/1.4 色温2800K]。 分镜3 红衣贵妃特写(1.0s):画面风格=精致工笔画风面部妆容浓烈强调权力威严;主体=中年女性丹凤眼柳叶眉唇色朱红表情冷峻;服饰=红色金线龙凤袍头戴蓝金凤凰冠垂挂珍珠红宝石流苏;动作=微微侧首目光锐利扫视前方嘴角微扬似冷笑;镜头=近景推至特写聚焦眼部与冠饰;构图=中心构图人物占满画面背景深褐色帷幕;光影=正面柔光打亮面部冠饰金属高光闪烁;台词=「你,可知罪?」(低沉女声);音效=环境寂静仅留呼吸声与衣料摩擦声;画质=4K 30fps ISO400 f/2.2 色温3500K。提示词=[宫廷室内红衣贵妃面部特写神情冷峻微扬嘴角],[精致工笔画风权力威严浓烈妆容],[微微侧首目光锐利扫视嘴角微扬冷笑],[近景推至特写聚焦眼部与冠饰],[台词你可知罪低沉女声+环境寂静],[4K 30fps ISO400 f/2.2 色温3500K]。 分镜4 白衣女子跪地哭泣(1.5s):画面风格=悲情戏剧风面部特写强化情绪张力;主体=年轻女性黑发湿濡遮脸泪痕斑驳眼神绝望;服饰=素白交领襦裙发间插白玉簪与小花饰;动作=低头垂泪泪水沿脸颊滑落肩部颤抖;镜头=特写→轻微晃动模拟呼吸节奏后拉至中景;构图=斜侧角度突出泪滴与湿润发丝背景烛光散景;光影=逆光勾勒轮廓面部阴影加深悲伤感烛光在泪珠上形成高光;台词=「求娘娘开恩...」(哽咽女声);音效=压抑抽泣声+远处钟声回响;画质=4K 24fps ISO600 f/2.0 色温3000K。提示词=[宫廷室内白衣女子跪地低头哭泣泪水滑落肩颤],[悲情戏剧风逆光轮廓],[低头垂泪泪水沿脸颊滑落肩部颤抖],[特写→轻微晃动后拉至中景],[哽咽女声求饶+压抑抽泣+远处钟声],[4K 24fps ISO600 f/2.0 色温3000K]。 | ← s1.分镜分析 | - | 遍历 | - | /表象/视觉/实体/物品/影像物品/艺术创作 | /呈现/视觉/视觉制作/后期处理/图像合成处理/AI生成合成 | 内容类型/素材/物理变化/视频片段 | 视频片段序列 | <4个分镜视频片段序列(茶盏倾酒/烛火飞雪/红衣贵妃/白衣哭泣),各镜头由Seedance 2.0独立生成,可后续手动拼接为完整视频> | → 返回 视频片段 | ||||||||
| └ s2.1 | 用Seedance 2.0将提示词元素生成为视频片段 | 主体生成 | /理念/知识/商业/前沿技术/AI智能/AI应用 | /架构/逻辑/信息编排逻辑/条目列举/模板映射 | 程序控制类型/指令/提示词 | 分镜提示词 | [古典宫廷室内着红袍女性慢动作茶水泼洒弧形水花手部特写],[古典宫廷风暖黄柔光],[手腕微颤茶水从杯口泼出弧形水花],[特写→慢镜拉近聚焦飞溅水珠],[瓷器碰撞声+水流哗啦声],[4K 60fps ISO200 f/2.8 色温3200K] | ← 分镜分析[i] | Seedance 2.0 | 生成/元素生成 | 时长=5s(单核心动作)/10s+(多镜头);按模型实际支持的最大时长选择 | 5秒视频只保留一个核心动作;10秒以上再考虑多个镜头变化(原文建议) | - | 随机 | /表象/视觉/实体/物品/影像物品/艺术创作 | /呈现/视觉/视觉制作/后期处理/图像合成处理/AI生成合成 | 内容类型/素材/物理变化/视频片段 | 视频片段 | <Seedance 2.0 生成的宫廷分镜视频片段,时长5s以内,对应单个分镜的画面风格、主体动作与镜头运动> | → 视频片段序列.追加 | ||||
| ↩ | 返回 视频片段 | |||||||||||||||||||||||