摘要: 很多人在面对写提示词时就挠头,不是不会描述,而是不知道一张图到底好在哪里,比如颜色、构图、光影、质感怎么描述,属实做到金口难开。 今天就教你换一个思路,别再对着图片猜猜猜,而是交给 AI,让它帮你把图片“拆开看”。 下面就
很多人在面对写提示词时就挠头,不是不会描述,而是不知道一张图到底好在哪里,比如颜色、构图、光影、质感怎么描述,属实做到金口难开。
今天就教你换一个思路,别再对着图片猜猜猜,而是交给
AI,让它帮你把图片“拆开看”。
下面就跟着我一块进行实操吧,流程十分简单:就是把你喜欢的图片或视频上传给
AI,让它先提取视觉结构,然后你再把这些结构转成可以直接用于生图或视频生成的提示词。更重要的是,你不需要看懂每一个专业词,你只要会复制、会微调,就能稳定复刻类似风格。
一、反推图片提示词
打开任意支持图片理解的
AI 工具,例如豆包、Gemini、
lovart
或其他多模态模型。
1、上传参考图片
上传你想参考的图片,然后输入提示词。
我这里随便在某书上找了一张目前比较火的古风图片进行实操。
在对话框输入这段提示词:
可直接复制的提示词
请以
JSON 结构化数据的形式,提取这张图片的视觉风格。请重点分析:颜色、构图、排版、主体、材质质感、光影、特效、画面氛围和适合复刻的关键词。输出要清晰、简洁,控制在500 字以内。
2、看懂 AI 分析的重点
AI 通常会输出一段类似代码的内容,里面会包含颜色、构图、质感、光影、特效等字段。但重点是:你不需要真的会写代码,只要明白这些字段分别代表什么。
JSON
{
"视觉风格分析": {
"颜色": {
"主色调": "淡雅绿色、米白色",
"辅助色": "粉色(花朵)、深棕色(木窗框)",
"色彩特征": "低饱和度、高明度、清新淡雅、春日感",
"色彩关系": "绿粉撞色、冷暖平衡"
},
"构图": {
"类型": "对角线构图",
"视角": "平视偏俯视",
"主体位置": "画面中心偏左,倚靠窗台",
"空间层次": "前景花枝、中景人物、后景虚化庭院"
},
"排版": {
"画幅比例": "9:16 竖构图",
"留白": "上方和右侧留白较多,营造呼吸感",
"视觉引导": "花枝自然框架引导视线至人物面部"
},
"主体": {
"人物": "年轻女性,古风造型",
"姿态": "慵懒侧卧,托腮,赤足",
"服饰": "薄纱绿色古风长裙,露肩设计",
"发饰": "编发盘发,白色小花点缀",
"神态": "温柔恬静,眼神清澈"
},
"材质质感": {
"服装": "轻盈薄纱,半透明质感",
"皮肤": "白皙细腻,自然光泽",
"木质": "深色木窗框,哑光质感",
"花朵": "柔软娇嫩,真实感"
},
"光影": {
"光源": "自然光,来自窗外",
"光质": "柔和散射光",
"明暗": "人物受光均匀,背景虚化柔和",
"氛围": "明亮通透,春日午后感"
},
"特效": {
"景深": "浅景深,背景虚化明显",
"光斑": "自然散景光斑",
"柔焦": "整体轻微柔焦,梦幻感"
},
"画面氛围": {
"情绪": "宁静、慵懒、浪漫",
"风格": "古风写真、仙侠剧照感",
"季节": "春日、花期",
"时间": "午后时光"
},
"复刻关键词": [
"古风少女",
"绿色薄纱汉服",
"木窗台侧卧",
"托腮姿态",
"花枝前景框架",
"浅景深",
"自然光",
"清新淡雅色调",
"春日庭院",
"编发花饰",
"9:16竖构图",
"柔和散景",
"低饱和度",
"电影感人像"
]
}
}
3、把结果交给生图模型
接下来打开你常用的生图工具,比如即梦、豆包、
Midjourney、
lovart
或其他模型。把刚才 AI 分析出来的结构化内容复制进去,再在前面加上你真正想生成的主体。
通用生图提示词模板
请帮我生成一张真实感人物图片,纯图片,不要文字,比例
9:16。请参考以下视觉风格结构,保留其颜色、构图、质感、光影和整体氛围:[粘贴 AI 分析出的结构化风格内容]
如果原参考图里有文字、
Logo 或水印,记得加一句:不要文字、不要 Logo、不要水印。这样生成结果会更干净,也更适合做封面、壁纸或角色图。
很快,复刻好的图片就出来了。
二、反推视频提示词
图片反推解决的是
画面长什么样子,但是视频反推还要多一步,那就是把视频拆成分镜。因为视频不只是风格,还有动作、镜头变化、声音、节奏和时长等。
1、首先我们准备要复刻的视频。
2、打开网址
https://modelscope.cn/studios/Qwen/Qwen3-VL-Demo/
视频反推提示词模板
请把这段视频拆分成不同分镜,并对每个分镜进行细致分析。每个分镜请包含:画面风格、主体特征、服装
/物品、动作描述、镜头变化、构图、光影、人物台词或旁白、背景音乐/音效、画质参数和时长。最后请生成一段可用于生成相似视频的完整提示词,格式为:[视频内容描述],[风格],[主体动作],[运镜],[声音],[画质参数]。
然后把参考视频上传到支持视频理解的模型里,让AI 按分镜拆解。重点不是让它总结剧情,而是让它分析每一段画面如何构成。
拿到结果之后,把每个分镜的提示词复制到视频模型里,比如
用Seedance2.0,然后
再根据模型支持的时长进行调整。5 秒视频就保留一个核心动作,10 秒以上再考虑多个镜头变化。
反推提示词的关键,不是让
AI 帮你“抄图”,而是让 AI 帮你把优秀画面的结构拆出来。颜色、构图、质感、光影、镜头和声音这些元素一旦被拆清楚,就能变成稳定可复用的创作模板。
简单的说:图片反推,是把风格拆成提示词;视频反推,是把镜头拆成分镜提示词。掌握这套方法后,你做封面、壁纸、角色设定、短视频分镜都会更快,也更容易得到接近目标的效果。
以上就是今天分享的全部内容。如果觉得对你有帮助,欢迎
点赞、收藏、关注
,你的支持是我持续更新的最大动力。
更多AI探索及案例:
华姐正在组建一个AI变现公益社群,每天都会分享最新的AI工具技巧、实战案例与变现思路,全程无广告、纯干货。感兴趣的朋友可以扫码添加下方微信,下方扫码
备注“AI”
拉你入群。
| 需求 | 输入 | 实现 | 输出 | ||||||||||
|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
| # | 目的 | 作用 | 实质 | 形式 | 类型 | 值 | 来源 | 外部工具 | 动作 | 指令 | 类型 | 值 | 去处 |
| s1 | 上传参考图片以供 AI 分析 | 预处理 | 图片 | 视觉结构 | 程序控制类型/指令/提示词 | inferred:true | 多模态 AI 工具 | 获取/录入/上传 | AI 视觉风格分析 JSON | s1o1 inferred:true | |||
| s2 | 根据 AI 分析的视觉风格生成复刻图片 | 主体生成 | 图片 | 视觉风格 | 程序控制类型/指令/提示词 | { "视觉风格分析": { "颜色": { "主色调": "淡雅绿色、米白色", "辅助色": "粉色(花朵)、深棕色(木窗框)", "色彩特征": "低饱和度、高明度、清新淡雅、春日感", "色彩关系": "绿粉撞色、冷暖平衡" }, "构图": { "类型": "对角线构图", "视角": "平视偏俯视", "主体位置": "画面中心偏左,倚靠窗台", "空间层次": "前景花枝、中景人物、后景虚化庭院" }, "排版": { "画幅比例": "9:16 竖构图", "留白": "上方和右侧留白较多,营造呼吸感", "视觉引导": "花枝自然框架引导视线至人物面部" }, "主体": { "人物": "年轻女性,古风造型", "姿态": "慵懒侧卧,托腮,赤足", "服饰": "薄纱绿色古风长裙,露肩设计", "发饰": "编发盘发,白色小花点缀", "神态": "温柔恬静,眼神清澈" }, "材质质感": { "服装": "轻盈薄纱,半透明质感", "皮肤": "白皙细腻,自然光泽", "木质": "深色木窗框,哑光质感", "花朵": "柔软娇嫩,真实感" }, "光影": { "光源": "自然光,来自窗外", "光质": "柔和散射光", "明暗": "人物受光均匀,背景虚化柔和", "氛围": "明亮通透,春日午后感" }, "特效": { "景深": "浅景深,背景虚化明显", "光斑": "自然散景光斑", "柔焦": "整体轻微柔焦,梦幻感" }, "画面氛围": { "情绪": "宁静、慵懒、浪漫", "风格": "古风写真、仙侠剧照感", "季节": "春日、花期", "时间": "午后时光" }, "复刻关键词": [ "古风少女", "绿色薄纱汉服", "木窗台侧卧", "托腮姿态", "花枝前景框架", "浅景深", "自然光", "清新淡雅色调", "春日庭院", "编发花饰", "9:16竖构图", "柔和散景", "低饱和度", "电影感人像" ] } } | 生图模型 | 生成/元素生成 | 复刻图片 | s2o1 <复刻的古风人物图片> | |||
| s3 | 使用通用模板生成图片 | 主体生成 | 图片 | 提示词 | 程序控制类型/指令/提示词 | 请帮我生成一张真实感人物图片,纯图片,不要文字,比例 9:16。请参考以下视觉风格结构,保留其颜色、构图、质感、光影和整体氛围:[粘贴 AI 分析出的结构化风格内容] 如果原参考图里有文字、 Logo 或水印,记得加一句:不要文字、不要 Logo、不要水印。 | 多模态 AI 工具 | 生成/元素生成 | |||||
| 需求 | 输入 | 实现 | 输出 | ||||||||||
|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
| # | 目的 | 作用 | 实质 | 形式 | 类型 | 值 | 来源 | 外部工具 | 动作 | 指令 | 类型 | 值 | 去处 |
| s1 | 将视频拆解为分镜并分析 | 预处理 | 视频 | 分镜 | 程序控制类型/指令/提示词 | inferred:true | 视频理解模型 | 提取/化学提取/解构 | 分镜分析报告 | s1o1 inferred:true | |||
| s2 | 根据分镜分析生成视频 | 主体生成 | 视频 | 分镜提示词 | 程序控制类型/指令/提示词 | 分镜 1: 茶盏倾洒 ◦ 画面风格:古典宫廷风,柔焦特写,慢动作捕捉液体飞溅的瞬间。 ◦ 主体特征:一位身着红色华服的女性(仅手部入镜),手指纤细,指甲修剪整齐。 ◦ 服装/物品:红色刺绣长袍(金线龙纹),白瓷茶盏与托盘,茶汤呈琥珀色。 ◦ 动作描述:女子右手持杯,手腕微倾,茶水从杯口泼洒而出,形成弧形水花。 ◦ 镜头变化:特写→慢镜头拉远,聚焦飞溅水珠轨迹。 ◦ 构图:左侧主体占画面1/3,右侧留白突出动态水花,背景虚化。 ◦ 光影:暖黄主光从左上方打亮手部与茶盏,水珠反光晶莹剔透。 ◦ 台词/旁白:无。 ◦ 音效:清脆的瓷器碰撞声+水流泼洒的“哗啦”声。 ◦ 画质参数:4K,帧率60fps(慢动作),ISO 200,f/2.8,色温3200K。 ◦ 时长:0.2秒。 ===== [图 7] 来源: https://mmbiz.qpic.cn/mmbiz_png/JI1THFoKuNoJ9I3LJaZoTzibYVqib5rna8IzgjDwj93VtUEjrHrtJjnhxO ===== Qwen3-VL + 新建对话 请把这段视频拆分成分... 时长: 0.2秒。 分镜 2: 烛火摇曳与飞雪 画面风格: 梦幻朦胧,景深极浅,营造神秘氛围。 主体特征: 模糊的烛光与飘落的白色颗粒(似雪或花瓣)。 服装/物品: 无明确主体,仅见暖黄色烛焰与银色链状装饰物。 动作描述: 白色颗粒从上至下飘落,烛光随气流轻微晃动。 镜头变化: 固定镜头,焦点在前景飘落物,背景完全虚化。 构图: 对角线构图,飘落物贯穿画面,烛光点缀中右区域。 光影: 暖黄烛光为唯一光源,颗粒反射高光,整体偏暗调。 台词/旁白: 无。 音效: 风声轻拂+微弱的铃铛叮当声。 画质参数: 4K,帧率24fps,ISO 800,f/1.4,色温2800K。 时长: 0.5秒。 分镜 3: 红衣贵妃特写 画面风格: 精致工笔画风,面部妆容浓烈,强调权力和威严。 主体特征: 中年女性,丹凤眼、柳叶眉,唇色朱红,表情冷峻。 服装/物品: 红色金线龙凤袍,头戴蓝金凤凰冠,垂挂珍珠与红宝石流苏。 动作描述: 微微侧首,目光锐利扫视前方,嘴角微扬似冷笑。 镜头变化: 近景推至特写,聚焦眼部与冠饰 ===== [图 8] 来源: https://mmbiz.qpic.cn/sz_mmbiz_png/JI1THFoKuNowMeHkialxhZkib43k4Hgianam0qrvZSCVR0fwxyiceIK ===== Qwen3-VL + 新建对话 请把这段视频拆分成不同分... 。 主体特征:中年女性,丹凤眼、柳叶眉,唇色朱红,表情冷峻。 。 服装/物品:红色金线龙凤袍,头戴蓝金凤凰冠,垂挂珍珠与红宝石流苏。 。 动作描述:微微侧首,目光锐利扫视前方,嘴角微扬似冷笑。 。 镜头变化:近景推至特写,聚焦眼部与冠饰细节。 。 构图:中心构图,人物占满画面,背景深褐色帷幕衬托华服。 。 光影:正面柔光打亮面部,冠饰金属部分高光闪烁。 。 台词/旁白:“你,可知罪?”(低沉女声) 。 音效:环境寂静,仅留呼吸声与衣料摩擦声。 。 画质参数:4K,帧率30fps,ISO 400,f/2.2,色温3500K。 。 时长:1.0秒。 分镜 4:白衣女子跪地哭泣 。 画面风格:悲情戏剧风,面部特写强化情绪张力。 。 主体特征:年轻女性,黑发湿漉漉贴面,泪痕斑驳,眼神绝望。 。 服装/物品:素白交领襦裙,发间插白玉簪与小花饰。 。 动作描述:低头垂泪,泪水沿脸颊滑落,肩部颤抖。 。 镜头变化:特写→轻微动模拟呼吸节奏,后拉至中景。 。 构图:斜侧角度拍摄,突出泪滴与湿润发丝,背景烛光成散景。 。 光影:逆光勾勒轮廓,面部阴影加深悲伤感,烛光在泪珠上形成高光。 。 台词/旁白:“求娘娘开恩…”(哽咽女声) 。 音效:压抑抽泣声+远处钟声回响。 。 画质参数:4K,帧率24fps,ISO 600,f/2.0,色温3000K。 。 时长:1.5秒。 | 视频生成模型 | 生成/元素生成 | 复刻视频片段 | s2o1 <复刻的视频片段> | |||
| 需求 | 输入 | 实现 | 输出 | ||||||||||
|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
| # | 目的 | 作用 | 实质 | 形式 | 类型 | 值 | 来源 | 外部工具 | 动作 | 指令 | 类型 | 值 | 去处 |
| s1 | 生成视频反推提示词 | 预处理 | 视频 | 提示词 | 程序控制类型/指令/提示词 | 请把这段视频拆分成不同分镜,并对每个分镜进行细致分析。每个分镜请包含:画面风格、主体特征、服装 /物品、动作描述、镜头变化、构图、光影、人物台词或旁白、背景音乐/音效、画质参数和时长。 | 视频理解模型工具 | 提取/化学提取/解构 | |||||