原文: 别再瞎写Prompt了!教你一键“反推”神级AI绘画提示词
zhihu · 2025-11-26 09:34:36

摘要: 前段时间知乎上有一个话题火了:“你认为该图片是真实拍摄的还是由AI生成的?”,还一度冲上知乎热榜前三。 该问题是@小乐的乐高世界提出的问题,并附上了一张非常真实的图片。由于这张图片真假难辨,引起了网友热议,依旧没有实锤和令人信服的回答出现。


前段时间知乎上有一个话题火了:“你认为该图片是真实拍摄的还是由AI生成的?”,还一度冲上知乎热榜前三。

该问题是@小乐的乐高世界提出的问题,并附上了一张非常真实的图片。由于这张图片真假难辨,引起了网友热议,依旧没有实锤和令人信服的回答出现。

直到一位答主@Martian,通过其他AI工具将这张图的提示词逆推出来了,且结合自己的经验,也认为这张图是即梦4.0生成了。于是将逆推出来的提示词。

第一张图

第二张图

第三张图

个人感觉:对于AI绘图不了解的人基本看不出这是虚假的图片,即使玩AI的朋友,不不认真和仔细琢的话,也难以判断出。现在的 AI绘画在真实感上真恐怖如斯啊。

还有@一支梅向东答主也根据以上提示词生成了以下以假乱真的图片。

同时我也对此问题进行了回答,我的结论也是AI生成的,其理由是地面太干净,太一尘不染了,不符合实际生活场景,尤其是图中散落一地的鞋子。

我当天正好提前体验到了Nano Banana Pro。于是使用这次提示词测试了一下。

图一:这张图右边有明显不合理的地方:充电线又长又多。

图二:这张图比较惊艳的地方是地板不是光滑一尘不染的,而是有明显的痕迹和污渍。但是美中不足的是左侧的充电线非常的长,不符合逻辑。

当然,我的关注点,不是惊叹这些图片如此的逼真,而是好奇@Martian

是如何逆推出来的,于是开始了自己的尝试。我将原图上传给 Gemini 了,并设定了一些规则,让其反推出该图的提示词。

你是一名专业的AI提示词工程师。专门为nano banana pro这个AI绘画大模型提供提示词。你会通过专业的规则或逻辑去反推用户提供的图片所需的提示词,进而用户拿到提示词后去使用nano banana pro生成。所有提示词务必是中文简体。规则和逻辑如下:1.确立视觉基调:故事、主体与风格为了获得最佳效果并拥有更细腻的创意控制权,请在您的提示词 (Prompt) 中包含以下核心要素:主体 (Subject): 画面中是谁或什么?请具体描述。(例如:一个眼中闪烁着蓝光的冷峻机器人咖啡师;一只戴着迷你巫师帽的毛茸茸三花猫)。构图 (Composition): 镜头的取景方式是怎样的?(例如:极特写、广角镜头、低角度镜头、肖像)。动作 (Action): 正在发生什么?(例如:正在冲泡一杯咖啡、正在施展魔法、正大步跑过田野)。地点 (Location): 场景发生在哪里?(例如:火星上的未来主义咖啡馆、杂乱的炼金术士图书馆、黄金时刻阳光普照的草地)。风格 (Style): 整体美学风格是什么?(例如:3D 动画、黑色电影风格、水彩画、照片级写实、90 年代产品摄影风格)。编辑指令 (Editing Instructions): 若要修改现有图像,指令需直接且具体。(例如:将男人的领带换成绿色,移除背景中的汽车)。2.雕琢细节:相机、布光与格式虽然简单的提示词依然有效,但要获得专业级的效果,需要更具体的指令。在撰写提示词时,请超越基础描述,加入以下进阶要素:构图与宽高比 (Composition and aspect ratio): 定义画布规格。(例如:“一张 9:16 的垂直海报”、“一张电影感的 21:9 广角镜头画面”。)相机与布光细节 (Camera and lighting details): 像电影摄影师一样指导镜头。(例如:“低角度镜头,浅景深 (f/1.8)”、“黄金时刻的逆光创造出长长的拖影”、“带有柔和青色调的电影感调色”。)特定文本整合 (Specific text integration): 清晰说明应该出现的文本及其外观。(例如:“标题‘URBAN EXPLORER’以粗体、白色无衬线字体呈现在顶部。”)事实性约束(针对图表)(Factual constraints): 明确对准确性的要求,并确保您输入的信息本身符合事实(例如:“一张科学准确的横截面图”、“确保维多利亚时代的特定历史准确性。”)。参考输入 (Reference inputs): 使用上传的图片时,明确定义每一张的作用。(例如:“使用图片 A 作为角色的姿势,图片 B 作为艺术风格,图片 C 作为背景环境。”)

接着上传原图,得到以下提示词。

提示词:Chinese high school girls in dormitory, wearing uniforms, barefoot, sitting on bunk beds.

Messy room, chaotic atmosphere.

The floor is

dirty, dusty old tiles

with scuff marks.

Scattered worn-out dirty sneakers and smelly socks

on the floor. Upper bunk piled with messy clothes.

Smartphone photography, low quality image, high ISO, raw, unedited, realistic lighting, harsh shadows.

生成图一:

就在昨天我看到@宝玉老师也分享了反推提示词:

Provide a detailed and comprehensive JSON prompt describing all aspects necessary for accurately replicating the original image. Include specifics about objects, clothing, hairstyles, intricate details, accessories, photographic equipment, environment, lighting, style, body poses, and any other relevant elements, ensuring that every detail of the original image can be precisely recreated.

我将其翻译了一下并增加了个硬性约束条件:“注意:图片比例的设定”提醒。

请编写一份详尽且全面的JSON格式提示词,旨在涵盖精准复刻原图所需的一切要素。内容须具体包含主体对象、服饰穿搭、发型设计、精微细节、配饰道具、拍摄设备、场景环境、光影布局、艺术风格、肢体姿态及其他所有相关元素,以确保原图的每一处细节均能被精确重现。注意:图片比例的设定。

我也测试了一下,结果还不错。

所以,除了我前面提到的反推提示词,这个提示词也收藏起来。

从不控评,接受批评和劝告,评论区等你。

需求 # 目的 作用 实质 形式
输入 类型 来源
实现 外部工具 动作 指令
输出 类型 去处
高亮推断 点击列名 ↔ 显示/隐藏 · 点击组名 ↔ 整组切换 · 「推」角标 hover 看推断理由
工序 反推提示词工序 #目的: 通过AI工具反推AI生成图片的提示词 #作者: zhihu · case: A_zhihu_19769469
返回
程序控制类型/指令/提示词
需求 输入 实现 输出
# 目的 作用 实质 形式 类型 来源 外部工具 动作 指令 类型 去处
s1
Gemini 反推 参考图,得到 提示词
预处理图片内容类型/素材/化学变化/参考图Chinese high school girls in dormitory, wearing uniforms, barefoot, sitting on bunk beds. Messy room, chaotic atmosphere. The floor is dirty, dusty old tiles with scuff marks. Scattered worn-out dirty sneakers and smelly socks on the floor. Upper bunk piled with messy clothes. Smartphone photography, low quality image, high ISO, raw, unedited, realistic lighting, harsh shadows.Gemini提取/化学提取/反推你是一名专业的AI提示词工程师。专门为nano banana pro这个AI绘画大模型提供提示词。你会通过专业的规则或逻辑去反推用户提供的图片所需的提示词,进而用户拿到提示词后去使用nano banana pro生成。所有提示词务必是中文简体。规则和逻辑如下:1.确立视觉基调:故事、主体与风格为了获得最佳效果并拥有更细腻的创意控制权,请在您的提示词 (Prompt) 中包含以下核心要素:主体 (Subject): 画面中是谁或什么?请具体描述。(例如:一个眼中闪烁着蓝光的冷峻机器人咖啡师;一只戴着迷你巫师帽的毛茸茸三花猫)。构图 (Composition): 镜头的取景方式是怎样的?(例如:极特写、广角镜头、低角度镜头、肖像)。动作 (Action): 正在发生什么?(例如:正在冲泡一杯咖啡、正在施展魔法、正大步跑过田野)。地点 (Location): 场景发生在哪里?(例如:火星上的未来主义咖啡馆、杂乱的炼金术士图书馆、黄金时刻阳光普照的草地)。风格 (Style): 整体美学风格是什么?(例如:3D 动画、黑色电影风格、水彩画、照片级写实、90 年代产品摄影风格)。编辑指令 (Editing Instructions): 若要修改现有图像,指令需直接且具体。(例如:将男人的领带换成绿色,移除背景中的汽车)。2.雕琢细节:相机、布光与格式虽然简单的提示词依然有效,但要获得专业级的效果,需要更具体的指令。在撰写提示词时,请超越基础描述,加入以下进阶要素:构图与宽高比 (Composition and aspect ratio): 定义画布规格。(例如:“一张 9:16 的垂直海报”、“一张电影感的 21:9 广角镜头画面”。)相机与布光细节 (Camera and lighting details): 像电影摄影师一样指导镜头。(例如:“低角度镜头,浅景深 (f/1.8)”、“黄金时刻的逆光创造出长长的拖影”、“带有柔和青色调的电影感调色”。)特定文本整合 (Specific text integration): 清晰说明应该出现的文本及其外观。(例如:“标题‘URBAN EXPLORER’以粗体、白色无衬线字体呈现在顶部。”)事实性约束(针对图表)(Factual constraints): 明确对准确性的要求,并确保您输入的信息本身符合事实(例如:“一张科学准确的横截面图”、“确保维多利亚时代的特定历史准确性。”)。参考输入 (Reference inputs): 使用上传的图片时,明确定义每一张的作用。程序控制类型/指令/提示词s1o1 Chinese high school girls in dormitory, wearing uniforms, barefoot, sitting on bunk beds. Messy room, chaotic atmosphere. The floor is dirty, dusty old tiles with scuff marks. Scattered worn-out dirty sneakers and smelly socks on the floor. Upper bunk piled with messy clothes. Smartphone photography, low quality image, high ISO, raw, unedited, realistic lighting, harsh shadows.
工序 提示词生成图工序 #目的: 使用反推的提示词生成新的AI图片 #作者: zhihu · case: A_zhihu_19769469
返回
生成图
需求 输入 实现 输出
# 目的 作用 实质 形式 类型 来源 外部工具 动作 指令 类型 去处
s2
Nano Banana Pro 生成 提示词,得到 生成图
主体生成图片照片级写实程序控制类型/指令/提示词Chinese high school girls in dormitory, wearing uniforms, barefoot, sitting on bunk beds. Messy room, chaotic atmosphere. The floor is dirty, dusty old tiles with scuff marks. Scattered worn-out dirty sneakers and smelly socks on the floor. Upper bunk piled with messy clothes. Smartphone photography, low quality image, high ISO, raw, unedited, realistic lighting, harsh shadows.← s1o1Nano Banana Pro生成/元素生成Provide a detailed and comprehensive JSON prompt describing all aspects necessary for accurately replicating the original image. Include specifics about objects, clothing, hairstyles, intricate details, accessories, photographic equipment, environment, lighting, style, body poses, and any other relevant elements, ensuring that every detail of the original image can be precisely recreated. 我将其翻译了一下并增加了个硬性约束条件:“注意:图片比例的设定”提醒。 请编写一份详尽且全面的JSON格式提示词,旨在涵盖精准复刻原图所需的一切要素。内容须具体包含主体对象、服饰穿搭、发型设计、精微细节、配饰道具、拍摄设备、场景环境、光影布局、艺术风格、肢体姿态及其他所有相关元素,以确保原图的每一处细节均能被精确重现。注意:图片比例的设定。生成图s2o1 <一张由Nano Banana Pro生成的以假乱真的宿舍场景图>