摘要: 拆解312个专业提示词,提炼7个AI出图公式:参数化模板、JSON结构化、摄影指令、分步组合、参考图驱动、多语言混用、结构化测试,各附实战案例与出图效果。
我花了一周时间拆解了312个GPT-Image-2的专业提示词——覆盖电商、广告创意、人像摄影、海报插画、角色设计、UI社媒、对比实验7大类——提炼出7个可直接复用的出图公式。不管你用即梦、Midjourney还是GPT-Image-2,这些底层逻辑都通用。
需要完整的全套提示词模板,迅雷搜【白嫖知识库】,我整理好了312个神级提示词和700个ai指令。
────────────────────────────────────────
先说结论:提示词不是"写句子",是"搭结构"
很多人用AI绘图,提示词就是一句话:"帮我画一个漂亮的xxx"。
结果出来,要么跟想象差十万八千里,要么每次效果完全不可控。
312个专业提示词告诉我一个核心事实:高手写提示词,不是在"描述画面",而是在"搭建生成框架"。他们用参数化模板控制变量,用JSON结构定义布局,用摄影术语锁定风格——每一条提示词本质上是一个可复用的生成配方。
下面7个公式,从简单到复杂,覆盖了90%的AI出图场景。
公式一:参数化模板——换一个词,出一套图
【公式】
{主体描述} with {argument name="变量名" default="默认值"} + {环境/光影/构图}
【核心思路】把需要频繁更换的元素(品牌名、产品名、颜色、材质)设为参数,其他描述固定为模板。
【实战案例】电商主图——香水瓶:
A luxurious cinematic product photograph of a classic rectangular perfume bottle
inspired by {argument name="brand label" default="N°5 CHANEL PARIS PARFUM"},
placed upright on a glossy black marble surface with white veining...
再比如护肤品主图:
A soft {argument name="bottle color" default="cream-colored"} bottle with a
{argument name="pump color" default="pastel yellow"} pump stands on a matte
podium, surrounded by silky foam and {argument name="flowers" default="chamomile blossoms"}...
出图效果:
【为什么有效】电商场景需要同一风格出几十张图,参数化模板保证视觉统一性,只需要换品牌名、产品色、装饰花材,就能批量产出同系列主图。即梦同样支持类似思路——先确定一个稳定的"画风锚点",只替换核心商品元素。
【适用场景】电商产品图批量生成、品牌系列素材、社交媒体模板图
公式二:JSON结构化——让AI听懂"左上角放什么、右下角放什么"
【公式】
{
"type": "画面类型",
"layout": { "结构描述" },
"sections": [
{ "position": "位置", "content": "具体内容", "text_labels": ["文字"] }
]
}
【核心思路】当画面需要多区域、多元素、精确布局时,用JSON结构告诉AI"哪里放什么",远比自然语言描述精准。
【实战案例】4格日系广告Banner:
{
"type": "2x2 grid of Japanese digital advertisement banners",
"layout": {
"structure": "4 equal quadrants",
"quadrants": [
{
"position": "top-left",
"theme": "Travel",
"subject": "A couple holding hands on a white sand beach...",
"text_labels": ["今年こそ、解き放て。", "沖縄旅行", "39,800円〜"]
},
...
]
}
}
还有品牌周边设计板、Dark Mode UI Mockup,都用JSON精确定义了每个区域的内容、颜色、文字。
出图效果:
【为什么有效】AI模型对结构化输入的理解力远超松散描述。JSON强制你理清布局逻辑,模型也更容易"按图施工"。在即梦里生成多区域海报、产品展示板时,试试把布局写成结构化描述,效果会有质变。
【适用场景】多区域Banner、品牌设计板、UI界面生成、信息图布局
公式三:自然语言摄影指令——用"行话"锁定影棚级画质
【公式】
{胶片类型/拍摄格式} + {光线描述} + {人物描述} + {构图/景别} + {后期风格}
【核心思路】别写"拍一个好看的女孩",要写"35mm胶片、便利店荧光灯+霓虹灯、中景、电影感街拍"——用专业摄影术语精确控制出图风格。
【实战案例1】便利店霓虹人像:
35mm film photography with harsh convenience store fluorescent lighting
mixed with colorful neon signs from outside, authentic film grain,
high contrast, slight color cast, cinematic street editorial style,
intimate medium shot...
【实战案例2】温泉旅馆人像:
35mm film photography, warm vintage Japanese onsen ryokan aesthetic,
soft ambient wooden lantern lighting mixed with gentle natural window light,
subtle film grain, gentle color shift, high atmosphere editorial style...
出图效果——便利店霓虹人像:
出图效果——温泉旅馆人像:
【拆解关键术语】
• 35mm film photography:锁定胶片质感,避免数码味
• harsh fluorescent lighting:硬质荧光灯,制造真实便利店光感
• film grain / color shift:胶片颗粒和偏色,是"胶片感"的灵魂
• medium shot:中景构图,控制人物在画面中的比例
【为什么有效】AI绘图模型在训练数据中见过大量带EXIF标签的摄影作品。当你用"35mm film""cinematic lighting""editorial style"这类术语,你实际上是在调取模型中"专业摄影"的深层表征。即梦3.0的文字增强和智能参考功能,同样对这类结构化摄影描述有更好的响应。
【适用场景】人像摄影、产品摄影、氛围感场景图
公式四:分步组合法——复杂画面,拆两步走
【公式】
Prompt 1: {基础构图 + 主体}
Prompt 2: {叠加效果 + 细节强化}
【核心思路】一步到位的提示词有时控制力不够。先生成基础画面,再在基础上叠加细节或修改,两步走比一步冲更可控。
【实战案例】汉堡产品图:
第一步生成主体汉堡构图,第二步叠加品牌标识、光影效果、背景虚化。
出图效果:
【为什么有效】这本质上是"先生成再编辑"的思路。即梦的"智能参考"功能天然支持这种工作流:先出基础图,再基于参考图做风格迁移或细节修改。复杂创意不要指望一条提示词搞定所有事。
【适用场景】复杂产品图、需要精确品牌元素的创意图、多轮迭代优化
公式五:参考图驱动——"照着这个感觉来"
【公式】
Based on {参考图描述} + {转换指令}
【核心思路】当文字描述力不从心时,直接给AI一张参考图,让它在参考基础上做转换。
【实战案例】角色设计中最经典的用法——
Show me the attached image as a snapshot from an actual anime
一张实拍照片,一条提示词,变成动画截图。简洁到极致,效果惊人。
还有更复杂的用法,Persona5风格角色设定卡——基于已有角色图,生成三视图、表情差分、服装分解、色板,一条提示词完成整套设定资料。
出图效果:
【为什么有效】参考图消除了"语言描述和视觉想象之间的信息损耗"。即梦3.0的智能参考功能就是这个逻辑——上传参考图后,AI从图像中提取构图、色调、风格信息,再按你的指令做定向修改。这是文字提示词无法替代的能力。
【适用场景】风格转换(实拍转动漫)、角色设定资料、基于品牌素材的再创作
公式六:多语言混用——用中文写提示词,一样能出神图
【公式】
{目标语言内容} + {英文风格/技术术语} + {排版/布局指令}
【核心思路】GPT-Image-2的CJK优化让中文提示词不再"打酱油"。即梦作为国产工具,中文理解力更是强项。混合使用中文(内容描述)、英文(技术术语)、日文(风格标签),各取所长。
【实战案例1】成都美食地图:
一张手绘风格的城市美食地图,以成都为主题。画面以鸟瞰视角的手绘简化城市地图为底,
标注主要道路和地标但不追求精确比例而是追求可爱的手绘感。地图上分布着12个美食地点
的精致手绘小插画:春熙路的串串香(一把竹签插着各种食材冒着热气)、宽窄巷子的三大炮
(三个糯米团子飞向铜盘)...左上角标题"成都·吃货暴走地图"使用胖圆的手绘美术字
配辣椒装饰。整体画风为水彩+彩铅混合的手绘质感,颜色以暖色系为主...
【实战案例2】四季眼部特写——中英混搭:
以眼部特写图片为基础,生成3:4的四屏构图超写实眼部特写,四屏按春夏秋冬上下排序。
第一屏:眼眸中带着绽粉樱色的美瞳,睫毛缀满迷你春花...
画面中央"SPRING"白色艺术字点缀...
下面用书法体写着春;...
【实战案例3】日文角色页——纯日文提示词一样出图:
このキャラクターと背景を元に、公式設定資料のようなキャラクターシートを
作成してください。・正面、側面、背面の3面図を含める...
出图效果:
【为什么有效】即梦的中文语义理解在国产工具中是第一梯队的。中文描述场景细节("九宫格锅翻滚冒泡")、英文锁定风格参数("35mm film photography")、日文匹配特定风格("設定資料"),各语言在各自擅长的维度上配合,出图精度远超单语言提示词。
【适用场景】中文内容图(美食地图、城市海报、中文UI)、日系风格素材、本地化营销图
公式七:结构化测试——用"数数"验证AI的智力上限
【公式】
{精确数量/结构要求} + {验证条件}
【核心思路】不是所有提示词都是"画个好看的图"。有些提示词是在测试AI的推理能力——它能不能准确地在书架上放1+3+7=11本书?能不能按要求在四个象限放不同内容?
【实战案例】书架计数测试:
A wooden bookshelf consisting of three shelves: On the top shelf,
there should be one book, on the second shelf, there should be three books,
and on the bottom shelf, there should be seven books.
看似简单,但这测试的是AI的"计数能力"和"空间推理能力"。早期模型大概率数不对,GPT-Image-2可以。
更高级的——"轮廓宇宙"叙事海报模板,要求AI根据主题自动选择最契合的轮廓载体,并在其中生成完整的叙事世界。这测试的是"主题理解+创意生成+空间布局"的综合能力。
出图效果:
【为什么有效】这种提示词不是拿来日常用的,但它是评估AI绘图工具能力的标尺。你用即梦或GPT-Image-2时,先跑几个"计数测试"和"结构化测试",就知道当前工具能支撑多复杂的指令。选工具先测能力边界,再谈创作自由度。
【适用场景】工具能力评估、复杂结构图验证、创意极限挑战
总结:7个公式一张表
公式
一句话概括
最佳场景
难度
参数化模板
换词出图,风格不变
电商批量、品牌系列
⭐⭐
JSON结构化
哪里放什么,写清楚
多区域布局、UI界面
⭐⭐⭐
摄影指令
用行话锁定画质
人像/产品摄影
⭐⭐
分步组合
先出基础再叠加
复杂创意、品牌图
⭐⭐⭐
参考图驱动
照着这个感觉来
风格转换、角色设定
⭐
多语言混用
各语言各取所长
中文内容图、日系素材
⭐⭐
结构化测试
数数看AI够不够聪明
工具评估、能力验证
⭐⭐⭐⭐
最后说两句
这312个提示词不是某个天才的灵光一现,而是一群专业设计师在大量实践中总结出的可复用生成框架。
提示词的本质不是"对AI说话",而是把自己的创作意图结构化——你想让画面呈现什么风格?主体在哪?光线怎么打?文字放哪里?当你把这些思考用结构化的方式表达出来,AI才能真正"听懂"你的需求。
即梦也好,GPT-Image-2也好,Midjourney也好——工具会换,但结构化思维不会过时。
掌握这7个公式,你写的每一条提示词都是在"搭框架"而不是"碰运气"。
本文提示词素材来自公开的GPT-Image-2 Prompt集合(312条,7大类),文中案例均为原文引用。
| 需求 | 输入 | 实现 | 输出 | |||||||||||||||||||||
|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
| # | 目的 | 作用 | 实质 | 形式 | 类型 | 变量名 | 值 | 来源 | 外部工具 | 动作 | 指令 | 配置 | 运行 | 备注 | 逻辑控制 | 特性 | 实质 | 形式 | 类型 | 变量名 | 值 | 去处 | ||
| s1 | 用 human 解构 从 描述 梳理出可参数化的 参数列表 | 预处理 | /表象/视觉/实体/物品/起居物品/美妆护肤 | /架构/修辞/语调风格/平实表达/直白陈述 | 程序控制类型/指令/描述 | 产品品类描述 | 电商香水瓶产品主图,需要生成一套可替换品牌名和装饰花材的系列图,保持luxurious cinematic风格不变 | ← 工序输入 | human | 提取/化学提取/解构 | 区分「稳定不变」要素(背景/光线/构图/风格)与「需要批量替换」要素(品牌名/颜色/材质/装饰)——前者固定进模板,后者提升为参数;电商场景需要同一风格出几十张图,参数化模板保证视觉统一性 | - | 人工 | /理念/知识/商业/产品服务/产品特征/规格参数 | /架构/逻辑/信息编排逻辑/条目列举/逐条罗列/通用列举 | 参数列表 | 参数变量清单 | 参数变量:brand label(默认 N°5 CHANEL PARIS PARFUM)、flowers(默认 chamomile blossoms);固定元素:glossy black marble surface with white veining / cinematic product photograph / dramatic side lighting / ultra-detailed glass texture / photorealistic 8K | → s2 | |||||
| s2 | 用 human 结构生成 将 参数列表 嵌入固定风格骨架,生成可复用的 提示词 | 预处理 | /理念/知识/商业/产品服务/产品特征/规格参数 | /架构/逻辑/信息编排逻辑/条目列举/逐条罗列/通用列举 | 参数列表 | 参数变量清单 | 参数变量:brand label(默认 N°5 CHANEL PARIS PARFUM)、flowers(默认 chamomile blossoms);固定元素:glossy black marble surface with white veining / cinematic product photograph / dramatic side lighting / ultra-detailed glass texture / photorealistic 8K | ← s1.参数变量清单 | human | 生成/关系生成/结构生成 | 以 {argument name="参数名" default="默认值"} 语法将参数变量内嵌到提示词中;其余描述固定为模板骨架;确保模板结构完整(主体描述+材质+环境+光影+构图+渲染风格) | 即梦同样支持此思路:先确定稳定的「画风锚点」,只替换核心商品元素;参数化模板的价值在于「一次定义,批量复用」 | - | 人工 | /表象/视觉/实体/物品/起居物品/美妆护肤 | /架构/逻辑/信息编排逻辑/条目列举/分段结构/规范框架 | 程序控制类型/指令/提示词 | 参数化提示词模板 | A luxurious cinematic product photograph of a classic rectangular perfume bottle inspired by {argument name="brand label" default="N°5 CHANEL PARIS PARFUM"}, placed upright on a glossy black marble surface with white veining, surrounded by scattered {argument name="flowers" default="chamomile blossoms"}, dramatic side lighting creating specular highlights on the glass, ultra-detailed glass texture, photorealistic rendering, 8K, luxury advertising style | → s3 | ||||
| s3 | 用 AI生图工具 元素生成 从 提示词 生成 成品图 | 主体生成 | /表象/视觉/实体/物品/起居物品/美妆护肤 | /架构/逻辑/信息编排逻辑/条目列举/分段结构/规范框架 | 程序控制类型/指令/提示词 | 参数化提示词模板 | A luxurious cinematic product photograph of a classic rectangular perfume bottle inspired by {argument name="brand label" default="N°5 CHANEL PARIS PARFUM"}, placed upright on a glossy black marble surface with white veining, surrounded by scattered {argument name="flowers" default="chamomile blossoms"}, dramatic side lighting creating specular highlights on the glass, ultra-detailed glass texture, photorealistic rendering, 8K, luxury advertising style | ← s2.参数化提示词模板 | <AI生图工具> | 生成/元素生成 | A luxurious cinematic product photograph of a classic rectangular perfume bottle inspired by {argument name="brand label" default="N°5 CHANEL PARIS PARFUM"}, placed upright on a glossy black marble surface with white veining, surrounded by scattered {argument name="flowers" default="chamomile blossoms"}, dramatic side lighting creating specular highlights on the glass, ultra-detailed glass texture, photorealistic rendering, 8K, luxury advertising style | 替换 brand label 参数即可切换品牌,替换 flowers 参数即可改变装饰风格;GPT-Image-2 / 即梦均支持此提示词结构;适用场景:电商产品图批量生成、品牌系列素材、社交媒体模板图 | - | 随机 | /表象/视觉/实体/物品/起居物品/美妆护肤 | /呈现/视觉/视觉制作/实景拍摄 | 内容类型/成品/成品图 | 商品主图 | <AI生成的香水瓶商品主图:Jimmy Choo香水瓶,深色渐变玻璃瓶身+金色JC标志,置于黑色大理石台面,金属花瓶和水晶碗陪衬,高端奢华广告风格,Pollo.ai水印> | → 返回 商品主图 | ||||
| ↩ | 返回 商品主图 | |||||||||||||||||||||||
| 需求 | 输入 | 实现 | 输出 | |||||||||||||||||||||
|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
| # | 目的 | 作用 | 实质 | 形式 | 类型 | 变量名 | 值 | 来源 | 外部工具 | 动作 | 指令 | 配置 | 运行 | 备注 | 逻辑控制 | 特性 | 实质 | 形式 | 类型 | 变量名 | 值 | 去处 | ||
| s1 | 用 human 结构生成 从 描述 编写精确的 提示词 | 预处理 | /理念/事件/商业事件/推广活动 | /架构/修辞/语调风格/平实表达/直白陈述 | 程序控制类型/指令/描述 | 布局需求描述 | 4格日系广告Banner(2x2网格),各象限主题分别为:旅行(冲绳旅行3日 39,800日元)、护肤(透明感水光肌 初回限定78%OFF 1,980日元)、美食(黑毛和牛A4/A5豪华牛排 期间限定4,980日元)、学习(在线资格讲座 10万人受讲 20%OFF) | ← 工序输入 | human | 生成/关系生成/结构生成 | 为每个区域明确标注:position(位置)、theme(主题)、subject(主体描述)、text_labels(画面内文字数组);顶层用 type 字段说明整体图像格式,layout.structure 描述网格结构 | AI模型对结构化输入的理解力远超松散描述;JSON强制理清布局逻辑,模型更容易「按图施工」;在即梦里生成多区域海报、产品展示板时,结构化描述效果会有质变;适用场景:多区域Banner、品牌设计板、UI界面生成、信息图布局 | - | 人工 | /理念/事件/商业事件/推广活动 | /架构/逻辑/信息编排逻辑/条目列举/分段结构/规范框架 | 程序控制类型/指令/提示词 | JSON结构化提示词 | { "type": "2x2 grid of Japanese digital advertisement banners", "layout": { "structure": "4 equal quadrants", "quadrants": [ { "position": "top-left", "theme": "Travel", "subject": "A couple holding hands on a white sand beach with turquoise water in Okinawa, bright tropical sky", "text_labels": ["今年こそ、解き放て。", "沖縄旅行", "3日間の癒やし旅", "39,800円〜", "航空券+ホテル", "往復航空券", "人気ホテル宿泊", "レンタカー付き", "絶景、グルメ、体験ぜんぶ叶う!"] }, { "position": "top-right", "theme": "Skincare", "subject": "Close-up of a young woman's face applying glowing skincare cream, skin radiant and clear", "text_labels": ["毛穴・くすみ卒業!", "透明感あふれる水光肌へ", "新感覚スキンケア", "毛穴ケア", "高保湿", "ハリ・ツヤ", "初回限定 78%OFF", "1,980円"] }, { "position": "bottom-left", "theme": "Food", "subject": "Premium A5 Wagyu beef steak sizzling on a grill, close-up, steam and fat marbling visible", "text_labels": ["とろける旨さ!", "黒毛和牛 A4 A5等級 贅沢ステーキ", "期間限定 特別価格", "通価格8,980円 4,980円"] }, { "position": "bottom-right", "theme": "Education", "subject": "Young man studying efficiently with smartphone at a bright modern desk", "text_labels": ["スキマ時間で最短合格!", "オンライン資格講座", "スマホで完結", "効率学習で差がつく!", "受講者数10万人突破!", "今だけ! 受講料20%OFF"] } ] } } | → s2 | ||||
| s2 | 用 AI生图工具 元素生成 将 提示词 渲染为精确布局的 成品图 | 主体生成 | /理念/事件/商业事件/推广活动 | /架构/逻辑/信息编排逻辑/条目列举/分段结构/规范框架 | 程序控制类型/指令/提示词 | JSON结构化提示词 | { "type": "2x2 grid of Japanese digital advertisement banners", "layout": { "structure": "4 equal quadrants", "quadrants": [ {"position": "top-left", "theme": "Travel", "subject": "A couple holding hands on a white sand beach with turquoise water in Okinawa, bright tropical sky", "text_labels": ["今年こそ、解き放て。", "沖縄旅行", "3日間の癒やし旅", "39,800円〜", "航空券+ホテル", "往復航空券", "人気ホテル宿泊", "レンタカー付き", "絶景、グルメ、体験ぜんぶ叶う!"]}, {"position": "top-right", "theme": "Skincare", "subject": "Close-up of a young woman's face applying glowing skincare cream, skin radiant and clear", "text_labels": ["毛穴・くすみ卒業!", "透明感あふれる水光肌へ", "初回限定 78%OFF", "1,980円"]}, {"position": "bottom-left", "theme": "Food", "subject": "Premium A5 Wagyu beef steak sizzling on a grill, close-up, steam and fat marbling visible", "text_labels": ["黒毛和牛 A4 A5等級 贅沢ステーキ", "期間限定 特別価格", "4,980円"]}, {"position": "bottom-right", "theme": "Education", "subject": "Young man studying efficiently with smartphone at a bright modern desk", "text_labels": ["スキマ時間で最短合格!", "受講者数10万人突破!", "受講料20%OFF"]} ] } } | ← s1.JSON结构化提示词 | <AI生图工具> | 生成/元素生成 | {
"type": "2x2 grid of Japanese digital advertisement banners",
"layout": {
"structure": "4 equal quadrants",
"quadrants": [
{"position": "top-left", "theme": "Travel", "subject": "A couple holding hands on a white sand beach with turquoise water in Okinawa, bright tropical sky", "text_labels": ["今年こそ、解き放て。", "沖縄旅行", "3日間の癒やし旅", "39,800円〜", "航空券+ホテル", "往復航空券", "人気ホテル宿泊", "レンタカー付き", "絶景、グルメ、体験ぜんぶ叶う!"]},
{"position": "top-right", "theme": "Skincare", "subject": "Close-up of a young woman's face applying glowing skincare cream, skin radiant and clear", "text_labels": ["毛穴・くすみ卒業!", "透明感あふれる水光肌へ", "初回限定 78%OFF", "1,980円"]},
{"position": "bottom-left", "theme": "Food", "subject": "Premium A5 Wagyu beef steak sizzling on a grill, close-up, steam and fat marbling visible", "text_labels": ["黒毛和牛 A4 A5等級 贅沢ステーキ", "期間限定 特別価格", "4,980円"]},
{"position": "bottom-right", "theme": "Education", "subject": "Young man studying efficiently with smartphone at a bright modern desk", "text_labels": ["スキマ時間で最短合格!", "受講者数10万人突破!", "受講料20%OFF"]}
]
}
} | - | 随机 | /理念/事件/商业事件/推广活动 | /呈现/视觉/视觉制作/构图编排/版面设计/版面结构 | 内容类型/成品/成品图 | 多区域广告图 | <AI生成的4格日系广告Banner:左上冲绳旅行(海滩情侣背影+日文旅行信息+价格39,800円),右上护肤品(水光肌特写+品牌LUMIÈRE+折扣信息1,980円),左下黑毛和牛牛排(特写冒烟+价格4,980円),右下在线资格讲座(学习男生+10万人突破+20%OFF)> | → 返回 多区域广告图 | |||||
| ↩ | 返回 多区域广告图 | |||||||||||||||||||||||
| 需求 | 输入 | 实现 | 输出 | |||||||||||||||||||||
|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
| # | 目的 | 作用 | 实质 | 形式 | 类型 | 变量名 | 值 | 来源 | 外部工具 | 动作 | 指令 | 配置 | 运行 | 备注 | 逻辑控制 | 特性 | 实质 | 形式 | 类型 | 变量名 | 值 | 去处 | ||
| s1 | 用 human 解构 从 描述 提炼五要素得到 提示词 | 预处理 | /表象/视觉/空间/空间场所/生活场景/商业场所 | /架构/修辞/语调风格/平实表达/直白陈述 | 程序控制类型/指令/描述 | 拍摄场景描述 | 便利店夜晚场景,女性中景,电影感街拍风格,有霓虹灯光效,胶片质感 | ← 工序输入 | human | 提取/化学提取/解构 | 按公式拆解摄影五要素:{胶片类型/拍摄格式} + {光线描述} + {人物描述} + {构图/景别} + {后期风格};将口语化描述替换为专业摄影术语(如「拍一个好看女孩」→「35mm film photography / medium shot / authentic film grain」) | AI绘图模型在训练数据中见过大量带EXIF标签的摄影作品;使用35mm film / cinematic lighting / editorial style等术语,等于调取模型「专业摄影」的深层表征;不要写「拍一个漂亮的便利店女孩」,要写摄影行话 | - | 人工 | /表象/视觉/实体/物品/影像物品/艺术创作 | /架构/逻辑/信息编排逻辑/条目列举/逐条罗列/通用列举 | 程序控制类型/指令/提示词 | 摄影要素清单 | 胶片格式: 35mm film photography / 光线: harsh convenience store fluorescent lighting mixed with colorful neon signs from outside / 质感: authentic film grain, high contrast, slight color cast / 构图景别: intimate medium shot / 后期风格: cinematic street editorial style | → s2 | ||||
| s2 | 用 human 结构生成 将 提示词 拼接为完整摄影指令 提示词 | 预处理 | /表象/视觉/实体/物品/影像物品/艺术创作 | /架构/逻辑/信息编排逻辑/条目列举/逐条罗列/通用列举 | 程序控制类型/指令/提示词 | 摄影要素清单 | 胶片格式: 35mm film photography / 光线: harsh convenience store fluorescent lighting mixed with colorful neon signs from outside / 质感: authentic film grain, high contrast, slight color cast / 构图景别: intimate medium shot / 后期风格: cinematic street editorial style | ← s1.摄影要素清单 | human | 生成/关系生成/结构生成 | 按{胶片类型} + {光线} + {人物描述} + {构图/景别} + {后期风格}顺序拼接各要素;所有风格参数用英文专业术语;人物描述可用中英混合 | - | 人工 | /表象/视觉/实体/人物/人物特征/形象呈现 | /架构/逻辑/信息编排逻辑/条目列举/分段结构/规范框架 | 程序控制类型/指令/提示词 | 摄影指令提示词 | 35mm film photography with harsh convenience store fluorescent lighting mixed with colorful neon signs from outside, authentic film grain, high contrast, slight color cast, cinematic street editorial style, intimate medium shot, young Asian woman in casual white button-down shirt and black mini skirt, leaning against glass refrigerator door, holding a drink bottle, messy bun hairstyle, natural makeup, photorealistic | → s3 | |||||
| s3 | 用 AI生图工具 元素生成 从 提示词 生成 成品图 | 主体生成 | /表象/视觉/实体/人物/人物特征/形象呈现 | /架构/逻辑/信息编排逻辑/条目列举/分段结构/规范框架 | 程序控制类型/指令/提示词 | 摄影指令提示词 | 35mm film photography with harsh convenience store fluorescent lighting mixed with colorful neon signs from outside, authentic film grain, high contrast, slight color cast, cinematic street editorial style, intimate medium shot, young Asian woman in casual white button-down shirt and black mini skirt, leaning against glass refrigerator door, holding a drink bottle, messy bun hairstyle, natural makeup, photorealistic | ← s2.摄影指令提示词 | <AI生图工具> | 生成/元素生成 | 35mm film photography with harsh convenience store fluorescent lighting mixed with colorful neon signs from outside, authentic film grain, high contrast, slight color cast, cinematic street editorial style, intimate medium shot, young Asian woman in casual white button-down shirt and black mini skirt, leaning against glass refrigerator door, holding a drink bottle, messy bun hairstyle, natural makeup, photorealistic | 即梦3.0的文字增强和智能参考功能对此类结构化摄影描述响应更好;适用场景:人像摄影、产品摄影、氛围感场景图 | - | 随机 | /表象/视觉/实体/人物/人物特征/形象呈现 | /呈现/视觉/视觉风格/视觉艺术风格/影视风格/胶片摄影 | 内容类型/成品/成品图 | 电影感人像照 | <AI生成的便利店霓虹人像:年轻亚裔女性,白色半透明衬衫+黑色短裙,倚着便利店冰柜玻璃门,手持棕色饮料瓶,荧光灯+霓虹灯混合光效,35mm胶片颗粒感,高对比度电影街拍风格> | → 返回 电影感人像照 | ||||
| ↩ | 返回 电影感人像照 | |||||||||||||||||||||||
| 需求 | 输入 | 实现 | 输出 | |||||||||||||||||||||
|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
| # | 目的 | 作用 | 实质 | 形式 | 类型 | 变量名 | 值 | 来源 | 外部工具 | 动作 | 指令 | 配置 | 运行 | 备注 | 逻辑控制 | 特性 | 实质 | 形式 | 类型 | 变量名 | 值 | 去处 | ||
| s1 | 用 human 解构 从 描述 提炼温泉场景五要素 提示词 | 预处理 | /表象/视觉/空间/空间场所 | /架构/修辞/语调风格/平实表达/直白陈述 | 程序控制类型/指令/描述 | 拍摄场景描述 | 日式温泉旅馆(onsen ryokan)人像,暖色木质灯笼光源,editorial高大气感风格,胶片质感,女性 | ← 工序输入 | human | 提取/化学提取/解构 | 按公式拆解摄影五要素:{胶片类型/拍摄格式} + {光线描述} + {人物描述} + {构图/景别} + {后期风格};温泉场景的光线描述重点:warm vintage aesthetic + wooden lantern lighting + natural window light | 与便利店场景的区别在于光线(harsh fluorescent → warm lantern)和整体美学基调(street editorial → vintage Japanese aesthetic);切换场景只需替换光线+美学两要素,其余框架不变 | - | 人工 | /表象/视觉/实体/物品/影像物品/艺术创作 | /架构/逻辑/信息编排逻辑/条目列举/逐条罗列/通用列举 | 程序控制类型/指令/提示词 | 摄影要素清单 | 胶片格式: 35mm film photography / 光线: warm vintage Japanese onsen ryokan aesthetic, soft ambient wooden lantern lighting mixed with gentle natural window light / 质感: subtle film grain, gentle color shift / 构图景别: high atmosphere editorial style / 后期风格: vintage Japanese aesthetic | → s2 | ||||
| s2 | 用 human 结构生成 将温泉场景 提示词 拼接为完整 提示词 | 预处理 | /表象/视觉/实体/物品/影像物品/艺术创作 | /架构/逻辑/信息编排逻辑/条目列举/逐条罗列/通用列举 | 程序控制类型/指令/提示词 | 摄影要素清单 | 胶片格式: 35mm film photography / 光线: warm vintage Japanese onsen ryokan aesthetic, soft ambient wooden lantern lighting mixed with gentle natural window light / 质感: subtle film grain, gentle color shift / 构图景别: high atmosphere editorial style / 后期风格: vintage Japanese aesthetic | ← s1.摄影要素清单 | human | 生成/关系生成/结构生成 | 按五要素顺序拼接:35mm film photography + warm vintage Japanese onsen ryokan aesthetic + 人物描述 + editorial style + 质感参数 | - | 人工 | /表象/视觉/实体/人物/人物特征/形象呈现 | /架构/逻辑/信息编排逻辑/条目列举/分段结构/规范框架 | 程序控制类型/指令/提示词 | 摄影指令提示词 | 35mm film photography, warm vintage Japanese onsen ryokan aesthetic, soft ambient wooden lantern lighting mixed with gentle natural window light, subtle film grain, gentle color shift, high atmosphere editorial style, young Asian woman in traditional Japanese yukata robe, sitting gracefully on wooden veranda, hot spring visible in background, photorealistic | → s3 | |||||
| s3 | 用 AI生图工具 元素生成 从 提示词 生成 成品图 | 主体生成 | /表象/视觉/实体/人物/人物特征/形象呈现 | /架构/逻辑/信息编排逻辑/条目列举/分段结构/规范框架 | 程序控制类型/指令/提示词 | 摄影指令提示词 | 35mm film photography, warm vintage Japanese onsen ryokan aesthetic, soft ambient wooden lantern lighting mixed with gentle natural window light, subtle film grain, gentle color shift, high atmosphere editorial style, young Asian woman in traditional Japanese yukata robe, sitting gracefully on wooden veranda, hot spring visible in background, photorealistic | ← s2.摄影指令提示词 | <AI生图工具> | 生成/元素生成 | 35mm film photography, warm vintage Japanese onsen ryokan aesthetic, soft ambient wooden lantern lighting mixed with gentle natural window light, subtle film grain, gentle color shift, high atmosphere editorial style, young Asian woman in traditional Japanese yukata robe, sitting gracefully on wooden veranda, hot spring visible in background, photorealistic | 温泉旅馆场景与便利店场景属同一公式(摄影指令)的不同应用实例;两者提示词框架相同,只替换光线描述和场景美学方向 | - | 随机 | /表象/视觉/实体/人物/人物特征/形象呈现 | /呈现/视觉/视觉风格/视觉艺术风格/影视风格/胶片摄影 | 内容类型/成品/成品图 | 温泉旅馆人像 | <AI生成的温泉旅馆editorial人像:年轻亚裔女性,浅色宽松和风浴衣,坐在木质台阶上,背景可见温泉热水,室内木质灯笼暖光,胶片颗粒感,高大气感editorial风格> | → 返回 温泉旅馆人像 | ||||
| ↩ | 返回 温泉旅馆人像 | |||||||||||||||||||||||
| 需求 | 输入 | 实现 | 输出 | |||||||||||||||||||||
|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
| # | 目的 | 作用 | 实质 | 形式 | 类型 | 变量名 | 值 | 来源 | 外部工具 | 动作 | 指令 | 配置 | 运行 | 备注 | 逻辑控制 | 特性 | 实质 | 形式 | 类型 | 变量名 | 值 | 去处 | ||
| s1 | 用 human 结构生成 从 描述 撰写聚焦主体构图的 提示词 | 预处理 | /表象/视觉/实体/物品/起居物品/食物 | /架构/修辞/语调风格/平实表达/直白陈述 | 程序控制类型/指令/描述 | 商品描述 | 汉堡产品图,需要精确放置品牌标识、增强光影效果、添加背景虚化 | ← 工序输入 | human | 生成/关系生成/结构生成 | 只描述基础构图和主体形态(产品形状/摆放/基础光线/构图比例),不写品牌标识和精细细节;确保基础构图到位(主次分明、比例正确、光线方向确定) | 分步法的核心:一步到位的提示词控制力不够;先生成基础画面,再叠加细节,两步走比一步冲更可控;即梦的「智能参考」功能天然支持这种工作流 | - | 人工 | /表象/视觉/实体/物品/起居物品/食物 | /架构/逻辑/信息编排逻辑/条目列举/分段结构/规范框架 | 程序控制类型/指令/提示词 | 基础构图提示词 | <基础构图提示词:product photography of a gourmet burger, centered composition, layers clearly visible (bun / lettuce / tomato / beef patty / cheese), studio lighting from top-left, white/neutral background, sharp focus on burger> | → s2 | ||||
| s2 | 用 AI生图工具 元素生成 从 提示词 生成主体 底图 | 主体生成 | /表象/视觉/实体/物品/起居物品/食物 | /架构/逻辑/信息编排逻辑/条目列举/分段结构/规范框架 | 程序控制类型/指令/提示词 | 基础构图提示词 | <基础构图提示词:product photography of a gourmet burger, centered composition, layers clearly visible (bun / lettuce / tomato / beef patty / cheese), studio lighting from top-left, white/neutral background, sharp focus on burger> | ← s1.基础构图提示词 | <AI生图工具> | 生成/元素生成 | <基础构图提示词:product photography of a gourmet burger, centered composition, layers clearly visible (bun / lettuce / tomato / beef patty / cheese), studio lighting from top-left, white/neutral background, sharp focus on burger> | 此directive内容为推断值(原文公式四未给出具体提示词文本),从上游s1输出透传而来 | - | 随机 | /表象/视觉/实体/物品/起居物品/食物 | /呈现/视觉/视觉制作/实景拍摄 | 内容类型/半成品/原子/底图 | 基础汉堡图 | <AI生成的基础汉堡构图:汉堡居中,食材层次分明,基础光线和构图到位,无品牌标识,白色/中性背景> | → s3, s4 | ||||
| s3 | 用 human 结构生成 从 底图 和 描述 撰写 提示词 | 预处理 | /表象/视觉/实体/物品/起居物品/食物 | /呈现/视觉/视觉制作/实景拍摄 | 内容类型/半成品/原子/底图 | 基础汉堡图 | <AI生成的基础汉堡构图:汉堡居中,食材层次分明,基础光线和构图到位,无品牌标识,白色/中性背景> | ← s2.基础汉堡图 | human | 生成/关系生成/结构生成 | 以基础图为参考,描述需要叠加的细节:品牌标识位置和样式、光影强化方向、背景虚化程度;在即梦中使用「智能参考」上传基础图,再添加叠加提示词 | 「基于参考图做风格迁移或细节修改」是即梦3.0智能参考功能的核心能力;复杂创意不要指望一条提示词搞定所有事 | - | 人工 | /表象/视觉/实体/物品/起居物品/食物 | /架构/逻辑/信息编排逻辑/条目列举/分段结构/规范框架 | 程序控制类型/指令/提示词 | 叠加效果提示词 | <叠加提示词:based on this burger image, add brand logo in top-left corner, enhance warm side lighting with golden highlights, add bokeh background effect, increase food texture detail and steam> | → s4 | ||||
| /表象/视觉/符号/文字符号/水印 | /架构/修辞/语调风格/平实表达/直白陈述 | 程序控制类型/指令/描述 | 品牌细节规格 | <品牌标识规格:logo位置(左上角)、光影强化(温暖侧光)、背景虚化(大光圈bokeh)> | ← 工序输入 | |||||||||||||||||||
| s4 | 用 AI生图工具 元素生成 按 提示词 对 底图 叠加细节生成 成品图 | 主体生成 | /表象/视觉/实体/物品/起居物品/食物 | /架构/逻辑/信息编排逻辑/条目列举/分段结构/规范框架 | 程序控制类型/指令/提示词 | 叠加效果提示词 | <叠加提示词:based on this burger image, add brand logo in top-left corner, enhance warm side lighting with golden highlights, add bokeh background effect, increase food texture detail and steam> | ← s3.叠加效果提示词 | <AI生图工具> | 生成/元素生成 | <叠加提示词:based on this burger image, add brand logo in top-left corner, enhance warm side lighting with golden highlights, add bokeh background effect, increase food texture detail and steam> | 此directive内容为推断值(叠加提示词由上游s3推断生成);即梦「智能参考」模式:上传基础汉堡图为参考,叠加提示词描述新增内容;适用场景:复杂产品图、需要精确品牌元素的创意图、多轮迭代优化 | - | 随机 | /表象/视觉/实体/物品/起居物品/食物 | /呈现/视觉/视觉制作/实景拍摄 | 内容类型/成品/成品图 | 精修商品图 | <最终精修的汉堡产品图:品牌标识精确放置,温暖侧光增强,背景自然虚化,食材纹理和蒸汽细节丰富,广告级商品图质量> | → 返回 精修商品图 | ||||
| /表象/视觉/实体/物品/起居物品/食物 | /呈现/视觉/视觉制作/实景拍摄 | 内容类型/半成品/原子/底图 | 基础汉堡图 | <AI生成的基础汉堡构图:汉堡居中,食材层次分明,基础光线和构图到位,无品牌标识> | ← s2.基础汉堡图 | |||||||||||||||||||
| ↩ | 返回 精修商品图 | |||||||||||||||||||||||
| 需求 | 输入 | 实现 | 输出 | |||||||||||||||||||||
|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
| # | 目的 | 作用 | 实质 | 形式 | 类型 | 变量名 | 值 | 来源 | 外部工具 | 动作 | 指令 | 配置 | 运行 | 备注 | 逻辑控制 | 特性 | 实质 | 形式 | 类型 | 变量名 | 值 | 去处 | ||
| s1 | 用 human 结构生成 从 描述 撰写极简 提示词 | 预处理 | /表象/视觉/实体/人物/人物特征/形象呈现 | /架构/修辞/语调风格/平实表达/直白陈述 | 程序控制类型/指令/描述 | 转换风格描述 | 将图中人物转换为真实动画(anime)的截图风格 | ← 工序输入 | human | 生成/关系生成/结构生成 | 一句话转换指令:直接描述目标风格输出形式;极简指令往往效果更好;避免过度描述细节,以免干扰AI对参考图的理解 | 参考图消除了「语言描述和视觉想象之间的信息损耗」;即梦3.0的智能参考功能——上传参考图后,AI从图像中提取构图、色调、风格信息,再按指令做定向修改;这是文字提示词无法替代的能力 | - | 人工 | /表象/视觉/实体/人物/人物特征/形象呈现 | /架构/修辞/语调风格/平实表达/直白陈述 | 程序控制类型/指令/提示词 | 转换指令提示词 | Show me the attached image as a snapshot from an actual anime | → s2 | ||||
| s2 | 用 AI生图工具 元素生成 将 参考图 按 提示词 转换为 成品图 | 主体生成 | /表象/视觉/实体/人物/人物特征/形象呈现 | /呈现/视觉/视觉制作/实景拍摄 | 内容类型/素材/化学变化/参考图 | 参考图 | <实拍照片:人物实拍照(女性),用于转换为动漫风格截图> | ← 工序输入 | <AI生图工具> | 生成/元素生成 | Show me the attached image as a snapshot from an actual anime | 输入:参考图(实拍人物照)+ 转换指令;AI从参考图提取构图、色调、角色特征,输出动漫截图风格;即梦3.0智能参考模式天然支持此工作流;适用场景:风格转换(实拍转动漫)、角色设定资料、基于品牌素材的再创作 | - | 随机 | /表象/视觉/实体/人物/人物特征/形象呈现 | /呈现/视觉/视觉风格/视觉艺术风格/绘画风格/卡通 | 内容类型/成品/成品图 | 动漫风格图 | <AI生成的动漫截图风格图:女性角色,黑色长发,深色大眼,哥特风黑色洋装+蕾丝领,泪眼含泪,深蓝色暗调动漫画风,呈现为「实际动漫」截图质感> | → 返回 动漫风格图 | ||||
| /表象/视觉/实体/人物/人物特征/形象呈现 | /架构/修辞/语调风格/平实表达/直白陈述 | 程序控制类型/指令/提示词 | 转换指令提示词 | Show me the attached image as a snapshot from an actual anime | ← s1.转换指令提示词 | |||||||||||||||||||
| ↩ | 返回 动漫风格图 | |||||||||||||||||||||||
| 需求 | 输入 | 实现 | 输出 | |||||||||||||||||||||
|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
| # | 目的 | 作用 | 实质 | 形式 | 类型 | 变量名 | 值 | 来源 | 外部工具 | 动作 | 指令 | 配置 | 运行 | 备注 | 逻辑控制 | 特性 | 实质 | 形式 | 类型 | 变量名 | 值 | 去处 | ||
| s1 | 用 human 结构生成 从 描述 撰写日文 提示词 | 预处理 | /表象/视觉/实体/人物/人物特征/形象呈现 | /架构/修辞/语调风格/平实表达/直白陈述 | 程序控制类型/指令/描述 | 设定资料规格 | Persona5风格角色设定卡,需要:正面/侧面/背面三视图、表情差分、服装分解、色板;基于已有角色图生成 | ← 工序输入 | human | 生成/关系生成/结构生成 | 用日文撰写角色设定资料提示词,指定设定卡格式要求(三视图/表情差分/服装分解/色板);日文「設定資料」「キャラクターシート」等术语直接触发特定的专业动画/游戏风格 | 日文提示词在特定风格(设计资料、动漫角色设定)上有语义优势——「設定資料」直接命中模型训练数据中的专业动画设定资料分类;适用场景:角色设定资料、基于品牌素材的再创作;纯日文提示词同样能生成高质量图像 | - | 人工 | /表象/视觉/实体/人物/人物特征/形象呈现 | /架构/逻辑/信息编排逻辑/条目列举/分段结构/规范框架 | 程序控制类型/指令/提示词 | 角色设定提示词 | このキャラクターと背景を元に、公式設定資料のようなキャラクターシートを作成してください。・正面、側面、背面の3面図を含める・表情差分(通常・笑顔・驚き・怒り)を追加・服装の各パーツを分解して詳細に描画・カラーパレットと素材の説明を含める・Persona5スタイルのグラフィックデザインで構成 | → s2 | ||||
| s2 | 用 AI生图工具 元素生成 从 参考图 和 提示词 生成 成品图 | 主体生成 | /表象/视觉/实体/人物/个体/虚构人物 | /呈现/视觉/视觉风格/视觉艺术风格/绘画风格/卡通 | 内容类型/素材/化学变化/参考图 | 角色参考图 | <已有角色图:女性战士角色(ソルジャンヌ),红黑色装甲战衣,蓝色能量核心,用于生成设定资料> | ← 工序输入 | <AI生图工具> | 生成/元素生成 | このキャラクターと背景を元に、公式設定資料のようなキャラクターシートを作成してください。・正面、側面、背面の3面図を含める・表情差分(通常・笑顔・驚き・怒り)を追加・服装の各パーツを分解して詳細に描画・カラーパレットと素材の説明を含める・Persona5スタイルのグラフィックデザインで構成 | 一条提示词完成整套设定资料;GPT-Image-2的CJK优化让日文提示词不再「打酱油」;即梦对日文描述同样有良好支持 | - | 随机 | /表象/视觉/实体/人物/人物特征/形象呈现 | /呈现/视觉/视觉风格/视觉艺术风格/绘画风格/卡通 | 内容类型/成品/成品图 | 角色设定卡 | <AI生成的ソルジャンヌ・スーツ角色设定卡:6格展示手动装备战衣的完整流程(1.确认内装+传感器 → 2.胸部肩部装甲 → 3.腰部ユニット固定 → 4.头盔准备 → 5.头盔装着+系统启动 → 6.装备完成),每格附日文说明,整体呈现Persona5风格官方设定资料格式> | → 返回 角色设定卡 | ||||
| /表象/视觉/实体/人物/人物特征/形象呈现 | /架构/逻辑/信息编排逻辑/条目列举/分段结构/规范框架 | 程序控制类型/指令/提示词 | 角色设定提示词 | このキャラクターと背景を元に、公式設定資料のようなキャラクターシートを作成してください。・正面、側面、背面の3面図を含める・表情差分(通常・笑顔・驚き・怒り)を追加・服装の各パーツを分解して詳細に描画・カラーパレットと素材の説明を含める・Persona5スタイルのグラフィックデザインで構成 | ← s1.角色设定提示词 | |||||||||||||||||||
| ↩ | 返回 角色设定卡 | |||||||||||||||||||||||
| 需求 | 输入 | 实现 | 输出 | |||||||||||||||||||||
|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
| # | 目的 | 作用 | 实质 | 形式 | 类型 | 变量名 | 值 | 来源 | 外部工具 | 动作 | 指令 | 配置 | 运行 | 备注 | 逻辑控制 | 特性 | 实质 | 形式 | 类型 | 变量名 | 值 | 去处 | ||
| s1 | 用 human 结构生成 从 描述 构建中英协同的 提示词 | 预处理 | /表象/视觉/实体/物品/起居物品/食物 /表象/视觉/实体/物品/器物物品/道具 | /架构/修辞/语调风格/平实表达/直白陈述 | 程序控制类型/指令/描述 | 内容主题描述 | 成都美食地图,手绘风格,鸟瞰视角,包含12个知名美食地点(串串香、红油水饺、三大炮、盖碗茶、冰粉、小龙坎火锅、钵钵鸡等),标注地标建筑和主要道路,整体暖色系手绘质感 | ← 工序输入 | human | 生成/关系生成/结构生成 | 按语言分工原则构建提示词:中文负责场景细节(如「九宫格锅翻滚冒泡」「串串香一把竹签插着各种食材冒着热气」);英文锁定风格参数(如「watercolor illustration」「warm color palette」);日文匹配特定风格标签(如「設定資料」);各语言在各自擅长的维度上配合 | 即梦的中文语义理解在国产工具中是第一梯队的;GPT-Image-2的CJK优化让中文提示词不再「打酱油」;混合使用时出图精度远超单语言提示词;中文描述场景细节(「九宫格锅翻滚冒泡」)、英文锁定风格参数(「watercolor illustration」)、各语言在各自擅长的维度上配合 | - | 人工 | /表象/视觉/实体/物品/起居物品/食物 /表象/视觉/实体/物品/器物物品/道具 | /架构/逻辑/信息编排逻辑/条目列举/分段结构/规范框架 | 程序控制类型/指令/提示词 | 多语言混合提示词 | 一张手绘风格的城市美食地图,以成都为主题。画面以鸟瞰视角的手绘简化城市地图为底,标注主要道路和地标但不追求精确比例而是追求可爱的手绘感。地图上分布着12个美食地点的精致手绘小插画:春熙路的串串香(一把竹签插着各种食材冒着热气)、宽窄巷子的三大炮(三个糯米团子飞向铜盘)、玉林路的小龙坎火锅(九宫格锅翻滚冒泡,越煮越巴适)、东郊记忆的冒椒麻辣(冒菜要冒到头),武侯祠大街的钵钵鸡(冷锅串串)、香港巷的肥肠粉(红薯粉Q弹),人民公园鹤鸣茶社的盖碗茶(茶碗与茶盖),锦里古街的冰粉(手握冰粉碗),双流老妈兔头(麻辣入味),建设路叶婆婆烘蛋糕(外酥里软),钟水饺(总店,红油水饺),陈麻婆豆腐(麻辣鲜香)。左上角标题「成都·吃货暴走地图」使用胖圆的手绘美术字配辣椒装饰。整体画风为水彩+彩铅混合的手绘质感,颜色以暖色系为主,边框用辣椒和植物装饰,右下角有图例说明和指南针。watercolor illustration, handmade texture, warm color palette, cozy illustrated map style | → s2 | ||||
| s2 | 用 AI生图工具 元素生成 将 提示词 渲染为精细的 成品图 | 主体生成 | /表象/视觉/实体/物品/起居物品/食物 /表象/视觉/实体/物品/器物物品/道具 | /架构/逻辑/信息编排逻辑/条目列举/分段结构/规范框架 | 程序控制类型/指令/提示词 | 多语言混合提示词 | 一张手绘风格的城市美食地图,以成都为主题。画面以鸟瞰视角的手绘简化城市地图为底,标注主要道路和地标但不追求精确比例而是追求可爱的手绘感。地图上分布着12个美食地点的精致手绘小插画:春熙路的串串香(一把竹签插着各种食材冒着热气)、宽窄巷子的三大炮(三个糯米团子飞向铜盘)、玉林路的小龙坎火锅(九宫格锅翻滚冒泡,越煮越巴适)、东郊记忆的冒椒麻辣,武侯祠大街的钵钵鸡(冷锅串串),人民公园鹤鸣茶社的盖碗茶,锦里古街的冰粉(手握冰粉碗),双流老妈兔头,建设路叶婆婆烘蛋糕,钟水饺(总店),陈麻婆豆腐(麻辣鲜香)。左上角标题「成都·吃货暴走地图」使用胖圆的手绘美术字配辣椒装饰。整体画风为水彩+彩铅混合的手绘质感,颜色以暖色系为主,边框用辣椒和植物装饰,右下角有图例说明和指南针。watercolor illustration, handmade texture, warm color palette, cozy illustrated map style | ← s1.多语言混合提示词 | <AI生图工具> | 生成/元素生成 | 一张手绘风格的城市美食地图,以成都为主题。画面以鸟瞰视角的手绘简化城市地图为底,标注主要道路和地标但不追求精确比例而是追求可爱的手绘感。地图上分布着12个美食地点的精致手绘小插画:春熙路的串串香(一把竹签插着各种食材冒着热气)、宽窄巷子的三大炮(三个糯米团子飞向铜盘)、玉林路的小龙坎火锅(九宫格锅翻滚冒泡),武侯祠大街的钵钵鸡,人民公园鹤鸣茶社的盖碗茶,锦里古街的冰粉,双流老妈兔头,建设路叶婆婆烘蛋糕,钟水饺(总店),陈麻婆豆腐...左上角标题「成都·吃货暴走地图」使用胖圆的手绘美术字配辣椒装饰。整体画风为水彩+彩铅混合的手绘质感,颜色以暖色系为主,边框用辣椒和植物装饰。watercolor illustration, handmade texture, warm color palette, cozy illustrated map style | GPT-Image-2的CJK优化让中文场景细节描述能被模型正确理解;「串串香(一把竹签插着各种食材冒着热气)」这类中文细节描述远比英文版精准;适用场景:中文内容图(美食地图、城市海报、中文UI)、日系风格素材、本地化营销图 | - | 随机 | /表象/视觉/实体/物品/起居物品/食物 /表象/视觉/实体/物品/器物物品/道具 | /呈现/视觉/视觉风格/视觉艺术风格/绘画风格/插画 | 内容类型/成品/成品图 | 本地化内容图 | <AI生成的成都吃货暴走地图:手绘水彩风格,鸟瞰成都城市地图,环形路/春熙路/宽窄巷子/锦里等地标可辨,12个美食地点各附精致手绘插画(串串香/水饺/三大炮/盖碗茶/冰粉等),暖黄暖棕色调,辣椒边框装饰,左上角「成都·吃货暴走地图」美术字,右下角图例说明+指南针> | → 返回 本地化内容图 | ||||
| ↩ | 返回 本地化内容图 | |||||||||||||||||||||||
| 需求 | 输入 | 实现 | 输出 | |||||||||||||||||||||
|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
| # | 目的 | 作用 | 实质 | 形式 | 类型 | 变量名 | 值 | 来源 | 外部工具 | 动作 | 指令 | 配置 | 运行 | 备注 | 逻辑控制 | 特性 | 实质 | 形式 | 类型 | 变量名 | 值 | 去处 | ||
| s1 | 用 human 结构生成 从 描述 撰写精确计数的 提示词 | 预处理 | /表象/视觉/实体/物品/起居物品/家居 | /架构/修辞/语调风格/平实表达/直白陈述 | 程序控制类型/指令/描述 | 结构精确性要求 | 三层木质书架计数测试:顶层1本书,第二层3本书,底层7本书,共11本 | ← 工序输入 | human | 生成/关系生成/结构生成 | 用英文撰写精确计数测试提示词;明确标注每个区域/层的数量(如「on the top shelf, there should be one book; on the second shelf, three books; on the bottom shelf, seven books」);语言精准,避免歧义 | 这种提示词不是拿来日常用的,而是评估AI绘图工具能力边界的标尺;先跑「计数测试」和「结构化测试」,就知道当前工具能支撑多复杂的指令;选工具先测能力边界,再谈创作自由度;测试AI的「计数能力」和「空间推理能力」 | - | 人工 | /表象/视觉/实体/物品/起居物品/家居 | /架构/逻辑/信息编排逻辑/条目列举/分段结构/规范框架 | 程序控制类型/指令/提示词 | 结构测试提示词 | A wooden bookshelf consisting of three shelves: On the top shelf, there should be one book, on the second shelf, there should be three books, and on the bottom shelf, there should be seven books. | → s2 | ||||
| s2 | 用 AI生图工具 元素生成 从 提示词 生成 样图 | 主体生成 | /表象/视觉/实体/物品/起居物品/家居 | /架构/逻辑/信息编排逻辑/条目列举/分段结构/规范框架 | 程序控制类型/指令/提示词 | 结构测试提示词 | A wooden bookshelf consisting of three shelves: On the top shelf, there should be one book, on the second shelf, there should be three books, and on the bottom shelf, there should be seven books. | ← s1.结构测试提示词 | <AI生图工具> | 生成/元素生成 | A wooden bookshelf consisting of three shelves: On the top shelf, there should be one book, on the second shelf, there should be three books, and on the bottom shelf, there should be seven books. | GPT-Image-2可以准确完成此计数测试;早期模型大概率数不对;计数准确性和空间推理能力是AI工具能力边界的重要维度 | - | 随机 | /表象/视觉/实体/物品/起居物品/家居 | /呈现/视觉/视觉制作/实景拍摄 | 内容类型/半成品/原子/样图 | 结构验证图 | <AI生成的木质书架图:三层书架,顶层1本深蓝色书「THE ART OF THOUGHT」,中层3本书(绿色「THE NATURAL WORLD」+红色「HISTORY OF CIVILIZATIONS」+蓝色「THE HUMAN SPIRIT」),底层7本书(The Classics/Poetry/Science and Discovery/Art Through the Ages/Explorers and Adventures/Great Minds/Legends and Myths),精确符合1+3+7=11本要求> | → s3 | ||||
| s3 | 用 human 识别 核验 样图 计数准确性,输出 评语 | 检验 | /表象/视觉/实体/物品/起居物品/家居 | /呈现/视觉/视觉制作/实景拍摄 | 内容类型/半成品/原子/样图 | 结构验证图 | <AI生成的木质书架图:三层书架,顶层1本深蓝色书「THE ART OF THOUGHT」,中层3本书,底层7本书,精确符合1+3+7=11本要求> | ← s2.结构验证图 | human | 提取/化学提取/识别 | 逐层清点图像中的书本数量:顶层应为1本,中层应为3本,底层应为7本;记录AI工具的计数准确性;若不符则标记为测试失败,记录实际数量与预期的差异 | - | 人工 | /理念/知识/商业/前沿技术/AI智能/AI应用 | /架构/逻辑/信息编排逻辑/归纳论证/归纳提炼/概括浓缩 | 程序控制类型/评估/评语 | 验证结果 | GPT-Image-2通过验证:书架三层分别有1本(顶)、3本(中)、7本(底),总计11本,精确符合计数和空间推理要求;该工具具备可靠的结构化指令执行能力,可支撑复杂计数约束场景 | → 返回 验证结果 | |||||
| /表象/视觉/实体/物品/起居物品/家居 | /架构/修辞/语调风格/平实表达/直白陈述 | 程序控制类型/指令/描述 | 结构精确性要求 | 三层木质书架计数测试:顶层1本书,第二层3本书,底层7本书,共11本 | ← 工序输入 | |||||||||||||||||||
| ↩ | 返回 验证结果 | |||||||||||||||||||||||