current_capability.json 203 KB

12345678910111213141516171819202122232425262728293031323334353637383940414243444546474849505152535455565758596061626364656667686970717273747576777879808182838485868788899091929394959697989910010110210310410510610710810911011111211311411511611711811912012112212312412512612712812913013113213313413513613713813914014114214314414514614714814915015115215315415515615715815916016116216316416516616716816917017117217317417517617717817918018118218318418518618718818919019119219319419519619719819920020120220320420520620720820921021121221321421521621721821922022122222322422522622722822923023123223323423523623723823924024124224324424524624724824925025125225325425525625725825926026126226326426526626726826927027127227327427527627727827928028128228328428528628728828929029129229329429529629729829930030130230330430530630730830931031131231331431531631731831932032132232332432532632732832933033133233333433533633733833934034134234334434534634734834935035135235335435535635735835936036136236336436536636736836937037137237337437537637737837938038138238338438538638738838939039139239339439539639739839940040140240340440540640740840941041141241341441541641741841942042142242342442542642742842943043143243343443543643743843944044144244344444544644744844945045145245345445545645745845946046146246346446546646746846947047147247347447547647747847948048148248348448548648748848949049149249349449549649749849950050150250350450550650750850951051151251351451551651751851952052152252352452552652752852953053153253353453553653753853954054154254354454554654754854955055155255355455555655755855956056156256356456556656756856957057157257357457557657757857958058158258358458558658758858959059159259359459559659759859960060160260360460560660760860961061161261361461561661761861962062162262362462562662762862963063163263363463563663763863964064164264364464564664764864965065165265365465565665765865966066166266366466566666766866967067167267367467567667767867968068168268368468568668768868969069169269369469569669769869970070170270370470570670770870971071171271371471571671771871972072172272372472572672772872973073173273373473573673773873974074174274374474574674774874975075175275375475575675775875976076176276376476576676776876977077177277377477577677777877978078178278378478578678778878979079179279379479579679779879980080180280380480580680780880981081181281381481581681781881982082182282382482582682782882983083183283383483583683783883984084184284384484584684784884985085185285385485585685785885986086186286386486586686786886987087187287387487587687787887988088188288388488588688788888989089189289389489589689789889990090190290390490590690790890991091191291391491591691791891992092192292392492592692792892993093193293393493593693793893994094194294394494594694794894995095195295395495595695795895996096196296396496596696796896997097197297397497597697797897998098198298398498598698798898999099199299399499599699799899910001001100210031004100510061007100810091010101110121013101410151016101710181019102010211022102310241025102610271028102910301031103210331034103510361037103810391040104110421043104410451046104710481049105010511052105310541055105610571058105910601061106210631064106510661067106810691070107110721073107410751076107710781079108010811082108310841085108610871088108910901091109210931094109510961097109810991100110111021103110411051106110711081109111011111112111311141115111611171118111911201121112211231124112511261127112811291130113111321133113411351136113711381139114011411142114311441145114611471148114911501151115211531154115511561157115811591160116111621163116411651166116711681169117011711172117311741175117611771178117911801181118211831184118511861187118811891190119111921193119411951196119711981199120012011202120312041205120612071208120912101211121212131214121512161217121812191220122112221223122412251226122712281229123012311232123312341235123612371238123912401241124212431244124512461247124812491250125112521253125412551256125712581259126012611262126312641265126612671268126912701271127212731274127512761277127812791280128112821283128412851286128712881289129012911292129312941295129612971298129913001301130213031304130513061307130813091310131113121313131413151316131713181319132013211322132313241325132613271328132913301331133213331334133513361337133813391340134113421343134413451346134713481349135013511352135313541355135613571358135913601361136213631364136513661367136813691370137113721373137413751376137713781379138013811382138313841385138613871388138913901391139213931394139513961397139813991400140114021403140414051406140714081409141014111412141314141415141614171418141914201421142214231424142514261427142814291430143114321433143414351436143714381439144014411442144314441445144614471448144914501451145214531454145514561457145814591460146114621463146414651466146714681469147014711472147314741475147614771478147914801481148214831484148514861487148814891490149114921493149414951496149714981499150015011502150315041505150615071508150915101511151215131514151515161517151815191520152115221523152415251526152715281529153015311532153315341535153615371538153915401541154215431544154515461547154815491550155115521553155415551556155715581559156015611562156315641565156615671568156915701571157215731574157515761577157815791580158115821583158415851586158715881589159015911592159315941595159615971598159916001601160216031604160516061607160816091610161116121613161416151616161716181619162016211622162316241625162616271628162916301631163216331634163516361637163816391640164116421643164416451646164716481649165016511652165316541655165616571658165916601661166216631664166516661667166816691670167116721673167416751676167716781679168016811682168316841685168616871688168916901691169216931694169516961697169816991700170117021703170417051706170717081709171017111712171317141715171617171718171917201721172217231724172517261727172817291730173117321733173417351736173717381739174017411742174317441745174617471748174917501751175217531754175517561757175817591760176117621763176417651766176717681769177017711772177317741775177617771778177917801781178217831784178517861787178817891790179117921793179417951796179717981799180018011802180318041805180618071808180918101811181218131814181518161817181818191820182118221823182418251826182718281829183018311832183318341835183618371838183918401841184218431844184518461847184818491850185118521853185418551856185718581859186018611862186318641865186618671868186918701871187218731874187518761877187818791880188118821883188418851886188718881889189018911892189318941895189618971898189919001901190219031904190519061907190819091910191119121913191419151916191719181919192019211922192319241925192619271928192919301931193219331934193519361937193819391940194119421943194419451946194719481949195019511952195319541955195619571958195919601961196219631964196519661967196819691970197119721973197419751976197719781979198019811982198319841985198619871988198919901991199219931994
  1. [
  2. {
  3. "id": "CAP-001",
  4. "name": "文本到图像生成",
  5. "criterion": "生成图像在内容、风格、构图上与提示词描述一致;反向提示词中的元素未出现在图像中",
  6. "description": "根据文字描述(正向/反向提示词)生成对应图像,是最基础的 AI 图像生成能力。支持通过提示词工程实现复杂场景生成,包括多光源(吊灯、筒灯、窗外自然光)的室内场景、特定色彩氛围(米色调、暖土色调等)、材质描述(木地板、大理石、织物纹理)与光照效果的组合生成。不同AI引擎在同一提示词下表现有差异。"
  7. },
  8. {
  9. "id": "CAP-002",
  10. "name": "结构/姿态控制生成",
  11. "criterion": "生成图像的主体姿态/空间结构与输入的控制图高度吻合;在保持结构约束的同时,图像内容/风格可自由变化",
  12. "description": "以线稿、深度图、姿态骨架、法线图等结构信息为约束条件,控制生成图像的构图、姿态或空间结构。ControlNet 光影控制模型(ioc-controlnet)可精准控制光影方向和强度,实现文字与图像的无缝融合,光影效果自然且可控。结合 3D 模型截图作为结构约束,可在保持建筑/景观设计不变的前提下,自由切换光照时段和光影风格,大幅提升建筑可视化效率。"
  13. },
  14. {
  15. "id": "CAP-003",
  16. "name": "图像主体一致性保持",
  17. "criterion": "生成图像中的主体与参考图在颜色、形状、纹理、关键特征上高度一致;背景/场景可以自由变化",
  18. "description": "以参考图像为输入,在生成新图像时保持参考图中主体(产品、角色、物体)的外观特征不变,使其出现在不同背景、场景或构图中。可实现同一产品在多宫格不同格子中外观特征高度一致,保持品牌视觉统一;批量生成的商品图产品主体无变形,可直接用于电商上架。"
  19. },
  20. {
  21. "id": "CAP-004",
  22. "name": "风格切换与风格控制",
  23. "criterion": "生成图像的视觉风格与目标风格(LoRA/参考图/参数描述)一致;可在同一内容基础上批量切换多种风格并输出",
  24. "description": "通过加载不同的风格模型或风格参数,在保持内容/结构基本不变的前提下,将图像渲染为指定的艺术风格;或通过风格参考图引导生成图像的整体视觉风格。通过风格提示词可在同一场景中快速切换赛博朋克霓虹、体积光、月光等截然不同的光效氛围,支持电影感灯光等多种风格控制。"
  25. },
  26. {
  27. "id": "CAP-005",
  28. "name": "人脸修复与增强",
  29. "criterion": "修复后人脸清晰度显著提升;五官比例自然,无明显 AI 变形痕迹;与图像其他区域融合自然",
  30. "description": "对图像中的人脸区域进行专项修复和增强,解决人脸模糊、变形、细节缺失等问题。在九宫格表情包等多格拼贴场景中,可确保每格人脸细节清晰,夸张表情(吐舌/捂嘴/双手捧脸)五官比例自然无变形,无需逐格筛选废图,显著提升生成效率。"
  31. },
  32. {
  33. "id": "CAP-006",
  34. "name": "图像细节增强与高清放大",
  35. "criterion": "放大后图像分辨率显著提升(如 2x/4x);细节更丰富,无明显模糊或锯齿;整体风格与原图一致",
  36. "description": "对已生成的图像进行分辨率提升和细节增强,在放大的同时补充高频细节(后处理路径,区别于生成阶段直接高清输出的 CAP-016)"
  37. },
  38. {
  39. "id": "CAP-007",
  40. "name": "图像上色",
  41. "criterion": "上色结果色彩自然,符合图像内容的语义(皮肤、天空、植物颜色合理);无明显色块错误或颜色溢出",
  42. "description": "将黑白或低饱和度的图像自动上色,生成色彩自然、符合语义的彩色图像"
  43. },
  44. {
  45. "id": "CAP-007a9dfb",
  46. "name": "视频背景替换与合成",
  47. "criterion": "人物主体与新背景在光照、透视、色调上协调;人物边缘抠像干净,无明显瑕疵;视频帧间连贯,无明显跳变",
  48. "description": "将视频中的人物主体从原背景中分离,替换到新的AI生成或实拍背景中,实现视频场景的自由更换,适用于低成本视频制作和创意视频合成"
  49. },
  50. {
  51. "id": "CAP-007d64d2",
  52. "name": "二维码与品牌 Logo 嵌入海报自动集成",
  53. "criterion": "输出海报须包含清晰可扫描的二维码和品牌 Logo,两者与海报整体视觉风格协调,且通过 AI 工具自动完成嵌入和排版,无需手动 PS 合成操作。",
  54. "description": "通过 AI 设计工具或生成式排版引擎,将二维码、品牌 Logo 等标准化品牌元素自动嵌入海报指定区域(如底部专用区块),保持视觉风格统一,无需手动定位和合成。"
  55. },
  56. {
  57. "id": "CAP-008",
  58. "name": "批量图像生成",
  59. "criterion": "单次执行可生成 N 张图像(N 可配置);每张图像按预设规则变化;自动保存并按规则命名,无需人工干预",
  60. "description": "在单次工作流执行中,通过批处理机制自动循环生成大量图像(不同背景、不同参数、不同种子等),并自动命名保存。可批量生成多张轮换使用以规避平台审核风险,或一次生成N张不同文字内容的表情包,无需逐张手动操作。"
  61. },
  62. {
  63. "id": "CAP-008ee6c9",
  64. "name": "真实感提示词注入",
  65. "criterion": "",
  66. "description": ""
  67. },
  68. {
  69. "id": "CAP-009",
  70. "name": "AI 文生视频 / 动画帧序列生成",
  71. "criterion": "生成的帧序列在内容上连贯,运动自然无明显跳变;帧与帧之间的角色/场景保持一致性;可导出为视频或 GIF",
  72. "description": "基于文本描述或参考图像,使用新一代 AI 文生视频模型(Seedance、Veo、Kling 等),通过结构化提示词直接生成具有时间连贯性的动画帧序列或完整视频片段,涵盖从静态氛围场景(夜景、日间、室内外)到动态运动内容的多种主题,将静态描述或插画的情绪氛围转化为具有时间维度的电影级动态视觉叙事。"
  73. },
  74. {
  75. "id": "CAP-00c474e2",
  76. "name": "视频动效字幕自动生成",
  77. "criterion": "字幕内容与视频语音内容一致,识别准确率高;字幕动效与视频节奏自然匹配;支持多种动效预设可选;全流程无需人工逐帧干预;输出视频可直接发布到社交平台",
  78. "description": "对视频内容自动识别语音并生成字幕,或基于输入的文本内容(SRT字幕文件或手动输入文字),自动为字幕附加动态视觉效果(如上升、弹出、闪烁、打字机、轮廓揭示、逐字/逐词出现、平滑过渡、关键词高亮等),支持多种动画样式,无需逐帧手动调整,实现全自动的动效字幕叠加输出,适用于短视频、社交媒体Reels/TikTok等场景。"
  79. },
  80. {
  81. "id": "CAP-010",
  82. "name": "动画帧插值",
  83. "criterion": "插值后帧率显著提升(如从 8fps 到 24fps);插入的过渡帧与相邻帧在内容和运动上自然衔接;无明显鬼影或模糊",
  84. "description": "在已有动画帧之间插入过渡帧,提升动画的流畅度和帧率,使运动更加平滑自然"
  85. },
  86. {
  87. "id": "CAP-011",
  88. "name": "工作流自动化与 API 集成",
  89. "criterion": "外部程序可通过 API 提交生成任务并获取结果;支持异步任务状态查询;可集成到业务系统或 CI/CD 流程中",
  90. "description": "通过 REST API 将图像生成能力集成到外部系统或自动化流程中,实现程序化调用、任务队列管理和结果获取"
  91. },
  92. {
  93. "id": "CAP-012",
  94. "name": "图像局部重绘",
  95. "criterion": "重绘区域内容按提示词生成,与周围区域在光照、风格、边缘上自然融合;非重绘区域像素保持不变",
  96. "description": "对图像的指定区域进行重新生成,保持其余区域不变,实现局部内容的替换、修复或扩展"
  97. },
  98. {
  99. "id": "CAP-013",
  100. "name": "实时语境融合生成",
  101. "criterion": "生成图像中包含了提示词所指向的真实世界最新信息(如比赛结果、当前事件、实时数据);若无网络搜索能力,同样的提示词将无法生成准确内容",
  102. "description": "在生成图像时,模型自动执行实时网络搜索,获取当前最新的事件、数据、状态等语境信息,并将其融入生成结果,使图像内容与现实世界的最新状态保持一致"
  103. },
  104. {
  105. "id": "CAP-014",
  106. "name": "图像内文字渲染",
  107. "criterion": "图像中的文字内容与提示词指定的文字一致;文字清晰可读,无明显拼写错误;文字与图像整体风格和场景自然融合;多语言文字(中/日/西班牙文等)可正确渲染",
  108. "description": "在生成的图像中嵌入清晰、可读、拼写正确的指定文字内容,使文字作为图像视觉元素的一部分自然呈现(如产品标签、Logo 文字、标牌、广告语等)"
  109. },
  110. {
  111. "id": "CAP-015",
  112. "name": "场景光照/时段转换",
  113. "criterion": "转换后图像的光照/时段氛围与目标描述一致;场景的空间结构、家具布局、主体形态保持不变;光照变化在整个画面中物理上自洽(如夜间场景中灯光投影合理)",
  114. "description": "对已有图像进行全局语义级的光照条件或时段氛围转换(如白天→夜晚、晴天→阴雨、自然光→人工照明),在保持场景结构和主体不变的前提下,整体改变图像的光照氛围"
  115. },
  116. {
  117. "id": "CAP-0151fa61",
  118. "name": "食物截面与内部结构特写生成",
  119. "criterion": "生成图像中食物截面的内部结构(气孔、层次、纹理)清晰可辨;截面边缘自然,无明显 AI 变形;食物色彩饱和度真实,具有视觉食欲感;画面主体占满画幅。",
  120. "description": "通过提示词精确描述食物被切开后的内部截面特征(气孔分布、层次结构、果肉纹理、水分光泽),引导 AI 生成具有食欲感和真实感的食物截面特写图,使内部结构细节清晰突出。"
  121. },
  122. {
  123. "id": "CAP-016",
  124. "name": "生成阶段原生高分辨率输出",
  125. "criterion": "生成图像在原始输出阶段即达到 2K(2048px)级别或以上分辨率;图像细节(如面料纹理、建筑线条、人物五官)在原生尺寸下清晰完整,无放大插值痕迹",
  126. "description": "在图像生成阶段直接输出高分辨率图像(而非先生成低分辨率再后期放大),使生成结果在细节密度、结构完整性上优于先生成后放大的路径"
  127. },
  128. {
  129. "id": "CAP-017",
  130. "name": "全向参考(Omni Reference)",
  131. "criterion": "生成图像能够综合体现参考图的多维度特征(如同时保留角色外观 + 场景氛围 + 风格倾向);与单一维度参考(仅风格或仅角色)相比,生成结果在多个维度上与参考图的吻合度更高",
  132. "description": "以单张或多张参考图像作为综合性参考输入,同时影响生成图像的内容主体、风格氛围、角色特征等多个维度,而非单一维度的参考约束"
  133. },
  134. {
  135. "id": "CAP-018",
  136. "name": "个人化风格持久化",
  137. "criterion": "启用个人化后,生成结果在风格倾向上与用户历史偏好一致,无需每次在提示词中重复描述风格偏好;不同用户使用相同提示词时,因个人化设置不同而产生风格差异化的输出",
  138. "description": "系统学习并记忆用户的历史审美偏好(如对特定色调、构图、风格的倾向),在后续生成中自动应用这些个人化偏好,使生成结果持续符合用户的个人审美风格,无需每次重复描述"
  139. },
  140. {
  141. "id": "CAP-019",
  142. "name": "草图/手绘转效果图",
  143. "criterion": "输出效果图的构图、空间布局与输入草图保持一致;视觉质量从草图级提升至效果图/写实级;主要结构元素与草图对应,无随意添加或删除",
  144. "description": "将用户提供的手绘草图、线稿、粗略示意图或3D模型截图转换为精美的效果图或写实渲染图,在保持原始构图和空间关系的同时,大幅提升视觉质量和细节丰富度。适用于建筑/景观设计的可视化,可替代传统渲染流程,通过万能公式提示词快速生成具有专业摄影质感的效果图。"
  145. },
  146. {
  147. "id": "CAP-01ccc296",
  148. "name": "表情包格式导出与优化",
  149. "criterion": "",
  150. "description": ""
  151. },
  152. {
  153. "id": "CAP-020",
  154. "name": "多主体场景合成",
  155. "criterion": "生成图像中包含所有指定的主体(人物/物体);每个主体的外观特征与其对应参考图一致;各主体在场景中的位置、比例、光照协调自然,整体构图合理",
  156. "description": "将多个独立的人物、角色或物体参考图像合成到同一个场景中,生成包含所有指定主体且各自外观特征保持一致的群体场景图。支持多人物错落有致布局,各人物外观特征保持一致无需逐一手动调整,适用于团队阵容展示、活动宣传海报等批量生成场景。"
  157. },
  158. {
  159. "id": "CAP-021",
  160. "name": "图像内文字编辑(翻译/重写/替换)",
  161. "criterion": "翻译后的文字内容语义准确;替换后的文字在字体风格、大小、位置上与原文字高度一致;图像中非文字区域(背景、人物、图形元素)保持不变;整体视觉效果自然,无明显拼接痕迹",
  162. "description": "识别图像(漫画、海报、标牌、AI 生成图)中已有的文字内容,对其进行翻译(多语言)或重写(内容更新/风格调整),并在保持原有字体风格、发光效果、颜色、排版布局和图像其余部分完全不变的前提下,将处理后的文字精准替换回图像中,无需重新生成整张图像。"
  163. },
  164. {
  165. "id": "CAP-024ac428",
  166. "name": "情绪标注驱动分镜生成",
  167. "criterion": "每条情绪标注对应生成一张角色表情图;生成图的情绪表达与标注标签一致;多张分镜图中角色外观保持一致;全流程无需人工逐帧干预",
  168. "description": "通过LLM(如ChatGPT/DeepSeek)或AI工具对文本、视频、图像中的情绪状态进行识别和标注,自动将情绪标签映射为对应的角色表情图、动作变体或角色替换生成指令,实现从情绪分析到视觉表达的全自动流水线。支持剧本分镜生成、情绪节点角色替换、以及同一角色的多情绪表情变体批量生成,保持角色外观一致性的同时实现情绪的戏剧化差异表达。"
  169. },
  170. {
  171. "id": "CAP-02cbdc18",
  172. "name": "色彩参数化提示词模板生成",
  173. "criterion": "提示词模板可通过替换占位符参数,在保持色彩张力风格一致的前提下,生成至少5种不同主体/场景的高饱和多色并置画面;各生成结果在色彩饱和度、对比强度上保持一致的视觉风格水准。",
  174. "description": "将高饱和多色并置的视觉需求抽象为可复用的提示词模板框架,通过参数化占位符([SUBJECT]、[COLOR1]、[COLOR2]、[STYLE])实现同一色彩张力效果在不同主体和场景上的批量复制,无需每次重新设计提示词。"
  175. },
  176. {
  177. "id": "CAP-067edd94",
  178. "name": "信息层级视觉引导排版",
  179. "criterion": "生成的排版中标题、副标题、正文在视觉上有明显层级区分(字号差异≥2px,或字重有明显差异);段落间有合理留白;重要信息通过视觉强调(加粗、色块、图标)突出;整体阅读路径清晰,无视觉混乱感。",
  180. "description": "在图文排版生成中,通过字号大小、字重、留白、分段、图标等视觉元素的差异化处理,自动构建清晰的信息层级结构(标题→副标题→正文→注释),引导读者视线按预设路径流动,提升内容的可读性和信息传达效率。"
  181. },
  182. {
  183. "id": "CAP-06f1893c",
  184. "name": "深色背景冷暖对比配色方案生成",
  185. "criterion": "生成图像或配色方案中,冷色系(蓝/青/紫)与暖色系(橙/红/粉)在深色背景上均有明确呈现;冷暖色之间的对比度满足视觉冲击要求(色相差 ≥ 120°);深色基底(明度 ≤ 20%)与高饱和霓虹色(饱和度 ≥ 80%)形成明显明暗对比",
  186. "description": "以深色(纯黑/深蓝/深紫)为基底,通过 AI 生成工具精准控制高饱和度冷暖撞色方案(如蓝紫 + 橙红、青绿 + 粉紫),在暗底上形成强烈的冷暖视觉对比,营造科技感、未来感或赛博朋克氛围。支持输出标准色值(HEX)配色方案供后续设计复用。"
  187. },
  188. {
  189. "id": "CAP-07a297a9",
  190. "name": "室内设计多视图分析图自动生成",
  191. "criterion": "从单张效果图出发,可自动生成至少3种不同类型的分析图(如轴测图+材质板+软装搭配图);各分析图与原效果图在风格、色调、材质上保持一致;整个过程无需人工逐一绘制,可一键触发。",
  192. "description": "基于单张室内效果图,通过 AI 工作流自动衍生生成多种专业设计分析图(轴测图、立面图、材质板、软装搭配图等),将一次生成的成果扩展为完整的设计提案文件包,无需逐一手动制作。"
  193. },
  194. {
  195. "id": "CAP-07b56ca5",
  196. "name": "服装材质物理属性模拟生成",
  197. "criterion": "生成图像中服装面料的视觉表现符合其物理特性:羽绒服有明显蓬松体积感而非扁平;真丝面料有细腻光泽;围巾有自然垂坠和纹理;整体无「塑料感」或材质失真现象。",
  198. "description": "在AI图像生成过程中,通过精确的材质描述词和物理建模参数,使生成图像中的服装面料呈现符合物理规律的视觉效果,包括羽绒服的蓬松体积感、真丝的光泽流动感、针织物的纹理质感、围巾的垂坠感等。"
  199. },
  200. {
  201. "id": "CAP-08e8cc8a",
  202. "name": "参考图手势角度迁移",
  203. "criterion": "生成图像中手部持握角度、手指弯曲程度与参考图高度一致;目标产品外观与产品参考图一致;手与产品的接触关系自然合理,无穿模;整体画面质量达到商业可用标准",
  204. "description": "以一张真实手部持握参考图为角度/姿态锚点,将其手势角度和持握方式迁移到新的目标物品上,生成保持原始手势角度、但手中物品已替换为目标产品的新图像。核心在于手势角度的精准继承,而非风格迁移。"
  205. },
  206. {
  207. "id": "CAP-0ba3159e",
  208. "name": "手部专项修复与重建",
  209. "criterion": "修复后手部手指数量正确(通常5根);手指关节比例自然;指甲形态正常;修复区域与周围皮肤在光照、肤色、纹理上自然融合;非手部区域保持不变。",
  210. "description": "针对AI生成图像中手部、手指、指甲等肢端区域出现的畸形、多指、结构错误等问题,通过专项修复工作流对手部区域进行精准重绘和结构重建,恢复正常手部形态。"
  211. },
  212. {
  213. "id": "CAP-0c30af82",
  214. "name": "非常规摄像机角度提示词工程",
  215. "criterion": "生成图像的视角类型与所使用的角度关键词高度吻合(如输入 'worm's eye view' 时画面呈现明显的低角度仰拍透视),且视觉冲击感显著区别于平视构图。",
  216. "description": "通过专业摄影术语关键词体系(如 Worm's Eye View、Bird's Eye View、Dutch Angle、God's Eye View、POV、FPV、Over-the-Shoulder 等)精确引导 AI 生成具有特定视角冲击力的图像或视频,无需额外控制图或模型微调。"
  217. },
  218. {
  219. "id": "CAP-0d035b89",
  220. "name": "AI多镜头奇幻短片生成",
  221. "criterion": "生成的多个镜头在视觉风格上保持一致(色调、光效类型、氛围);每个镜头的光效内容与对应提示词描述一致;镜头之间的叙事逻辑连贯;最终组合成的短片具有完整的起承转合结构。",
  222. "description": "通过为每个镜头单独设计AI提示词,按照叙事结构(幕次/场景)依次生成多个奇幻光效镜头,并将其组合为具有完整叙事弧线的短片,实现从单张图像到完整奇幻视频作品的全流程AI生成。"
  223. },
  224. {
  225. "id": "CAP-0db7350d",
  226. "name": "互动动作自然感提示词工程",
  227. "criterion": "使用该提示词工程生成的画面中,人物动作(手扶、轻托、端、触碰等)自然流畅;人物与道具的接触方式符合物理逻辑;神态表情与场景情绪匹配;整体画面具有真实摄影感而非 AI 生成的刻板感。",
  228. "description": "通过结构化的提示词公式(分桶描述法、场景公式法),精确描述人物与道具/环境的互动动作细节(拍摄角度、肢体动作、道具接触方式、神态表情、光影效果),使 AI 生成的互动画面具有真实的'活人感',避免僵硬或不自然的姿态。"
  229. },
  230. {
  231. "id": "CAP-0dc2a15b",
  232. "name": "产品材质与表面质感精准描述生成",
  233. "criterion": "生成图像中目标材质的表面特征(光泽度、粗糙度、纹路走向)与提示词描述高度吻合;材质边界清晰,无明显 AI 塑料感或过度平滑;不同材质区域之间的质感差异可辨。",
  234. "description": "通过在提示词中精确描述目标材质的物理属性(如 glossy、matte、brushed steel、anodized aluminum、leather grain、crisp edges),引导 AI 生成具有高度真实感的材质表面纹理,使金属光泽、皮革纹路、食物截面等质感在图像中清晰突出。"
  235. },
  236. {
  237. "id": "CAP-0e3d61ca",
  238. "name": "鱼眼/广角镜头畸变效果生成",
  239. "criterion": "生成图像呈现明显的桶形畸变(barrel distortion)特征,画面边缘线条向外弯曲;视角范围接近或超过 120°(超广角)或 180°(鱼眼);整体视觉效果与真实鱼眼镜头拍摄效果高度相似。",
  240. "description": "在 AI 生成图像中模拟鱼眼镜头(Fisheye Lens)或超广角镜头的桶形畸变效果,产生极端的透视夸张感,使画面边缘产生弯曲变形,强化视觉冲击力和空间纵深感,常与虫眼视角或 GoPro/Action Cam 风格结合使用。"
  241. },
  242. {
  243. "id": "CAP-1000e70d",
  244. "name": "饰品/美甲自动穿戴融合",
  245. "criterion": "输出图像中饰品精准贴合模特对应身体部位;饰品的造型、颜色、细节与参考图一致;佩戴效果自然,光影融合无明显拼接痕迹;非佩戴区域保持不变。",
  246. "description": "将耳饰、项链、戒指、美甲等饰品参考图自动融合到模特身体对应部位(耳部、颈部、手指等),生成逼真的佩戴效果特写图,无需手绘遮罩或手工操作。"
  247. },
  248. {
  249. "id": "CAP-12d2aa10",
  250. "name": "AI 智能主体抠图与背景分离",
  251. "criterion": "输出PNG图像主体边缘清晰自然,无明显锯齿或残留背景色块;透明区域完全透明,可直接叠加到任意新背景上而无拼接感。",
  252. "description": "利用 AI 语义分割模型自动识别图像中的主体(人物、动物、食材、产品、物体等),精准将其从原始背景中分离,输出带透明通道(Alpha)的 PNG。支持毛发、发丝等复杂边缘的精细处理,无需手动绘制蒙版或逐像素操作,供后续叠加合成、背景替换或拼贴使用。"
  253. },
  254. {
  255. "id": "CAP-13bb82f5",
  256. "name": "超现实宏大场景叙事构图设计",
  257. "criterion": "生成图像具有明确的视觉层次和空间纵深感;画面中的'空旷区域'与'光影结构'形成有意义的张力对比;整体构图在视觉上传达出超越现实物理尺度的宏大感;观看者能直观感受到史诗级的空间压迫感或震撼感。",
  258. "description": "通过系统化的提示词构建方法(如 Shell & Cut 公式、光作为建筑材料理论),将'空旷空间'而非'堆砌细节'作为核心设计原则,生成具有史诗级规模感、强烈心理张力和电影级叙事感的超现实场景图像。"
  259. },
  260. {
  261. "id": "CAP-140f969e",
  262. "name": "AI 动作控制视频生成(动捕级)",
  263. "criterion": "生成视频中手部动作流畅,无明显跳帧或抖动;手持物品在运动过程中保持稳定,无明显漂移;人脸一致性在整个视频中保持;动作控制精度媲美专业动捕设备;视频时长可按需延伸",
  264. "description": "通过 AI 动作控制技术,对视频中人物的手部、身体动作进行精准参数化控制,实现媲美专业动作捕捉技术的动作精度,使 AI 生成视频中的手持物品动作、手势变化自然流畅,同时保持人脸一致性。"
  265. },
  266. {
  267. "id": "CAP-143f8142",
  268. "name": "软阴影与光影层次渲染",
  269. "criterion": "生成图像中的阴影边缘柔和渐变,无明显硬边界;阴影深度和范围符合光源位置和强度的物理规律;多光源场景中阴影相互叠加形成丰富的明暗层次;阴影色彩带有环境光的色温影响(如暖光下的阴影偏暖色调)",
  270. "description": "通过提示词工程或渲染参数控制,生成具有柔和过渡、层次丰富的阴影效果,避免硬边界的生硬阴影,模拟真实世界中多光源、漫反射、环境光遮蔽产生的自然光影效果"
  271. },
  272. {
  273. "id": "CAP-14bd7a4d",
  274. "name": "冬季氛围场景环境生成",
  275. "criterion": "生成图像的背景场景与冬季主题高度契合(如雪地、飘雪、冰雪环境);场景光照与人物服装的色调协调统一;动态元素(如飘雪)自然融入画面,无明显合成痕迹。",
  276. "description": "通过精确的场景描述词和环境参数,生成与冬季穿搭主题高度匹配的背景环境(如雪地、冰湖、城市雪景、室内暖调空间等),使人物与场景在光照、色调、氛围上形成统一的冬季视觉叙事。"
  277. },
  278. {
  279. "id": "CAP-154a84fd",
  280. "name": "图像区域图标标签叠加",
  281. "criterion": "每个图像区域可独立配置图标类型和文字内容;标签组件(图标+文字)在对应区域内位置准确、样式统一;支持批量为多个区域同时叠加不同内容的标签,无需逐一手动添加。",
  282. "description": "在已有图像或拼贴画布的指定区域上,自动叠加由图标(如定位图标、勾选符号、时钟图标)与文字(地点名称、任务描述、价格标注)组合而成的标签组件,实现信息模块化标注效果。"
  283. },
  284. {
  285. "id": "CAP-1649b549",
  286. "name": "戏剧性明暗对比与光源方向控制(Chiaroscuro / Low-Key)",
  287. "criterion": "生成图像的暗部区域接近纯黑(无过多细节),亮部区域明亮突出;明暗交界线清晰或有合理的半影过渡;整体画面呈现出强烈的戏剧性情绪氛围,符合Low-Key或Chiaroscuro的视觉标准。",
  288. "description": "通过提示词精准控制画面的明暗分布比例与光源方向(侧光、逆光、硬光、背光),实现暗部极深(接近纯黑)、亮部极亮(接近纯白)的戏剧性反差,模拟卡拉瓦乔式明暗对照法(Chiaroscuro/Tenebrism)、低调光(Low-Key)或暗调长调配色的视觉风格,赋予画面强烈情绪张力和电影感。"
  289. },
  290. {
  291. "id": "CAP-16c5174b",
  292. "name": "图像文字描边与阴影视觉强化",
  293. "criterion": "叠加文字在任意背景(深色/浅色/复杂纹理)上均清晰可读;描边宽度、阴影偏移、发光半径等参数可独立调节;支持多重效果叠加(如描边+阴影同时存在);输出图像中文字与背景视觉层次分明",
  294. "description": "在图像或视频帧上叠加的文字中,自动为文字添加描边(Outline/Stroke)、阴影(Shadow)、发光(Glow/Neon)、多重阴影等视觉增强效果,使文字在复杂背景上保持高可读性和视觉冲击力,常用于综艺花字、表情包大字、YouTube 缩略图标题等场景。"
  295. },
  296. {
  297. "id": "CAP-19e5402a",
  298. "name": "双重曝光剪影叙事构图生成",
  299. "criterion": "生成图像中可清晰识别外轮廓剪影形态;轮廓内部场景与主题语义高度关联;边缘区域呈现自然的飞白或渐隐效果,消除 AI 塑料感;整体视觉呈现设计师作品质感而非普通 AI 跑图效果。",
  300. "description": "以人物或物体的剪影轮廓为外框/容器,在轮廓内部填充与主题绑定的完整世界观场景(宇宙星云、山地景观、粒子场、自然景致、微型世界),结合空气透视、水彩刷痕、边缘飞白、雾气/粒子/光晕自然过渡等视觉语言,生成具有电影海报质感的双重曝光叙事插画,人像与景观相互渗透。"
  301. },
  302. {
  303. "id": "CAP-1b3e966f",
  304. "name": "360度等距矩形全景图原生生成",
  305. "criterion": "输出图像为标准等距矩形投影格式(宽高比约 2:1),左右边缘像素无缝衔接;可在 360 度查看器中正常显示为球面全景,无明显接缝或变形。",
  306. "description": "以等距矩形投影(equirectangular)格式直接生成 360 度球面全景图,输出图像具有无缝环绕边缘,可被 360 度查看器、VR 设备和游戏引擎直接识别和使用,无需后期拼接。"
  307. },
  308. {
  309. "id": "CAP-1f898cd9",
  310. "name": "超现实场景变形与物理违和感生成",
  311. "criterion": "生成图像中包含至少一处明显违反物理规律的超现实元素;该元素与真实场景无缝融合,分不清真实与虚构的边界;整体画面保持视觉统一性,超现实元素不显突兀",
  312. "description": "通过 AI 生成引擎,在同一画面中构建违反物理规律的超现实视觉元素(如沙丘变形为马群、镜面倒影出现不存在的景象、巨型地貌人脸、几何体建筑悬浮等),使画面产生强烈的梦境感和视觉震撼力。"
  313. },
  314. {
  315. "id": "CAP-20409fa6",
  316. "name": "AI 多页轮播/长文分页/社交媒体序列生成",
  317. "criterion": "单次提示词输入后,30秒内输出N张(可配置)完整幻灯片/轮播页;每页包含标题、布局、品牌元素;视觉风格统一;无需人工干预排版细节。",
  318. "description": "以主题、语气、长文内容或多张素材为输入,AI 自动完成内容拆分、版式匹配、图文合成,输出多页轮播/幻灯片、长文分图片序列(按段落分页、自动加页码)、数字剪贴簿、社交媒体无缝横幅拼接(多帖子在个人主页网格中连续成大图)等多种序列形态,所有页面视觉风格统一,适配社交平台比例一键发布。"
  319. },
  320. {
  321. "id": "CAP-206faaab",
  322. "name": "实景视频特效合成",
  323. "criterion": "特效素材在视频中的位置随摄像机运动稳定跟随,无明显漂移或抖动;特效与实景在光照、透视上协调一致;合成结果在运动过程中保持视觉连贯性。",
  324. "description": "通过 AI 摄像机运动追踪技术,将 2D/3D 特效素材(如卡通道具、魔法阵、粒子效果)精确锁定并叠加到实拍视频的特定位置,使特效随镜头运动自然跟随,实现虚实融合的合成效果。"
  325. },
  326. {
  327. "id": "CAP-24dd762b",
  328. "name": "跨物种形态融合生成",
  329. "criterion": "生成图像中人类面部结构可辨识,同时指定生物特征(如触角、复眼、甲壳纹理、多足)清晰呈现;人类皮肤到生物外骨骼/纹理的过渡区域自然无突兀拼接感;整体画面在奇幻与写实之间保持视觉平衡。",
  330. "description": "以文本提示词为核心驱动,将人类面部/身体特征与指定生物(昆虫、动物、奇幻生物)的外骨骼、纹理、附肢等形态特征在同一图像中自然融合,生成皮肤到异种纹理过渡自然、比例协调的混合体形象。"
  331. },
  332. {
  333. "id": "CAP-2517158f",
  334. "name": "Candid风格生成(非摆拍感)",
  335. "criterion": "人物姿态和表情自然、非刻意;构图可能不完美(如主体偏离中心、边缘裁切);可能包含轻微模糊或动态感;整体呈现'被抓拍'而非'摆拍'的视觉特征;符合手机随手拍的真实感",
  336. "description": "生成具有抓拍、非摆拍特征的图像,包括自然的肢体动作、非刻意的表情、随意的构图、轻微的动态模糊等,模拟真实生活中的随机瞬间捕捉"
  337. },
  338. {
  339. "id": "CAP-2608518c",
  340. "name": "AI 驱动表情包图文一体生成",
  341. "criterion": "生成图像中文字内容与输入描述一致且清晰可读;视觉形象(角色/场景)与文字语义匹配;中文字符可正确渲染无乱码;单次生成即可直接使用,无需后期文字叠加步骤",
  342. "description": "以文字描述为输入,AI 模型直接生成包含指定文字内容与对应视觉形象(Q版角色、梗图人物、场景)的完整表情包图片,文字与图像在生成阶段即融为一体,无需分步叠加。"
  343. },
  344. {
  345. "id": "CAP-26100ea8",
  346. "name": "微距/极端特写构图与画幅填充控制",
  347. "criterion": "生成图像中主体占画幅比例不低于 80%;主体边缘无明显裁切失真;画面无多余背景干扰;微距视角下纹理细节清晰可辨。",
  348. "description": "通过提示词中的镜头参数(macro lens、micro lens、close-up、extreme close-up)与构图指令(主体占满画幅、fill the frame、极端裁切),精确控制 AI 生成图像中主体(人体局部:眼部/嘴部/手部/指甲/耳部;或产品/物件/食物截面)的放大比例、裁切范围与焦点区域,生成画面填充感强、主体突出的微距/特写图像。"
  349. },
  350. {
  351. "id": "CAP-263a2276",
  352. "name": "提示词驱动的信息图结构化生成",
  353. "criterion": "输入单一关键词(如食材名称)后,输出的信息图包含完整的多格内容(每格有标题、图像、文字说明);各格内容逻辑连贯、信息准确;整体视觉风格统一;无需用户手动填写每格内容。",
  354. "description": "通过精心设计的结构化提示词模板,将用户输入的主题词(如食材名称、学科章节)自动扩展为完整的信息图内容框架,包括自动整理信息层级、分配各格内容、生成配套插画与文字说明,实现从单一关键词到完整多格信息图的端到端自动化生成。"
  355. },
  356. {
  357. "id": "CAP-2671cd39",
  358. "name": "分镜网格图驱动视频生成(图生视频)",
  359. "criterion": "输出视频中每个片段对应输入分镜图中的一个格子;各片段之间叙事连贯,动作过渡自然;整体视频时长和节奏符合分镜设计意图;无需人工逐帧干预",
  360. "description": "以包含多个分镜格子的网格图作为输入,通过 AI 视频生成模型将每个格子的静态分镜内容转化为动态视频片段,并按叙事顺序拼接为完整短片,实现从单张分镜大图到完整视频的自动化转化。"
  361. },
  362. {
  363. "id": "CAP-269f4d94",
  364. "name": "视频场景内角色精准替换",
  365. "criterion": "替换后视频中的目标角色外观与参考图片一致;场景中其他人物、背景、摄像机运动完全保持不变;角色替换在时间维度上连贯,无明显跳帧或闪烁;可通过文本描述精准指定要替换的具体人物(如通过服装颜色、位置描述定位)。",
  366. "description": "在保持视频场景完整连续性(摄像机运动、背景、其他人物不变)的前提下,根据文本描述精准识别并替换视频中的指定角色,将其替换为参考图片中的目标人物,实现无缝的角色置换效果。"
  367. },
  368. {
  369. "id": "CAP-26ac8133",
  370. "name": "服装单品结构化分层提示词工程",
  371. "criterion": "生成图像中所有指定单品(如黑色羽绒服、红色围巾、红色手套、宽腿裤)均清晰可见且搭配逻辑合理;各单品颜色、材质、款式与提示词描述一致;整体造型无单品堆砌或风格冲突现象。",
  372. "description": "通过将服装搭配拆解为「内搭+中层+外套」三层结构或「颜色+材质+款式」公式化模板,以结构化方式组织提示词,确保AI生成时能准确理解并呈现多件单品的组合穿搭逻辑,避免单品堆砌和风格混乱。"
  373. },
  374. {
  375. "id": "CAP-26df0450",
  376. "name": "文字与图像主体深度层次融合",
  377. "criterion": "文字与主体的前后遮挡关系自然真实,主体轮廓边缘处理干净无锯齿,整体视觉效果具有明显的空间深度感,与简单平面叠加有显著区别",
  378. "description": "通过图层蒙版与主体分割技术,使叠加文字与图像中的人物/主体产生真实的前后空间层次关系——文字可部分被主体遮挡,或主体可穿越文字层,创造出文字嵌入场景的三维深度感,而非简单的平面叠加。"
  379. },
  380. {
  381. "id": "CAP-26fac738",
  382. "name": "文字图像风格主题化生成",
  383. "criterion": "文字的字体、颜色、装饰效果与图像整体风格高度一致;不同主题风格(复古/综艺/电影感)下文字呈现出对应的视觉特征;整体图像具有统一的风格调性,无文字与背景风格割裂感",
  384. "description": "在生成带文字的图像时,将文字的视觉风格(字体选择、颜色方案、装饰元素)与整体图像的主题风格(复古、综艺、电影感、玻璃拟态等)统一协调,使文字成为风格表达的有机组成部分而非简单叠加。"
  385. },
  386. {
  387. "id": "CAP-28f13fac",
  388. "name": "生活化场景语义理解",
  389. "criterion": "生成的场景在季节特征上准确(如冬季有雪、春季有花);时段氛围与描述一致(如清晨柔光、傍晚金色光);人物服装、配饰与季节和场景匹配;环境元素(建筑、植物、天气)符合地理和季节逻辑;整体情绪基调与场景描述一致",
  390. "description": "理解并生成符合特定生活场景语义的图像内容,包括场景的季节特征、时段氛围、情绪基调、服装搭配、环境元素等,使生成结果符合真实生活逻辑"
  391. },
  392. {
  393. "id": "CAP-298dcb55",
  394. "name": "低饱和度/去色色调定向生成",
  395. "criterion": "生成图像的整体色彩饱和度明显低于普通生成结果;画面主色调落在灰色系、莫兰迪色系或黑白灰区间内;不同批次生成的同主题画面色调一致性高,无随机出现高饱和色块",
  396. "description": "在AI图像生成阶段,通过提示词色彩语义描述(如莫兰迪色、高级灰、去色、黑白灰调)或专用色彩风格LoRA,将生成画面的整体色彩纯度精准压低至目标区间,使输出图像呈现克制、安静的低饱和度视觉质感,与高饱和度画面形成可量化的色彩对比。"
  397. },
  398. {
  399. "id": "CAP-29e214e9",
  400. "name": "金色粒子/星光点缀",
  401. "criterion": "背景为深色(黑色、深蓝、深紫);金色元素色温 2500K-3000K(金黄至暖金);粒子/星光具有发光效果或高亮度;整体呈现奢华、魔法或庆典氛围",
  402. "description": "在暗色背景上添加金色/金黄色的粒子、星光、光斑、五彩纸屑等动态或静态元素,营造奢华、魔法、庆典或梦幻的视觉氛围"
  403. },
  404. {
  405. "id": "CAP-2a05e535",
  406. "name": "宠物主体外观特征锁定",
  407. "criterion": "同一宠物在不同服装/场景/姿态的多张生成图中,毛色、花纹分布、面部特征(眼睛颜色、鼻型)、体型比例与参考照片的相似度可被人眼识别为同一只宠物;不出现品种混淆或外观突变。",
  408. "description": "在多轮、多场景的宠物图像生成中,通过提示词约束或参考图锁定机制,确保同一只宠物的毛色、花纹、面部特征、体型在所有生成结果中保持高度一致,不因服装、背景、姿态变化而产生外观漂移。"
  409. },
  410. {
  411. "id": "CAP-2a528b38",
  412. "name": "多角色互动对话场景生成",
  413. "criterion": "生成的场景序列中各角色外观在不同帧间保持一致;角色间的位置关系、互动动作符合故事脚本描述;每个场景的背景、灯光、mood 与故事情节匹配;支持为每个角色生成对应的语音并实现唇形同步。",
  414. "description": "基于故事脚本,自动生成包含多个一致角色在同一场景中进行对话、互动的画面序列,各角色的外观特征、位置关系、情绪表达在整个序列中保持连贯,支持配音和唇形同步。"
  415. },
  416. {
  417. "id": "CAP-2bd131b4",
  418. "name": "AI驱动的幽默文案生成",
  419. "criterion": "",
  420. "description": ""
  421. },
  422. {
  423. "id": "CAP-2bd87e28",
  424. "name": "主题色调系统约束生成(prompt 驱动)",
  425. "criterion": "生成图像中单一主色调覆盖画面面积超过70%;辅色与点缀色均服从主色调的色相倾向;整体饱和度偏高,无明显杂色干扰主色调的视觉统治力。",
  426. "description": "通过在提示词中指定主导色调(单一色相锁定:深蓝、赤红、暖色、金色、冷色)或完整的主题色彩系统(主色 + 辅助色 + 强调色,HEX/HSL 参数),配合光源描述、饱和度和背景处理关键词,使生成图像的整体色彩严格围绕指定方案,形成沉浸式的单色调氛围或系统一致的品牌色彩表达。"
  427. },
  428. {
  429. "id": "CAP-2d1bc846",
  430. "name": "JSON 结构化图像精确编辑与风格克隆",
  431. "criterion": "通过 JSON 编辑后重新生成的图像,在被修改的字段(如文字内容、物体类型、风格参数)上与编辑意图一致;未被修改的字段(如整体构图、艺术风格、色彩基调)保持不变;摄影风格克隆后,目标图像在镜头感、光照氛围、色彩分级上与参考摄影作品高度相似。",
  432. "description": "通过将图像的视觉信息(构图、色彩、光照、物体、文字等)提取为结构化 JSON 数据,再对 JSON 进行精确编辑后重新生成图像,实现对 AI 图像的外科手术级精确控制;同时支持将真实摄影的技术参数(镜头、光照、色彩分级)克隆为 JSON 格式并应用到任意主体上。"
  433. },
  434. {
  435. "id": "CAP-2de278d6",
  436. "name": "高饱和多色并置与互补/对比色张力控制",
  437. "criterion": "生成图像中可识别出至少3种高饱和度颜色(饱和度 S≥80%)的明确并置区域;各色块边界清晰或过渡自然;整体色彩浓烈饱满,无灰暗或低饱和区域主导画面。",
  438. "description": "在图像生成过程中,通过精确的色彩参数化控制(多高饱和度色值、色相对比关系、色块分布比例),指定互补色对(complementary color pairs)、高对比色组合或双色对撞分区结构(对角分屏、红蓝对立),使画面呈现最大色彩纯度与最大色相张力,产生迷幻、震撼、多巴胺式的视觉冲击。"
  439. },
  440. {
  441. "id": "CAP-306c15fe",
  442. "name": "AI 一次生成多格网格图(姿态/分镜/漫画/表情矩阵)",
  443. "criterion": "单张图像中包含指定数量(如9个)的独立表情格子,由清晰边框分隔;每个格子中的角色外观特征(服装、发型、肤色)与其他格子保持一致;各格子的表情/动作/角度互不重复;整体构图比例协调,无格子缺失或变形。",
  444. "description": "通过结构化提示词(JSON 格式或自然语言,指定 layout/subject/expressions/lighting/color_tone 等字段),驱动 AI 模型一次性生成包含多个分区的完整网格大图。支持多种用途:同一主体的多姿势/多角度/多场景矩阵、多格分镜叙事(起承转合)、多格漫画故事板、表情包 9 宫格、Bento Grid、非对称布局等,整体输出为单张图像,风格/色调/角色外观在格间保持统一,无需后期拼接。"
  445. },
  446. {
  447. "id": "CAP-3086677b",
  448. "name": "体积光/丁达尔效应生成",
  449. "criterion": "生成图像中光束路径清晰可见,具有明显的方向性和体积感;光束与周围暗部形成强烈明暗对比;介质(烟雾/尘埃/雾气)的散射效果真实自然,光束边缘有合理的衰减过渡。",
  450. "description": "通过在提示词中精准描述光线穿透介质(烟雾、尘埃、雾气、水汽)的物理过程,驱动AI生成具有可见光束路径的体积光效果(即丁达尔效应/耶稣光/上帝之光),使光线在空气中呈现出清晰的三维体积感和方向性。"
  451. },
  452. {
  453. "id": "CAP-311931fc",
  454. "name": "实时手绘到照片级图像生成",
  455. "criterion": "AI 生成图像与手绘内容在构图和内容上高度对应;手部持笔动作在生成图像中清晰可见且自然;从手绘输入到图像生成的延迟不超过 3 秒;生成图像达到照片级真实感",
  456. "description": "在用户使用数位板进行手绘创作的同时,AI 实时捕捉手部持笔动作和绘画内容,即时生成与手绘内容对应的照片级图像,实现手绘输入与 AI 生成输出的实时交互反馈循环。"
  457. },
  458. {
  459. "id": "CAP-3178172e",
  460. "name": "选择性色彩保留(Selective Color)",
  461. "criterion": "黑白/低饱和区域完全去色或降低饱和度至灰度;保留色彩的区域边缘自然、无明显蒙版痕迹;保留区域的色彩饱和度、色相与原图一致;整体画面形成明确的视觉焦点",
  462. "description": "将图像转换为黑白或低饱和度单色调,同时保留指定区域的完整色彩,使该区域成为画面中唯一的色彩焦点,形成强烈的视觉对比和引导效果"
  463. },
  464. {
  465. "id": "CAP-34f85267",
  466. "name": "自然语言驱动图表代码生成",
  467. "criterion": "输入一段自然语言描述后,AI 输出的代码可直接导入对应工具(ProcessOn、Draw.io、Mermaid AI 等)渲染为完整图表,且图表结构与描述语义一致,无需人工修正代码逻辑。",
  468. "description": "用户以自然语言描述系统架构或业务流程,AI 大模型(如 DeepSeek、Claude、Gemini)自动将其转化为结构化图表标记语言代码(Mermaid、PlantUML、Draw.io XML、SVG 等),无需用户掌握任何绘图语法,实现从语义意图到可渲染图表代码的一步跨越。"
  469. },
  470. {
  471. "id": "CAP-3530bbb1",
  472. "name": "图像主体人像与大字号文字的空间层叠合成",
  473. "criterion": "人物主体与文字的层叠关系自然,边缘处理干净无锯齿;文字在被遮挡后仍保持足够的可读性(遮挡面积不超过 40%);整体合成效果具有明确的空间层次感(前景/中景/背景)",
  474. "description": "将人物/主体图像与超大字号标题文字进行空间层叠合成,实现文字在主体前方或后方穿插的视觉效果(如文字被人物遮挡一部分、人物从文字中'穿出'),在保持大字号标题视觉冲击力的同时,增加版面的空间深度感和视觉趣味性。"
  475. },
  476. {
  477. "id": "CAP-37399643",
  478. "name": "图像主体智能分割与背景替换",
  479. "criterion": "主体分割边缘精确,无明显锯齿或残留背景像素;主体与新背景在光照方向、色温、阴影上协调一致;合成结果无明显拼接痕迹,整体视觉自然;可处理复杂边缘(如发丝、透明物体)的精确分割。",
  480. "description": "自动识别并精确分割图像中的主体对象(人物、产品、物体),将主体从原始背景中提取出来,并无缝合成到新的背景场景中,实现主体与新背景在光照、色调、边缘上的自然融合。"
  481. },
  482. {
  483. "id": "CAP-37bf461c",
  484. "name": "柔光朦胧光效生成",
  485. "criterion": "生成图像中高光区域呈现柔和衰减而非硬边高光;画面整体存在轻微的朦胧感或柔焦效果;边缘线条不尖锐,整体视觉感受符合'朦胧通透、柔光包裹'的描述;与未加柔光效果的同内容图像相比,氛围感显著提升",
  486. "description": "在图像生成或后处理阶段,为画面叠加柔光滤镜、高光晕染、边缘模糊等效果,使整体画面呈现出朦胧通透、如蒙薄纱的视觉质感,强化梦幻静谧的氛围感而非清晰锐利的写实感。"
  487. },
  488. {
  489. "id": "CAP-37d125f6",
  490. "name": "自然语言指令驱动的图像编辑",
  491. "criterion": "AI能够正确理解自然语言指令的编辑意图;自动完成指令要求的图像修改;编辑结果符合用户指令描述;整个过程无需用户手动操作编辑工具",
  492. "description": "通过自然语言指令驱动AI自动对图像进行编辑和调整,无需手动操作具体的编辑工具,AI理解指令意图并自动完成相应的视觉修改"
  493. },
  494. {
  495. "id": "CAP-39883874",
  496. "name": "色彩脚本分区域色调控制",
  497. "criterion": "生成图像中各空间区域的色调与预设的色彩脚本一致;主色调区域的色彩饱和度和覆盖面积符合预期;不同区域之间的色调过渡自然,整体画面色彩逻辑统一。",
  498. "description": "通过色彩脚本(Color Scripting)方法,为画面的不同空间区域(前景、中景、背景、天空、地面等)分别指定主导色调,实现画面整体色调的精确分层控制,使单一主色调在特定区域形成强烈的视觉主导,同时保持整体色彩逻辑的自洽性。"
  499. },
  500. {
  501. "id": "CAP-3a1c7ef7",
  502. "name": "表情迁移与驱动",
  503. "criterion": "目标人物的面部表情与源驱动信号高度吻合(眼睛开合度、嘴型、眉毛角度等关键参数误差在可接受范围内);目标人物的面部身份特征(肤色、五官比例)在迁移后保持不变;输出图像/视频无明显变形或伪影。",
  504. "description": "以源视频或图像中的面部表情为驱动信号,将其精准复刻到目标人物图像或视频上,实现跨人物的表情转移,同时保持目标人物的外貌特征不变。"
  505. },
  506. {
  507. "id": "CAP-3a6bc8f3",
  508. "name": "自定义人物LoRA脸模训练",
  509. "criterion": "训练完成的脸模在不同姿势、表情、光线条件下均能稳定复现目标人物的面部特征;与未训练的基础模型相比,人物面部相似度显著提升;可与其他LoRA(如风格LoRA)叠加使用。",
  510. "description": "通过收集特定人物的训练数据并在AI模型上进行LoRA微调训练,生成专属于该人物的脸模(Face LoRA),使后续生成时能够稳定复现该人物的面部特征,解决AI短剧、IP形象设计等场景中的角色一致性问题。"
  511. },
  512. {
  513. "id": "CAP-3b0de1ce",
  514. "name": "超写实人像去 AI 感(皮肤微纹理 + 次表面散射 + 光线结构化)",
  515. "criterion": "生成人像皮肤呈现真实毛孔、细纹、不均匀肤色等自然瑕疵;光线在人物面部形成符合物理规律的明暗结构(而非全脸均匀打亮);整体画面不超过一个区域呈现最高清晰度,其余区域自然过渡;观看者无法直接判断为AI生成。",
  516. "description": "通过将皮肤视为物理材质而非美化效果、将光线视为空间结构而非氛围装饰,在提示词中明确加入皮肤微纹理描述(毛孔、绒毛、细纹、雀斑、轻微不对称、油性高光、微瑕疵)与次表面散射(Subsurface Scattering)参数,并通过专项皮肤增强工具进一步细化,从根本上消除 AI 生成人像的过度光滑、油腻、塑料感,使生成结果达到真实摄影级自然质感。"
  517. },
  518. {
  519. "id": "CAP-3b51102e",
  520. "name": "镜面/水面反射物理模拟生成",
  521. "criterion": "生成图像中的倒影与实景在内容上像素级对应,光照方向、色温、透视关系物理自洽;水面/镜面材质质感真实(如静水微波纹、镜面高光反射);实景与倒影的分界线自然,无明显拼接痕迹。",
  522. "description": "在 AI 图像生成中,通过 prompt 工程或专用编辑功能,精确模拟物理上真实的镜面、水面反射效果,使实景与倒影在光学上自洽(像素级对称、光线角度正确、水面涟漪折射合理),形成上下或左右对称的嵌套镜像构图。"
  523. },
  524. {
  525. "id": "CAP-3b763f9c",
  526. "name": "图片/草图识别转可编辑图表",
  527. "criterion": "上传一张白板草图或架构图截图后,AI 输出的可编辑图表能还原原图中 80% 以上的节点和连接关系,且输出格式可在 Draw.io 等工具中直接打开并进行节点级编辑。",
  528. "description": "用户上传白板草图照片、手绘示意图或已有架构图截图,AI 自动识别其中的图形结构、连接关系和文字标注,将其转换为标准的、可在图表工具中二次编辑的结构化图表(如 Draw.io 格式),实现从非结构化图像到可编辑数字图表的自动化转换。"
  529. },
  530. {
  531. "id": "CAP-3b8ba97e",
  532. "name": "东方美学红黑金配色",
  533. "criterion": "红色为主色调(朱砂红、中国红),占比 40%-60%;黑色勾勒轮廓和结构,占比 30%-40%;金色点缀关键位置,占比 5%-15%;构图具有东方美学特征(留白、对称、剪影)",
  534. "description": "运用东方传统色彩体系,以红色(朱砂)为底色、黑色(墨色)勾勒结构、金色作为点睛,结合古建筑剪影、留白等元素,营造大气、神秘、高级的东方美学氛围"
  535. },
  536. {
  537. "id": "CAP-3b8df701",
  538. "name": "AI 生成内容与真实镜头混合(AI VFX)",
  539. "criterion": "AI 生成元素与真实镜头在光照方向、色调、运动模糊上保持一致;合成边缘无明显抠图痕迹;AI 元素的运动轨迹与真实镜头的摄像机运动协调;整体视觉效果令观众难以区分 AI 与真实部分。",
  540. "description": "将 AI 生成的视觉元素(角色、人群、特效、场景)与真实拍摄镜头进行专业级视觉特效合成,使 AI 生成内容在光照、运动、透视、色彩上与真实镜头自然融合,实现无缝混合的电影级视觉效果。支持从绿幕抠像到多层合成的完整 VFX 流程。"
  541. },
  542. {
  543. "id": "CAP-3bf86ae3",
  544. "name": "室内空间色调统一控制",
  545. "criterion": "生成图像中所有主要视觉元素(墙面、家具、地板、软装、光影)的色调在同一暖色系色域内;不同批次生成的同一场景效果图在色调上保持一致,无明显色偏或冷暖跳变。",
  546. "description": "在生成或重绘室内效果图时,对整体色彩倾向进行精准锁定,确保奶油色、暖棕色、原木色等特定色调在墙面、家具、软装、光影各层次中保持高度统一,避免色彩割裂感。"
  547. },
  548. {
  549. "id": "CAP-3c49ff0a",
  550. "name": "空间透视与多层景深提示词精确控制",
  551. "criterion": "生成图像中地板线条、天花板线条、墙面边缘等建筑元素明确向单一或双消失点汇聚;画面呈现出清晰的近大远小关系;观看者能直观感受到由近到远的空间延伸感,无透视错误或空间扭曲。",
  552. "description": "通过在提示词中精确指定消失点类型(一点/两点/三点透视)、视平线高度、相机视角(低角度/眼平/俯视),分层描述前景/中景/背景各层元素(实焦/虚化、高斯模糊、大气透视),建筑框景元素(拱门/窗框/门洞/柱廊/地板线条向消失点汇聚/纹理拼接角度)以及镜头参数(广角/超广角),或通过 ControlNet 深度图约束,生成具有强烈空间纵深感、三维立体景深和史诗级空间规模感的画面。"
  553. },
  554. {
  555. "id": "CAP-3d809797",
  556. "name": "动态抓拍摄影参数模拟",
  557. "criterion": "生成图像在视觉上具备真实摄影特征:背景存在合理的景深虚化、主体运动状态自然(非摆拍感)、光线方向与场景物理逻辑一致;观看者无法直接判断图像为 AI 生成而非真实摄影。",
  558. "description": "通过在提示词中精确描述真实摄影参数(镜头焦距、快门速度、光圈、ISO、景深、光线方向等)以及动态构图方式(抓拍构图、平视微侧、中景景别),使 AI 生成的图像在视觉上模拟真实相机拍摄的即时抓拍效果,呈现自然随意的动态感和生活化质感。"
  559. },
  560. {
  561. "id": "CAP-3e353fc5",
  562. "name": "文字叠加与情感标注",
  563. "criterion": "文字可精确放置在图片任意位置,字体、颜色、背景透明度均可调整,最终文字与图片内容语义协调。",
  564. "description": "在图片或拼贴画布的指定位置添加文字内容,包括说明性文字、情感点评、地点标注、碎碎念等,支持字体样式、背景色、透明度调整。"
  565. },
  566. {
  567. "id": "CAP-3ee6c232",
  568. "name": "文本转信息图表可视化",
  569. "criterion": "生成的信息图表类型与文本内容的逻辑结构匹配(如因果关系→鱼骨图,时序关系→时间轴);图表中的文字内容与原文语义一致;所有图层元素(文字/图标/颜色/形状)可独立编辑;支持导出为图片或 PDF。",
  570. "description": "将纯文本、URL 链接或 PDF 文件作为输入,由 AI 自动分析语义结构,选择最适合的可视化形式(流程图、思维导图、时间轴、对比图、鱼骨图、循环图、饼图等),生成图文并茂的信息图表,所有元素支持二次编辑。"
  571. },
  572. {
  573. "id": "CAP-4086912c",
  574. "name": "产品多角度一致性视图生成",
  575. "criterion": "生成的多角度视图中,产品的颜色、材质纹理、品牌标识与参考图一致;不同角度视图的透视关系合理,符合真实三维物体的视角变化规律;各角度视图可直接用于电商详情页展示,无需额外修图。",
  576. "description": "基于单张产品参考图,自动生成该产品在不同角度(正面、侧面、俯视、细节特写等)的视图,保持产品外观特征(颜色、材质、形状、品牌标识)在各角度视图中高度一致。"
  577. },
  578. {
  579. "id": "CAP-411039fa",
  580. "name": "大型花艺装置与穹顶结构生成",
  581. "criterion": "花艺装置的空间结构(穹顶弧度/拱门形状/层次高低)符合描述;花材品种、颜色与指定内容一致;花瓣质感真实,有自然光线与阴影;整体与仪式区/宴会厅背景环境协调",
  582. "description": "生成鲜花穹顶、巨型花艺装置、花艺拱门等大型三维立体花艺结构图像,支持多色花材(玫瑰/牡丹/百合/绣球/尤加利叶)的层次组合,能生成真实感强的花瓣质感、空间纵深感和光线穿透效果,适用于婚礼仪式区、宴会厅顶部装饰、户外庆典入口等场景。"
  583. },
  584. {
  585. "id": "CAP-411da039",
  586. "name": "场景背景一键替换",
  587. "criterion": "角色与背景场景融合自然,光照方向和色调协调一致;角色主体外观特征不受背景替换影响;支持多种场景批量切换输出",
  588. "description": "将已有角色图(含白底图或透明底图)与指定场景背景(办公室、草地、室内等)自动合成,生成角色置于目标场景中的完整图像,无需手动抠图或合成。"
  589. },
  590. {
  591. "id": "CAP-41ac8100",
  592. "name": "多图拼贴布局自动编排",
  593. "criterion": "输出图中所有输入照片均被完整呈现,照片之间无遮挡关键内容;整体布局在视觉上均衡协调,符合指定的排版风格(网格/错落/中心环绕等);可在不同尺寸比例(1:1、4:3、9:16)下正确适配。",
  594. "description": ""
  595. },
  596. {
  597. "id": "CAP-42988fbb",
  598. "name": "谐音梗与双关文案 AI 创意生成",
  599. "criterion": "生成的谐音梗文案与原词语发音相似度高(≥2个音节谐音);双关含义清晰可辨;文案与图像中的食物元素强相关;批量生成时每条文案不重复。",
  600. "description": "利用大语言模型(LLM)基于指定食物名称、成语或日常用语,自动批量生成谐音梗文案和双关语,为表情包提供文字创意内容,覆盖中文谐音、中英混搭双关等多种玩法。"
  601. },
  602. {
  603. "id": "CAP-45a51b6d",
  604. "name": "数据报告整体视觉风格统一与配色方案生成",
  605. "criterion": "同一份报告中所有图表的主色调属于同一色系,色值偏差在可接受范围内;标题、图表、文字说明的字体规范和颜色层级清晰;整体视觉风格与指定的商务/科技/研究报告风格一致,无明显视觉冲突。",
  606. "description": "AI 根据指定的色彩主题(如蓝紫色系、橙色系、科技深蓝等)或参考版式,自动为整份数据报告中的所有图表、标题、文字说明、背景等视觉元素生成统一的配色方案和视觉风格,确保多图表并存时整体视觉协调一致。"
  607. },
  608. {
  609. "id": "CAP-47151d87",
  610. "name": "逆光轮廓光与发丝光效果生成",
  611. "criterion": "生成图像中主体(人物/物体)的轮廓边缘可见明显的高光描边(rim light),发丝或毛发细节被背景光源照亮呈现半透明发光效果;主体与背景之间存在清晰的明暗分离,背景亮度高于主体正面,符合逆光物理规律。",
  612. "description": "专门针对逆光场景中主体轮廓被光线勾勒(rim light/hair light)的视觉效果进行 AI 生成控制,使人物或物体的边缘呈现出发光的金色/白色轮廓,主体与背景形成强烈的明暗分离感,营造神圣感或电影感氛围。"
  613. },
  614. {
  615. "id": "CAP-47d6893f",
  616. "name": "图片蒙版与形状裁剪",
  617. "criterion": "图片可被裁剪为指定形状,边缘平滑无锯齿,形状内容完整显示。",
  618. "description": "对输入图片应用几何形状蒙版(圆形、心形、星形、三角形、矩形、自定义轮廓等)进行裁剪,改变图片显示形态,输出带透明通道的异形图片,可直接叠加到背景或拼贴画布上,丰富视觉层次和情感表达。"
  619. },
  620. {
  621. "id": "CAP-485908fc",
  622. "name": "网格系统参数化版面规划",
  623. "criterion": "生成的网格框架参数精确(如3栏×6格/栏=18单元格);图片边缘与网格线对齐,无偏移;文字基线与网格行对齐;支持模块网格/栏式网格/比例网格等多种网格类型;可导出为设计软件可用的参考线文件。",
  624. "description": "基于专业排版网格系统理论,通过参数化设置(版心边距、分栏数、栏间距、基线网格、字号层级等),自动生成精确的版面网格框架,为多格子图文排版提供规范化的空间划分基础,确保图片底边/顶边与文本行对齐、不同栏文字基线同一水平。"
  625. },
  626. {
  627. "id": "CAP-48dec6e0",
  628. "name": "视频角色动作迁移驱动",
  629. "criterion": "迁移后的角色动作与参考视频中的动作在时序和幅度上高度对应;角色在运动过程中无明显肢体变形或穿模;动画流畅度达到可发布标准(无明显跳帧);角色外观特征(毛色、体型、服装)在动作过程中保持稳定。",
  630. "description": "将参考视频中的人体动作序列自动迁移到3D卡通动物角色上,使角色按照参考动作流畅运动,同时保持角色原有的外观特征和风格,避免肢体变形等常见问题。"
  631. },
  632. {
  633. "id": "CAP-49175b92",
  634. "name": "电影感镜头语言控制",
  635. "criterion": "生成视频中的镜头运动与提示词描述的轨迹一致(如跟随镜头、低角度扫视、俯瞰弧线等);景别切换自然流畅;整体呈现出专业电影级别的镜头感,而非普通录像感",
  636. "description": "在 AI 视频生成中,通过提示词精确描述摄影机运动轨迹、镜头类型、景别切换、时间段分镜和专业摄影参数(推拉摇移、环绕、起重机升降、视差漂移、一镜到底等),或通过平台专属控制项指定镜头运动,使生成视频按照专业电影镜头语言输出具有叙事节奏感和电影级质感的动态画面。"
  637. },
  638. {
  639. "id": "CAP-4afeb722",
  640. "name": "多图无缝融合与渐变过渡",
  641. "criterion": "相邻照片之间的过渡区域无明显硬边或突兀色差;整体画面色调和谐统一;融合后的图像在视觉上呈现自然的连续感,而非机械拼接感。",
  642. "description": "将多张照片通过渐变淡化、透明度叠加、色调统一等方式进行边缘融合,使相邻照片之间平滑过渡,消除明显的拼接边界,形成视觉上连贯一体的合成图像。"
  643. },
  644. {
  645. "id": "CAP-4c471e0d",
  646. "name": "超宽画幅与镜头参数控制",
  647. "criterion": "生成图像的画幅比例符合设定的超宽格式;画面中可见明显的透视纵深线条或消失点;宽角镜头效果使场景边缘可见范围显著大于标准画幅。",
  648. "description": "通过设定超宽宽高比(如 21:9、2:1)、镜头类型(广角、变形宽银幕、短焦距)及构图参数(高角度、消失点透视),在 AI 生成图像中实现宽广的视野范围和强烈的空间纵深感。"
  649. },
  650. {
  651. "id": "CAP-4cf9e4c7",
  652. "name": "图像转3D模型生成",
  653. "criterion": "生成的3D模型在形态上与输入的2D参考图高度对应;模型具有合理的拓扑结构,可用于动画绑定;纹理贴图与原始图像色彩和材质一致;可导出为标准3D格式(OBJ/FBX等)并在主流3D软件中使用。",
  654. "description": "将2D概念图或参考图像自动转换为可用于渲染、动画和游戏引擎的3D模型,通过AI自动完成拓扑重建、纹理烘焙和骨骼绑定等传统3D制作流程中的耗时环节,大幅提升3D角色制作效率。"
  655. },
  656. {
  657. "id": "CAP-4d8ba002",
  658. "name": "LLM 图像提示词双向转化(扩写 + 反推)",
  659. "criterion": "LLM输出的提示词能被图像模型正确理解并生成符合用户意图的图像;相比用户直接输入关键词,经LLM扩写后的提示词生成图像质量更高、细节更丰富;整个过程无需用户手动编写复杂提示词。",
  660. "description": "以大语言模型(ChatGPT/Claude/Gemini/DeepSeek/GPT-4V)为中间层,**扩写**方向:将用户简短关键词或模糊创意意图自动扩展为结构化、高质量的图像生成提示词;**反推**方向:对参考图像进行语义分析,自动提取色彩、构图、风格、镜头、布光、材质等维度的结构化提示词;实现从语义意图到可执行提示词、从视觉参考到文字描述的双向自动转化。"
  661. },
  662. {
  663. "id": "CAP-4e7cc33d",
  664. "name": "东方传统插画风格生成",
  665. "criterion": "生成的插画元素具有明显的手绘/水墨/工笔画风格特征;中药材、植物等元素的形态准确可辨认;与暖色调背景(米色/浅棕色)融合自然,无明显风格割裂感;书法字体装饰与整体东方美学氛围协调。",
  666. "description": "生成具有东方传统美学特征的插画元素,包括手绘风格的中药材图谱、植物花卉、书法字体装饰、传统纹样等,这些元素与暖色调背景融合,营造复古温暖的东方文化氛围,适用于中医养生、传统文化类内容的视觉表达。"
  667. },
  668. {
  669. "id": "CAP-4e89bb57",
  670. "name": "品牌规则约束信息图生成",
  671. "criterion": "生成的信息图在配色、字体、Logo 使用、版式布局上与预设品牌规则文件一致;不同主题的信息图在同一品牌规则下输出时视觉风格统一;无需人工逐项检查品牌合规性。",
  672. "description": "通过预先定义品牌规则文件(包含配色、字体、Logo、布局约束、风格指南等),在生成信息图时自动遵循品牌规范,确保输出结果与品牌视觉体系高度一致,无需每次在提示词中重复描述品牌要求。"
  673. },
  674. {
  675. "id": "CAP-4eca62ec",
  676. "name": "中国传统吉祥符号主题化生成",
  677. "criterion": "生成图像中的中国传统吉祥符号(如双喜字、牡丹、龙凤)形态完整、语义正确;符号与整体画面的色彩(红金配色)、构图风格协调统一;用户可识别出具体的吉祥符号类型",
  678. "description": "以中国传统吉祥符号(双喜字、牡丹、红玫瑰、金色纹样、龙凤图腾、灯笼等)为核心视觉主题,通过专项提示词工程和文化语义理解,生成具有强烈中式喜庆氛围的图像内容,确保吉祥符号在画面中的语义准确性和视觉完整性。"
  679. },
  680. {
  681. "id": "CAP-4f15a85f",
  682. "name": "多景别镜头提示词精确控制",
  683. "criterion": "生成图像的景别类型(远景/中景/特写等)与提示词中描述的一致;主体在画面中的占比与指定参数吻合(如 65% 垂直占比);焦距模拟效果(广角畸变、长焦压缩)符合物理光学逻辑;同一提示词模板可复用并批量生成多个景别的系列图",
  684. "description": "通过在提示词中嵌入专业电影摄影语言(景别类型、焦距参数、相机距离、画面占比、拍摄角度等),精确控制 AI 生成图像或视频中的景别效果,使输出结果符合指定的远景/全景/中景/近景/特写等具体构图要求。"
  685. },
  686. {
  687. "id": "CAP-4f1c2773",
  688. "name": "图片描边效果",
  689. "criterion": "描边样式清晰可见,粗细和颜色可调,与图片内容协调统一。",
  690. "description": "为拼贴中的单张图片添加描边,支持铅笔、马克笔、虚线、双重、撕纸等多种描边样式,使图片轮廓更突出。"
  691. },
  692. {
  693. "id": "CAP-511c45c1",
  694. "name": "文本内容结构化提炼与知识点萃取",
  695. "criterion": "输出内容覆盖原文核心要点,无遗漏关键信息;逻辑框架与原文结构匹配(总分/并列/因果等);输出格式为可直接用于排版的结构化文本(Markdown/JSON/大纲);提炼后字数精简至原文 20% 以内。",
  696. "description": "利用大语言模型对输入的长篇文章、书籍章节或原始素材进行语义理解,自动提炼核心知识点、搭建逻辑框架(金字塔型、流程型、对比型等),输出结构化的卡片内容大纲,为后续排版和可视化提供标准化输入。"
  697. },
  698. {
  699. "id": "CAP-51665ef6",
  700. "name": "卡通拟人化装饰元素生成",
  701. "criterion": "生成的卡通元素(五官、触角等)在位置和比例上与照片中物体的形态相匹配;卡通元素的风格统一(如简笔画风格、Q 版风格);拟人化效果自然,使物体看起来具有生命感和表情;元素种类可按需组合(眼睛+眉毛+腮红+触角等)。",
  702. "description": "根据照片中真实物体的形态特征,AI 自动生成与该物体形态相匹配的卡通拟人化装饰元素(如卡通五官、触角、腮红、对话框、表情符号等),使真实物体在视觉上呈现出拟人化的卡通生命感,是实物照片手绘化创作中最核心的趣味元素生成能力。"
  703. },
  704. {
  705. "id": "CAP-5326543f",
  706. "name": "球形全景/小行星投影效果生成",
  707. "criterion": "生成图像中场景呈现明显的球形弯曲或圆形包裹效果;地平线弯曲成圆弧;场景元素(建筑、植被、地面)沿球面分布;整体构图呈现微型星球或雪球般的封闭圆形世界感",
  708. "description": "通过在提示词中使用球形全景相关关键词(如 spherical tiny planet composition、ultra-wide fisheye lens bends reality into a perfectly circular micro-world、equirectangular photograph 等),驱动 AI 生成将真实场景弯曲成球形或圆形微世界的超现实图像,呈现反重力、360° 全景包裹的视觉效果。"
  709. },
  710. {
  711. "id": "CAP-5342ad19",
  712. "name": "角色设定卡 / 多视图参考表生成",
  713. "criterion": "输出的角色表包含至少3个角度的全身视图和不少于2个表情特写;所有面板中角色的面部特征、发型、服饰、体型比例保持完全一致;面板间光照统一、间距规整、背景干净;可直接作为参考图输入到后续图像生成工具中",
  714. "description": "基于文字描述或单张参考图,一次性生成同一角色的多角度视图(正面/侧面/背面全身)、多表情特写以及服装/配饰细节,形成标准化的角色参考表(Character Sheet)或多视图主体库,作为后续跨场景、跨工具的角色一致性生成的视觉锚点,支持复用。"
  715. },
  716. {
  717. "id": "CAP-5590aa35",
  718. "name": "AI驱动的图像文字内容智能生成",
  719. "criterion": "生成的文字内容与图像主题高度相关,语义通顺,风格适配目标场景",
  720. "description": "AI模型根据图像内容或用户提示,自动生成适配的文字内容(如电影海报的标题、标语、演员列单等),无需人工撰写"
  721. },
  722. {
  723. "id": "CAP-562d91c1",
  724. "name": "海报/长图多元素自动排版与版式智能设计",
  725. "criterion": "输出长图包含所有指定的视觉元素类型(文字、图片、图表等);各元素在版面中的位置、比例符合输入的布局草图或模板;整体视觉层次清晰,信息阅读顺序合理;版面色调统一,无明显拼接痕迹;可在单次工作流执行中完成从素材到成图的全流程合成。",
  726. "description": "通过 AI 设计工具或生成式排版引擎,将多种异质视觉元素(人物照片、品牌 Logo、活动标识、二维码、数据图表、时间线、流程图、文字段落、装饰元素、地图、产品照片)按照信息层级、品牌规范和视觉平衡原则,自动选择最优构图方案(居中、左右、对角、时间轴、戏剧性垂直分割、三角形/X 形),并按信息优先级分配视觉权重,合成为专业商业海报、信息图或杂志/报告风格的完整长图版面。"
  727. },
  728. {
  729. "id": "CAP-56368e3a",
  730. "name": "室内自然材质纹理与有机形态精准生成",
  731. "criterion": "生成图像中的藤编纹理可见编织结构;实木纹理呈现自然木纹走向;大理石纹路清晰且符合天然石材特征;宣纸肌理墙面呈现低饱和度哑光质感;各材质在同一空间中的光泽度差异(哑光vs亮面)正确呈现",
  732. "description": "在室内效果图生成中,精准还原藤编、实木(胡桃木/榆木/橡木)、大理石、宣纸肌理、竹编、棉麻、亚麻等天然材质的视觉纹理特征,并控制弧形、拱形、圆润等有机形态设计元素,使画面传达自然、温润、生活化的治愈氛围,区别于冷硬工业风或过度精致的奢华风。"
  733. },
  734. {
  735. "id": "CAP-57948a3f",
  736. "name": "产品展示特写构图生成",
  737. "criterion": "生成图像的构图焦点在手与物品的互动区域;物品细节(纹理、材质、标识)清晰可辨;手部与物品的比例关系自然;背景虚化程度与前景焦点形成合理对比;整体构图符合商业摄影审美标准",
  738. "description": "通过提示词工程精准控制画面构图,生成以手部与物品互动为核心的特写画面,包括焦距模拟、景深控制、背景虚化、光线方向等摄影参数的 AI 化表达,使生成图像达到商业摄影级别的构图质量。"
  739. },
  740. {
  741. "id": "CAP-57e99eb4",
  742. "name": "节日吉祥符号与传统纹样渲染",
  743. "criterion": "传统符号(喜/福/龙凤/祥云等)形态准确,文化语义正确;立体感/材质感(KT板/金属/竹编)与描述一致;符号颜色与场景主色调(红金/米白/淡豆沙)协调统一;尺寸比例在场景中合理(如2米高喜字在宴会厅中的视觉比例)",
  744. "description": "生成符合中式婚礼/节日庆典语境的传统吉祥图案与立体符号,包括立体喜字(KT板/竹编/金属材质)、福字(鎏金/发光/立方体堆叠)、龙凤浮雕纹、祥云图案、生肖元素等,要求符号造型准确、文化寓意正确、材质质感与场景主题风格统一。"
  745. },
  746. {
  747. "id": "CAP-580dd48f",
  748. "name": "生成参数化风格强度控制",
  749. "criterion": "调整风格化参数后,生成结果的艺术化程度随参数值变化呈现可感知的梯度差异;低参数值时画面更接近写实,高参数值时风格特征更突出;用户可通过参数复现特定风格化程度的结果",
  750. "description": "在AI图像生成阶段,通过引擎专属的数值化参数(如Midjourney的--s风格化强度、--p个人化参数)对生成结果的风格偏离程度进行精准量化控制,使用户可以在'写实还原'与'高度风格化'之间连续调节,而非只能在预设风格间二选一。"
  751. },
  752. {
  753. "id": "CAP-59491141",
  754. "name": "多角色画面分区控制",
  755. "criterion": "生成图像中各分区内的角色外观与其对应提示词/LoRA 设定一致;不同分区角色之间无特征混淆(如服装颜色、发型不互相污染);整体画面构图自然,分区边界无明显割裂感",
  756. "description": "将画面划分为多个独立的潜空间区域,每个区域绑定独立的提示词和 LoRA 模型,从而在同一张图中精确控制不同位置的角色外观、服装和特征,避免多人生成时角色特征相互污染或混乱。"
  757. },
  758. {
  759. "id": "CAP-59d2256e",
  760. "name": "渐变映射单色调后处理",
  761. "criterion": "处理后图像的色相完全统一为目标色系(色相变化范围 ≤ 20°);原图的明暗层次(value)得到完整保留,高光区域对应目标色系浅色端,阴影区域对应深色端;视觉上呈现丰富的明度层次而非平涂效果。",
  762. "description": "将图像的明度信息(灰度值)通过渐变映射(Gradient Map)重新映射到目标单色系的不同明度变体上,使画面在保留明暗层次的同时,所有色相统一收敛到同一色系,实现纯粹的单色调视觉效果。"
  763. },
  764. {
  765. "id": "CAP-59fd3bd8",
  766. "name": "宫格图商业带货内容生成",
  767. "criterion": "输出的宫格图包含多个商品或商品细节展示;各格图片规格统一(横竖大小一致);配有精简文字说明(描述口感/使用场景等);整体色彩饱和度高、视觉冲击力强;适配平台最佳展示比例(如3:4)。",
  768. "description": "针对电商/自媒体带货场景,将多个商品或同一商品的多个细节/角度,自动整合为四宫格/六宫格拼图形式,配合精简文字说明,形成适合抖音/小红书图文带货的视觉内容,提升商品展示效率和转化率。"
  769. },
  770. {
  771. "id": "CAP-5a1ac59d",
  772. "name": "多情绪状态表情包批量生成",
  773. "criterion": "单次执行输出不少于6种明确可辨的情绪状态图;同套图中角色外观(颜色、体型、服饰道具)保持一致;每张图的情绪表达与目标情绪标签高度吻合,无歧义",
  774. "description": "针对同一角色IP,通过结构化情绪列表(如沮丧、无奈、委屈、狂喜、愤怒、震惊等)驱动AI在单次工作流中批量输出覆盖全情绪谱系的表情包图集,每张图保持角色外观一致、情绪表达准确、可直接用于社交传播。"
  775. },
  776. {
  777. "id": "CAP-5ad20f82",
  778. "name": "多层级立体架构图视觉化",
  779. "criterion": "输出图表中各层级在视觉上可被明确区分(颜色、高度或形状不同);层级数量与输入描述一致;图表在 PPT 或文档中插入后视觉效果专业,无需额外美化。",
  780. "description": "将系统架构、业务逻辑或概念层级关系以立体堆叠图形(金字塔、圆柱堆叠、同心圆、环形闭环等)进行视觉化表达,通过渐变色彩区分层级、立体透视增强空间感,使观众能一眼识别层级关系和模块归属,相比平面方框图更具视觉冲击力和汇报说服力。"
  781. },
  782. {
  783. "id": "CAP-5b000814",
  784. "name": "结构化 Prompt 框架工程(分段/模板/参数化)",
  785. "criterion": "使用该 Prompt 框架生成的图像须在风格(赛博朋克/科技感)、构图(人物位置、背景元素)、质量(分辨率、细节丰富度)上与预期高度吻合,且同一框架可复用于批量生成风格一致的系列图。",
  786. "description": "系统化设计 Prompt 的分段结构(SUBJECT / ENVIRONMENT / MOOD / COLOR LOGIC / CAMERA / SCENE / LIGHTING / QUALITY 等维度),使 AI 模型能够分维度理解并精确控制图像;并将验证过的高质量 Prompt 框架抽象为可复用模板,通过替换变量(主题、国家、产品、风格词等)批量生成风格统一的系列化内容,实现 AI 生成输出的可复现精准风格控制。"
  787. },
  788. {
  789. "id": "CAP-5b240afd",
  790. "name": "AI 驱动科普文案生成",
  791. "criterion": "给定一个主题词,模型能自动输出 N 条(N 可配置)独立完整的科普知识点;每条知识点语言简洁、专业准确、符合目标平台调性;输出格式为结构化 JSON,字段完整,可直接被下游节点引用,无需人工二次整理。",
  792. "description": "以主题关键词或领域方向为输入,由大语言模型(LLM)自动生成结构化的科普知识点文案,输出格式化的内容列表(如 JSON 数组),每条包含名称、描述、要点等字段,直接供后续图像生成和排版节点消费。"
  793. },
  794. {
  795. "id": "CAP-5b469359",
  796. "name": "焦散光效(Caustics)与彩虹色散生成",
  797. "criterion": "生成图像中可见明显的焦散光斑图案或彩虹色散效果;光斑形态与光源和介质形状物理自洽;色散效果呈现出可识别的彩虹色序(红橙黄绿蓝紫);整体光线质感真实且具有视觉吸引力。",
  798. "description": "通过AI提示词或3D渲染引擎参数,生成光线穿过透明介质(玻璃、水、钻石、棱镜)后产生的折射光斑(焦散)和彩虹色散效果,在画面中呈现出彩虹色光晕、水波光斑、钻石色散等高级光线质感。"
  799. },
  800. {
  801. "id": "CAP-5c1ae6ce",
  802. "name": "噪点密度空间分布控制",
  803. "criterion": "输出图像中噪点分布与画面明暗关系自洽(如暗部颗粒更密集、亮部颗粒稀疏);不同区域的颗粒大小和密度可独立配置;整体颗粒分布具有有机感而非机械均匀。",
  804. "description": "在颗粒噪点生成过程中,对画面不同区域的噪点密度、大小和分布进行差异化控制,使亮部、暗部、边缘区域呈现不同强度的颗粒感,模拟真实胶片或手工绘制中噪点随光影变化的自然分布规律。"
  805. },
  806. {
  807. "id": "CAP-5c76f74a",
  808. "name": "图表矢量格式导出(SVG/PDF)",
  809. "criterion": "导出的 SVG/PDF 文件在任意分辨率下放大均无锯齿或模糊;PNG 导出分辨率不低于 1920px;文件可直接在浏览器或矢量编辑器中打开并保持完整结构。",
  810. "description": "AI 生成的图表可直接输出为无损矢量格式(SVG、PDF)或高清光栅格式(PNG 1920px+),确保图表在任意缩放比例下保持清晰,可直接插入论文、PPT、技术文档而不模糊,满足出版级输出要求。"
  811. },
  812. {
  813. "id": "CAP-5e371e70",
  814. "name": "拟人化角色换装与道具替换",
  815. "criterion": "换装后的角色:①核心动物特征(毛色、体型、面部)与原角色保持一致;②新服饰/道具与角色气质协调;③可批量生成多套造型变体;④不同造型间的角色辨识度保持稳定。",
  816. "description": "在保持拟人化动物角色核心外观特征(毛色、体型、面部特征)不变的前提下,通过提示词或局部重绘技术为角色替换不同的服饰、道具或配件,快速生成同一角色的多种造型变体,用于换装视频、系列内容或角色多场景展示。"
  817. },
  818. {
  819. "id": "CAP-5e899749",
  820. "name": "梦幻装饰元素点缀生成",
  821. "criterion": "生成图像中包含至少一种梦幻装饰元素(花瓣/星光/光晕/薄雾/气泡等);装饰元素与画面主体在色调、透明度上自然融合,不显突兀;整体画面氛围因装饰元素的存在而更具梦幻感和层次感",
  822. "description": "在插画或场景图生成时,自动在画面中融入花瓣飘落、闪烁星光、光晕粒子、薄雾飘散、漂浮气泡等奇幻装饰性元素,使画面在静态构图之上增添梦幻灵动的视觉层次,强化童话感与诗意氛围。"
  823. },
  824. {
  825. "id": "CAP-5f9644fb",
  826. "name": "AI 原声音乐生成配乐",
  827. "criterion": "生成音乐的情绪基调与视觉内容的氛围描述一致(如孤寂荒漠场景配以平静宽敞的环境音景);音乐为 100% 原创,无版权风险;可直接用于视频配乐发布",
  828. "description": "使用 AI 音乐生成工具,根据视觉内容的情绪氛围(如孤寂、神秘、史诗感)自动创作与画面高度匹配的原创背景音乐,实现视听一体化的沉浸式体验。"
  829. },
  830. {
  831. "id": "CAP-5fb6dd66",
  832. "name": "室内多光源分层与物理光照提示词工程",
  833. "criterion": "生成效果图中可识别出至少两种光源层次(如灯带+自然光、台灯+落地灯);光线过渡自然柔和,无硬阴影或曝光过度;整体画面呈现温馨治愈的氛围感,与单一顶灯照明效果有明显差异。",
  834. "description": "在提示词中分层描述室内多光源组合(自然窗光/日光、吊灯、筒灯、射灯、落地灯/台灯、隐藏灯带),并指定光源类型、方向、色温、光质(漫射/定向/体积光束)以及物理行为(环境遮蔽、接触阴影、自然反弹、由近到远的光影渐变),生成具有丰富光影层次与物理正确感的室内效果图。"
  835. },
  836. {
  837. "id": "CAP-60bf1206",
  838. "name": "实物照片与手绘元素图层合成",
  839. "criterion": "输出图像中真实物体的纹理、颜色、光影等写实细节得以完整保留;手绘元素与照片主体在视觉上自然融合,无明显拼接感;手绘元素的位置、比例与照片主体的形态相匹配(如五官叠加在物体正面合适位置);整体呈现出'实物+手绘'的双层视觉结构。",
  840. "description": "以真实物体照片为底图,将 AI 生成的手绘简笔画元素(如卡通五官、触角、对话框、箭头、装饰线条等)精准叠加到照片指定位置,形成'实物底图+手绘层'双重视觉结构,使照片呈现出实物与手绘结合的趣味效果,同时保持照片主体的真实质感不被破坏。"
  841. },
  842. {
  843. "id": "CAP-60fe95a7",
  844. "name": "自定义轮廓形状照片拼贴填充",
  845. "criterion": "多张照片填充在指定自定义形状轮廓内,整体轮廓边界清晰;各照片在形状内部合理分布,无明显空白或溢出;整体视觉效果cohesive,可识别出原始形状轮廓",
  846. "description": "将多张独立照片填充到自定义形状轮廓(如人脸、动物、Logo、产品轮廓等 SVG 形状)内部,形成以该形状为边界的多照片拼贴效果,超越基础矩形网格框架,实现创意化的非规则网格拼贴。"
  847. },
  848. {
  849. "id": "CAP-61f83796",
  850. "name": "无缝循环光效动画生成",
  851. "criterion": "动画循环点处画面内容和运动状态完美衔接,无明显跳变或闪烁;循环播放时视觉上感知不到重复点;光效颜色和运动模式与设计意图一致;可导出为标准视频格式用于实时播放。",
  852. "description": "生成可无限循环播放的光效动画(Seamless Loop),光线、粒子或抽象图案在循环点处完美衔接,无明显跳变,适用于VJ表演、直播背景、展示屏幕等需要持续播放的场景。"
  853. },
  854. {
  855. "id": "CAP-6249caa6",
  856. "name": "服装多视角设计图生成",
  857. "criterion": "生成图像中包含正面和背面(或其他指定视角)的完整服装展示;各视角的服装款式、颜色、纹理保持一致;细节特写与整体图在设计语言上统一;可选标注内容清晰可读。",
  858. "description": "基于文本描述或参考图,AI一次性生成包含正面、背面、细节特写等多个视角的完整服装设计图,并可在图中自动标注材质、结构、色彩等设计要素,形成专业的服装设计展示文档。"
  859. },
  860. {
  861. "id": "CAP-6365b50f",
  862. "name": "照片动画化",
  863. "criterion": "静态图片可被赋予平滑的运动动画,动画时长和幅度可调,输出为视频格式。",
  864. "description": "对静态照片添加平移、缩放等动画效果,使拼贴内容具有运动感,适用于视频形式的拼贴叙事。"
  865. },
  866. {
  867. "id": "CAP-63c933bb",
  868. "name": "视频内容转图文卡片",
  869. "criterion": "输出图文卡片的核心内容与原视频信息一致,无关键信息遗漏;图文格式符合目标平台规范(如小红书图文比例);全流程无需人工介入,从视频输入到图文输出自动完成;支持批量处理多个视频。",
  870. "description": "以短视频(如抖音视频)为输入源,通过 AI 工作流自动完成视频内容理解、关键帧提取、文案提炼、图文排版等步骤,输出适配目标平台(如小红书)格式的图文笔记卡片组。"
  871. },
  872. {
  873. "id": "CAP-6485105e",
  874. "name": "高饱和冲突色配色方案智能生成",
  875. "criterion": "生成的配色方案包含至少 2 种高饱和色(饱和度 S > 80%);标题文字颜色与背景颜色的对比度符合 WCAG AA 标准(对比度 ≥ 4.5:1);配色方案与目标情绪/场景匹配(如红色=紧迫感、黄色=能量、橙色=热情);可输出具体色值(HEX/RGB)",
  876. "description": "基于目标场景(电商促销、YouTube 缩略图、社交媒体封面等)和情绪目标(紧迫感、兴奋感、能量感),自动生成由 2-3 种高饱和互补色或冲突色构成的配色方案,并将其应用于标题文字填充色、描边色、背景色的精确色值分配,实现最大化视觉冲击力的色彩组合。"
  877. },
  878. {
  879. "id": "CAP-64f5a261",
  880. "name": "标题字号对比度与视觉层次自动编排",
  881. "criterion": "生成版面中标题字号与正文字号之比不低于 2:1(理想为 5:1 以上);标题区域占版面面积 30%-80%;正文在标题强烈对比下仍保持可读性;整体版面信息层次清晰,观众视线能自然从标题流向正文",
  882. "description": "在图文排版生成中,自动实现标题与正文之间的极端字号对比(标题为正文的 2-8 倍字号),并通过字重、字体族、颜色饱和度的多维度差异,构建清晰的视觉信息层次,使版面在高信息密度下仍保持可读性与视觉冲击力。"
  883. },
  884. {
  885. "id": "CAP-66cd9fbf",
  886. "name": "背景选择与设置",
  887. "criterion": "背景与主体图片色调协调,不喧宾夺主,整体视觉统一。",
  888. "description": "为拼贴选择合适的底图背景,支持纯色、渐变色、材质纹理(如星星卡纸)等多种背景类型,或使用一张照片作为底图。"
  889. },
  890. {
  891. "id": "CAP-67324920",
  892. "name": "颗粒噪点纹理叠加生成",
  893. "criterion": "输出图像中颗粒噪点分布自然均匀,强度与提示词或参数设定一致;颗粒不破坏主体轮廓清晰度;在不同色块区域颗粒密度可独立调节;整体呈现印刷在粗糙介质上的视觉质感。",
  894. "description": "在 AI 生成图像的基础上,通过后处理节点或生成阶段的噪点参数,将可控强度的颗粒噪点均匀或非均匀地叠加到画面全局或指定区域,模拟胶片颗粒、印刷噪点或手工绘制的细密点状肌理效果。"
  895. },
  896. {
  897. "id": "CAP-6742d9b6",
  898. "name": "AI 生成参数精准风格化控制(MJ/Niji 参数工程)",
  899. "criterion": "使用参数控制后,生成图像的风格特征(动漫感/写实感/风格化程度)与参数设定一致;--no 参数指定的排除元素(如文字)未出现在图像中;--s 参数值越高,生成结果越具艺术风格化;同一咒语模板可稳定复现相似风格",
  900. "description": "通过系统化运用 Midjourney 及 Niji 模型的专属参数(--niji、--s、--chaos、--no、--ar 等),对 AI 生成图像的风格化程度、动漫/写实倾向、随机性、排除元素、画面比例等维度进行精准控制,实现可复用的科技感海报生成咒语模板。"
  901. },
  902. {
  903. "id": "CAP-677f2802",
  904. "name": "无限递归/无限深度视觉幻象生成",
  905. "criterion": "生成图像中存在视觉上可感知的递归/无限延伸效果(如镜中镜、循环建筑、无限深度通道);递归层次至少可辨认 3 层以上;整体构图具有强烈的视觉深度感和空间延伸感。",
  906. "description": "通过 AI 生成工具,在图像中构建视觉上无限延伸或递归重复的空间结构(如无限镜面反射、无限循环建筑、万花筒式递归图案),使观众产生空间无限延伸的视觉幻象,强化超现实的空间突破感。"
  907. },
  908. {
  909. "id": "CAP-689bac61",
  910. "name": "色彩配色方案生成与推荐",
  911. "criterion": "生成图像的色彩搭配和谐统一;色调符合产品定位(如高端奢侈品用低饱和度色调、活力产品用明亮色彩);背景色与产品色形成适当对比,突出主体",
  912. "description": "基于色彩理论(对比色、互补色、邻近色、三色组合、渐变过渡色)、内容主题、情感氛围或参考图输入,自动生成或推荐协调的配色方案(主色 + 辅助色 + 强调色,附 HEX/RGB 色值),涵盖产品摄影、海报、图文排版、品牌物料等场景。支持参考图语义分析与 HEX 色板自动提取(从图像提取 5 个核心色值渲染为调色板)。"
  913. },
  914. {
  915. "id": "CAP-694db036",
  916. "name": "3D渲染器照明模拟(非AI生成)",
  917. "criterion": "渲染结果符合物理光照规律(光线衰减、反射、折射、焦散等);材质表现真实(金属反射、布料漫反射、玻璃透射等);阴影和高光符合光源位置和强度;支持HDRI环境贴图提供真实环境光",
  918. "description": "使用专业3D渲染软件(Blender Cycles、Enscape、UE5等)通过物理光照模型(HDRI环境光、面积光源、点光源、聚光灯等)和PBR材质节点,模拟真实世界的光照效果,生成照片级室内渲染图"
  919. },
  920. {
  921. "id": "CAP-69cb7cbe",
  922. "name": "Midjourney 风格参考码(--sref)驱动的光影风格固化",
  923. "criterion": "使用相同 --sref 码生成的不同内容图像,在光影风格(色调、光质、明暗分布)上保持高度一致;与不使用 --sref 的同提示词生成结果相比,风格稳定性显著提升;用户可通过分享 --sref 码实现风格的跨用户复现。",
  924. "description": "利用 Midjourney 的风格参考(Style Reference,--sref)参数,通过特定的风格码或参考图 URL 将某种特定的光影风格(如奢华幻想发光风格、复古未来主义剪影风格)精确固化并可重复应用,无需每次重新描述复杂的光影参数。"
  925. },
  926. {
  927. "id": "CAP-6a4f793a",
  928. "name": "毛发/鬃毛物理动态模拟",
  929. "criterion": "生成图像/视频中动物的毛发(鬃毛/尾巴/体毛)在运动方向上呈现出符合物理规律的飘动轨迹;毛发的飘动方向与动物运动方向、风向一致;毛发细节(丝丝分明、层次感)在高分辨率下清晰可见;与静态毛发相比,观看者能明显感受到速度感和动感。",
  930. "description": "在 AI 生成的动物运动图像或视频中,精确模拟毛发、鬃毛、尾巴等柔性体在运动中受风力、惯性、重力影响下的动态飘动效果,使生成结果中的毛发运动符合真实物理规律,呈现出强烈的动感和生命力。"
  931. },
  932. {
  933. "id": "CAP-6af31201",
  934. "name": "设计 Token 与 AI 代码双向同步",
  935. "criterion": "设计工具中修改 Token 后,代码端对应变量自动更新,无需手动同步;AI 可根据设计 Token 自动生成符合规范的组件代码;设计与代码端的视觉表现保持一致,无偏差。",
  936. "description": "通过 AI 辅助将设计工具中定义的设计变量(颜色、字体、间距等 Design Token)与代码端实现保持实时双向同步,使设计稿修改可自动反映到代码组件,消除设计与开发之间的手动交接损耗。"
  937. },
  938. {
  939. "id": "CAP-6af51b66",
  940. "name": "AI场景背景生成与人物合成",
  941. "criterion": "AI生成的背景场景氛围、风格与需求一致;人物与背景在光照、透视、色调上自然融合;合成后整体视觉效果真实可信或符合创意风格",
  942. "description": "先使用AI工具生成目标场景背景(如雪山、梦幻场景、超现实环境),再将实拍或生成的人物主体合成到该场景中,实现低成本、高创意的场景置景效果"
  943. },
  944. {
  945. "id": "CAP-6c14041c",
  946. "name": "胶片与镜头光学质感模拟(柔焦/散景/颗粒/暗角/色调/光晕)",
  947. "criterion": "生成图像中可见明显的胶片光学特征(如圆形散景光斑、边缘暗角、细腻颗粒感、高光辉光晕染);整体色调仍保持统一,光学效果与主色调氛围协调一致;画面呈现手持慢快门的朦胧纪实质感。",
  948. "description": "通过在提示词中注入胶片摄影的光学特征与色调关键词(柔焦、散景、胶片颗粒、暗角、辉光/Halation、Kodak Portra 400 暖调、复古胶片颗粒、镜头光晕 Lens Flare、镜头绽放 Lens Bloom),模拟真实胶片相机的光学成像与色调特性,使生成图像呈现朦胧、疏离、梦幻的胶片质感氛围。"
  949. },
  950. {
  951. "id": "CAP-6e503f51",
  952. "name": "次表面散射与材质透光质感生成",
  953. "criterion": "生成图像中半透明材质(皮肤/玻璃/果冻等)在强光照射下呈现出内部透光效果;材质边缘有合理的光线渗透和色彩偏移;整体材质质感真实,具有明显的次表面散射特征(如皮肤在逆光下呈现红润透光感)。",
  954. "description": "通过提示词描述光线穿透半透明材质(皮肤、果冻、蜡烛、玉石、琥珀玻璃瓶)时产生的次表面散射(Subsurface Scattering)效果,使AI生成的材质呈现出内部发光、透光通透的高级质感,增强画面的光线层次感和材质真实度。"
  955. },
  956. {
  957. "id": "CAP-6e77db54",
  958. "name": "卡片版式模块化智能布局",
  959. "criterion": "每张卡片包含完整的标准模块(标题+编号+插图+说明文字);各模块在卡片内位置固定、比例协调;同一系列多张卡片的版式结构完全一致;输出图片尺寸符合目标平台规范(如 3:4 竖版)。",
  960. "description": "根据内容结构和目标平台规范,自动将知识内容分配到标准化的卡片版式模块中(标题区、编号区、插图区、要点列表区、底部总结区等),确保每张卡片信息层次分明、图文比例协调、跨卡片视觉风格统一。"
  961. },
  962. {
  963. "id": "CAP-6f73062a",
  964. "name": "拼贴风格化装饰元素叠加",
  965. "criterion": "叠加的装饰元素与拼贴图的整体风格(复古/可爱/ins风/手帐风)保持一致;装饰元素的颜色、大小、位置与画面协调,不遮挡照片主体关键内容;输出图包含所有指定装饰层。",
  966. "description": "在拼贴图基础上自动叠加与整体风格匹配的装饰元素,包括手绘涂鸦(星星、爱心、箭头、花朵)、纸张纹理、撕纸边框、胶片条框架、邮票穿孔边缘等,形成完整的风格化拼贴视觉效果。"
  967. },
  968. {
  969. "id": "CAP-727ea06b",
  970. "name": "第一人称/POV 沉浸式视角生成",
  971. "criterion": "生成内容明确呈现第一人称主观视角特征(如可见主体的手/爪/触角、视线方向与主体朝向一致);画面具有对应主体的尺度感(如昆虫 POV 时周围物体显得巨大);整体视觉效果令观看者产生身临其境的沉浸感。",
  972. "description": "生成模拟特定主体(人类、动物、微型生物等)主观视角的图像或视频,画面呈现该主体眼睛所见的第一人称场景,配合微距细节、运动模糊、手持抖动等拟真效果,营造强烈的沉浸感和代入感。"
  973. },
  974. {
  975. "id": "CAP-72ab826b",
  976. "name": "Glitch 故障艺术效果生成",
  977. "criterion": "生成图像中包含可识别的故障艺术特征(像素噪点/扫描线/色彩错位/数据断层中至少两种);故障效果与深色背景自然融合,整体呈现'材质感'和'情绪设计'而非具体主体;彩色流光与故障元素协调共存",
  978. "description": "通过 AI 生成工具在图像中模拟数字信号故障、像素错位、扫描线干扰、数据断层等故障艺术(Glitch Art)视觉效果,营造现实卡顿、信号失真、画面撕裂的炫酷氛围,常与深色背景和彩色流光结合使用。"
  979. },
  980. {
  981. "id": "CAP-7423a8b2",
  982. "name": "图像分层叙事构图生成",
  983. "criterion": "生成图像中可识别出至少前景、中景、背景三个视觉层次;各层次元素在比例、清晰度、色彩上形成自然的空间深度感;主体元素作为视觉锚点清晰突出;整体构图平衡,具有视觉动线引导。",
  984. "description": "通过 AI 生成引擎,在单一画面内实现前景、中景、背景的多层次视觉叙事构图,使不同层次的视觉元素(主体人物/产品、场景背景、装饰元素)在同一版面内形成有深度感的空间层次关系,实现'定格于一帧'的丰富视觉叙事。"
  985. },
  986. {
  987. "id": "CAP-74b4e2d1",
  988. "name": "视频截帧转拼图",
  989. "criterion": "从视频中提取的帧画质清晰,可直接用于拼贴,无明显模糊或压缩失真。",
  990. "description": "从视频片段中提取关键帧,将视频内容转化为静态拼贴长图。"
  991. },
  992. {
  993. "id": "CAP-74dca28f",
  994. "name": "知识内容结构化分板块拆解",
  995. "criterion": "输出的板块数量与内容复杂度匹配(通常 4-8 个板块);每个板块有独立标题和 2-4 条核心要点;板块间逻辑递进清晰;每个板块附带配图风格/主题建议,可直接用于后续插画生成提示词",
  996. "description": "将连续的知识文本(如心理学文章、医疗科普、历史知识)通过 AI 自动拆解为多个独立的知识板块,每个板块包含标题、核心要点、配图关键词建议,形成可直接用于图文排版的结构化内容单元。"
  997. },
  998. {
  999. "id": "CAP-758922b1",
  1000. "name": "照片级真实感渲染增强",
  1001. "criterion": "生成图像中的材质(藤编、木纹、布艺、石材)具有真实的高光、反射和次表面散射效果;光照在场景中物理自洽,阴影方向一致;图像包含适度的相机不完美(轻微景深虚化、自然颗粒感),整体难以与真实室内摄影区分。",
  1002. "description": "通过 PBR 物理材质、HDRI 环境光照、受控相机不完美(景深、色差、颗粒感)等多维度技术组合,将 AI 生成的室内效果图从「明显是渲染图」提升至「难以分辨是否为真实照片」的照片级质感。"
  1003. },
  1004. {
  1005. "id": "CAP-762555e1",
  1006. "name": "饰品珠宝细节构图公式化生成",
  1007. "criterion": "生成图像的构图方式与指定公式一致;饰品金属光泽和宝石细节清晰,无塑料感;背景简洁不干扰主体;画面主体占满画幅,质感高级。",
  1008. "description": "通过预设的构图公式(居中构图、三角形构图、前景构图、三分线构图、对角线构图、切圆构图)结合微距特写参数,引导 AI 生成饰品珠宝的高级感特写图,使金属光泽和宝石闪耀效果得到最佳呈现。"
  1009. },
  1010. {
  1011. "id": "CAP-76d7f3af",
  1012. "name": "多帧/分镜色调一致性控制",
  1013. "criterion": "系列图像中各帧的主色相偏差不超过 ±20°;高光/阴影的色温倾向一致;视觉上无明显的帧间色调跳变;可在不同场景内容下维持统一的色调氛围。",
  1014. "description": "在生成多张连续场景图(如 AI 影片分镜、系列插画)时,通过九宫格分镜布局、统一色调参考图或批量色调后处理,确保所有帧/画面之间的光影色彩保持高度一致,消除 AI 生成内容在多帧间的色调漂移问题。"
  1015. },
  1016. {
  1017. "id": "CAP-792fd807",
  1018. "name": "景深虚化光学模拟",
  1019. "criterion": "",
  1020. "description": ""
  1021. },
  1022. {
  1023. "id": "CAP-79590b09",
  1024. "name": "全局色调风格化(蓝紫/复古/电影感色彩分级)",
  1025. "criterion": "调整后图像的整体色调与目标色系(如蓝紫/复古/电影感)高度一致;高光、中间调、阴影的色彩倾向符合预设;不同来源的多张图像经过同一色调处理后视觉风格统一,可作为系列素材使用",
  1026. "description": "对图像进行全局性的色彩倾向调整,将整体色调统一为特定的艺术氛围色系(如蓝紫色调、复古暖色、电影感青橙等),通过 HSL 分通道调整、分离色调(Split Toning)、LUT 应用等手段,使图像在色彩层面呈现出统一的艺术风格感,而非仅改变内容或笔触风格"
  1027. },
  1028. {
  1029. "id": "CAP-79f3d420",
  1030. "name": "3D 玩偶/手办风格角色生成",
  1031. "criterion": "生成的 3D 玩偶/手办形象具有清晰的材质质感(如毛绒、塑料、树脂);配套道具(包装盒、亚克力底座、标签)细节清晰可辨;整体比例符合对应玩具品类的视觉规范;光照渲染具有商业摄影级质量。",
  1032. "description": "将真实人物照片或文字描述转换为具有商业级质感的 3D 收藏玩偶、手办或 Jellycat 风格毛绒玩具形象,生成结果包含专业包装、展示底座等道具细节,整体呈现博物馆级收藏品质感。"
  1033. },
  1034. {
  1035. "id": "CAP-7a121f9b",
  1036. "name": "AI 视频生成与场景动态化",
  1037. "criterion": "生成视频在时间维度上保持场景空间一致性;视频帧率流畅(通常 24fps 以上);场景中的动态元素(光线变化、植被摇动等)与静态空间结构协调一致。",
  1038. "description": "将静态全景图或场景描述转换为动态 AI 视频,支持文本到视频、帧序列到视频、素材组合到视频等多种生成方式,使静态空间场景获得动态展示效果,增强空间规模感的视觉传达。"
  1039. },
  1040. {
  1041. "id": "CAP-7a4539ae",
  1042. "name": "多人/多动物骨骼姿态同步提取与对齐",
  1043. "criterion": "生成画面中所有主体的姿态与各自参考图高度吻合;多主体之间的相对位置、朝向、互动关系(如并排、面对面、背靠背)符合预设的空间关系描述;不同主体的骨骼骨架在同一画面中无冲突或穿插。",
  1044. "description": "从单张或多张参考图像中同时提取多个人物或动物的骨骼姿态信息,并将这些姿态精确对齐到同一画面坐标系中,实现多主体之间的同步、对称或互动姿态约束生成。"
  1045. },
  1046. {
  1047. "id": "CAP-7b12dc08",
  1048. "name": "多视角电影故事板生成",
  1049. "criterion": "生成的多视角网格中包含至少 6 种以上不同机位;各机位下角色外观(面部、服装、发型)保持一致;景深随镜头类型合理变化;整体具有电影级调色和照片般真实纹理;无明显角色外观漂移。",
  1050. "description": "从单张参考图或单个提示词出发,自动生成包含多个电影机位(大远景、全景、中景、特写、低角度、高角度等)的网格故事板图像,所有机位下角色外观、服装、光照保持严格一致,具备电影级构图和调色。"
  1051. },
  1052. {
  1053. "id": "CAP-7b9d2baf",
  1054. "name": "视频片段首尾帧衔接续生成",
  1055. "criterion": "衔接处前后两段视频在画面内容、角色外观、场景氛围上自然过渡,无明显跳切或不连续感;角色身份在跨片段中保持一致;可通过 prompt 指定延续时长和动作方向。",
  1056. "description": "以视频片段的首帧和/或尾帧作为约束条件,通过 AI 视频生成模型实现视频片段的延续生成或两帧之间的过渡生成。支持将已有视频的最后一帧作为下一段视频的起始条件实现无缝衔接,或以用户指定的起始帧和结束帧为约束自动推断并生成完整过渡视频,保持角色、场景、动作在跨片段中的一致性和连续性。"
  1057. },
  1058. {
  1059. "id": "CAP-7c8532dc",
  1060. "name": "宠物服装虚拟上身合成",
  1061. "criterion": "生成图像中服装图案与原产品图一致,版型随宠物体型自然弯曲贴合(无平铺感),服装与宠物毛发/皮肤边界融合自然,无明显拼接痕迹;宠物主体外观特征与输入照片保持一致。",
  1062. "description": "以宠物真实照片(或标准白底宠物模特图)和服装产品图为双输入,通过AI自动将服装虚拟穿戴到宠物身上,生成服装与宠物身体自然贴合的穿着效果图。AI能够精准贴合宠物身体轮廓,清晰呈现服装图案、版型、印花细节与宠物体型的适配关系,输出真实感强的上身效果图,用于宠物服装商品的电商展示或个性化定制预览。"
  1063. },
  1064. {
  1065. "id": "CAP-7d935e94",
  1066. "name": "单图生成全景3D场景",
  1067. "criterion": "输入单张图像后,输出的3D场景模型具有完整的全景视角覆盖;场景中的空间关系(前景/中景/背景的纵深层次)与原图一致;可从不同角度渲染出新视角,且新视角画面质量与原图相当。",
  1068. "description": "以单张参考图像为输入,通过深度估计和3D场景重建算法(如高斯飞溅技术),自动生成可交互的全景3D场景模型,使平面的超现实场景图像获得真实的空间纵深感和可探索的3D视角。"
  1069. },
  1070. {
  1071. "id": "CAP-7fe213d3",
  1072. "name": "幽灵模特无实体服装展示",
  1073. "criterion": "生成图像中服装保持完整的三维立体形态,无塌陷或变形;无可见人体,但服装的穿戴状态自然真实;可选择性叠加标注、说明文字等视觉元素;整体效果达到商业产品展示标准。",
  1074. "description": "通过AI生成技术,在没有真实人体模特的情况下,使服装在三维空间中以自然撑开的形态独立呈现,仿佛穿戴在隐形人体上,实现专业级的服装产品展示效果,同时可叠加解剖图式标注等创意视觉元素。"
  1075. },
  1076. {
  1077. "id": "CAP-807df7b0",
  1078. "name": "产品动态旋转视频生成",
  1079. "criterion": "生成视频中产品旋转运动平滑自然,无明显跳帧或抖动;产品材质质感在运动过程中保持一致;成分分离动画保持对齐关系和比例;整体运动节奏符合高端产品展示调性。",
  1080. "description": "基于静态产品图或提示词,生成产品缓慢旋转或成分动态分离的短视频,使产品在动态展示中保持材质质感和结构完整性,适用于电商产品展示视频。"
  1081. },
  1082. {
  1083. "id": "CAP-81439a38",
  1084. "name": "AI视频室内漫游帧间一致性控制",
  1085. "criterion": "生成的室内漫游动画中,建筑元素(墙壁、窗框、地板、天花板)在各帧间保持几何一致,无明显变形或幻觉;相机运动平滑自然;起始帧和结束帧与指定的参考图像高度一致;输出动画可直接用于客户展示,无需大量后期修复。",
  1086. "description": "通过设置起始帧和结束帧(Start and End Frames)约束AI视频生成的边界,防止室内空间漫游动画中出现几何变形、幻觉(ghosting)和不稳定的建筑结构,确保窗框、拱门、地板等建筑元素在整个动画序列中保持几何一致性。"
  1087. },
  1088. {
  1089. "id": "CAP-8302ef3b",
  1090. "name": "高饱和渐变色彩背景生成",
  1091. "criterion": "生成背景的色彩饱和度达到高饱和标准(HSB饱和度≥70%);渐变过渡自然流畅,无明显色块断裂;色彩组合与提示词指定的色调(蓝紫/橙红/粉金等)高度吻合;可批量产出不同配色方案的系列背景。",
  1092. "description": "通过AI提示词精准控制生成高饱和度、多色渐变的背景图像,支持蓝紫、橙红、粉金等多种色彩组合,实现流体渐变、断层渐变、网格渐变等多种渐变形态,直接满足宣传海报背景的色彩需求。"
  1093. },
  1094. {
  1095. "id": "CAP-832e80ac",
  1096. "name": "系列海报批量变体生成",
  1097. "criterion": "批量输出的多张海报须在色调、字体、构图框架上保持高度一致(视觉风格统一度≥90%),同时各张在指定替换元素上有所差异,且无需对每张海报单独重新设计。",
  1098. "description": "基于同一视觉风格和品牌规范,通过 AI 批量生成多张风格高度一致的海报变体,支持替换人物、口味、标签、道具等单一元素而不破坏整体设计风格,形成系列展示图。"
  1099. },
  1100. {
  1101. "id": "CAP-84277e91",
  1102. "name": "流体有机色彩形态生成",
  1103. "criterion": "生成图像中可见明显的流体流动轨迹或有机形态(细胞状、泡泡状、羽毛状、漩涡状等);多种高饱和颜色在流动形态中自然分布,无生硬拼接感;整体呈现类似丙烯倒流画的视觉效果。",
  1104. "description": "通过AI生成模拟流体艺术(Fluid Art)的有机色彩形态,使多种高饱和颜色在画面中呈现自然流动、融合、形成细胞状/泡泡状/羽毛状等有机形态,色彩边界清晰但过渡自然,产生迷幻的视觉流动感。"
  1105. },
  1106. {
  1107. "id": "CAP-8467736a",
  1108. "name": "粒子光效与环境特效场景生成",
  1109. "criterion": "生成画面中包含可见的多色发光粒子群;粒子运动轨迹自然流畅(流动、汇聚、爆发等);粒子颜色与提示词描述一致;整体画面具有明显的发光感和空间层次感。",
  1110. "description": "通过 AI 提示词或专业 3D/特效工具,生成大量发光粒子(星点、尘埃、能量球、光束)或环境粒子(尘土飞扬、烟雾弥漫、水花飞溅、花瓣飘落)在场景中流动、汇聚、爆发或与主体运动物理联动的视觉效果。粒子具有多种颜色(橙、蓝、紫、金等)与自发光属性,形成梦幻/魔幻氛围或强化主体动感与临场感。"
  1111. },
  1112. {
  1113. "id": "CAP-851ef56b",
  1114. "name": "AI 文本到视频生成(动物运动专项)",
  1115. "criterion": "生成视频中动物的运动方式(奔跑/潜行/跳跃)自然流畅,符合真实生物力学;视频时长、帧率、分辨率达到指定参数;镜头运动(跟踪/推进/摇摄)与动物运动协调配合;整体视觉质量达到电影级或专业摄影级标准。",
  1116. "description": "使用专业 AI 视频生成引擎(如 KLING、Veo-3)通过文本提示词直接生成包含动物运动的高质量视频片段,无需传统动画制作流程,可精确控制动物的运动方式、镜头语言、场景氛围和视觉风格。"
  1117. },
  1118. {
  1119. "id": "CAP-8531d74f",
  1120. "name": "画中画嵌套框架构图生成",
  1121. "criterion": "生成图像中存在清晰可辨的内嵌框架元素;框架内外呈现两个视觉上有差异的空间或世界;框架边缘与周围场景的光照、透视关系自洽;整体构图具有明确的视觉焦点引导(观众视线被框架引导至内部场景)。",
  1122. "description": "通过 AI 生成工具,在单张图像中构建一个或多个可见的内嵌框架(如悬空矩形框、镜框、门窗框、门户/传送门、圆形虚空等),使框架内部呈现与外部场景不同的另一个世界或视角,形成画中画的嵌套空间层次感,制造超现实的空间突破效果。"
  1123. },
  1124. {
  1125. "id": "CAP-86fc2867",
  1126. "name": "图像比例扩展(Outpainting/画布扩图)",
  1127. "criterion": "扩展区域生成的内容与原图在光照、色调、风格上自然衔接,无明显拼接痕迹;原图主体区域像素保持不变;扩展后图像比例符合目标尺寸要求;扩展内容在语义上与原图场景合理延续。",
  1128. "description": "对已有图像进行画布扩展,在原图边界之外自动生成与原图内容、光照、风格一致的新内容,使图像适配目标比例(如将非16:9图片扩展为16:9横屏构图),同时保持原图主体和视觉风格不变。"
  1129. },
  1130. {
  1131. "id": "CAP-87ba3b7d",
  1132. "name": "图文信息卡片一键排版",
  1133. "criterion": "输入纯文字内容后,输出的卡片具有清晰的信息层级(标题>小标题>正文);字体、间距、留白符合设计规范;整体视觉具有高级感;支持多种卡片样式模板切换;可批量导出多张卡片图片。",
  1134. "description": ""
  1135. },
  1136. {
  1137. "id": "CAP-894379db",
  1138. "name": "提示词驱动食材百科信息卡片自动生成",
  1139. "criterion": "输出信息卡片包含营养成分可视化图表(环形图/条形图)、人体器官功效标注、烹饪参数矩阵、季节轮盘等多个信息模块;整体设计风格统一专业;用户无需提供额外参数或了解设计规则即可获得完整输出。",
  1140. "description": "用户仅需输入食材名称,系统通过预设的结构化提示词模板自动完成信息整理与视觉设计,一键输出包含营养成分图表、健康功效地图、烹饪方法矩阵、季节指南、搭配矩阵等多维度信息的博物馆级设计信息卡片。"
  1141. },
  1142. {
  1143. "id": "CAP-8c805e0e",
  1144. "name": "无缝拼接/连续画面",
  1145. "criterion": "相邻图片边缘视觉连续,滑动浏览时无明显断裂感,整体构成一幅完整大图。",
  1146. "description": "创建多张图片在视觉上连续衔接的效果,使拼贴在横向滑动或整体观看时呈现无断点的连贯画面。"
  1147. },
  1148. {
  1149. "id": "CAP-8d69865f",
  1150. "name": "照片 AI 一键转绘插画",
  1151. "criterion": "输出图像的构图和主体内容与输入照片对应;视觉风格完整转换为目标插画风格(笔触、色彩、线条均符合目标风格特征);转换过程全自动,无需人工逐帧绘制;多张照片经同一流程处理后风格统一",
  1152. "description": "以真实照片为输入,通过 AI 图生图(Image-to-Image)技术,自动识别照片中的人物面部、身体特征或场景构图,在保留原始照片内容和主体可识别特征的前提下,将照片的视觉风格整体转换为指定的艺术风格(如卡通/动漫、扁平插画、油画、CityPop、动画风等),输出可直接用于设计、社交媒体或商业应用的风格化素材,全程 AI 自动处理,无需手绘技能或逐步手动调整。"
  1153. },
  1154. {
  1155. "id": "CAP-8d6ec160",
  1156. "name": "信息可视化图表自动生成",
  1157. "criterion": "生成的信息图包含至少一种数据可视化图表形式(如环形图、条形图、树状结构、时间线等);信息分块清晰,主次层级明确;整体配色统一,可直接用于发布。",
  1158. "description": "根据结构化数据或知识内容,自动生成包含树状图、时间线、环形图、条形图、放射状布局等多种图表形式的信息可视化海报,将复杂的科普知识转化为直观易读的视觉图形。"
  1159. },
  1160. {
  1161. "id": "CAP-906cdefd",
  1162. "name": "拼贴模板快速套用",
  1163. "criterion": "套用模板后只需替换图片内容,5分钟内可完成专业级拼贴,无需从零设计布局。",
  1164. "description": "使用预制的拼贴版式模板快速生成专业美观的拼贴效果,降低制作门槛。"
  1165. },
  1166. {
  1167. "id": "CAP-91cd83b4",
  1168. "name": "人物构图分区与网格布局规划",
  1169. "criterion": "画面中所有人物均有独立展示区域,互不遮挡核心信息;主要人物(主讲/主嘉宾)在视觉权重上明显突出;整体构图在视觉上保持平衡,无明显空白或拥挤区域。",
  1170. "description": "针对多人物展示海报,根据人物数量和重要性层级,自动规划最优的空间分区方案(如三排错落、菱形网格、圆形放射、中心辐射等),确保多人物在有限画布内排列有序、视觉平衡、主次分明。"
  1171. },
  1172. {
  1173. "id": "CAP-920091f9",
  1174. "name": "动态文字动画效果生成",
  1175. "criterion": "动画效果流畅,帧率不低于 24fps;文字在动画过程中始终保持可读性;动画风格与版面整体视觉调性一致;可导出为视频格式(MP4/GIF)用于社交媒体发布",
  1176. "description": "基于静态大字号标题文字,自动生成具有视觉冲击力的动态文字动画效果(如闪烁、平滑滑入、3D 透视旋转、数字计数、轮廓揭示、文字在主体后等),适用于短视频封面动画、社交媒体动态内容等场景,使大字号标题在动态环境中保持强烈的视觉吸引力。"
  1177. },
  1178. {
  1179. "id": "CAP-92b0fd72",
  1180. "name": "图片参考垫图引导生成(图生图)",
  1181. "criterion": "生成图像在色调、构图或氛围上与参考图保持明显的视觉关联;同时在内容上有明确的创意延伸(非简单复制);参考图的核心视觉特征(如大地色系、极简构图)在生成结果中清晰可辨",
  1182. "description": "以一张或多张参考图像作为视觉基底,引导 AI 生成引擎在保留参考图整体氛围、色调或构图的基础上,生成新的创意内容,实现从参考图到创意图的风格迁移与内容再创作。"
  1183. },
  1184. {
  1185. "id": "CAP-9359b49f",
  1186. "name": "复古印刷质感与半色调/孔版/波普纹理生成",
  1187. "criterion": "生成图像中可见明显的复古印刷质感特征(半色调网点、颗粒噪点、色彩分离错位、做旧肌理中的至少一种);高饱和色彩与复古质感自然融合,不显突兀;整体呈现丝网印刷或老式印刷品的视觉风格。",
  1188. "description": "通过 AI 生成或后处理节点,模拟复古印刷工艺的视觉质感:丝网印刷、半色调网点(Halftone)、孔版印刷(Risograph)、波普艺术网点与几何光学错觉纹理、混合模式叠印、颜色分层叠印、油墨渗透扩散,在高饱和色彩画面上叠加颗粒噪点、做旧肌理和色彩分离效果,使画面呈现强烈的年代感与手工印刷质感。"
  1189. },
  1190. {
  1191. "id": "CAP-93b11467",
  1192. "name": "AI视频生成与音画同步",
  1193. "criterion": "生成视频中人物运动自然流畅,无明显跳帧或变形;配音与画面内容在时间轴上同步;视频整体风格与静态图像保持一致;可导出为适合社交媒体发布的格式。",
  1194. "description": "将AI生成的静态图像序列转化为带有动态运动效果和同步配音的短视频内容,实现从静态穿搭图到动态展示视频的自动化生成,适用于社交媒体的动态内容发布。"
  1195. },
  1196. {
  1197. "id": "CAP-93cffeb9",
  1198. "name": "水彩手绘偶然性肌理模拟",
  1199. "criterion": "输出图像中可见水彩特有的晕染边缘和颜料堆积效果;纸张纤维纹理在颜色较浅区域自然显现;整体呈现手工水彩绘制在粗糙介质上的偶然性美感,而非数字滤镜的机械感。",
  1200. "description": "通过 AI 生成模型模拟水彩颜料在粗糙纸张上晕染、渗透、干燥后形成的偶然性肌理效果,包括水痕边缘、颜料堆积、纸张纤维显现等特征,使数字插画呈现手工水彩的有机质感。"
  1201. },
  1202. {
  1203. "id": "CAP-94c648d6",
  1204. "name": "信息层级视觉权重控制",
  1205. "criterion": "生成图像中,高权重区域的视觉元素(如标题文字、核心图表)在对比度、清晰度、色彩饱和度上明显优于低权重区域;版面整体信息层级清晰,用户视线可自然从主要信息引导至次要信息;不同信息区域的视觉权重差异可通过参数调节。",
  1206. "description": "通过注意力掩码(Attention Mask)或区域提示词权重控制,在同一版面中对不同信息区域施加差异化的生成权重,使主要信息区域(标题、核心数据)获得更高的视觉突出度,次要信息区域(正文、背景)保持适当的视觉弱化,从而在 AI 生成阶段即实现版面的信息层级结构。"
  1207. },
  1208. {
  1209. "id": "CAP-952b88b5",
  1210. "name": "品牌联名世界观构建与视频生成",
  1211. "criterion": "生成视频中的服装融合了多个品牌的设计元素且可识别;角色在极端场景(如火山爆发)中的服装细节依然清晰;场景与人物融合自然,视觉冲击力强",
  1212. "description": "基于多个品牌的设计元素(如Adidas x Gucci x Issey Miyake),构建统一的联名世界观和角色设定,并在极端或创意场景中生成视频内容,保持品牌元素和服装细节的清晰可见"
  1213. },
  1214. {
  1215. "id": "CAP-96182b8f",
  1216. "name": "毛茸茸/特殊材质质感渲染",
  1217. "criterion": "生成图像中角色毛发/绒毛质感明显可辨(如毛茸茸、蓬松、绒毛层次感);与普通平涂卡通风格有明显视觉区别;质感在批量生成的多张图中保持一致",
  1218. "description": "通过特定模型权重、精确的提示词关键词组合或风格LoRA,使生成的卡通/3D角色呈现出毛茸茸绒毛、羊毛毡、皮克斯级3D毛发、柔软蓬松质感等特定材质效果。核心提示词包括 fluffy、furry、plush-like texture、hyper-realistic micro-textures、soft detailed fur、matte and plush-like、wool felt 等材质描述词,配合光影渲染参数(soft diffused lighting、subtle shading、no hard shadows)实现高度逼真的可触摸柔软蓬松感,而非普通平涂卡通效果。"
  1219. },
  1220. {
  1221. "id": "CAP-97d386fd",
  1222. "name": "全景图格式转换与多平台适配",
  1223. "criterion": "转换后的立方体贴图可在目标 3D 引擎(Unity/Unreal/Blender)中正确加载为天空盒;注入元数据后的全景图/视频可被 360 度播放器(GOM Player、YouTube 等)识别为交互式 360 度内容。",
  1224. "description": "将等距矩形投影(equirectangular)全景图转换为立方体贴图(cubemap)、天空盒(skybox)等不同格式,并注入 XMP 空间媒体元数据,使全景图可被 Unity、Unreal Engine、Blender、Three.js 等 3D 引擎及 VR 播放器正确识别和使用。"
  1225. },
  1226. {
  1227. "id": "CAP-98490894",
  1228. "name": "唇形同步与说话人脸动画",
  1229. "criterion": "生成视频中角色口型与语音内容在时间轴上精确对齐;面部表情随语音情绪自然变化;角色面部其他特征(眼睛、鼻子、发型)在动画过程中保持稳定;整体视觉效果自然,无明显抖动或变形。",
  1230. "description": "将静态人物图像或 AI 生成角色与语音音频、配音内容或文字台词结合,自动生成与语音内容精确同步的口型动画,使角色看起来像在真实说话。支持 UGC 风格视频、多角色对话场景制作、多语言自动翻译+口型重新同步,无需手动逐帧调整口型,实现从静态图到有声视频的全流程自动化。"
  1231. },
  1232. {
  1233. "id": "CAP-9a2cc3d8",
  1234. "name": "AI角色配音生成",
  1235. "criterion": "生成的配音内容与角色性格和情绪状态匹配(如可爱动物角色配音应具有高音调、活泼感);配音与视频时间轴对齐;支持多语言配音输出。",
  1236. "description": "通过AI文字转语音工具,为3D卡通动物角色生成符合其性格特征的专属声音(如可爱兔子声、萌系动物声),并与角色动画视频精确对齐,实现完整的有声动画内容。"
  1237. },
  1238. {
  1239. "id": "CAP-9a963517",
  1240. "name": "视频模板换脸/换装合成",
  1241. "criterion": "输出视频中主体(猫咪头部/全身)与模板服装身体的比例、位置、光照自然匹配;主体特征(毛色、面部)清晰可辨;视频播放流畅无明显拼接痕迹;支持多套模板批量切换输出",
  1242. "description": "利用预制的职业服装视频模板,将用户上传的宠物/人物照片自动嵌入模板中的对应位置,生成主体穿着职业服装的动态视频效果,无需逐帧手动合成。"
  1243. },
  1244. {
  1245. "id": "CAP-9b71604d",
  1246. "name": "室内软装配色方案智能生成",
  1247. "criterion": "生成的配色方案中主色调(米白/暖棕)占比符合指定比例(如60%留白+40%木色);点缀色(黛蓝/石青/深棕)的使用位置和面积合理;整体色调呈现低饱和度、高雅致感;不同空间(客厅/卧室/餐厅)的配色方案保持整体协调",
  1248. "description": "基于指定的主色调约束(如米白+暖棕)和东方美学留白原则,自动生成完整的室内软装配色方案,包括墙面色、地面色、家具色、软装点缀色的比例分配,并输出对应的效果图"
  1249. },
  1250. {
  1251. "id": "CAP-9cef0d0f",
  1252. "name": "东方传统美学风格精准提示词工程",
  1253. "criterion": "生成图像能准确区分新中式/宋式美学/禅意侘寂/轻奢中式等细分风格;关键风格标识元素(如宋式美学的哑光青灰砖+藤编+纸灯笼+月洞门组合)在生成结果中完整呈现;不同细分风格之间的生成结果有明显视觉差异",
  1254. "description": "针对新中式/宋式美学/东方禅意等细分东方风格,构建包含色彩体系、材质语言、造型元素、氛围关键词的专项提示词模板库,使AI生成结果精准命中特定东方美学风格而非泛化的'中式风格'"
  1255. },
  1256. {
  1257. "id": "CAP-9d6f874a",
  1258. "name": "数据驱动图表插画一体化生成",
  1259. "criterion": "生成图像中的数据图表内容与输入数据一致,数值准确无误;图表类型(柱状图/折线图/饼图等)与数据特征匹配;图表与插画风格元素(卡通角色、科技感装饰)自然融合,整体视觉统一。",
  1260. "description": "将结构化数据(如 Excel 表格、统计数字)与视觉插画风格融合,由 AI 自动生成包含柱状图、折线图、饼图、关系图等数据图表的插画风格信息图,使数据可视化结果同时具备专业性和视觉吸引力。"
  1261. },
  1262. {
  1263. "id": "CAP-9efd3488",
  1264. "name": "系列表情包拼贴图排版合成",
  1265. "criterion": "拼贴图中各单元格尺寸统一、间距一致;每格图像的猫咪主体居中且面部清晰可辨;整体排版整洁美观,可直接发布到社交媒体平台",
  1266. "description": "将多张已生成的猫咪职业场景图像按照统一的视觉规范(尺寸、间距、背景色、标题文字)自动排列合成为一张多格拼贴图,适合在社交媒体上一次性展示完整的职业系列"
  1267. },
  1268. {
  1269. "id": "CAP-9f24d1c7",
  1270. "name": "图像转视频(Image-to-Video)生成",
  1271. "criterion": "输出视频中角色动作流畅自然,无明显跳帧或变形;角色外观与输入图像保持一致;视频时长可控(通常 3-10 秒);可导出为 MP4 格式用于社交平台发布。",
  1272. "description": "将静态 AI 生成图像转换为具有动态效果的短视频,使图像中的动物角色产生自然的动作(如咀嚼、移动、表情变化),适用于将表情包图片升级为病毒式短视频内容。"
  1273. },
  1274. {
  1275. "id": "CAP-a0336037",
  1276. "name": "职业场景主题化生成",
  1277. "criterion": "生成图像中包含与所选职业高度匹配的服装、道具和场景背景(如厨师帽+围裙+厨房、安全帽+反光背心+工地);职业识别度清晰,无需额外说明即可辨认职业类型;同一主体可批量切换多个职业主题输出",
  1278. "description": "以宠物/角色照片为输入,通过AI工具的职业主题选择或结构化描述词,一键生成包含完整职业服装、道具和场景背景的主题化写真图,无需用户逐一指定每个元素。"
  1279. },
  1280. {
  1281. "id": "CAP-a08749c3",
  1282. "name": "模板数据驱动批量图文套版",
  1283. "criterion": "单次操作可将N条数据记录(N可配置)批量填充到同一版式模板,生成N张独立图文素材;每张素材的版式结构完全一致;文字和图片内容与数据源对应准确;可批量导出为PNG/JPG/PSD格式,无需逐一手动编辑。",
  1284. "description": "以预设的视觉版式模板为基础,通过连接外部结构化数据源(如 Google Sheets、CSV、Excel、JSON 等),将不同产品的图片、文字、价格等变量数据通过数据合并机制自动映射填充到模板对应位置,批量生成版式统一、内容各异的图文素材或信息卡片。支持一键批量打印导出,全程无需人工逐张填写调整。"
  1285. },
  1286. {
  1287. "id": "CAP-a185d6d2",
  1288. "name": "冷暖色温对比光影氛围构建",
  1289. "criterion": "生成图像中可明确识别出冷色调和暖色调两个光源区域;冷暖光在画面中形成明显的色彩对比和边界;整体色调氛围与目标风格(赛博朋克/黄金时刻/蓝调时刻等)高度吻合。",
  1290. "description": "通过在提示词中同时指定冷色调(蓝/青/紫)和暖色调(橙/金/红)的光源,构建画面中冷暖光源相互对抗的戏剧性色彩张力,实现赛博朋克霓虹、黄金时刻、蓝调时刻等具有强烈情绪感的光影氛围。"
  1291. },
  1292. {
  1293. "id": "CAP-a35e7966",
  1294. "name": "霓虹/光晕/泛光/流光发光效果生成",
  1295. "criterion": "生成图像中的目标元素(文字/轮廓/场景物体)具有明显的霓虹发光效果;发光颜色与指定的霓虹色调(橙色/蓝色/粉色/绿色等)一致;发光层次自然,与深色背景形成高对比度视觉冲击;无明显色块溢出或发光边缘生硬。",
  1296. "description": "在 AI 生成图像中通过提示词参数或后处理节点,为文字、轮廓线、场景元素、光源周围(灯笼/路灯/窗灯/月亮等深色背景光源)添加多种发光效果:霓虹管状发光、外发光晕、光晕 Halo、泛光 Glow、光芒扩散、多层渐变光晕、流光线条、粒子散射、渐变镭射,营造赛博朋克/科技感/深色氛围的发光视觉质感。"
  1297. },
  1298. {
  1299. "id": "CAP-a3b3ab31",
  1300. "name": "人像面部表情精准生成与控制",
  1301. "criterion": "生成图像中人物面部表情与目标情绪描述高度吻合;眼神、嘴型、眉毛等五官细节协调一致地传达同一情绪;不同情绪批量生成时,每张图的表情差异明显且各自准确。",
  1302. "description": "通过提示词中的情绪关键词、表情细节描述或AI表情控制节点,精准生成或调整人物面部表情,使生成的肖像呈现特定的情绪状态(如惊讶、哭泣、俏皮、严肃等),让观看者能清晰感受到人物的神态与情感。"
  1303. },
  1304. {
  1305. "id": "CAP-a3e7db63",
  1306. "name": "动物体态与食物视觉比喻创意合成",
  1307. "criterion": "生成图像中动物体态与对应食物的形态相似度高(观者可直观感知类比关系);食物命名与动物毛色/体型特征强相关;图像整体风格统一,食物与动物的视觉融合自然。",
  1308. "description": "通过 AI 图像理解与生成能力,识别动物的体态特征(体型、毛色、姿势),将其与形态相似的食物进行创意视觉类比,生成动物「化身」为食物的拟食物化表情包,无需复杂合成,核心在于体态相似性的创意发现与视觉呈现。"
  1309. },
  1310. {
  1311. "id": "CAP-a4b638a6",
  1312. "name": "文字特效与动画渲染",
  1313. "criterion": "",
  1314. "description": ""
  1315. },
  1316. {
  1317. "id": "CAP-a52a2a7e",
  1318. "name": "图像像素化与低模风格化",
  1319. "criterion": "输出图像呈现明显的像素块状感,色彩被量化为有限色阶;像素化程度可参数化控制;主体轮廓在像素化后仍可辨认,整体风格统一。",
  1320. "description": "通过 AI 控制图像的像素密度和色块粒度,将普通照片或合成图转换为具有低分辨率像素感(低模感/像素艺术感)的风格化图像,营造特定的搞笑或复古视觉效果。"
  1321. },
  1322. {
  1323. "id": "CAP-a5661db3",
  1324. "name": "发光字牌与霓虹灯效果生成",
  1325. "criterion": "发光字文字内容与指定内容一致;发光效果真实(光晕、阴影、环境反光自然);发光字与场景中其他元素(花艺/背景板)在光照上协调自洽;支持多种发光字形式(灯泡字/霓虹字/LED字)的视觉差异化呈现",
  1326. "description": "生成具有发光效果的立体文字装置图像,包括大灯泡外露发光字、LED霓虹包边字、亚克力发光字等多种形式,支持自定义文字内容、发光颜色(暖黄/红/蓝/白)和发光强度,要求文字与周围花艺/装饰场景在光照上协调融合,呈现真实的光晕、阴影和环境反光效果。"
  1327. },
  1328. {
  1329. "id": "CAP-a597f297",
  1330. "name": "3D 模型到全景图渲染输出",
  1331. "criterion": "输出的全景图覆盖完整的 360 度水平视角和 180 度垂直视角;图像分辨率满足全景查看需求(通常 4K 以上);渲染质量包含准确的光照、阴影和材质表现。",
  1332. "description": "将 SketchUp、3ds Max、Rhino 等 3D 建模软件中的场景模型,通过专业渲染器(D5、Enscape、VRay 等)以全景相机模式渲染输出为 360 度等距矩形全景图,实现从 3D 模型到可交互全景图的完整转换。"
  1333. },
  1334. {
  1335. "id": "CAP-a5f8e368",
  1336. "name": "AI 驱动的图文版面自动构图与分区",
  1337. "criterion": "生成版面包含清晰的信息层级分区(至少 3 个层级);视觉流方向符合自然阅读习惯(从标题→内容→行动号召);各分区内容不重叠、不拥挤;版面在目标尺寸(如 1280x720px、A4)下比例协调",
  1338. "description": "基于输入的文案内容(标题、副标题、正文、行动号召等)和目标尺寸,由 AI 自动规划版面分区(如顶部标题区/中部图文区/底部信息区),确定各区域的面积比例、对齐方式、视觉流方向,输出完整的版面构图方案,使信息密度高的版面在视觉上仍保持秩序感。"
  1339. },
  1340. {
  1341. "id": "CAP-a688b102",
  1342. "name": "文本词频分析与词云图自动生成",
  1343. "criterion": "词云图中词语的显示大小与其在原始文本中的词频正相关;高频词汇清晰可辨;支持自定义形状蒙版时,词云整体轮廓与指定形状吻合;可导出为图片格式直接用于报告。",
  1344. "description": "AI 对输入的文本数据进行词频统计和关键词提取,自动生成词云图,支持自定义形状蒙版、字体大小与词频映射、色彩主题设置,将文本数据的高频词汇以直观的视觉方式呈现。"
  1345. },
  1346. {
  1347. "id": "CAP-a802aa75",
  1348. "name": "手绘笔触与线条风格生成",
  1349. "criterion": "生成的线条/笔触具有手绘特有的不规则性和有机感(非机械均匀的数字线条);线条粗细、压感变化、墨水渗透等手绘特征可见;整体视觉效果与真实手绘工具(钢笔、铅笔、炭笔、马克笔)的质感相符。",
  1350. "description": "在 AI 图像生成过程中,模拟真实手绘的笔触质感、线条特征和纸张纹理,使生成的图像或叠加元素呈现出手工绘制的有机感和不规则美感,包括墨水线条、铅笔素描、炭笔阴影、松散涂鸦笔触等多种手绘风格的线条表现。"
  1351. },
  1352. {
  1353. "id": "CAP-a968e1fd",
  1354. "name": "中性色调与材质组合提示词工程",
  1355. "criterion": "生成图像的主色调为中性色系(米色、灰褐色、象牙白等),无明显饱和色彩;材质表现真实(木材纹理、金属光泽、织物质感);整体氛围温暖柔和而不冷淡;色彩和材质组合符合提示词描述",
  1356. "description": "通过提示词明确指定中性色调调色板(taupe灰褐色、ivory象牙白、beige米色等)和自然材质(oak wood橡木、brass黄铜、marble大理石、linen亚麻等),生成具有永恒设计感的室内空间图像"
  1357. },
  1358. {
  1359. "id": "CAP-aa48b87b",
  1360. "name": "人物肖像赛博朋克风格化迁移",
  1361. "criterion": "输出图像中人物面部可辨识度≥80%,同时呈现霓虹灯光、机械装备或赛博元素等风格化特征,且无需手工绘制或修图软件人工操作。",
  1362. "description": "将用户提供的真实人物照片或参考图,通过 AI 图像生成/风格迁移技术,自动转化为赛博朋克/未来主义风格的人物形象,保留人物面部特征的同时叠加霓虹光效、机械元素、科技感服装等视觉改造。"
  1363. },
  1364. {
  1365. "id": "CAP-aaaef688",
  1366. "name": "电影级光照与写实质感提示词工程",
  1367. "criterion": "生成图像具有明显的光影对比和戏剧性;光照质量达到电影或高端摄影水平(柔和过渡、丰富层次、精确控制);整体氛围符合电影或时尚大片的视觉标准;光照效果支撑叙事性或情绪表达",
  1368. "description": "通过提示词引入电影摄影的专业光照术语与写实质感维度:光照(golden hour lighting 黄金时段、cinematic lighting 电影级照明、editorial lighting 编辑级照明)、摄影参数(景深、镜头角度)、材质细节(毛发纹理、皮肤质感)、场景氛围(色彩分级、环境光)的综合组合策略,系统化提升 AI 生成图像的戏剧性、艺术性和照片级真实度。"
  1369. },
  1370. {
  1371. "id": "CAP-ab1f763a",
  1372. "name": "装饰贴纸与涂鸦",
  1373. "criterion": "贴纸和涂鸦元素可自由缩放、旋转、放置,与整体风格协调,不遮挡主要内容。",
  1374. "description": "在拼贴画面中添加手帐贴纸、emoji、星星、蝴蝶结、花朵等装饰元素,或使用涂鸦笔手绘小图案填补空白区域,营造氛围感。"
  1375. },
  1376. {
  1377. "id": "CAP-ac5640b7",
  1378. "name": "AI社交媒体风格文案生成",
  1379. "criterion": "生成文案的语言风格与目标平台(如小红书)的用户习惯高度吻合,包含适量Emoji、口语化表达和互动引导语;文案内容与配套图片主题一致;可直接用于发布无需大幅修改。",
  1380. "description": "基于给定的主题或食材信息,由大语言模型自动生成符合特定社交媒体平台(如小红书)语言风格的图文配套文案,包含标题、正文、Emoji表情、话题标签等完整内容结构。"
  1381. },
  1382. {
  1383. "id": "CAP-ac9c30ba",
  1384. "name": "海报多层级标题信息架构生成",
  1385. "criterion": "海报顶部区域包含至少两个层级的标题文字(主标题字号明显大于副标题);各层级文字在视觉上有明确的大小/颜色/字重区分;整体标题区与人物展示区、底部信息区形成清晰的三段式视觉分区。",
  1386. "description": "在海报画面顶部区域,按照「活动主标题 → 专场名称 → 时间/地点等辅助信息」的层级逻辑,自动生成字号递减、视觉权重分明的标题文字区块,使观众能在第一时间识别活动核心信息。"
  1387. },
  1388. {
  1389. "id": "CAP-ae2b8c91",
  1390. "name": "人体与物品接触关系精准生成",
  1391. "criterion": "生成图像中人体局部与物品的接触方式与描述一致(如'嘴唇衔住花茎'而非'嘴唇靠近花朵');接触点的形变、受力关系符合物理逻辑(如嘴唇轻咬花茎时的微小形变);物品在接触区域的遮挡关系正确,无穿模现象。",
  1392. "description": "精准控制人体局部(嘴唇、手指、眼睛等)与外部物品(花朵、水果、道具等)之间的接触方式(含/咬/衔/夹/捻/沾等)及空间关系(平面接触/空间环绕/空间包裹),生成接触关系自然可信、物理逻辑正确的创意组合图像。"
  1393. },
  1394. {
  1395. "id": "CAP-b01b3d53",
  1396. "name": "图文卡片画板排版合成",
  1397. "criterion": "输出卡片中各元素(标题、编号、插图、说明文字)位置符合模板预设;多张卡片在背景色、字体、圆角、边框等视觉元素上保持高度一致;卡片尺寸符合目标平台规范(如小红书 3:4、Instagram 9:16);整组卡片可直接发布,无需人工二次调整。",
  1398. "description": "将 AI 生成的插图(已抠图)、文案文字(标题、编号、说明)、背景色块、装饰元素等多个独立素材,按照预设的卡片模板布局(如顶部标题区 + 中部插图区 + 底部说明区)自动组合排版,输出风格统一、尺寸规范的单张图文卡片,多张卡片构成系列组合。"
  1399. },
  1400. {
  1401. "id": "CAP-b32980e1",
  1402. "name": "幽默夸张服装穿搭视觉反差生成",
  1403. "criterion": "生成图像中人物穿戴的物品与提示词描述的夸张穿法一致(如短裤当长袍、篮球服模仿古希腊长袍);视觉反差效果明显,观看者能直接感知到物品错位穿戴的幽默意图;人物整体画面质量达到可发布标准。",
  1404. "description": "通过精准的提示词工程,引导AI图像生成模型将日常普通物品(如运动短裤、超大号服装)以非常规、夸张的方式穿戴在人物身上,刻意制造物品原始用途与当前穿戴方式之间的强烈视觉反差,产生幽默搞怪的喜剧效果。"
  1405. },
  1406. {
  1407. "id": "CAP-b3d8f0fc",
  1408. "name": "AI 音效生成",
  1409. "criterion": "生成的音效在类型、节奏、强度上与画面内容语义匹配(如人群欢呼声与欢呼画面同步);音频质量清晰,无明显噪声或失真;可直接用于视频配音而无需额外处理",
  1410. "description": "根据场景描述或视频内容,自动生成与画面内容语义匹配的环境音效、动作音效或氛围音频,使生成的活动现场视频具备真实的声音维度。"
  1411. },
  1412. {
  1413. "id": "CAP-b4092cfe",
  1414. "name": "AI 虚拟换装",
  1415. "criterion": "换装后服装与主体身体贴合自然,无明显拼接或变形;主体面部特征(毛色、眼神、表情)与原图保持一致;服装细节(颜色、图案、材质)与参考服装图高度吻合",
  1416. "description": "以猫咪(或其他主体)原始照片和目标职业服装图片为输入,通过扩散模型将服装自然地穿戴到主体身上,保持主体面部特征和体型不变,实现一键换装效果"
  1417. },
  1418. {
  1419. "id": "CAP-b4abc0ef",
  1420. "name": "视觉焦点饱和度对比",
  1421. "criterion": "视觉中心区域饱和度 ≥70%;周围区域饱和度 ≤30%;饱和度过渡自然无突兀感;高饱和区域成为明确的视觉焦点",
  1422. "description": "通过控制画面不同区域的色彩饱和度分布,使视觉中心区域保持高饱和度,周围区域降低饱和度,从而自然引导观众视线聚焦到高饱和区域"
  1423. },
  1424. {
  1425. "id": "CAP-b5822b4a",
  1426. "name": "长文智能拆分为多图卡片序列",
  1427. "criterion": "拆分后每张卡片内容独立完整,信息量适中(不过长也不过短);卡片间逻辑顺序与原文一致;自动生成的编号/页码连续准确;整组卡片覆盖原文核心信息,无重要内容遗漏;全程无需人工手动分段。",
  1428. "description": "将一篇完整的长文章或长文案,由 AI 自动识别章节结构和语义边界,智能拆解为多个独立的内容单元,每个单元对应一张图文卡片,并自动生成编号序列和页码,最终输出一组结构清晰、逻辑连贯的多图卡片序列,适合在小红书、Instagram 等平台以轮播形式发布。"
  1429. },
  1430. {
  1431. "id": "CAP-b5dc2a07",
  1432. "name": "天体尺度宇宙视角场景生成",
  1433. "criterion": "生成图像中的天体元素(地球、星云、星环、星空)在视觉上具有物理可信度(大气层光晕、星球曲率、星云色彩);人物或建筑与天体的尺度对比关系合理且震撼;整体画面具有宇宙级的空间纵深感和史诗感。",
  1434. "description": "专门生成以宇宙、太空、星空、天体为核心视觉元素的超现实场景图像,包括从太空俯瞰地球、星云中的人物、天体尺度的星球对比、宇宙级星空美学等,通过精确的天文视觉描述词和写实渲染参数,产出兼具科学可信度与梦幻美感的宇宙视角画面。"
  1435. },
  1436. {
  1437. "id": "CAP-b5ee6f9b",
  1438. "name": "节日欢庆氛围元素生成",
  1439. "criterion": "生成的氛围元素(颗粒、光效、飞溅等)与背景色彩协调融合;元素分布自然,不显堆砌;整体画面氛围与目标节日/庆典主题一致;视觉热烈程度达到欢庆活动宣传标准。",
  1440. "description": "通过AI提示词控制,在海报图像中生成具有节日欢庆氛围的装饰性元素,包括金色闪光颗粒、彩色粉末飞溅、发光光效、丝绸波浪、烟花粒子、金箔纹理等,使整体画面呈现出热烈、充满活力的欢庆感。"
  1441. },
  1442. {
  1443. "id": "CAP-b6492d95",
  1444. "name": "电影级光效与发光特效生成",
  1445. "criterion": "生成图像中可见明确的发光效果(如霓虹光晕、光轨、边缘发光);光效颜色与主色调(红/蓝)一致;光影在画面中物理上自洽,增强而非破坏整体视觉效果。",
  1446. "description": "在 AI 图像生成中,通过提示词精确描述电影级灯光、霓虹发光、光晕、光轨等光效元素,使画面在高饱和度色彩对比的基础上叠加戏剧性光影效果,增强视觉震撼力和沉浸感。"
  1447. },
  1448. {
  1449. "id": "CAP-b9caca43",
  1450. "name": "服装印花图案精准还原",
  1451. "criterion": "生成图像中服装印花图案的主要元素(颜色、形状、排列规律)与参考产品图可被人眼识别为同款;图案在宠物身体曲面上的透视变形符合物理规律(非平铺拉伸);图案细节在正常展示尺寸下清晰可辨。",
  1452. "description": "在宠物穿着效果图生成过程中,确保服装上的印花图案(如青花瓷纹样、心形印花、金色刺绣、格纹等)在贴合到宠物身体曲面后,图案内容、色彩、细节密度与原始服装设计稿或产品图保持高度一致,不因曲面变形而导致图案失真或模糊。"
  1453. },
  1454. {
  1455. "id": "CAP-bb672010",
  1456. "name": "户外场景氛围感提示词结构化生成",
  1457. "criterion": "按框架生成的提示词所产出的图像,在场景真实感、光线自然度、人物动态自然度上,与专业摄影师手写提示词的产出效果无显著差异;框架覆盖至少8个核心维度(主体、服装、动作、场景、光线、构图、色调、风格)。",
  1458. "description": "将户外儿童摄影的核心要素(主体年龄/特征、服装道具、场景环境、光线时段、构图视角、色温色调、拍摄风格)按照标准化框架自动组合为高质量生成提示词,使非专业用户也能稳定产出具有专业摄影感的户外生活记录照片。"
  1459. },
  1460. {
  1461. "id": "CAP-bbac5ce2",
  1462. "name": "喜庆红金配色氛围控制",
  1463. "criterion": "生成图像的主色调为中国传统红色(朱砂红/大红)与金色的组合;画面整体色彩饱和度、明度符合喜庆氛围要求;红色运用典雅高端,不显廉价;金色元素(文字、装饰、纹样)与红色背景形成视觉层次",
  1464. "description": "通过色彩语义提示词工程和色调参数控制,将图像整体色彩方案锁定在中国传统喜庆配色体系(朱砂红、金色、暖红)内,确保生成图像呈现强烈的节日喜庆氛围,同时保持色彩的典雅高端感而非廉价俗气感。"
  1465. },
  1466. {
  1467. "id": "CAP-bc10670f",
  1468. "name": "图表类型自动识别与语义形状分配",
  1469. "criterion": "在用户未明确指定图表类型和节点样式的情况下,AI 输出的图表能正确识别图类型,且各节点形状与其语义角色符合行业惯例(如判断节点为菱形、数据库为圆柱体),颜色编码在同一图中保持一致。",
  1470. "description": "AI 根据用户描述的内容语义,自动判断最适合的图表类型(如 RAG 架构图、Multi-Agent 协作图、泳道流程图、组织架构图等),并为不同语义角色的节点自动分配对应的标准形状(六边形表示 Agent、圆柱体表示存储、菱形表示判断节点等)和语义颜色编码,无需用户手动指定每个节点的样式。"
  1471. },
  1472. {
  1473. "id": "CAP-bc257960",
  1474. "name": "照片形状蒙版裁切",
  1475. "criterion": "裁切后照片的边缘与指定形状轮廓高度吻合,无锯齿或模糊;透明区域完全透明(alpha=0),照片主体区域无损;支持圆形、心形、星形、矩形圆角等至少5种常用形状。",
  1476. "description": "将输入照片按指定的几何形状(圆形、心形、星形、三角形、自定义轮廓等)进行裁切,输出带透明通道的异形照片,可直接叠加到背景图或拼贴画布上。"
  1477. },
  1478. {
  1479. "id": "CAP-bc4f1b77",
  1480. "name": "文字构成图像(文字雕塑/文字艺术生成)",
  1481. "criterion": "输出图像中文字/字母/数字形态清晰可辨;文字同时承担视觉构成功能(形状、纹理、结构);指定的材质/风格/年代主题在文字形态上有明确体现;多格子布局中每个格子的文字主题独立且风格统一。",
  1482. "description": "以文字、字母或数字作为图像的视觉构成元素,通过AI生成技术将文字本身塑造为具有特定形态、材质、风格的视觉主体,使文字既是可读的信息载体,又是图像的核心视觉结构(如文字堆叠成建筑剖面、字母由年代物体构成的3D雕塑)。"
  1483. },
  1484. {
  1485. "id": "CAP-bd4828fc",
  1486. "name": "文字透视变形与场景表面 3D 融合",
  1487. "criterion": "变形后文字的透视方向与背景场景的空间透视一致;文字可读性保持良好;支持梯形强度、相对高度等参数的精细调节;输出图像中文字与场景融合自然,具有空间纵深感",
  1488. "description": "对叠加或生成的文字应用三维透视变形(梯形、弧形、斜向排列、曲面贴合、消失点对齐),使文字随场景物体表面(建筑、桥梁、地面、墙面)产生渐进压缩、深度衰减和空间透视关系,形成文字融入场景的氛围感效果(而非漂浮叠加),广泛用于照片加字、创意 P 图、场景海报风格。"
  1489. },
  1490. {
  1491. "id": "CAP-bf803742",
  1492. "name": "AI 辅助内容智能填充",
  1493. "criterion": "AI 填充的内容与同列/同行已有数据在语义和风格上保持一致;空白单元格填充率达到 100%;填充内容可直接用于模板渲染,无需人工二次校对修改。",
  1494. "description": "在批量设计模板的数据表格中,利用 AI 自动识别上下文并填充空白单元格内容(如文案、标签文字、描述信息),减少人工逐一录入的工作量,使数据驱动的批量设计流程更加自动化。"
  1495. },
  1496. {
  1497. "id": "CAP-c03a8207",
  1498. "name": "创意概念产品视觉化",
  1499. "criterion": "生成图像将创意概念准确视觉化;细节丰富且物理上合理(如透视、光影、比例关系正确);整体呈现超现实但可信的视觉效果",
  1500. "description": "将抽象的创意概念转化为具象的产品视觉呈现,如将国旗转化为微型城市、将普通物品赋予超现实特性等,在保持物理合理性的同时实现创意突破"
  1501. },
  1502. {
  1503. "id": "CAP-c0c3186e",
  1504. "name": "Gaussian Splat 沉浸式 3D 场景重建",
  1505. "criterion": "重建的 Gaussian Splat 场景可在查看器中实现平滑的六自由度漫游;场景中的空间关系和光照效果与原始全景图高度一致;无明显的几何错误或渲染伪影。",
  1506. "description": "基于全景图或多视角图像,通过 Gaussian Splatting 技术重建具有真实感的沉浸式 3D 场景,支持在专用查看器中进行六自由度(6DoF)自由漫游,提供比传统全景图更强的空间沉浸感。"
  1507. },
  1508. {
  1509. "id": "CAP-c2c42fc7",
  1510. "name": "产品摄影专用光照氛围提示词控制",
  1511. "criterion": "生成图像的光照方向、色温与提示词描述一致;高光区域不过曝,阴影区域保留细节;产品轮廓光影层次清晰,整体氛围与目标风格(商业广告/电影感/自然光)匹配。",
  1512. "description": "通过在提示词中精确描述光源类型、方向、色温和光质(如 soft cinematic studio lighting、subtle shadows、natural light、warm brushed metal lighting),引导 AI 生成符合商业产品摄影标准的光影效果,使产品质感和立体感在图像中得到最佳呈现。"
  1513. },
  1514. {
  1515. "id": "CAP-c43f095f",
  1516. "name": "几何抽象图形生成与叠加",
  1517. "criterion": "生成的几何图形与背景色彩协调融合,无突兀感;图形叠加后产生明显的空间层次感;几何图形的形态、数量、排列与提示词描述一致;整体构图具有设计感,不显杂乱。",
  1518. "description": "通过AI生成或矢量工具自动构建几何抽象图形(圆形、三角形、方形、多边形及其切割叠加变体),并将其以半透明叠压、渐变填充、线条描边等方式与背景融合,形成具有空间层次感和视觉冲击力的装饰性图形元素。"
  1519. },
  1520. {
  1521. "id": "CAP-c5beae45",
  1522. "name": "极简留白构图生成",
  1523. "criterion": "生成图像中主体元素数量极少(通常1-3个),画面存在大面积留白或纯色背景区域;构图简洁,无多余装饰元素;整体视觉重心明确,符合极简主义审美标准",
  1524. "description": "在AI图像生成阶段,通过提示词构图语义描述(如留白、极简、孤舟、单一元素)引导模型生成大面积空白、元素极少的极简构图画面,使画面呈现'以少胜多'的东方禅意或现代极简美学,而非信息密集的复杂构图。"
  1525. },
  1526. {
  1527. "id": "CAP-c5f7ce81",
  1528. "name": "赛博故障艺术效果生成",
  1529. "criterion": "输出图像须呈现可见的 RGB 错位色边、噪点纹理或像素故障效果,整体视觉符合赛博故障美学,且通过 AI 工具或结构化 Prompt 自动生成,无需手工 PS 通道操作。",
  1530. "description": "通过 AI 生成引擎或结构化 Prompt,自动生成 RGB 通道错位、数字噪点纹理、像素破碎、彩色故障条纹等赛博故障艺术(Glitch Art)视觉效果,应用于人物海报或背景设计。"
  1531. },
  1532. {
  1533. "id": "CAP-c64131f1",
  1534. "name": "传统建筑造型元素精准生成",
  1535. "criterion": "拱形门洞的弧度与指定造型(圆形/拱形/海棠角双弧线)一致;格栅隔断的竖条间距均匀;月洞门的圆形比例正确;海棠角的双弧线顶部造型清晰可辨;各造型元素与周围空间的比例关系协调",
  1536. "description": "在室内效果图中精准生成拱形门洞、月洞门、海棠角门洞、中式格栅、木质屏风隔断等具有东方传统建筑特征的造型元素,确保弧度比例、线条间距等几何特征符合传统美学规范"
  1537. },
  1538. {
  1539. "id": "CAP-c6dfb2b0",
  1540. "name": "复古/特定风格大字报纹理与做旧效果生成",
  1541. "criterion": "叠加的纹理效果与版面整体风格一致;纹理不遮挡标题文字的核心可读性;做旧/故障等效果具有真实感,非简单滤镜叠加;可批量应用于同一套文案的多种风格变体",
  1542. "description": "在大字号标题排版图像上自动叠加特定风格的纹理效果(如复古纸张做旧、波普网点、故障风RGB错位、酸性渐变金属质感等),使版面在保持高饱和色彩和大字号冲击力的同时,呈现特定的艺术风格质感,适用于品牌海报、音乐视觉、电商视觉等场景。"
  1543. },
  1544. {
  1545. "id": "CAP-c75d7a0a",
  1546. "name": "人物信息标签自动绑定",
  1547. "criterion": "每位人物旁均有对应的姓名+职位标签,标签位置与人物空间关系正确(脚下/侧边/下方);多人物场景中各标签互不遮挡;标签字体、颜色、样式在同一海报中保持统一风格。",
  1548. "description": "针对多人物海报场景,自动识别画面中每个人物的位置区域,并在对应人物旁边精准绑定姓名、职位、头衔等结构化信息标签,确保标签与人物一一对应、不错位、风格统一。"
  1549. },
  1550. {
  1551. "id": "CAP-c89e2af5",
  1552. "name": "人物与道具互动关联生成",
  1553. "criterion": "生成画面中角色与道具的接触点(手持、肩扛、腰挂等)自然无错位;道具比例与角色身体比例协调;角色的动作、表情与道具使用场景语义一致;道具外观特征与参考图保持一致。",
  1554. "description": "在单次生成中,将指定角色与特定道具(武器、产品、日常物品等)进行语义级绑定,生成角色自然持握、使用或展示道具的互动画面,确保角色与道具在比例、接触点、动作逻辑上高度自洽。"
  1555. },
  1556. {
  1557. "id": "CAP-c8c9adf4",
  1558. "name": "庆典场景整体氛围感渲染",
  1559. "criterion": "场景中各装饰元素(花艺/发光字/喜字/灯笼/背景板/小道具)在视觉层次、光照、色调上协调统一;整体氛围感强烈,具有沉浸式视觉效果;无明显元素堆砌或比例失调问题;前中后景层次分明,空间纵深感真实",
  1560. "description": "对婚礼/节日庆典全景场景进行整体氛围渲染,通过统筹花艺密度、灯光色温、道具数量与分布、空间层次(前景/中景/背景)等参数,生成沉浸式、强氛围感的全场景图。强调'道具与场景协调统一'的整体性,避免单一元素堆砌感,实现空间叙事与视觉张力的平衡。"
  1561. },
  1562. {
  1563. "id": "CAP-c904341b",
  1564. "name": "可复用设计组件系统构建",
  1565. "criterion": "封装后的组件可在不同内容填充下保持布局稳定;修改主组件后所有实例自动同步更新;组件库可被团队成员共享调用,无需重复搭建。",
  1566. "description": "在设计工具中将卡片的视觉元素(图标、标题区、配图区、标签等)封装为可复用的标准化组件,通过响应式布局约束确保组件在不同内容填充下保持视觉一致性,支持跨场景批量复用。"
  1567. },
  1568. {
  1569. "id": "CAP-c9426dcc",
  1570. "name": "产品爆炸分解图生成",
  1571. "criterion": "生成图像中各分解层次清晰独立,垂直对齐关系准确;每个成分/层次的材质纹理真实;整体构图符合信息图规范,背景简洁不干扰主体;各层次比例与真实产品一致。",
  1572. "description": "通过提示词描述产品各层成分悬浮分解的视觉效果(exploded view、ingredients separated、suspended layers、爆炸式分解视图),引导 AI 生成产品成分或结构的垂直分解信息图,展示产品的内部结构、组成成分或层次关系,使各部件/层次在空间中分离但保持对齐和比例关系,清晰可见且具有专业信息图美感。"
  1573. },
  1574. {
  1575. "id": "CAP-cd789496",
  1576. "name": "画面分区独立提示词控制",
  1577. "criterion": "各分区内容与对应提示词描述一致;不同分区之间无内容溢出或混淆;分区边界清晰;多角色场景中每个角色的外观特征与其对应 LoRA 或提示词设定吻合。",
  1578. "description": "在单张画布上将画面划分为多个独立区域,每个区域由独立的提示词或 LoRA 模型控制生成内容,实现同一画面内不同角色、不同场景、不同风格的并存,各区域之间有清晰的分割感。"
  1579. },
  1580. {
  1581. "id": "CAP-ce7f49c8",
  1582. "name": "AI 文本内容批量生成",
  1583. "criterion": "单次调用可输出 N 条符合主题的文案素材;生成内容语义准确、风格统一;输出格式结构化(如 JSON/列表),可直接导入设计模板无需二次整理。",
  1584. "description": "通过大语言模型(LLM)根据主题、场景或结构化要求,批量生成适用于信息卡片的文案素材(如金句、知识点、标题、标签等),输出结构化文本列表供后续设计环节直接调用。"
  1585. },
  1586. {
  1587. "id": "CAP-d043d289",
  1588. "name": "手持物体精准细节保持",
  1589. "criterion": "生成图像中手部解剖结构正确,无多余手指或变形;道具在手持状态下的形状、纹理与参考图一致;手指与道具的接触面(握持、捧持、夹持)物理上合理;道具被遮挡部分的边缘过渡自然。",
  1590. "description": "在生成角色手持特定道具(产品、书本、购物篮等)的场景时,确保手部解剖结构正确、手指与道具的接触关系自然,同时道具的形状、纹理、品牌细节在手持状态下 100% 还原,不因手部遮挡或角度变化而失真。"
  1591. },
  1592. {
  1593. "id": "CAP-d063bf4f",
  1594. "name": "AI 图像光影局部增强与氛围注入",
  1595. "criterion": "增强后图像中新增的光效元素(光晕/光束/发光效果)与原图的光照方向和色调自然融合,无明显合成痕迹;原图中人物的肤色、面部细节和整体比例保持不变;光线过渡自然协调,不出现突兀的光斑或色块。",
  1596. "description": "对已有图像(照片或 AI 生成图)进行局部光效增强,通过自然语言指令向图像中添加特定光效元素(如逆光光晕、阳光光束、发丝发光、晚霞氛围),在保持原图主体和构图不变的前提下,提升画面的光影层次感和氛围感。"
  1597. },
  1598. {
  1599. "id": "CAP-d1764148",
  1600. "name": "多图批量导入与叙事排序",
  1601. "criterion": "用户可一次性导入5张以上图片,并能通过拖拽操作在30秒内完成顺序调整,最终输出顺序与预期叙事一致。",
  1602. "description": "支持批量上传多张照片或截图,并允许用户通过拖拽等方式自由调整图片排列顺序,按叙事逻辑组织内容。"
  1603. },
  1604. {
  1605. "id": "CAP-d1e23288",
  1606. "name": "文字与图像情绪语义匹配",
  1607. "criterion": "",
  1608. "description": ""
  1609. },
  1610. {
  1611. "id": "CAP-d1f429ff",
  1612. "name": "科技感视觉元素生成(粒子/光带/几何图形/HUD界面)",
  1613. "criterion": "生成图像中包含指定类型的科技感视觉元素(粒子/光带/几何图形/HUD等);元素与整体科技感主题风格一致;元素分布合理,不遮挡主体信息;整体呈现数字化、科技化的视觉质感。",
  1614. "description": "在AI生成图像中,通过提示词或专项参数,生成具有科技感的抽象视觉元素,包括粒子散射、数据光柱、几何线条网格、三维立方体、HUD界面元素、像素块城市景观、流线型结构等,用于构建未来感/科技感的海报背景或装饰层。"
  1615. },
  1616. {
  1617. "id": "CAP-d23f2e35",
  1618. "name": "中式装饰艺术画生成",
  1619. "criterion": "生成的水墨画具有墨色浓淡变化和留白构图特征;花鸟画的花卉/鸟类形态符合中国传统绘画风格;书法作品字形清晰可辨且具有书法笔意;装饰画与室内空间的色调、风格协调统一;画幅比例(横幅/竖幅/方形)与挂置位置匹配",
  1620. "description": "生成符合新中式室内场景需求的装饰艺术画,包括水墨山水画、花鸟画、书法作品、拓片等中式艺术形式,使装饰画内容与室内风格高度匹配,并可指定画幅尺寸、构图方式和装裱形式"
  1621. },
  1622. {
  1623. "id": "CAP-d3325637",
  1624. "name": "AI 驱动设计 QA 自动评分与迭代优化",
  1625. "criterion": "QA Agent 能覆盖预设的全部检查项(如15+设计检查);评分结果可量化(如95/100);低于阈值时自动触发重新生成或局部修改;最终输出结果通过全部检查项。",
  1626. "description": "在信息图或海报生成后,由 AI Agent 自动执行多维度设计质量检查(包括布局合理性、品牌合规性、可读性、视觉层次等),给出量化评分,并根据评分结果自动触发迭代优化,直至达到预设质量阈值后输出最终结果。"
  1627. },
  1628. {
  1629. "id": "CAP-d4b16545",
  1630. "name": "符号化人物消解与意象化表达",
  1631. "criterion": "生成图像中的人物面部不可辨认(无清晰五官);人物通过服饰、配件、姿态等符号化元素传达明确的文化意象(如西部牛仔、游牧精神);画面整体呈现出抽象化的集体叙事感,而非个人肖像感",
  1632. "description": "通过 AI 生成引擎,刻意消解画面中人物的具体面部特征,转而以符号化元素(斗笠、长袍、马鬃、头巾等)替代个体身份,将具象人物升华为承载集体意象的抽象符号,营造神秘、普世的视觉叙事。"
  1633. },
  1634. {
  1635. "id": "CAP-d5baecb9",
  1636. "name": "生物发光与魔幻氛围场景生成",
  1637. "criterion": "生成画面中的发光元素(植物、水体、生物等)具有自然的生物发光质感;发光颜色(蓝、绿、紫等)与提示词描述一致;整体场景氛围达到梦幻或神秘感;发光效果与周围环境光照协调自然。",
  1638. "description": "通过AI提示词精确控制场景中的生物发光(Bioluminescence)效果,生成植物、水体、生物等自然元素自发光的魔幻场景,配合极光、星空、发光雾气等元素,营造出梦幻、神秘或奇幻的整体氛围。"
  1639. },
  1640. {
  1641. "id": "CAP-d6efcb5f",
  1642. "name": "混合媒体拼贴美学图像生成",
  1643. "criterion": "生成图像中可识别出至少两种以上不同类型的视觉载体(如照片质感区域 + 插画/几何图形区域 + 文字元素);各元素之间通过纹理叠加、色彩呼应或构图关系形成视觉统一感;整体呈现拼贴美学特征,无明显违和感。",
  1644. "description": "通过 AI 生成引擎,将真实照片、插画、几何图形、纹理、霓虹线条等异质视觉元素在同一画面内进行拼贴式融合,生成具有混合媒体拼贴美学(Mixed Media Collage Aesthetic)的图像,实现不同视觉载体形式在单一版面内的有机共存。"
  1645. },
  1646. {
  1647. "id": "CAP-d74e6d10",
  1648. "name": "图片色调与滤镜调整",
  1649. "criterion": "调整后所有图片色调统一,整体视觉风格一致,无明显色差。",
  1650. "description": "对单张或整体拼贴图片进行色调、饱和度、曲线、色阶等调整,统一拼贴整体视觉风格。"
  1651. },
  1652. {
  1653. "id": "CAP-d7c7858c",
  1654. "name": "图像到 3D 动态海报生成",
  1655. "criterion": "输入静态图像,输出具有明显三维立体感的动态海报;3D 效果与原始图像内容保持视觉关联;动态效果流畅自然;整体风格氛围与目标风格(如梦核、赛博朋克)一致。",
  1656. "description": "将静态图像(如旧电子设备照片、产品图)通过 AI 3D 模型生成工具转换为具有三维立体感和动态效果的海报,结合特定视觉风格(如千禧梦核、透明材质)生成兼具复古氛围与现代动态感的视觉内容。"
  1657. },
  1658. {
  1659. "id": "CAP-d92ffc99",
  1660. "name": "AI 虚拟换装与服装配饰迁移",
  1661. "criterion": "换装后人物图像中的服装与参考服装图在颜色、款式、纹理上高度一致;服装与人物体型、姿态融合自然,无明显拼接或变形痕迹;人物面部及非服装区域保持不变。",
  1662. "description": "以参考服装/配饰图像为输入,将指定单品(服装、帽子、眼镜、假发、项链等)自动迁移并穿戴到目标人物或角色上,保持服装款式/颜色/纹理/图案细节不变,同时与主体体型、姿态和场景光照自然融合。支持平铺图到模特上身转换、保持角色面部外观不变的跨造型换装,适用于电商展示、虚拟试衣。"
  1663. },
  1664. {
  1665. "id": "CAP-d93a0ac2",
  1666. "name": "场景透视与光影一致性校正",
  1667. "criterion": "合成图中猫咪主体与场景背景的地平线对齐,透视灭点合理;光照方向、阴影角度与场景一致;大气透视(远冷近暖)处理自然,整体无明显合成痕迹。",
  1668. "description": "在将不同来源的元素(抽象元素如星云、粒子、太极图,或具体主体如猫咪、人物)合成到背景场景时,自动或半自动地对齐两者的透视关系(地平线、灭点、深度空间)和光影特性(光源方向、色调、光照类型),确保合成画面在物理逻辑和视觉上自洽协调,消除因元素来源不同导致的光影穿帮、透视错位与违和感,适用于写实场景合成和超现实艺术创作。"
  1669. },
  1670. {
  1671. "id": "CAP-d95ca82b",
  1672. "name": "视频光效风格化重绘(Chat-based Video Editing)",
  1673. "criterion": "重绘后视频的原始运动轨迹和场景结构基本保留;新增光效(如火焰、闪电、彩色光束)与原始画面自然融合;光效风格与提示词描述一致;整体视觉效果达到魔幻或超现实感。",
  1674. "description": "通过对话式AI指令对已有视频片段进行光效风格化重绘,在保留原始视频运动和结构的基础上,叠加或替换为魔幻光效(如火焰、闪电、彩色光束等),实现从普通视频到魔幻光效视频的一键转换。"
  1675. },
  1676. {
  1677. "id": "CAP-da51c2ec",
  1678. "name": "AI 脚本/分镜/故事文案与叙事顺序生成",
  1679. "criterion": "生成的脚本/文案覆盖指定格数(如 9 格)的完整叙事结构;每格内容描述具体可执行(包含画面内容、镜头角度、关键文字等);整体叙事逻辑连贯,符合输入主题方向;可直接作为图像生成的提示词使用。",
  1680. "description": "根据用户输入的主题、关键词、拟人化角色或故事梗概,由 LLM 自动生成结构完整的脚本与分镜文案,涵盖动画脚本、短视频分镜、漫画分镜、情感叙事故事、绘本故事文案、剧本分页文字等多种载体。输出内容包含每格画面的场景描述、情绪标注、镜头语言、对白/旁白、叙事逻辑(起承转合)与叙事顺序规划,为后续图像/视频生成提供结构化提示词输入。"
  1681. },
  1682. {
  1683. "id": "CAP-db0cb47e",
  1684. "name": "标题文字视觉特效增强(描边/阴影/3D/发光)",
  1685. "criterion": "添加描边后文字在任意背景色上均清晰可读;3D/立体效果具有明确的光源方向和阴影一致性;发光效果与文字颜色协调;整体特效不遮挡文字内容本身的可读性",
  1686. "description": "对图像中的标题文字自动添加描边、投影、3D 立体、外发光、内阴影等视觉增强效果,使文字在复杂背景上保持高可读性,同时增强视觉冲击力和层次感,适用于高饱和色彩环境下的大字号标题渲染。"
  1687. },
  1688. {
  1689. "id": "CAP-db22d1ad",
  1690. "name": "图像转鱼眼视角(图生图变形)",
  1691. "criterion": "转换后图像中原始人物的面部特征、服装等关键外观元素可被识别;图像整体呈现明显的鱼眼畸变效果(桶形变形、边缘弯曲);转换效果自然,无明显拼接或合成痕迹",
  1692. "description": "以用户上传的普通照片为输入,通过 AI 图生图(img2img)能力将其转换为鱼眼镜头视角版本,在保留原始人物外观特征的同时,对图像施加球形畸变、透视压缩等鱼眼光学效果,实现从普通照片到夸张变形构图的一键转换。"
  1693. },
  1694. {
  1695. "id": "CAP-dba3b9ec",
  1696. "name": "层叠条纹地形色彩图案生成",
  1697. "criterion": "生成图像中可见明显的层叠条纹结构,条纹随地形/波浪形态弯曲起伏;至少包含5种以上不同颜色的条纹层;整体呈现彩虹渐变或高对比色彩序列;色彩饱和度高但视觉和谐不刺眼。",
  1698. "description": "通过AI生成将地形轮廓、波浪形态与多色条纹图案结合的视觉效果,使彩色条纹随地形起伏弯曲,形成彩虹般的层叠色彩地形插画,每层条纹使用不同高饱和颜色,整体呈现丰富的视觉层次和色彩深度。"
  1699. },
  1700. {
  1701. "id": "CAP-dc082c10",
  1702. "name": "3D 道具资产批量生成",
  1703. "criterion": "生成的 3D 道具模型面数符合目标平台要求(低面数);UV 展开合理,无明显拉伸;烘焙贴图清晰,细节保留完整;可在引擎中正常导入并与角色进行交互绑定。",
  1704. "description": "通过 AI 建模工具批量生成低面数的 3D 道具模型,经过减面优化、UV 展开、烘焙贴图等流程处理后,输出可直接在游戏引擎或动画软件中使用的道具资产,供角色互动场景调用。"
  1705. },
  1706. {
  1707. "id": "CAP-ddbe0c46",
  1708. "name": "抽象情绪概念转具象视觉表达",
  1709. "criterion": "生成图像能够让观看者在不看文字说明的情况下,准确感知到目标情绪状态;图像中的肢体语言、面部表情、光影氛围等视觉元素与目标情绪高度契合;情绪表达具有强烈的感染力,能引发观看者的情感共鸣。",
  1710. "description": "将抽象的心理状态、情绪概念或内心感受(如'过度思考'、'压抑的愤怒'、'释然的宁静')转化为具体可见的视觉形象,通过肢体语言、面部微表情、环境氛围、光影等多维度视觉元素的组合,使抽象情绪获得强烈的视觉冲击力和情感共鸣。"
  1711. },
  1712. {
  1713. "id": "CAP-ded93adb",
  1714. "name": "科技感/赛博朋克风格文生图",
  1715. "criterion": "生成图像须包含黑色/深色背景、可见的霓虹或流光线条元素,人物主体清晰,整体视觉风格符合赛博朋克/科技感定义,且全程无人工绘制介入。",
  1716. "description": "通过结构化 Prompt 驱动 AI 图像生成引擎,一键输出具有黑色背景、霓虹光效、流光线条、赛博朋克美学的人物宣传海报底图,无需任何手工绘制。"
  1717. },
  1718. {
  1719. "id": "CAP-e0451c51",
  1720. "name": "动物拟人化配饰穿戴生成",
  1721. "criterion": "生成图像中动物佩戴的配饰与其体型比例协调;配饰样式与提示词描述一致;配饰与动物毛发/皮肤的边界自然融合,无明显穿模或悬浮感;同一角色可切换多种配饰方案。",
  1722. "description": "通过 AI 图像生成技术,为动物角色(猫、狗等)自动添加拟人化配饰(帽子、厨师服、僧袍、背带裤、蝴蝶结、球衣等),使动物呈现出角色扮演的拟人化视觉效果,配饰与动物体型、毛色自然适配。"
  1723. },
  1724. {
  1725. "id": "CAP-e196c683",
  1726. "name": "赛博朋克霓虹配色(Cyberpunk Neon Palette)",
  1727. "criterion": "背景为霓虹黑(#0A090C)或深空灰;使用 2-3 种霓虹色,饱和度 ≥80%;霓虹色占画面比例 ≤30%,集中在关键接口位置(按钮、眼神光、能量条、灯光);整体呈现'High Tech, Low Life'的赛博朋克美学",
  1728. "description": "在绝对深黑或深空灰背景上,使用 2-3 种高饱和霓虹色(如炽焰红、霓虹紫、电光蓝、幻彩青柠)进行点缀,模拟数字世界的'光污染'效果,营造赛博朋克风格的视觉冲击"
  1729. },
  1730. {
  1731. "id": "CAP-e2f50edf",
  1732. "name": "AI驱动的矢量图形生成",
  1733. "criterion": "生成的SVG矢量图结构清晰、代码规范;图形质量高,具有良好的设计感和美学;符合提示词描述的形状、风格要求;支持无损缩放和后续编辑;生成速度快、成本低",
  1734. "description": "通过AI提示词自动生成高质量的SVG矢量图形,基于代码生成而非像素近似,生成的矢量图具有结构化、可编辑、无损缩放的特性"
  1735. },
  1736. {
  1737. "id": "CAP-e3836a5b",
  1738. "name": "口型同步驱动",
  1739. "criterion": "生成视频中角色口型变化与音频内容在时间轴上精准对齐;口型动作自然流畅,无明显跳帧或错位;面部其他区域(眼睛、胡须)保持自然状态",
  1740. "description": "以猫咪(或其他角色)图像/视频和目标音频(人声)为输入,通过 AI 驱动角色口型与音频内容精准同步,生成开口说话或唱歌的动态视频"
  1741. },
  1742. {
  1743. "id": "CAP-e4cea9b8",
  1744. "name": "纸张肌理素材 AI 生成",
  1745. "criterion": "生成的纹理素材具有自然的纸张纤维感或粗糙介质质感;可无缝平铺或作为叠加层使用;纹理细节丰富,无明显重复规律;可通过提示词控制纹理类型(水彩纸、牛皮纸、麻布、粗糙石膏等)。",
  1746. "description": "通过 AI 生成工具直接生成可复用的纸张纹理、粗糙介质肌理素材图(透明底或纯纹理层),供后续与插画内容叠加合成使用,替代手工扫描或购买纹理素材包的传统流程。"
  1747. },
  1748. {
  1749. "id": "CAP-e5309049",
  1750. "name": "产品多 SKU 颜色与表面处理变体生成",
  1751. "criterion": "各变体图中产品几何形状、光照角度、透视关系与原图完全一致;颜色和表面处理变化自然真实,无数字重着色的平面感;每个变体可独立用于电商展示,无需额外修图。",
  1752. "description": "以单一产品参考图为输入,通过提示词约束保持产品几何形状、光照和透视不变,仅改变表面颜色和材质处理(finish),批量生成同一产品的多颜色/多材质变体图,使每个变体看起来像真实制造的产品而非数字重着色。"
  1753. },
  1754. {
  1755. "id": "CAP-e5982261",
  1756. "name": "提示词模板化参数替换批量生产",
  1757. "criterion": "同一模板替换不同参数后,生成结果在视觉风格、构图结构上保持一致;参数替换后的内容准确反映新参数的语义;可在不修改模板核心结构的前提下生成 N 个系列化变体。",
  1758. "description": "将经过验证的高质量提示词结构化为可复用模板,通过替换模板中的变量参数(如主题词、国家名、产品名、风格词等),批量生成系列化、风格统一的图像内容,无需每次从零构建提示词。"
  1759. },
  1760. {
  1761. "id": "CAP-e62ec752",
  1762. "name": "提示词色温参数化控制",
  1763. "criterion": "生成图像的光照色温与提示词中指定的色温值或描述一致;2000K-3000K呈现温暖黄光,3500K-4500K呈现中性白光,5000K-6500K呈现冷白光;色温变化在整个画面中保持统一协调",
  1764. "description": "通过在提示词中明确指定色温参数(如2000K-6500K)或色温描述(warm glow、clinical bright),精确控制生成图像的光照色温氛围,实现从暖黄光到冷白光的连续调节"
  1765. },
  1766. {
  1767. "id": "CAP-e80e4194",
  1768. "name": "多景别叙事序列规划与生成",
  1769. "criterion": "生成的图像集合能完整覆盖从远至近的景别序列;各景别的叙事功能清晰(交代环境→呈现人物→展示关系→捕捉情感→强调细节);场景氛围和角色风格在序列中保持统一;可一键输出供后续视频生成工具直接使用的分镜草图集",
  1770. "description": "以故事叙事逻辑为驱动,将同一主体或场景的多张不同景别图像(远景定调→全景叙事→中景互动→近景抒情→特写点睛)按叙事弧线顺序规划并批量生成,形成具有完整叙事张力的图片集合或分镜脚本,可用于短片、漫画、商业影视等创作场景。"
  1771. },
  1772. {
  1773. "id": "CAP-e8399ada",
  1774. "name": "智能体工作流一键批量创作",
  1775. "criterion": "单次工作流触发后,可自动完成从主题输入到最终视频/图像输出的全流程;批量生成的多个作品在风格上保持统一;整个过程无需人工在各工具间手动切换;生成效率相比手动操作提升显著。",
  1776. "description": "通过 Coze 等智能体平台搭建自动化工作流,将超现实场景的主题输入、提示词生成、图像/视频生成、风格统一等多个步骤串联为一键触发的自动化流程,实现从创意到成品的批量无人工干预生产。"
  1777. },
  1778. {
  1779. "id": "CAP-e8a77f70",
  1780. "name": "自然光照与特定时刻氛围生成",
  1781. "criterion": "光照效果符合自然光物理规律(如方向性、色温、阴影);不同时段的光照特征准确(如清晨冷色调、傍晚暖色调);光照与场景氛围协调一致;无明显人工光源痕迹或过度HDR效果",
  1782. "description": "生成具有真实自然光照效果的图像,涵盖柔和自然光、金色时刻(Golden Hour,日出后/日落前约 1 小时,温暖橙金色调)、蓝调时刻(Blue Hour,日落后约 20 分钟,清冷蓝紫色调)、日落暖光、阴天柔光、室内窗光等真实光照条件,并配合斑驳树影、水面反光、晨雾等自然光效果,营造特定情绪氛围。"
  1783. },
  1784. {
  1785. "id": "CAP-e92b8d89",
  1786. "name": "极简主义产品构图生成",
  1787. "criterion": "生成图像背景纯净(纯白、浅灰或单一柔和色调);产品居中放置,构图平衡;无多余装饰元素;整体视觉简洁现代",
  1788. "description": "生成具有极简主义美学的产品展示图:干净的单色背景、居中对称的构图、最少的视觉干扰元素,突出产品主体"
  1789. },
  1790. {
  1791. "id": "CAP-e962c3ef",
  1792. "name": "非人类主体拟人化角色形象构建",
  1793. "criterion": "生成图像中动物主体同时具备:①可识别的动物物种特征(毛色、耳型、体态);②明确的人类职业/角色标识(服饰、道具、场景);③符合角色设定的人类表情或姿态;三者缺一不可,且整体视觉协调自然。",
  1794. "description": "通过结构化提示词工程,为非人类主体(动物如猫咪、玩具、机器人、材质实体等)赋予完整的人类角色属性——职业身份、服饰道具(帽子、厨师服、僧袍、背带裤、球衣、蝴蝶结)、面部表情、肢体姿态与背景故事,并使其与道具(书本、购物篮、玩偶)产生自然交互。保留物种/材质本体特征(毛色、外形、质感),实现角色扮演级的拟人化视觉表达。"
  1795. },
  1796. {
  1797. "id": "CAP-e9b763d2",
  1798. "name": "AI分镜多格画面视觉统一性控制",
  1799. "criterion": "处理后的多张照片在色调上视觉统一,无明显的冷暖色差或亮度跳变;整体色调符合指定的风格倾向(如暖色系、冷色系、黑白高对比);处理前后照片的主体内容和细节保持不变。",
  1800. "description": ""
  1801. },
  1802. {
  1803. "id": "CAP-e9ebac4d",
  1804. "name": "动物外形特征提取与人类角色融合设计",
  1805. "criterion": "生成的拟人化角色设计图中:①可通过动物特征(耳型、毛色、斑纹)识别出原始动物物种;②人类角色的发色、眼睛颜色与原始动物毛色高度呼应;③服饰风格与动物气质相符(如黑猫→暗黑系服装);④提供参考图与成品的对比展示。",
  1806. "description": "以真实动物照片为参考输入,自动提取动物的核心外形特征(毛色、耳型、眼睛颜色、斑纹、体态神态),并将这些特征系统性地映射融入人类角色设计中(发色、发型、眼睛颜色、服饰气质),同时保留动物耳朵、尾巴等标志性元素,生成兼具动物辨识度与人类角色完整性的拟人化角色设计图。"
  1807. },
  1808. {
  1809. "id": "CAP-eae5b198",
  1810. "name": "点彩与点画笔触肌理模拟",
  1811. "criterion": "输出图像在放大后可见明显的点状结构;点的大小、密度和颜色分布符合点彩派或点画技法的视觉规律;整体图像在正常观看距离下内容清晰,同时保留点状颗粒的肌理感。",
  1812. "description": "通过 AI 生成模型模拟点彩派(Pointillism)或点画/点刻法(Stipple)的视觉效果,使图像由密集的彩色或单色点阵构成,在近距离呈现颗粒点状结构,远距离形成完整图像,营造独特的手工点绘质感。"
  1813. },
  1814. {
  1815. "id": "CAP-eaf114b5",
  1816. "name": "非对称拼贴布局生成",
  1817. "criterion": "生成的拼贴布局呈现非对称、不规则特征;图像尺寸和长宽比多样化;无严格网格对齐;整体视觉效果自然、有机,类似手工拼贴或杂志编辑风格;各图像之间的间距和重叠关系自然合理",
  1818. "description": "生成多张图像的非对称、不规则拼贴布局,模拟手工拼贴的自然感,包括不同尺寸、不同长宽比的图像随意排列,无严格网格对齐,具有自然重叠和间距变化"
  1819. },
  1820. {
  1821. "id": "CAP-eb71d416",
  1822. "name": "高动态运动瞬间捕捉提示词工程",
  1823. "criterion": "生成图像/视频中动物的运动姿态具有明显的瞬间张力感(如四肢腾空、鬃毛飞扬、尘土轨迹可见);画面动感强烈,主体动态突出;与普通静态动物图相比,观看者能明显感受到速度感和力量感。",
  1824. "description": "通过系统化的结构化提示词设计(包含主体动态描述、运动细节关键词、专业摄影设备参数、摄影师风格引用等多层次组合),精确引导 AI 生成具有强烈瞬间张力的动物运动高动态画面,使鬃毛飞扬、肢体伸展、尘土飞扬等动态细节得以精准呈现。"
  1825. },
  1826. {
  1827. "id": "CAP-ec45f9c7",
  1828. "name": "多视角构图生成",
  1829. "criterion": "生成的图像集包含至少3种以上不同视角;视角变化自然合理,符合真实拍摄场景;包含特殊视角(如俯拍脚部、镜中自拍、远景虚化);各视角图像在主体一致性和场景连贯性上保持协调",
  1830. "description": "在单个场景或主题下生成多种拍摄视角的图像,包括俯拍、仰拍、平视、特写、远景、镜面反射等多样化视角,模拟真实摄影中的随机抓拍效果"
  1831. },
  1832. {
  1833. "id": "CAP-ecef270b",
  1834. "name": "图文语义驱动插图生成",
  1835. "criterion": "生成插图的视觉内容与配套文案的核心语义高度吻合(如文案为'摆烂'则插图角色呈现躺平/瘫倒姿态);目标用户在不看文字的情况下,能从插图中猜出对应文案的大致含义;图文组合后整体传达的情绪/信息与文案意图一致。",
  1836. "description": "以文案内容的语义意图为核心输入,自动生成与文字含义直接对应的插图——插图内容、角色动作、表情或场景元素直接反映文字所表达的情绪、动作或概念,使图与文在语义层面形成一眼可辨的呼应关系。"
  1837. },
  1838. {
  1839. "id": "CAP-ed461080",
  1840. "name": "AI 虚拟人 UGC 广告视频生成",
  1841. "criterion": "生成视频中 AI 虚拟人面部自然、口型与语音同步;手持产品动作流畅,产品外观与输入参考图一致;整体视觉风格与真实 UGC 内容无明显区别;单条视频生成时间不超过 10 分钟",
  1842. "description": "以产品图片和脚本为输入,自动生成 AI 虚拟人(数字创作者)手持或展示产品的 UGC 风格短视频,包含自然的面部表情、口型同步、手势动作和真实感背景,输出可直接投放 TikTok/Reels/Shorts 的广告素材。"
  1843. },
  1844. {
  1845. "id": "CAP-ed4b506e",
  1846. "name": "人像专业布光模式精准复现",
  1847. "criterion": "生成图像的光影结构与目标布光模式的物理特征高度吻合(如伦勃朗光应在面部阴影侧出现三角形亮区);主体的立体感和轮廓感明显;光影方向性清晰,符合单一主光源的物理逻辑。",
  1848. "description": "通过在提示词中使用专业摄影布光术语,精准复现经典或氛围性布光模式:伦勃朗光(Rembrandt)、蝴蝶光(Butterfly)、侧逆光(Rim Lighting)、二分光(Split Lighting)、丁达尔光晕、黄金时刻逆光、窗户光、影棚柔光箱、光比与光源方向控制,使生成人像呈现专业摄影棚级别的光影结构、面部立体感与情绪氛围。"
  1849. },
  1850. {
  1851. "id": "CAP-ee5ffa0b",
  1852. "name": "360 度全景图空间一致性世界生成",
  1853. "criterion": "生成的 360 度全景世界在任意视角下均保持空间几何一致性,无明显的透视错误或风格断裂;可导出为可编辑的 3D mesh 资产;支持在场景内自由漫游而不出现穿帮。",
  1854. "description": "基于单张图片或文字提示词,AI 模型自动生成具备全局空间一致性的 360 度全景世界,确保场景在各个方向上的几何关系、光照和风格保持连贯,支持自由漫游探索和 mesh 资产导出。"
  1855. },
  1856. {
  1857. "id": "CAP-ee7df476",
  1858. "name": "参数化/ControlNet 驱动的多视角图像生成",
  1859. "criterion": "生成的多视角图像能按照输入的方位角/仰角参数准确旋转,主体外观特征(颜色、服装、结构)在各视角下保持一致;支持侧面、背面等困难视角生成,不出现严重形变或身份丢失;不同距离参数下主体在画面中的大小比例符合透视逻辑",
  1860. "description": "以单张参考图为输入,通过参数化控制(方位角 Azimuth、仰角 Elevation、距离 Distance)或 LoRA 坐标系、ControlNet、深度估计等技术,精确控制视角旋转,生成同一主体在 360° 任意水平/垂直方向上的视角变体,不依赖提示词抽卡。"
  1861. },
  1862. {
  1863. "id": "CAP-eecac475",
  1864. "name": "多源异构数据解析与图表转换",
  1865. "criterion": "能够从 Excel、PDF、图片三种以上数据来源中准确提取数值数据;提取后的数据与原始数据误差率低于 5%;可直接基于提取结果生成对应图表,无需人工二次录入。",
  1866. "description": "AI 能够自动识别并解析来自不同来源、不同格式的数据载体(Excel 文件、PDF 文档、图片截图中的数据表格),将其结构化提取后转换为标准可视化图表,打通从非结构化数据到图表的全链路。"
  1867. },
  1868. {
  1869. "id": "CAP-eee5aa08",
  1870. "name": "品牌 Logo 材质化浮雕特写生成",
  1871. "criterion": "生成图像中 Logo 从表面凸起效果真实,如硬币浮雕般有厚度感;材质表面纹理(ISO 800 颗粒感)自然;光照方向一致,浮雕边缘倒角平滑;全画面清晰对焦,无景深虚化。",
  1872. "description": "通过分阶段提示词控制,将品牌 Logo 以浮雕形式从材质表面凸起生成,实现金属、陶瓷、碳纤维等不同材质表面上的 Logo 立体化展示,适用于品牌视觉物料和产品包装特写图。"
  1873. },
  1874. {
  1875. "id": "CAP-ef0a4c0c",
  1876. "name": "摄影级镜头与相机参数模拟",
  1877. "criterion": "生成图像中可识别出与指定参数对应的视觉特征:大光圈(f/1.4-f/2.8)对应明显背景虚化(bokeh);长焦(85mm+)对应空间压缩感;暖色温(5500K-6500K)对应金色调;中画幅(Hasselblad X2D)对应高细节密度和特定色彩还原风格。",
  1878. "description": "在 AI 图像生成提示词中嵌入专业摄影参数(焦距 mm、光圈 f/值、ISO、快门速度、色温 K 值、画幅格式、传感器尺寸、白平衡)以及相机位置与姿态(高度、倾斜、旋转、视野范围),使生成图像模拟特定摄影设备和拍摄参数下的真实光学效果(景深虚化、色温偏移、镜头畸变),并在多次生成中保持相机参数一致。"
  1879. },
  1880. {
  1881. "id": "CAP-f1b56bc8",
  1882. "name": "多镜头连续场景叙事生成",
  1883. "criterion": "生成的多镜头序列:①每个镜头的角色外观与其他镜头保持一致;②镜头间存在清晰的叙事逻辑递进关系;③每个镜头的场景、道具、动作描述准确呈现;④整体可组合为完整的故事叙事。",
  1884. "description": "将单一故事主题拆解为多个连续的叙事镜头,为每个镜头独立编写包含角色状态、动作细节、场景环境的视觉提示词,并通过角色一致性约束确保同一角色在所有镜头中外观统一,最终生成可组合为完整故事的多帧图像序列或视频分镜。"
  1885. },
  1886. {
  1887. "id": "CAP-f353813a",
  1888. "name": "抽象元素头部替换合成",
  1889. "criterion": "替换后的抽象头部元素与人体颈肩部位在边缘、光影、色调上自然融合,无明显切割痕迹;抽象元素(星云/粒子/太极)的视觉体量与原头部比例协调;整体画面具备统一的超现实风格氛围。",
  1890. "description": "将人物头部区域精准识别并替换为宇宙星云、太极图、粒子爆炸、几何抽象体等非具象视觉元素,同时保持颈部以下身体结构、服装、光影与替换元素在视觉上自然衔接,营造超现实哲学感或科幻感画面。"
  1891. },
  1892. {
  1893. "id": "CAP-f459d6a8",
  1894. "name": "信息层级可视化编排",
  1895. "criterion": "输出画面包含至少2种以上信息可视化模块(如时间轴+数据图表,或流程图+分类网格);各模块之间通过视觉元素(箭头/引线/虚线)建立关联;信息层级(主标题/副标题/说明文字)清晰可辨;整体呈现疏密有致的多格子信息图表效果。",
  1896. "description": "将复杂的多维度信息(时间轴、流程步骤、数据统计、分类标签、地域分布等)自动转化为多模块图形化排版,通过时间轴节点、环形图、饼图、引线标注、箭头连接等视觉元素,在多个格子单元中构建清晰的信息层级与阅读路径。"
  1897. },
  1898. {
  1899. "id": "CAP-f5bdf401",
  1900. "name": "对话式图表迭代修改",
  1901. "criterion": "在同一对话上下文中,用户提出修改需求后,AI 输出的新版图表代码能准确反映修改意图,且保留上一版本中未被修改的部分;至少支持 3 轮以上连续修改而不丢失上下文。",
  1902. "description": "用户在 AI 生成初版图表后,通过自然语言对话持续描述修改需求(如'有些框的文字重叠了,帮我调整一下'、'把基础层背景色改为深蓝色'),AI 理解上下文并自动更新图表代码,实现无需手动编辑代码的多轮迭代优化,直至图表满足需求。"
  1903. },
  1904. {
  1905. "id": "CAP-f60a97fe",
  1906. "name": "全局色调映射与色相偏移",
  1907. "criterion": "处理后图像的主色相集中在目标色相 ±40° 范围内;画面整体色调统一感明显优于处理前;场景内容结构(构图、主体形态)保持不变;不同明度区域(高光/中间调/阴影)均偏向目标色相。",
  1908. "description": "对已生成的图像进行全局色相偏移处理,将画面中所有元素的颜色统一向目标色相靠拢,通过 HSL 色相旋转、色彩分级(Color Grading)或 LUT 应用,使原本多色相的图像呈现出高度统一的单色调视觉效果。"
  1909. },
  1910. {
  1911. "id": "CAP-f616297b",
  1912. "name": "人物照片融合喜庆背景生成",
  1913. "criterion": "输出图像中人物面孔与参考照片高度相似,可被识别;人物与喜庆背景的光照方向、色调一致,无明显合成痕迹;背景中的吉祥符号(双喜字、红玫瑰、金色纹样)完整清晰;整体画面呈现强烈喜庆氛围",
  1914. "description": "以用户上传的真实人物照片为输入,通过 AI 图像生成技术将人物面孔自然嵌入预设的喜庆背景(红色背景、传统纹样、吉祥符号装饰)中,在保持人物面部特征清晰可辨的同时,使人物与喜庆背景在光照、色调、风格上协调融合,生成定制化喜庆图案。"
  1915. },
  1916. {
  1917. "id": "CAP-f6d53ed4",
  1918. "name": "数据图表动态动画化渲染",
  1919. "criterion": "生成的数据图表动画帧与帧之间数据变化连贯自然,无跳变;动态排行榜的排序变化与原始数据时序一致;可导出为视频格式直接用于内容发布;零基础用户可在 30 分钟内完成制作。",
  1920. "description": "将静态数据图表转化为具有动态效果的图表动画(如动态排行榜、数据增长动画、数字翻牌器等),通过 AI 整理数据后配合视频剪辑工具自动生成丝滑的数据变化动画,适用于视频内容创作和数据大屏展示。"
  1921. },
  1922. {
  1923. "id": "CAP-f6fee5ab",
  1924. "name": "AI 创意短片叙事生成",
  1925. "criterion": "生成的画面序列在视觉风格上高度统一;叙事主题通过视觉对比(明暗、色彩、元素象征)清晰传达;无需逐帧手动干预即可完成完整叙事序列的生成。",
  1926. "description": "以哲学主题、文化符号(如地藏王菩萨誓愿、太极阴阳、宇宙轮回)为叙事核心,通过 AI 生成工具将抽象概念转化为具有强烈视觉对比(光与暗、苦与乐、沉沦与超脱)的连续画面序列,形成具备完整叙事弧线的创意短片或视觉诗篇。"
  1927. },
  1928. {
  1929. "id": "CAP-f8f10f5f",
  1930. "name": "AI 图文海报一体化生成",
  1931. "criterion": "输出图像中文字内容与输入主题语义一致;文字排版与图像视觉风格协调统一;关键信息(标题、说明文字)清晰可读;一次输入即可输出可直接使用的完整图文作品",
  1932. "description": "以主题描述或参考链接为输入,AI 模型同时完成图像内容生成与文字排版设计,输出图文融合的完整海报、宣传图或卡片,文字内容、字体风格、排版布局均由 AI 自动决策,无需分步操作。"
  1933. },
  1934. {
  1935. "id": "CAP-f9d0b2e6",
  1936. "name": "复古做旧色彩调色",
  1937. "criterion": "输出图像色调与目标复古风格(如70年代胶片、复古印刷品、老旧杂志)一致;色彩饱和度适度降低,具有年代感;配合颗粒感后整体呈现真实的复古印刷品视觉效果。",
  1938. "description": "通过 AI 生成阶段的色彩参数或后处理节点,对图像进行复古色调处理,包括降低饱和度、添加暖黄/冷蓝色偏、模拟胶片曝光不足或过曝效果,配合颗粒感共同营造印刷品老化的视觉氛围。"
  1939. },
  1940. {
  1941. "id": "CAP-fa16e6ba",
  1942. "name": "图像主体自动抠图",
  1943. "criterion": "输出图像主体边缘干净,无明显残留背景色;透明区域正确,主体轮廓完整;可直接叠加到任意颜色背景上而无明显拼接感;处理过程全自动,无需人工描边或手动选区。",
  1944. "description": "对 AI 生成的插图或普通图片进行自动化前景主体提取,去除背景并输出透明底 PNG 格式,使插图主体可以自由叠加到卡片背景色块、模板画板等任意底色上,实现图文卡片中插图与背景的干净分离。"
  1945. },
  1946. {
  1947. "id": "CAP-facb7a60",
  1948. "name": "图层叠放与遮挡关系管理",
  1949. "criterion": "图层顺序可自由调整,前景图片可遮挡后景图片,遮挡关系自然合理。",
  1950. "description": "调整多张图片在画布上的图层顺序,实现图片间的叠加、遮挡效果,使拼贴具有空间深度感。"
  1951. },
  1952. {
  1953. "id": "CAP-fbb3586e",
  1954. "name": "图文叙事多页排版合成",
  1955. "criterion": "每页图文布局合理,文字位置不遮挡关键画面元素,文字量适中(每页2-4行),整体叙事节奏流畅,多页风格统一,可直接导出为发布格式",
  1956. "description": "将AI生成的插画序列与对应的故事文字(对话、旁白、说明)按叙事逻辑自动排版合成为多页图文作品,支持文字位置自适应画面构图(上方留白、下方说明区、人物附近对话区等),输出可直接发布的图文内容。"
  1957. },
  1958. {
  1959. "id": "CAP-fc2bd5cf",
  1960. "name": "对话气泡形状生成与智能定位",
  1961. "criterion": "生成的气泡形状与风格匹配目标漫画/故事风格,气泡指向箭头正确指向对应角色,文字内容完整容纳于气泡内且不超出边界,气泡位置不遮挡关键画面元素",
  1962. "description": "自动生成符合漫画/故事叙事规范的对话气泡形状(包括普通对话泡、思考泡、喊叫泡、日式/西式风格等),并根据画面构图智能定位气泡位置与指向箭头方向,使气泡自然指向对应角色。"
  1963. },
  1964. {
  1965. "id": "CAP-fc3c58a4",
  1966. "name": "单色调提示词色相锁定工程",
  1967. "criterion": "生成图像中主色系占比不低于 70%,所有主要场景元素(天空、地面、主体物)的色相偏向同一色相区间(±30° 以内);辅助色点缀面积不超过 15%;整体视觉呈现统一的色调氛围,无明显色相跳变。",
  1968. "description": "通过在文生图提示词中精确声明整体色调方案(如 'overall color scheme features dark blue as the main tone'、'整体色调清澈明亮'),将画面所有元素的色相锁定在同一色系内,辅以少量对比色点缀,实现梦幻沉浸的单色调视觉氛围。"
  1969. },
  1970. {
  1971. "id": "CAP-fddd3349",
  1972. "name": "网格/全景大图自动切割为独立子图",
  1973. "criterion": "输出的子图数量与网格规格一致(如 3x3 输出 9 张);每张子图的宽高比与母图一致(行列数相同时);子图内容完整,无裁切错位;可按顺序命名导出",
  1974. "description": "将包含多个画面单元的网格大图(3×3 九宫格、4×4 十六格等)或宽幅全景图,按网格坐标或等宽比例自动切割为多张尺寸一致、边缘整齐的子图,可按顺序单独发布到社交媒体(Instagram 轮播、无缝横幅等)或用于后续处理,无需二次裁剪。"
  1975. },
  1976. {
  1977. "id": "CAP-fe53515d",
  1978. "name": "版式构图模式智能推荐与套用",
  1979. "criterion": "系统能根据图片数量(2-9张)自动匹配对应的构图模式;主体图片被放置在视觉焦点位置(中心/C位/对角);次要图片分布在辅助位置;输出的排版画面符合对称与均衡、节奏和韵律等视觉原则;用户可从至少5种以上构图模式中选择。",
  1980. "description": "根据用户提供的图片数量、内容主次关系和使用场景,自动推荐最适合的多格子构图模式(如上下构图、居中构图、对角构图、散点构图、S形构图等),并将图片和文字内容自动套入对应的构图模板,生成视觉平衡、层次清晰的排版画面。"
  1981. },
  1982. {
  1983. "id": "CAP-fee513ed",
  1984. "name": "节点式视频广告自动化生成",
  1985. "criterion": "输入单张产品照片,系统可在 1 分钟内自动完成视频广告生成;输出视频包含产品展示画面、配音、动态图形等至少三种媒体元素;各节点(视频/配音/动态图形/最终编辑)可独立配置并自动串联;无需人工逐帧编辑。",
  1986. "description": "通过节点式(Node-Based)AI 工作流系统,将产品照片、配音脚本、动态图形模板等多种素材自动组合,在单一画布上以节点连接的方式完成视频广告的全流程自动化生成,输出包含视频画面、配音、动态图形的完整广告视频。"
  1987. },
  1988. {
  1989. "id": "CAP-ffb20b0d",
  1990. "name": "人物与场景光影融合",
  1991. "criterion": "融合后画面中人物身上的阴影方向与场景光源一致;人物皮肤色温与场景环境色温协调;场景中的反射材质对人物产生合理的环境光反射;整体无明显拼贴边缘或尺度感错误。",
  1992. "description": "将人物图像与目标场景进行深度融合,使人物的光照方向、色温、阴影落点与场景环境物理自洽,消除拼贴感,实现人物仿佛真实置身于场景中的视觉效果。"
  1993. }
  1994. ]