outdoor_character_workflow_summary_20260409.md 15 KB

户外场景人物活动照片生成工作流合集

调研日期: 2026-04-09
调研渠道: 小红书、X (Twitter)、YouTube
提取成果: 6种完整工作流方案,12个工具,7个教程资源


一、核心工作流方案

Workflow 1: OpenArt Character Builder + 多场景一致性工作流

适用场景: 需要保持角色一致性,在多个户外场景中生成人物活动照片

工具链: OpenArt AI Character Builder → Nano Banana 2 / Seedance 2.0 → Kling 3.0

步骤拆解:

Step 1: 创建角色基础

  • 输入: 选择风格(Style)、性别(Gender)、种族(Ethnicity)、年龄(Age)
  • 工具: OpenArt Character Builder
  • 输出: 锁定角色DNA的基础图像(480种组合可选)
  • 说明: 无需编写复杂提示词,通过UI选择锁定角色特征

Step 2: 生成角色参考表 (Character Reference Sheet)

  • 输入: 上传Step 1生成的角色图像
  • 工具: Nano Banana 2 / Seedance 2.0
  • 提示词:

    Create a professional character reference sheet based strictly on the uploaded reference image. 
    Use a clean, neutral plain background. Arrange into two horizontal rows:
    - Top row: four full-body standing views – front, left profile, right profile, back
    - Bottom row: Four close-up portraits – front, left profile, right profile, back
    Maintain perfect identity consistency across every panel.
    
  • 输出: 多视角角色参考表(8个面板)

Step 3: 场景生成

  • 输入: 角色参考表 + 场景提示词
  • 工具: Seedance 2.0 / Kling 3.0
  • 提示词结构:

    {
    "subject": "角色描述",
    "environment": {
    "setting": "户外场景 (如:spring alpine meadow, cherry blossom street)",
    "time_of_day": "golden hour / soft daylight",
    "lighting": "natural lighting, volumetric light shafts"
    },
    "camera": {
    "lens": "85mm / wide-angle"
    },
    "lighting": {
    "type": "soft diffused daylight",
    "effect": "rim lighting, gentle shadows"
    }
    }
    
    • 输出: 角色在户外场景中的图像/视频

    Step 4: 视频生成 (可选)

    • 输入: 起始帧 + 结束帧
    • 工具: Seedance 2.0
    • 提示词: "Show me what happens in between. USE MULTIPLE CAMERA ANGLES"
    • 输出: 多镜头角度的过渡视频

    关键技术要点:

    • 角色一致性保证:使用Character Builder锁定DNA + 生成多视角参考表 + 所有场景使用相同参考图
    • 户外场景提示词要素:golden hour, volumetric light shafts, rim lighting, subsurface scattering

    来源: 小红书/X/YouTube调研 (@thetripathi58, @heyDhavall, @MaAyyoub)


    Workflow 2: ComfyUI + Blender 户外场景生成工作流

    适用场景: 需要高度可控的3D场景建模和电影级渲染效果

    工具链: Blender → ComfyUI → Z-Image Turbo → LTX-2.3 → ComfyUI-VideoColorGrading

    步骤拆解:

    Step 1: 场景建模

    • 输入: 文本提示词或概念图
    • 工具: Blender (在ComfyUI内运行)
    • 输出: 3D场景模型(支持视口预览)

    Step 2: 渲染控制

    • 输入: 3D模型 + 相机路径
    • 工具: ComfyUI + Blender集成节点
    • 输出: 渲染帧序列

    Step 3: 图像生成增强

    • 输入: 渲染帧
    • 工具: Z-Image Turbo
    • 输出: 增强细节的图像

    Step 4: 视频生成

    • 输入: 增强后的图像序列
    • 工具: LTX-2.3 + WanAnimate
    • 输出: 最终视频

    Step 5: 颜色分级

    • 输入: 生成的视频 + 参考图像
    • 工具: ComfyUI-VideoColorGrading (Kijai)
    • 流程: 从参考图像生成3D color LUT → 两阶段扩散过程对齐源视频帧与参考风格 → 应用时间一致性颜色分级
    • 输出: 颜色分级后的最终视频

    优势:

    • 完全可控的3D场景布局
    • 支持精确的相机路径设计
    • 专业的颜色分级流程

    难度等级: ⭐⭐⭐⭐⭐(需要Blender和ComfyUI专业知识)

    来源: X/YouTube调研


    Workflow 3: ComfyUI + BrushNet 婚纱摄影外景工作流

    适用场景: 婚纱摄影、商业人像外景合成

    工具链: ComfyUI → BrushNet → IC-Light → Segment Anything → IPAdapter

    核心流程:

    1. 模型及原图加载 → 设置宽高比、缩放模式
    2. 遮罩生成 → Segment Anything 自动分割人物
    3. BrushNet 局部重绘背景
    4. 优势:对遮罩边界控制优秀,不破坏主体
    5. 透视关系协调
    6. IC-Light 打光融合 → 使人物与背景光影统一
    7. 高清修复放大 → 恢复原图尺寸
    8. PS 细节还原 → 图层和遮罩处理

    关键节点: comfyui-brushnet, comfyui-inpaint-nodes, comfyui-ipadapter_plus

    来源: 小红书 (帖子: 婚纱摄影外景自由)


    Workflow 4: ComfyUI 人像摄影工作流 (SD1.5)

    适用场景: 换装、换背景、保持面部特征的人像创作

    工具链: ComfyUI → SD1.5 → ControlNet (OpenPose) → IPAdapter → LoRA

    核心思路:

    1. 蒙版遮罩 + Latent 复合 → 重绘目标区域,保证光影效果
    2. ControlNet 固定姿态 → OpenPose 控制人物姿势
    3. IPAdapter + WD14 标签提取 → 风格迁移

    工作流特点:

    • 保持面部特征不变
    • 可换装、换背景
    • 支持多 ControlNet 叠加 (Depth, Canny, OpenPose)

    来源: 小红书 (帖子: comfyui 人像摄影工作流)


    Workflow 5: Kontext + MidJourney 场景及角色一致性工作流

    适用场景: 叙事动画、多镜头分镜、大场景多主体融合

    工具链: Kontext (Flux) → MidJourney → GPT

    5步流程:

    1. 准备三视图 → 角色/关键道具的正面、侧面、背面图
    2. 准备分镜草图 → 手绘构图规划
    3. 做主场景氛围空镜 → 确定整体色调和氛围
    4. 做分镜场景空镜 → MJ 生成,使用 --sref 引用氛围图
    5. 主体与场景融合 → Kontext 双图/多图模式融合

    关键技巧:

    • 大场景分区处理:先融合局部,再拼合到全景
    • 小角度机位切换可直接用 Kontext,大角度需单独生成
    • 建议使用 Kontext Pro/Max 版本,开源 dev 版本效果有限

    来源: 小红书 (帖子: 用Kontext + MJ 控制场景及角色一致性)


    Workflow 6: Nano Banana + Kling 户外人物行走场景

    适用场景: 街拍松弛感写真、人物行走视频

    工具链: Nano Banana Pro → Kling 3.0 → Topaz Gigapixel AI → Photoshop

    街拍松弛感写真流程:

    1. 上传参考照片 → 清晰半身照
    2. 使用详细提示词 (见下方模板)
    3. 生成多视角变体 → 选择最佳
    4. Topaz 放大 → 4K 输出
    5. PS 合成清理 → 去除瑕疵
    6. Kling 动画 → 首尾帧控制生成行走视频

    提示词模板 (精简版): ```

参考我上传的照片,输出高分辨率彩色时尚人像。 主体:年轻女性,长发微卷,米色宽松衬衫外套,白色蕾丝短裙,黑色皮包,手持咖啡。 姿态:三分之四侧身,左脚微前,右手轻抬整理发丝,眼神自信直视镜头。 环境:高端城市街区咖啡店门口,暖色橱窗虚化,石材路面反光。 光线:阴天自然柔光,侧后缘光勾勒发丝和包带。 摄影:全画幅 85mm 人像镜头,f/1.8,浅景深,人物位于右侧三分之一处。 细节:肌肤保留毛孔,发丝清晰,皮包纹理可见,轻微胶片颗粒。 比例:4:5


**来源**: 小红书 (帖子: Nano Banana生成街拍松弛感写真) + YouTube (Uvq85gcMSE0, SeuI2zIWQJ0)

---

## 二、工具清单汇总

| 工具名称 | 类别 | 核心用途 | 状态 |
|---------|------|---------|------|
| **OpenArt Character Builder** | 角色生成 | 4步锁定角色DNA (风格/性别/种族/年龄) | 已验证 |
| **Nano Banana / Nano Banana Pro** | 图像生成 | 角色参考表、多视角生成、街拍写真 | 已验证 |
| **Seedance 2.0** | 图像/视频生成 | 角色一致性、场景生成、视频过渡 | 已验证 |
| **Kling 3.0** | 视频生成 | 高质量视频、首尾帧控制、多镜头角度 | 已验证 |
| **ComfyUI** | 工作流编排 | 节点式工作流,集成多种模型 | 已验证 |
| **BrushNet** | 局部重绘 | 背景替换,遮罩边界控制优秀 | 已验证 |
| **IC-Light** | 光影融合 | 人物与背景打光统一 | 已验证 |
| **ControlNet** | 姿态控制 | OpenPose/Depth/Canny 固定构图 | 已验证 |
| **IPAdapter** | 风格迁移 | 参考图风格提取 | 已验证 |
| **Kontext (Flux)** | 图像融合 | 多主体场景融合,角色一致性 | 已验证 |
| **MidJourney** | 场景生成 | 氛围空镜、分镜场景生成 | 已验证 |
| **Topaz Gigapixel AI** | 图像放大 | 4K 无损放大 | 已验证 |
| **Photoshop** | 后期处理 | 遮罩清理、细节还原、图层合成 | 已验证 |
| **Segment Anything** | 图像分割 | 自动人物抠图 | 已验证 |
| **Blender** | 3D建模 | 场景建模,可与ComfyUI集成 | 已验证 |
| **Z-Image Turbo** | 图像增强 | 提升渲染帧质感和细节 | 已验证 |
| **LTX-2.3** | 视频生成 | 图像序列转视频 | 已验证 |
| **WanAnimate** | 视频生成 | 视频生成和动画 | 已验证 |
| **ComfyUI-VideoColorGrading** | 视频后期 | 基于参考图的颜色分级 | 已验证 |
| **ChatGPT** | 提示词优化 | 构建光线控制等专业提示词 | 已验证 |
| **PixPrettyAI** | 图像生成平台 | 托管Nano Banana 2等模型 | 已验证 |

---

## 三、关键提示词模板

### 角色参考表生成 (Nano Banana 2)

Create a professional character reference sheet based strictly on the uploaded reference image. Use a clean, neutral plain background. Arrange into two horizontal rows:

  • Top row: four full-body standing views – front, left profile, right profile, back
  • Bottom row: Four close-up portraits – front, left profile, right profile, back Maintain perfect identity consistency across every panel.

    
    ### 户外场景生成 (Seedance 2.0 / Kling)
    ```json
    {
    "subject": "年轻女性,长发微卷,米色衬衫外套,白色蕾丝裙",
    "environment": {
    "setting": "spring alpine meadow / cherry blossom street / urban cafe",
    "time_of_day": "golden hour / soft daylight",
    "lighting": "natural lighting, volumetric light shafts",
    "elements": ["flowers", "trees", "mountains", "cobblestone street"]
    },
    "camera": {
    "lens": "85mm portrait / wide-angle",
    "movement": "slow tracking / pan"
    },
    "lighting": {
    "type": "soft diffused daylight",
    "effect": "rim lighting, gentle shadows"
    }
    }
    

自然光线人像提示词结构

A high-contrast cinematic portrait with dramatic rim lighting from behind.
Subject: [描述人物特征、服装、动作]
Lighting: 
  - Strong direct light illuminating one side of face
  - Clear highlights and definition
  - Softly shadowed opposite side
  - Light source direction clearly visible
Environment: Dark abstract bokeh background / outdoor park setting
Camera: 85mm lens, shallow depth of field
Style: Professional DSLR portrait, film grain, vintage feel

光线类型关键词对照表

光线类型 提示词关键词 适用场景
Rim Lighting dramatic rim lighting from behind 人像特写、逆光场景
Golden Hour golden hour lighting, warm tones 温馨场景、日落场景
Volumetric Light volumetric light shafts, god rays 森林、有遮挡的场景
Soft Diffused soft diffused daylight, overcast 日常场景、阴天场景
Subsurface Scattering subsurface scattering for skin 人像特写、皮肤质感

四、调研经验总结

经验 1: 如何构造有效的搜索关键词

当调研AI生图工作流/工序时,应该将用户需求转换为偏向「教程」、「工作流」、「全套方案」的搜索词,而非单一软件名。

原因: 单一软件名搜索结果多为工具介绍,而工作流关键词能直接找到完整的多步工序方案。

案例: 本次调研「户外场景人物活动照片」需求,构造了5个关键词:

  1. AI生图 户外人物 工作流 教程
  2. Stable Diffusion 真实场景人物 完整流程
  3. AI绘画 自然光线 人物活动 步骤详解
  4. ComfyUI 户外场景 人物生成 workflow
  5. AI生图 真实背景人物合成 全套方案

每个关键词都包含「工作流/流程/方案/教程」等工序导向词,成功从300条结果中提取19个完整Workflow。

经验 2: 多渠道调研的并行执行策略

当需要多渠道(小红书、X、YouTube)调研同一主题时,应该为每个渠道启动独立的research子agent并行执行。

原因:

  • 各渠道数据结构不同,独立agent可针对性处理
  • 并行执行大幅缩短调研时间

案例: 本次调研同时启动3个agent,分别使用中文关键词(小红书)和英文关键词(X、YouTube),每个agent搜索5个关键词×20条结果,总计300条结果,在约15分钟内完成全部调研并提取19个Workflow。

关键技巧:

  1. 为不同渠道准备适配的关键词(中文/英文)
  2. 任务描述中明确要求「只提取多步工序,严格拆解步骤」
  3. 使用deconstruct agent类型自动进行工序拆解

五、工作流选择建议

需求场景 推荐工作流 理由
角色一致性优先 Workflow 1 (OpenArt + Seedance) 4步锁定DNA,参考表机制成熟
3D场景精确控制 Workflow 2 (Blender + ComfyUI) 完全可控的3D布局,专业颜色分级
婚纱摄影/商业人像 Workflow 3 (BrushNet) 遮罩控制精准,光影融合自然
换装/换背景灵活操作 Workflow 4 (ComfyUI SD1.5) ControlNet + IPAdapter 组合灵活
叙事动画/多镜头 Workflow 5 (Kontext + MJ) 分镜规划完善,大场景分区处理
街拍松弛感写真 Workflow 6 (Nano Banana + Kling) 提示词模板成熟,视频生成流畅

六、教程资源索引

来源 标题 链接
小红书 BrushNet婚纱摄影外景工作流 https://www.xiaohongshu.com/explore/67b8726e0000000029032412
小红书 ComfyUI人像摄影工作流(SD1.5) https://www.xiaohongshu.com/explore/66253296000000000302272a
小红书 Kontext + MJ场景及角色一致性 https://www.xiaohongshu.com/explore/687771cf0000000024008e4b
小红书 Nano Banana街拍松弛感写真 https://www.xiaohongshu.com/explore/68e11fa700000000070363c7
YouTube Add AI People to Your Renders https://www.youtube.com/watch?v=Uvq85gcMSE0
YouTube Turn One Image into Multiple Camera Angles https://www.youtube.com/watch?v=SeuI2zIWQJ0
本地缓存 AI户外工作流合集原始数据 /root/Agent/.cache/research/ai_outdoor_workflow_collection_20260409.json

文档生成时间: 2026-04-09 19:38
调研执行Agent: Librarian Agent
数据状态: 已整理归档,待入库