摘要: 用720度全景图当虚拟影棚,先对参考图反推提示词、图生图生成全景底图,再用全景查看器任意截取一致角度,最后图生图合入角色人物,彻底解决AI多角度场景一致性难题。
前两天刷短视频,看到一个优秀的创作者发了一组图。
几组不同角度的场景,角色位置不同,但场景一样,光影不错,不至于太假,凉亭的位置还始终如一,连那水里的鱼,也保持不变。
我愣住了,我第一反应:这人是后期修的?每个场景的位置都来了一遍?
好奇心上来了,船长肯定使劲问那位作者,结果咋问都不回,好不容易回了,还让我加群,我一看到这消息....心里就一万个X尼M了,又是这一套流程?船长一般都是咱船员能割我,什么时候轮到你了?
所以,船长这2天就给他安排了,好像到船长这,都是白菜了一样,免费给你们分享,结果还有人说,你咋老是写这些能白嫖的?我人麻了,得,你说的对。
这套整体的思路是什么?我给大家理一理。
原理是啥:
先生成一张720度全景图,然后在这个图里随便截,反正场景不变,最后再把人物放进去。这是不是太简单了?
老规矩:地址船长放在评论区,需要的留言,我会逐一回复。
先说说这个痛点,有多痛?这就叫场景一致性,你画了一个场景图,正面没问题,换个角度,要么是里面结构偏了,要么是光线歪了。
这也没办法,AI每次生成一张图,都是独立的,它会忘记上一张图。
所以要做一整个连贯的场景图,要么是图生图抽卡,要么是靠后期修,这里就延伸出来一个问题了,到底有没有一种方式方法,能彻底解决这个破事?
那就是720度,全景图,咱不墨迹,手把手一步步做,从0-1开始。
一:没有灵感,我没有图?怎么办?
可以去Pinterest或者去小红书,找一个环节,比如修仙风格,就搜修仙场景。应该足够你用了。
我选择了这个试试:
船员也可以根据我的步骤一步步来:这是初始图:
二:接下来干啥?反推提示词,
为啥?是因为咱后期需要多个角度,让AI给补全你素材没有的画面,比如说,差了点风景,头顶的屋檐,所以补全后空间嘎嘎完整。
咋做?把这个图片给到大模型,比如豆包,当然或者其他,输入以下提示词:
“帮我想一下这个场景全景图的AI提示词,也要发散想象,想一想图片外不包含的画面。我要用于720全景图展示,并保证3d国漫的风格,不要生成图片,只要中文提示词。”
然后你会得到一段提示词,太长截不全了,自己一试便知。
第三:生成底图,打开支持图生图的,
或者文生图的工具,最好用香蕉2,能选4K选4K,不能选就选2K好了,把上面的提示词复制进去,图生图。
你得到了一张视野360度初始场景图。整个场景和画面是不是有感觉了?
这里是不是有人问了,船长船长,有没有高清的工具啊?有这个想法的,那就给船长一键三连,多多支持,地址我也放评论区。生成几次不知道,没测试
第四:全景取景,也是最关键的一步:
打开我评论区的地址,把图片拖进去。
这效果不就来了,之后找到合适的角度,截图就行了。
第五:根据上一步截图的场景图,
添加人物,怎么添加?准备好2个角色三视图,这个不需要交吧,之后还是图生图的形式。
效果:是不是有那感觉了?稳稳当当的坐着,可以再加其他角色。
有时候问题的解法,不在于让AI画的更好,而在于让AI画的更少,与其让AI生成一百张图,然后一个个选,不如一开始就生成一张图,在这张图里取任意的角度。
前者是无限游戏,后者是有限游戏。
所以换一种思维,当你把生成的问题,变成取景的问题,这问题就消失了。
看到这里:
留下你的关注,如果觉得不错,点个赞,推荐,转发三连。
想进群的船员,可以打赏下
,之后私我拉你。
| 需求 | 输入 | 实现 | 输出 | ||||||||||
|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
| # | 目的 | 作用 | 实质 | 形式 | 类型 | 值 | 来源 | 外部工具 | 动作 | 指令 | 类型 | 值 | 去处 |
| s1 | 用human按创作主题词在公共图库检索,选取一张目标参考场景图 | 预准备 | 场景 | 修仙 | 创作主题词 | 可以去Pinterest或者去小红书,找一个环节,比如修仙风格,就搜修仙场景。应该足够你用了。 | human | 获取/搜索/检索 | 参考场景图 | s1o1 https://pic1.zhimg.com/v2-df1c1bb42cec65cbc1d6ca7e9200907e_1440w.jpg | → s2, s3 | ||
| s2 | 以参考场景图和提示词为输入,用(大模型)反推场景要素,生成全景场景提示词 | 预处理 | 场景 | 3D国漫、720度全景 | 参考场景图 | https://pic1.zhimg.com/v2-df1c1bb42cec65cbc1d6ca7e9200907e_1440w.jpg | ← s1o1 | (大模型) | 提取/化学提取/反推 | 帮我想一下这个场景全景图的AI提示词,也要发散想象,想一想图片外不包含的画面。我要用于720全景图展示,并保证3d国漫的风格,不要生成图片,只要中文提示词 | 全景场景提示词 | s2o1 3D国漫风 720全景图 提示词 (中文) 【核心视角与风格】 3D国漫高精渲染风格,720度全景视角(球形投影/全景构图),极致画质,电影级布光。 【全景核心区(复刻并融合 image_0.png 元素)】 构图中心:一座古朴的、具有典型中国古代建筑风格的合院天井(院子)。院子由石板铺地,其上落满了粉色的樱花瓣。 核心元素:巨型古木:院中矗立着那棵巨大的、枝干扭曲盘旋的粉色樱花树(和合树),它的巨大树冠几乎覆盖了半个天空(和天井)。 中庭桌椅:院子中央摆放着那套古朴的木质桌椅和花瓶(如 image_0.png 所示)。 四周建筑:环绕四周的是精美的两层中式阁楼,拥有飞檐翘角、青瓦屋顶、木质花窗和红灯笼(如 image_0.png 所示)。左侧的石阶、右侧的石狮像、以及各处的盆栽植物(桔子树等)都保留并精细化。 光影与氛围:温和的午后阳光通过树冠和天井洒下斑驳的光影,空气中飘散着发散性的樱花花瓣。(截自 Gemini 对话截图,完整提示词后续部分被截断) | → s3 |
| 程序控制类型/指令/提示词 | 帮我想一下这个场景全景图的AI提示词,也要发散想象,想一想图片外不包含的画面。我要用于720全景图展示,并保证3d国漫的风格,不要生成图片,只要中文提示词 | ||||||||||||
| s3 | 用nano_banana以全景场景提示词和参考场景图图生图元素生成,得到720度全景场景图 | 主体生成 | 场景 | 3D国漫、720度全景 | 全景场景提示词 | 3D国漫风 720全景图 提示词 (中文) 【核心视角与风格】 3D国漫高精渲染风格,720度全景视角(球形投影/全景构图),极致画质,电影级布光。 【全景核心区(复刻并融合 image_0.png 元素)】 构图中心:一座古朴的、具有典型中国古代建筑风格的合院天井(院子)。院子由石板铺地,其上落满了粉色的樱花瓣。 核心元素:巨型古木:院中矗立着那棵巨大的、枝干扭曲盘旋的粉色樱花树(和合树),它的巨大树冠几乎覆盖了半个天空(和天井)。 中庭桌椅:院子中央摆放着那套古朴的木质桌椅和花瓶(如 image_0.png 所示)。 四周建筑:环绕四周的是精美的两层中式阁楼,拥有飞檐翘角、青瓦屋顶、木质花窗和红灯笼(如 image_0.png 所示)。左侧的石阶、右侧的石狮像、以及各处的盆栽植物(桔子树等)都保留并精细化。 光影与氛围:温和的午后阳光通过树冠和天井洒下斑驳的光影,空气中飘散着发散性的樱花花瓣。(截自 Gemini 对话截图,完整提示词后续部分被截断) | ← s2o1 | nano_banana | 生成/元素生成 | 打开支持图生图的, 或者文生图的工具,最好用香蕉2,能选4K选4K,不能选就选2K好了,把上面的提示词复制进去,图生图 | 720度全景场景图 | s3o1 https://pic4.zhimg.com/v2-f4c7892485f38c17e323286b0cbd747b_1440w.jpg | → s4 |
| 参考场景图 | https://pic1.zhimg.com/v2-df1c1bb42cec65cbc1d6ca7e9200907e_1440w.jpg | ← s1o1 | |||||||||||
| s4 | 用(AI超分工具)增强对720度全景场景图做6倍画质提升,得到高清全景图 | 后期 | 场景 | 高清画质 | 720度全景场景图 | https://pic4.zhimg.com/v2-f4c7892485f38c17e323286b0cbd747b_1440w.jpg | ← s3o1 | (AI超分工具) | 修改/变/增强 | AI画质增强,选择6x放大倍率 | 高清全景图 | s4o1 https://pic3.zhimg.com/v2-87014f1eb9413767dae11b645de93e78_1440w.jpg | → s5 |
| s5 | 用(全景查看工具)从高清全景图中裁切合适视角,得到截图 | 预处理 | 场景 | 高清全景图 | https://pic3.zhimg.com/v2-87014f1eb9413767dae11b645de93e78_1440w.jpg | ← s4o1 | (全景查看工具) | 提取/物理提取/裁切 | 打开我评论区的地址,把图片拖进去。 这效果不就来了,之后找到合适的角度,截图就行了 | 内容类型/素材/物理变化/截图 | s5o1 <国风樱花庭院场景从特定角度取景的截图,场景一致,供后续人物融合使用> | → s6 | |
| s6 | 用nano_banana_z以截图为场景、角色三视图为角色参考元素生成人物入场合成图 | 装配 | 人物、场景 | 3D国漫 | 内容类型/素材/物理变化/截图 | https://pic4.zhimg.com/v2-f4c7892485f38c17e323286b0cbd747b_1440w.jpg | ← s5o1 | nano_banana_z | 生成/元素生成 | 准备好2个角色三视图,这个不需要交吧,之后还是图生图的形式 | 内容类型/成品/合成图 | s6o1 https://pic3.zhimg.com/v2-4d250add0e6d873125cfc44772120b64_1440w.jpg | |
| 角色三视图 | https://picx.zhimg.com/v2-60517138c5617cbd868171e33e98533d_1440w.jpg | ||||||||||||