作者khara (逝)
看板AI_Art
标题[闲聊] AI生成图片的背景延伸与拼接问题
时间Fri Apr 25 21:55:35 2025
也是个初级问题。不好意思!
有没有较好的免费资源的背景延伸的平台?
以及拼接图片的技巧应如何?
这是我请 ChatGPT 生成左右两幅後拼接而成的图:
蔡牵末路图。
https://i.imgur.com/qkqOmkd.jpeg
故事背景简单说就是嘉庆年间出身同安的海贼王蔡牵,
被出身台湾嘉义的名将王得禄击沉座船,
最後一刻蔡牵选择以火药自爆的场景。
但中间延伸背景而拼接的感觉有点不自然。
且现在 ChatGPT 背後的生图模型似乎还无法理解
「生成左右两幅,左幅的右方边界恰好可与右幅的左方边界衔接」
这样的描述?
上面分别是来自下述两幅的拼接
(但蔡牵自爆那幅我把它左右180度反转了才恰好可衔接)
https://i.imgur.com/YU3KN5S.png
https://i.imgur.com/JHjTEvB.png
然後我问了 ChatGPT,他给的改进意见是分成三幅,
於是就产生了下述三幅难以拼接的内容
https://i.imgur.com/lNDVYU3.png
https://i.imgur.com/P0impr2.png
https://i.imgur.com/OcWdEeC.png
因为我想把邱良功(出身金门的名将,共同负责击垮蔡牵)加入,
结果发现这三幅还真难以衔接。
其实就算把中间那幅省略也还是很难衔接。
(另外题外话之一是新生成的蔡牵自爆的表情不如原来的生动,
题外话之二是王得禄的画像很容易可找到,
我就请 ChatGPT 「依据画像年轻化」,
但邱良功的画像似乎不易找到?)
这种是要另外找别的生图模型较好?还是找较恰当的背景延伸器较好?
顺便附一个拼接感更重的『李长庚殉职图』:
https://i.imgur.com/qnRbWln.jpeg
故事背景是清朝水师名将李长庚几乎要击溃蔡牵时却中弹而亡。
这让我觉得很适合做成画。
但,目前这幅的几大缺点:
1.首先最突兀的当然是中间着火的船还有一些木材残骸。
那是由於原本生成左中右三幅,再另外生成背景,
而我又舍不得中间这幅残骸图,
硬是擦去部份然後贴上,感觉很不自然。
(应该要用背景延伸器把烟雾延伸出来。
不过木材残骸的海色不同也讨厌。)
2.左方清军船只与右方海贼船只上的人物都是额外黏贴的。
有不自然的痕迹。
原因也是最初生成的图的船只是部份而很难衔接,
所以我去背景後额外再生成凸显甲板的船只然後把人贴上来。
(试了几次沟通,似乎很难直接生成全景甲板加人物都顺畅的。)
3.船只太小而人物太大:
这一点我是故意的。
因为如果真按比例的话,人物会小到看不见而变成船只占画面大半,
但我希望凸显人物。
这一点我欠缺美术训练,不知道专业画家们是如何处理这类问题的。
总之主要问题还是目前似乎语言模型的 AI 还无法驾驭太复杂的场景,
而且只能生成较小幅的画(跟免费用户有关吗?),
所以得额外延伸背景且拼接。
而这方面须要技巧。
另外当然我在美术上欠缺训练则是我个人的问题了。
--
Immer mit den einfachsten Beispielen anfangen.
David Hilbert
--
※ 发信站: 批踢踢实业坊(ptt.cc), 来自: 114.37.223.157 (台湾)
※ 文章网址: https://webptt.com/cn.aspx?n=bbs/AI_Art/M.1745589338.A.6EC.html
1F:→ error405: 用photoshop改个大概再拿去tensor或pixai图生图不知行不 04/25 22:14
2F:→ error405: 行 但问题是还得先找到风格近似的模型 04/25 22:14
哈哈!
看似我这题材较冷门,或许不易找到相近风格的模型?
不过由於先与ChatGPT讨论到 The Death of Nelson (West painting),
https://reurl.cc/OYYEQy
结果这系列历史画作他都给我生成油画风,
优点是有历史感(但要像那幅那样塞满人物的似乎目前也难生成),
缺点是拼贴不易。
例如我嫌他给的画血流得不够,额外找血的题材来贴,
但由於写实的血与油画的血风格差很多,
贴上来感觉就很不自然。
题外话是再提供个Grok理解出差错的搞笑
(但这类搞笑应该各位都经历不少了)
https://i.imgur.com/RBO0kHr.jpeg
也是提供素材请 Grok 改画。
不知是素材的光线不佳还是怎样,居然画出三条腿!
不过在我测试鸭子坐的时候还出现过忽略小腿的:
但这一幅还正常,左右都是伸两根手指:
https://i.imgur.com/CcrfhNM.jpeg
这一幅直接把两根手指改成三根手指了:
https://i.imgur.com/V81p0Wf.jpeg
晚点再找 tensor 等测试看看。
但历史主题的而非萌主题的不知道那里是否适合就是。
3F:推 Supasizeit: Google那个不是丢三张图他会自己拼起来 04/25 22:20
Claude吗?好的。有机会也侧看看。
目前 ChatGPT 优点是有时比 Grok 细腻但缺点是每天限制额度。
Grok 优点就是可以大量生,但某些主题的图他太弱。
其他几家我也试试看吧。
其实之前也有综合两家的图来拼接的。利用各家的优点再拼接这也是可行之路。
※ 编辑: khara (114.37.223.157 台湾), 04/25/2025 22:51:59
4F:推 stlinman: 楼上说的Google应该是AI Studio或Gemini 04/26 14:33
5F:→ stlinman: Stable Diffusion 的话,可以用"线稿"或"工作流"来拼接 04/26 14:35
6F:推 stlinman: 不过我是觉得A、B、C三幅拼接或是乾脆分镜处理都不错啊! 04/26 14:38
那我找机会测一下AI Studio或Gemini。
目前正在苦恼三幅该如何衔接。
先给各位看一下今天请求它重绘後出现的搞笑场景
https://i.imgur.com/yrKOylS.png
我要求中间这幅应该整船入镜以便放置在远方作插绘,
主角是王得禄(A幅)与蔡牵(C幅),
结果它重绘的下场是确实整艘船入镜了,
但邱良功将军(姑且这麽称呼)却整个人站立在海上!
根据 OpenAI 的政策,禁止绘制啥奇蹟之类的场景,
可是它自己却老是自动产生这种「将军凭空站在海上」的奇蹟!
真是超级搞笑!XD
※ 编辑: khara (114.37.227.246 台湾), 04/26/2025 16:52:05
7F:推 Vulpix: 你这张看起来很像是站在浅滩,海水及膝。 04/26 18:27
8F:→ Vulpix: 我也很常看到AI把脚插到床、地板上。 04/26 18:28
9F:→ Vulpix: 直接要求panorama不行吗? 04/26 18:29
确实变成像浅滩登陆哈哈!XD
喔喔!我明天试试在 prompt 中加入 panorama 的要求。
不过我觉得 ChatGPT 的生成图片会有自动聚焦的特色。
换言之,一次给太多要点,
AI会自动判定主要与次要,结果聚焦在主要,其他细节就会错乱。
例如我请AI生成一幅汉土和尚回归而中途遇暴风,
船上其他印度人指责这汉土和尚不祥而只有一位施主保护和尚的图。
结果是要嘛太小:
https://i.imgur.com/A0S8jZt.png
要嘛整艘船入镜结果就错乱(暴风雨中站在木板上,变成少年pi了):
https://i.imgur.com/774Gp4E.png
要嘛又是浅滩附近:
https://i.imgur.com/xtaGTOn.png
最後还是用拼接的硬凑出,但细节就有点不自然:
https://i.imgur.com/getEgPP.jpeg
不过我再试试把 panorama 加入 prompt中。感谢建议!
※ 编辑: khara (114.37.212.119 台湾), 04/26/2025 21:21:36
※ 编辑: khara (114.37.212.119 台湾), 04/26/2025 21:22:44
哈哈!
andy大的这幅也是。
画风很有气势很有感觉,
但印度人在巨浪滔天的甲板外责难汉地和尚这也相当奇蹟! XD
看来不玩拼接很难完成这种大幅的一张塞入多要素的画啊!
※ 编辑: khara (114.37.220.11 台湾), 04/27/2025 11:23:03
然後结果我还是自行手动拼接了。
ChatGPT 新生成的还是很难贴起来,结果我还是自行修图拼接。
结果如下。
看来这就是我目前技术的限度了。
https://i.imgur.com/gJgHjwI.jpeg
※ 编辑: khara (114.37.219.47 台湾), 04/28/2025 05:31:29