作者khara (逝)
看板AI_Art
標題[閒聊] AI生成圖片的背景延伸與拼接問題
時間Fri Apr 25 21:55:35 2025
也是個初級問題。不好意思!
有沒有較好的免費資源的背景延伸的平臺?
以及拼接圖片的技巧應如何?
這是我請 ChatGPT 生成左右兩幅後拼接而成的圖:
蔡牽末路圖。
https://i.imgur.com/qkqOmkd.jpeg
故事背景簡單說就是嘉慶年間出身同安的海賊王蔡牽,
被出身臺灣嘉義的名將王得祿擊沉座船,
最後一刻蔡牽選擇以火藥自爆的場景。
但中間延伸背景而拼接的感覺有點不自然。
且現在 ChatGPT 背後的生圖模型似乎還無法理解
「生成左右兩幅,左幅的右方邊界恰好可與右幅的左方邊界銜接」
這樣的描述?
上面分別是來自下述兩幅的拼接
(但蔡牽自爆那幅我把它左右180度反轉了才恰好可銜接)
https://i.imgur.com/YU3KN5S.png
https://i.imgur.com/JHjTEvB.png
然後我問了 ChatGPT,他給的改進意見是分成三幅,
於是就產生了下述三幅難以拼接的內容
https://i.imgur.com/lNDVYU3.png
https://i.imgur.com/P0impr2.png
https://i.imgur.com/OcWdEeC.png
因為我想把邱良功(出身金門的名將,共同負責擊垮蔡牽)加入,
結果發現這三幅還真難以銜接。
其實就算把中間那幅省略也還是很難銜接。
(另外題外話之一是新生成的蔡牽自爆的表情不如原來的生動,
題外話之二是王得祿的畫像很容易可找到,
我就請 ChatGPT 「依據畫像年輕化」,
但邱良功的畫像似乎不易找到?)
這種是要另外找別的生圖模型較好?還是找較恰當的背景延伸器較好?
順便附一個拼接感更重的『李長庚殉職圖』:
https://i.imgur.com/qnRbWln.jpeg
故事背景是清朝水師名將李長庚幾乎要擊潰蔡牽時卻中彈而亡。
這讓我覺得很適合做成畫。
但,目前這幅的幾大缺點:
1.首先最突兀的當然是中間著火的船還有一些木材殘骸。
那是由於原本生成左中右三幅,再另外生成背景,
而我又捨不得中間這幅殘骸圖,
硬是擦去部份然後貼上,感覺很不自然。
(應該要用背景延伸器把煙霧延伸出來。
不過木材殘骸的海色不同也討厭。)
2.左方清軍船隻與右方海賊船隻上的人物都是額外黏貼的。
有不自然的痕跡。
原因也是最初生成的圖的船只是部份而很難銜接,
所以我去背景後額外再生成凸顯甲板的船隻然後把人貼上來。
(試了幾次溝通,似乎很難直接生成全景甲板加人物都順暢的。)
3.船隻太小而人物太大:
這一點我是故意的。
因為如果真按比例的話,人物會小到看不見而變成船隻佔畫面大半,
但我希望凸顯人物。
這一點我欠缺美術訓練,不知道專業畫家們是如何處理這類問題的。
總之主要問題還是目前似乎語言模型的 AI 還無法駕馭太複雜的場景,
而且只能生成較小幅的畫(跟免費用戶有關嗎?),
所以得額外延伸背景且拼接。
而這方面須要技巧。
另外當然我在美術上欠缺訓練則是我個人的問題了。
--
Immer mit den einfachsten Beispielen anfangen.
David Hilbert
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 114.37.223.157 (臺灣)
※ 文章網址: https://webptt.com/m.aspx?n=bbs/AI_Art/M.1745589338.A.6EC.html
1F:→ error405: 用photoshop改個大概再拿去tensor或pixai圖生圖不知行不 04/25 22:14
2F:→ error405: 行 但問題是還得先找到風格近似的模型 04/25 22:14
哈哈!
看似我這題材較冷門,或許不易找到相近風格的模型?
不過由於先與ChatGPT討論到 The Death of Nelson (West painting),
https://reurl.cc/OYYEQy
結果這系列歷史畫作他都給我生成油畫風,
優點是有歷史感(但要像那幅那樣塞滿人物的似乎目前也難生成),
缺點是拼貼不易。
例如我嫌他給的畫血流得不夠,額外找血的題材來貼,
但由於寫實的血與油畫的血風格差很多,
貼上來感覺就很不自然。
題外話是再提供個Grok理解出差錯的搞笑
(但這類搞笑應該各位都經歷不少了)
https://i.imgur.com/RBO0kHr.jpeg
也是提供素材請 Grok 改畫。
不知是素材的光線不佳還是怎樣,居然畫出三條腿!
不過在我測試鴨子坐的時候還出現過忽略小腿的:
但這一幅還正常,左右都是伸兩根手指:
https://i.imgur.com/CcrfhNM.jpeg
這一幅直接把兩根手指改成三根手指了:
https://i.imgur.com/V81p0Wf.jpeg
晚點再找 tensor 等測試看看。
但歷史主題的而非萌主題的不知道那裡是否適合就是。
3F:推 Supasizeit: Google那個不是丟三張圖他會自己拼起來 04/25 22:20
Claude嗎?好的。有機會也側看看。
目前 ChatGPT 優點是有時比 Grok 細膩但缺點是每天限制額度。
Grok 優點就是可以大量生,但某些主題的圖他太弱。
其他幾家我也試試看吧。
其實之前也有綜合兩家的圖來拼接的。利用各家的優點再拼接這也是可行之路。
※ 編輯: khara (114.37.223.157 臺灣), 04/25/2025 22:51:59
4F:推 stlinman: 樓上說的Google應該是AI Studio或Gemini 04/26 14:33
5F:→ stlinman: Stable Diffusion 的話,可以用"線稿"或"工作流"來拼接 04/26 14:35
6F:推 stlinman: 不過我是覺得A、B、C三幅拼接或是乾脆分鏡處理都不錯啊! 04/26 14:38
那我找機會測一下AI Studio或Gemini。
目前正在苦惱三幅該如何銜接。
先給各位看一下今天請求它重繪後出現的搞笑場景
https://i.imgur.com/yrKOylS.png
我要求中間這幅應該整船入鏡以便放置在遠方作插繪,
主角是王得祿(A幅)與蔡牽(C幅),
結果它重繪的下場是確實整艘船入鏡了,
但邱良功將軍(姑且這麼稱呼)卻整個人站立在海上!
根據 OpenAI 的政策,禁止繪製啥奇蹟之類的場景,
可是它自己卻老是自動產生這種「將軍憑空站在海上」的奇蹟!
真是超級搞笑!XD
※ 編輯: khara (114.37.227.246 臺灣), 04/26/2025 16:52:05
7F:推 Vulpix: 你這張看起來很像是站在淺灘,海水及膝。 04/26 18:27
8F:→ Vulpix: 我也很常看到AI把腳插到床、地板上。 04/26 18:28
9F:→ Vulpix: 直接要求panorama不行嗎? 04/26 18:29
確實變成像淺灘登陸哈哈!XD
喔喔!我明天試試在 prompt 中加入 panorama 的要求。
不過我覺得 ChatGPT 的生成圖片會有自動聚焦的特色。
換言之,一次給太多要點,
AI會自動判定主要與次要,結果聚焦在主要,其他細節就會錯亂。
例如我請AI生成一幅漢土和尚回歸而中途遇暴風,
船上其他印度人指責這漢土和尚不祥而只有一位施主保護和尚的圖。
結果是要嘛太小:
https://i.imgur.com/A0S8jZt.png
要嘛整艘船入鏡結果就錯亂(暴風雨中站在木板上,變成少年pi了):
https://i.imgur.com/774Gp4E.png
要嘛又是淺灘附近:
https://i.imgur.com/xtaGTOn.png
最後還是用拼接的硬湊出,但細節就有點不自然:
https://i.imgur.com/getEgPP.jpeg
不過我再試試把 panorama 加入 prompt中。感謝建議!
※ 編輯: khara (114.37.212.119 臺灣), 04/26/2025 21:21:36
※ 編輯: khara (114.37.212.119 臺灣), 04/26/2025 21:22:44
哈哈!
andy大的這幅也是。
畫風很有氣勢很有感覺,
但印度人在巨浪滔天的甲板外責難漢地和尚這也相當奇蹟! XD
看來不玩拼接很難完成這種大幅的一張塞入多要素的畫啊!
※ 編輯: khara (114.37.220.11 臺灣), 04/27/2025 11:23:03
然後結果我還是自行手動拼接了。
ChatGPT 新生成的還是很難貼起來,結果我還是自行修圖拼接。
結果如下。
看來這就是我目前技術的限度了。
https://i.imgur.com/gJgHjwI.jpeg
※ 編輯: khara (114.37.219.47 臺灣), 04/28/2025 05:31:29