作者khara (滅卻心頭火自涼)
看板AI_Art
標題[閒聊] 幾家 AI 似皆難處理對鏡中人畫自畫像?
時間Fri Aug 8 03:46:13 2025
以下內容是 ChatGPT 整理與我的對話稿後給的。
偷懶直接貼他給的內容了。
# 主題概念
一個看似簡單卻似乎能難倒許多圖像生成 AI(如 Grok、Gemini、Copilot、豆包、
DALL·E)的畫圖 prompt,該 prompt 目標是測試 AI 對
鏡像對稱與手部邏輯的處理
能力。
# Prompt 內容(初始版本)
「一張桌椅前面有一個直立的大鏡子。一位中學女生坐在椅子上邊看鏡中的自己邊在
桌上的草稿圖上作畫。但她草稿圖上的自畫像卻是醜醜的不很像自己的人物圖。」
英文版(ChatGPT給的)
a woman in her 20s sitting at a wooden desk, looking into a large vertical
mirror. She is holding a pencil in her right hand and sketching a self-
portrait on a drawing pad. In the mirror, her reflection is holding the
pencil in her left hand, perfectly mirroring her real pose. There is also
a drawing pad visible in the mirror, with a mirrored version of her sketch.
(開頭20代女性我實測改回 a girl。原本是我跟ChatGPT說我不是蘿莉控甚至我想要
生成40代女性但又怕40代被AI畫太醜才改20s,不過後來測試時還是決心改回女孩。)
# 測試結果
僅挑選部份示意
*.豆包改善前
https://meee.com.tw/Q7SqwVi.png
*.豆包改善後
https://meee.com.tw/GUvlmdL.png
(注意到雖說改善了但既有矯枉過正也還有弱點)
*.Grok
https://meee.com.tw/8bNjrcZ.jpg
*.tensor.art
https://meee.com.tw/dIN1Wmh.png
(很奇怪的視角似乎能繞過弱點不過鏡像也不太成功)
*.imagineArt
https://meee.com.tw/dF5AmmK.png
另外Gemini與DALL-E(ChatGPT)就不列了。
Copilot、豆包、 Grok、Gemini在處理鏡中與現實人物的左右手對稱問題皆失敗。
豆包在我補充說明後狡猾地看似改善了但還是有點問題。主要問題是來自模型的強
制矯正:右手持筆的女孩,鏡中反射仍是右手,而非左手。而畫稿在鏡像中亦難呈現。
# 視覺錯誤類型
-
左右手鏡像錯誤:右手持筆對鏡後仍是右手。
-
畫紙穿透鏡面錯誤:鏡中出現與現實同一張畫紙,無對稱版本。
-
畫稿內容一致性錯誤:鏡中的畫稿與實際畫稿非對稱或邏輯不一致。
# 推測原因
- AI 對「對稱邏輯」與「空間映射」處理能力薄弱。
- 訓練資料中缺乏類似視角與條件的例子。
- Transformer 架構並不具備天然的幾何推理能力。
# 推薦用途
- 可作為 prompt 工程與圖像模型測試的「單元測試」項目。
- 適合作為 AI 美術教育中「錯誤案例分析」素材。
- 對 AI 模型進行「空間推理能力」補強的切入點。
# 備註
- 本 prompt 初衷原為測試「畫稿畫得不像自己」的趣味性表現。
- 可延伸為:讓畫畫者是 20 歲左右的成熟女性,畫作內容為素描而非醜畫,
以便更合理地演繹。
(最後這點其實不必要。單純是我跟ChatGPT說我不是蘿莉控之後它給的補充。)
--
Immer mit den einfachsten Beispielen anfangen.
David Hilbert
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 1.161.58.174 (臺灣)
※ 文章網址: https://webptt.com/m.aspx?n=bbs/AI_Art/M.1754595977.A.506.html
1F:推 error405: 要自拍的話倒是有selfie這個詞 08/08 05:02
2F:→ AoWsL: 草圖 圖生圖 08/08 05:54
其實我的重點倒不在這幅圖而是在測試AI能否直接用prompt畫出真人對鏡像啦。
ChatGPT跟我討論了一系列關卡
https://meee.com.tw/eZATmid.jpg
但看起來光是第一關就很難過關了:
https://reurl.cc/6qQo4M
(這不是我欺負Grok,而是大方的馬斯克允許我這免費仔在同一串中大量生圖。
馬斯克我感謝你! m(_ _)m )
(其實我設想是多面鏡子,其他都正常映射,但有一面當中是某個模仿妖怪)
當然如果說是修圖之後以圖生圖那應該是沒問題就是。
不過那就等於額外動工了。也可以啦反正比起親自畫圖還是容易些。
※ 編輯: khara (114.37.220.72 臺灣), 08/08/2025 07:54:17
看似鏡像映射問題在目前的AI生圖還算是個難題,除非以圖改圖。
不過似乎幾家AI的設計者多少也意識到了?
會用一些方法迴避,但還是會露餡。
ImagineArt 對鏡畫自畫像:
https://meee.com.tw/q6CDs9C.png
https://meee.com.tw/KaNXifH.png
幾乎成功了但仔細看可以看出弱點。
豆包 對鏡哭泣\梳妝
https://meee.com.tw/U9bumvl.png
https://meee.com.tw/9X5pJlu.png
似乎還可以。不過感覺針對這主題用了點技巧。
(上面那個對著鏡子畫自畫像的就失敗了
梳妝這個仔細看也可以看出小錯誤。)
豆包 魔法師在鏡群中
https://meee.com.tw/7bnNhh9.png
https://meee.com.tw/yQJ53Tu.jpg
提示了從不同角度映射,不過照出的鏡像仍怪怪的,背後應該看不到臉。
Gemini 魔法師在鏡群中(後面幾幅我要求有個神祕模仿怪非鏡像)
https://meee.com.tw/YmGosgu.png
(一面鏡子表現得還好)
https://meee.com.tw/Dqqvqa6.png
(看起來我該要求女巫面對鏡子,但即使這樣也還是有左右不對稱。}
https://meee.com.tw/pMEH4qL.png
https://meee.com.tw/j0zuVWi.png
(扣除模仿怪,正常的鏡像也還是怪怪的)
總之至少目前我覺得鏡像映射似乎是AI生圖的一個弱項吧。
不知多久可跨越就是。
※ 編輯: khara (114.37.214.142 臺灣), 08/08/2025 19:48:51
再測了一個有點偽百合感的鏡像測試
https://meee.com.tw/defsFnk.png
也許是我的提示詞寫得不夠好?
不過目前看來似乎要造成鏡像恰當反射的圖形
似乎對目前的AI仍是難題。
一句簡單的描述「某人對著鏡子從事 畫像/梳妝/哭泣」等行為,
背後涉及太多數學運算。
真人繪圖可以以繪師的直覺來拿捏鏡中該如何反映及角度如何,
但似乎對擴散模型就仍稍難?
※ 編輯: khara (1.161.60.67 臺灣), 08/09/2025 12:59:02
親吻鏡子這個看來是我的英文 prompt 寫得不好。
豆包測試的結果似乎還不錯。
https://meee.com.tw/22nbzOv.png
https://meee.com.tw/LGPaSLq.png
不過讓動作稍帶偏態的結果似乎就還是失敗了。
(或者也該在提示詞中詳細描述鏡中的景象才好?)
https://meee.com.tw/RT2OnFb.png
https://meee.com.tw/KvxzjUY.png
※ 編輯: khara (1.161.60.67 臺灣), 08/09/2025 13:48:07
3F:→ Supasizeit: 幽靈貓 08/09 16:18
哈哈!真的!原來這隻貓咪是幽靈,鏡中無法照出! XD
鏡子真的是看似簡單實際上是超級難題啊!
倒是說到攝影避免穿幫的花招,
https://reurl.cc/7V74bN
照片作假這典故當然大家都熟悉了。
不過鏡像考驗我又想到一個
https://reurl.cc/gY4enL
原本的設想是 俠客/武士 或任何類似腳色,閉目冥想的同時,
他水中的倒影心魔卻睜開眼睛向他挑戰的一瞬間。
這個倒影不難但難卻難在倒影既與岸上對稱(直接180度反轉)
卻又要不對稱(倒影心魔睜開眼睛)。
我給豆包的中文描述
一位俠客,面向鏡頭,正於河岸邊閉目雙盤打坐,他的劍放在他右方草地上,河水中清晰
地映射出他以及岸上的倒影,但他的倒影的眼睛卻睜開了。
但豆包直接把後方倒影睜開眼睛給忽略了。
(或許這個加上權重 ‘the eyes of the reflection are open’ 就可解決?)
ChatGPT幫我設計的難倒AI的系列關卡
https://reurl.cc/Nx4b2Q
※ 編輯: khara (114.37.223.216 臺灣), 08/09/2025 20:22:29
5F:推 Jotarun: 就是這樣 影片也一樣 看似進步神速 其實都在撞牆了 08/13 06:55
看似鏡像若不刻意強化描述或以圖修圖,目前還真是難題!
還在想還有啥可以難倒目前模型的哈哈! XD
※ 編輯: khara (114.37.205.140 臺灣), 08/13/2025 13:26:09
6F:推 Supasizeit: 靠Inference的就這樣了 剩下就是推論性的AI 自己inpa 08/13 13:28
7F:→ Supasizeit: int這種 08/13 13:28