AI_Art 板


LINE

以下內容是 ChatGPT 整理與我的對話稿後給的。 偷懶直接貼他給的內容了。 # 主題概念 一個看似簡單卻似乎能難倒許多圖像生成 AI(如 Grok、Gemini、Copilot、豆包、 DALL·E)的畫圖 prompt,該 prompt 目標是測試 AI 對鏡像對稱與手部邏輯的處理 能力。 # Prompt 內容(初始版本) 「一張桌椅前面有一個直立的大鏡子。一位中學女生坐在椅子上邊看鏡中的自己邊在 桌上的草稿圖上作畫。但她草稿圖上的自畫像卻是醜醜的不很像自己的人物圖。」 英文版(ChatGPT給的) a woman in her 20s sitting at a wooden desk, looking into a large vertical mirror. She is holding a pencil in her right hand and sketching a self- portrait on a drawing pad. In the mirror, her reflection is holding the pencil in her left hand, perfectly mirroring her real pose. There is also a drawing pad visible in the mirror, with a mirrored version of her sketch. (開頭20代女性我實測改回 a girl。原本是我跟ChatGPT說我不是蘿莉控甚至我想要 生成40代女性但又怕40代被AI畫太醜才改20s,不過後來測試時還是決心改回女孩。) # 測試結果 僅挑選部份示意 *.豆包改善前 https://meee.com.tw/Q7SqwVi.png
*.豆包改善後 https://meee.com.tw/GUvlmdL.png
(注意到雖說改善了但既有矯枉過正也還有弱點) *.Grok https://meee.com.tw/8bNjrcZ.jpg
*.tensor.art https://meee.com.tw/dIN1Wmh.png
(很奇怪的視角似乎能繞過弱點不過鏡像也不太成功) *.imagineArt https://meee.com.tw/dF5AmmK.png
另外Gemini與DALL-E(ChatGPT)就不列了。 Copilot、豆包、 Grok、Gemini在處理鏡中與現實人物的左右手對稱問題皆失敗。 豆包在我補充說明後狡猾地看似改善了但還是有點問題。主要問題是來自模型的強 制矯正:右手持筆的女孩,鏡中反射仍是右手,而非左手。而畫稿在鏡像中亦難呈現。 # 視覺錯誤類型 - 左右手鏡像錯誤:右手持筆對鏡後仍是右手。 - 畫紙穿透鏡面錯誤:鏡中出現與現實同一張畫紙,無對稱版本。 - 畫稿內容一致性錯誤:鏡中的畫稿與實際畫稿非對稱或邏輯不一致。 # 推測原因 - AI 對「對稱邏輯」與「空間映射」處理能力薄弱。 - 訓練資料中缺乏類似視角與條件的例子。 - Transformer 架構並不具備天然的幾何推理能力。 # 推薦用途 - 可作為 prompt 工程與圖像模型測試的「單元測試」項目。 - 適合作為 AI 美術教育中「錯誤案例分析」素材。 - 對 AI 模型進行「空間推理能力」補強的切入點。 # 備註 - 本 prompt 初衷原為測試「畫稿畫得不像自己」的趣味性表現。 - 可延伸為:讓畫畫者是 20 歲左右的成熟女性,畫作內容為素描而非醜畫, 以便更合理地演繹。 (最後這點其實不必要。單純是我跟ChatGPT說我不是蘿莉控之後它給的補充。) -- Immer mit den einfachsten Beispielen anfangen.                     David Hilbert --



※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 1.161.58.174 (臺灣)
※ 文章網址: https://webptt.com/m.aspx?n=bbs/AI_Art/M.1754595977.A.506.html
1F:推 error405: 要自拍的話倒是有selfie這個詞 08/08 05:02
2F:→ AoWsL: 草圖 圖生圖 08/08 05:54
其實我的重點倒不在這幅圖而是在測試AI能否直接用prompt畫出真人對鏡像啦。 ChatGPT跟我討論了一系列關卡 https://meee.com.tw/eZATmid.jpg
但看起來光是第一關就很難過關了: https://reurl.cc/6qQo4M (這不是我欺負Grok,而是大方的馬斯克允許我這免費仔在同一串中大量生圖。 馬斯克我感謝你! m(_ _)m ) (其實我設想是多面鏡子,其他都正常映射,但有一面當中是某個模仿妖怪) 當然如果說是修圖之後以圖生圖那應該是沒問題就是。 不過那就等於額外動工了。也可以啦反正比起親自畫圖還是容易些。 ※ 編輯: khara (114.37.220.72 臺灣), 08/08/2025 07:54:17 看似鏡像映射問題在目前的AI生圖還算是個難題,除非以圖改圖。 不過似乎幾家AI的設計者多少也意識到了? 會用一些方法迴避,但還是會露餡。 ImagineArt 對鏡畫自畫像: https://meee.com.tw/q6CDs9C.png
https://meee.com.tw/KaNXifH.png
幾乎成功了但仔細看可以看出弱點。 豆包 對鏡哭泣\梳妝 https://meee.com.tw/U9bumvl.png
https://meee.com.tw/9X5pJlu.png
似乎還可以。不過感覺針對這主題用了點技巧。 (上面那個對著鏡子畫自畫像的就失敗了 梳妝這個仔細看也可以看出小錯誤。) 豆包 魔法師在鏡群中 https://meee.com.tw/7bnNhh9.png
https://meee.com.tw/yQJ53Tu.jpg
提示了從不同角度映射,不過照出的鏡像仍怪怪的,背後應該看不到臉。 Gemini 魔法師在鏡群中(後面幾幅我要求有個神祕模仿怪非鏡像) https://meee.com.tw/YmGosgu.png
(一面鏡子表現得還好) https://meee.com.tw/Dqqvqa6.png
(看起來我該要求女巫面對鏡子,但即使這樣也還是有左右不對稱。} https://meee.com.tw/pMEH4qL.png
https://meee.com.tw/j0zuVWi.png
(扣除模仿怪,正常的鏡像也還是怪怪的) 總之至少目前我覺得鏡像映射似乎是AI生圖的一個弱項吧。 不知多久可跨越就是。 ※ 編輯: khara (114.37.214.142 臺灣), 08/08/2025 19:48:51 再測了一個有點偽百合感的鏡像測試 https://meee.com.tw/defsFnk.png
也許是我的提示詞寫得不夠好? 不過目前看來似乎要造成鏡像恰當反射的圖形 似乎對目前的AI仍是難題。 一句簡單的描述「某人對著鏡子從事 畫像/梳妝/哭泣」等行為, 背後涉及太多數學運算。 真人繪圖可以以繪師的直覺來拿捏鏡中該如何反映及角度如何, 但似乎對擴散模型就仍稍難? ※ 編輯: khara (1.161.60.67 臺灣), 08/09/2025 12:59:02 親吻鏡子這個看來是我的英文 prompt 寫得不好。 豆包測試的結果似乎還不錯。 https://meee.com.tw/22nbzOv.png
https://meee.com.tw/LGPaSLq.png
不過讓動作稍帶偏態的結果似乎就還是失敗了。 (或者也該在提示詞中詳細描述鏡中的景象才好?) https://meee.com.tw/RT2OnFb.png
https://meee.com.tw/KvxzjUY.png
※ 編輯: khara (1.161.60.67 臺灣), 08/09/2025 13:48:07
3F:→ Supasizeit: 幽靈貓 08/09 16:18
哈哈!真的!原來這隻貓咪是幽靈,鏡中無法照出! XD
4F:推 error405: 想到這個 https://youtu.be/2p0ibXdzXVI 08/09 16:28
鏡子真的是看似簡單實際上是超級難題啊! 倒是說到攝影避免穿幫的花招, https://reurl.cc/7V74bN 照片作假這典故當然大家都熟悉了。 不過鏡像考驗我又想到一個 https://reurl.cc/gY4enL 原本的設想是 俠客/武士 或任何類似腳色,閉目冥想的同時, 他水中的倒影心魔卻睜開眼睛向他挑戰的一瞬間。 這個倒影不難但難卻難在倒影既與岸上對稱(直接180度反轉) 卻又要不對稱(倒影心魔睜開眼睛)。 我給豆包的中文描述 一位俠客,面向鏡頭,正於河岸邊閉目雙盤打坐,他的劍放在他右方草地上,河水中清晰 地映射出他以及岸上的倒影,但他的倒影的眼睛卻睜開了。 但豆包直接把後方倒影睜開眼睛給忽略了。 (或許這個加上權重 ‘the eyes of the reflection are open’ 就可解決?) ChatGPT幫我設計的難倒AI的系列關卡 https://reurl.cc/Nx4b2Q ※ 編輯: khara (114.37.223.216 臺灣), 08/09/2025 20:22:29
5F:推 Jotarun: 就是這樣 影片也一樣 看似進步神速 其實都在撞牆了 08/13 06:55
看似鏡像若不刻意強化描述或以圖修圖,目前還真是難題! 還在想還有啥可以難倒目前模型的哈哈! XD ※ 編輯: khara (114.37.205.140 臺灣), 08/13/2025 13:26:09
6F:推 Supasizeit: 靠Inference的就這樣了 剩下就是推論性的AI 自己inpa 08/13 13:28
7F:→ Supasizeit: int這種 08/13 13:28







like.gif 您可能會有興趣的文章
icon.png[問題/行為] 貓晚上進房間會不會有憋尿問題
icon.pngRe: [閒聊] 選了錯誤的女孩成為魔法少女 XDDDDDDDDDD
icon.png[正妹] 瑞典 一張
icon.png[心得] EMS高領長版毛衣.墨小樓MC1002
icon.png[分享] 丹龍隔熱紙GE55+33+22
icon.png[問題] 清洗洗衣機
icon.png[尋物] 窗台下的空間
icon.png[閒聊] 双極の女神1 木魔爵
icon.png[售車] 新竹 1997 march 1297cc 白色 四門
icon.png[討論] 能從照片感受到攝影者心情嗎
icon.png[狂賀] 賀賀賀賀 賀!島村卯月!總選舉NO.1
icon.png[難過] 羨慕白皮膚的女生
icon.png閱讀文章
icon.png[黑特]
icon.png[問題] SBK S1安裝於安全帽位置
icon.png[分享] 舊woo100絕版開箱!!
icon.pngRe: [無言] 關於小包衛生紙
icon.png[開箱] E5-2683V3 RX480Strix 快睿C1 簡單測試
icon.png[心得] 蒼の海賊龍 地獄 執行者16PT
icon.png[售車] 1999年Virage iO 1.8EXi
icon.png[心得] 挑戰33 LV10 獅子座pt solo
icon.png[閒聊] 手把手教你不被桶之新手主購教學
icon.png[分享] Civic Type R 量產版官方照無預警流出
icon.png[售車] Golf 4 2.0 銀色 自排
icon.png[出售] Graco提籃汽座(有底座)2000元誠可議
icon.png[問題] 請問補牙材質掉了還能再補嗎?(台中半年內
icon.png[問題] 44th 單曲 生寫竟然都給重複的啊啊!
icon.png[心得] 華南紅卡/icash 核卡
icon.png[問題] 拔牙矯正這樣正常嗎
icon.png[贈送] 老莫高業 初業 102年版
icon.png[情報] 三大行動支付 本季掀戰火
icon.png[寶寶] 博客來Amos水蠟筆5/1特價五折
icon.pngRe: [心得] 新鮮人一些面試分享
icon.png[心得] 蒼の海賊龍 地獄 麒麟25PT
icon.pngRe: [閒聊] (君の名は。雷慎入) 君名二創漫畫翻譯
icon.pngRe: [閒聊] OGN中場影片:失蹤人口局 (英文字幕)
icon.png[問題] 台灣大哥大4G訊號差
icon.png[出售] [全國]全新千尋侘草LED燈, 水草

請輸入看板名稱,例如:Gossiping站內搜尋

TOP