AI_Art 板


LINE

以下内容是 ChatGPT 整理与我的对话稿後给的。 偷懒直接贴他给的内容了。 # 主题概念 一个看似简单却似乎能难倒许多图像生成 AI(如 Grok、Gemini、Copilot、豆包、 DALL·E)的画图 prompt,该 prompt 目标是测试 AI 对镜像对称与手部逻辑的处理 能力。 # Prompt 内容(初始版本) 「一张桌椅前面有一个直立的大镜子。一位中学女生坐在椅子上边看镜中的自己边在 桌上的草稿图上作画。但她草稿图上的自画像却是丑丑的不很像自己的人物图。」 英文版(ChatGPT给的) a woman in her 20s sitting at a wooden desk, looking into a large vertical mirror. She is holding a pencil in her right hand and sketching a self- portrait on a drawing pad. In the mirror, her reflection is holding the pencil in her left hand, perfectly mirroring her real pose. There is also a drawing pad visible in the mirror, with a mirrored version of her sketch. (开头20代女性我实测改回 a girl。原本是我跟ChatGPT说我不是萝莉控甚至我想要 生成40代女性但又怕40代被AI画太丑才改20s,不过後来测试时还是决心改回女孩。) # 测试结果 仅挑选部份示意 *.豆包改善前 https://meee.com.tw/Q7SqwVi.png
*.豆包改善後 https://meee.com.tw/GUvlmdL.png
(注意到虽说改善了但既有矫枉过正也还有弱点) *.Grok https://meee.com.tw/8bNjrcZ.jpg
*.tensor.art https://meee.com.tw/dIN1Wmh.png
(很奇怪的视角似乎能绕过弱点不过镜像也不太成功) *.imagineArt https://meee.com.tw/dF5AmmK.png
另外Gemini与DALL-E(ChatGPT)就不列了。 Copilot、豆包、 Grok、Gemini在处理镜中与现实人物的左右手对称问题皆失败。 豆包在我补充说明後狡猾地看似改善了但还是有点问题。主要问题是来自模型的强 制矫正:右手持笔的女孩,镜中反射仍是右手,而非左手。而画稿在镜像中亦难呈现。 # 视觉错误类型 - 左右手镜像错误:右手持笔对镜後仍是右手。 - 画纸穿透镜面错误:镜中出现与现实同一张画纸,无对称版本。 - 画稿内容一致性错误:镜中的画稿与实际画稿非对称或逻辑不一致。 # 推测原因 - AI 对「对称逻辑」与「空间映射」处理能力薄弱。 - 训练资料中缺乏类似视角与条件的例子。 - Transformer 架构并不具备天然的几何推理能力。 # 推荐用途 - 可作为 prompt 工程与图像模型测试的「单元测试」项目。 - 适合作为 AI 美术教育中「错误案例分析」素材。 - 对 AI 模型进行「空间推理能力」补强的切入点。 # 备注 - 本 prompt 初衷原为测试「画稿画得不像自己」的趣味性表现。 - 可延伸为:让画画者是 20 岁左右的成熟女性,画作内容为素描而非丑画, 以便更合理地演绎。 (最後这点其实不必要。单纯是我跟ChatGPT说我不是萝莉控之後它给的补充。) -- Immer mit den einfachsten Beispielen anfangen.                     David Hilbert --



※ 发信站: 批踢踢实业坊(ptt.cc), 来自: 1.161.58.174 (台湾)
※ 文章网址: https://webptt.com/cn.aspx?n=bbs/AI_Art/M.1754595977.A.506.html
1F:推 error405: 要自拍的话倒是有selfie这个词 08/08 05:02
2F:→ AoWsL: 草图 图生图 08/08 05:54
其实我的重点倒不在这幅图而是在测试AI能否直接用prompt画出真人对镜像啦。 ChatGPT跟我讨论了一系列关卡 https://meee.com.tw/eZATmid.jpg
但看起来光是第一关就很难过关了: https://reurl.cc/6qQo4M (这不是我欺负Grok,而是大方的马斯克允许我这免费仔在同一串中大量生图。 马斯克我感谢你! m(_ _)m ) (其实我设想是多面镜子,其他都正常映射,但有一面当中是某个模仿妖怪) 当然如果说是修图之後以图生图那应该是没问题就是。 不过那就等於额外动工了。也可以啦反正比起亲自画图还是容易些。 ※ 编辑: khara (114.37.220.72 台湾), 08/08/2025 07:54:17 看似镜像映射问题在目前的AI生图还算是个难题,除非以图改图。 不过似乎几家AI的设计者多少也意识到了? 会用一些方法回避,但还是会露馅。 ImagineArt 对镜画自画像: https://meee.com.tw/q6CDs9C.png
https://meee.com.tw/KaNXifH.png
几乎成功了但仔细看可以看出弱点。 豆包 对镜哭泣\梳妆 https://meee.com.tw/U9bumvl.png
https://meee.com.tw/9X5pJlu.png
似乎还可以。不过感觉针对这主题用了点技巧。 (上面那个对着镜子画自画像的就失败了 梳妆这个仔细看也可以看出小错误。) 豆包 魔法师在镜群中 https://meee.com.tw/7bnNhh9.png
https://meee.com.tw/yQJ53Tu.jpg
提示了从不同角度映射,不过照出的镜像仍怪怪的,背後应该看不到脸。 Gemini 魔法师在镜群中(後面几幅我要求有个神秘模仿怪非镜像) https://meee.com.tw/YmGosgu.png
(一面镜子表现得还好) https://meee.com.tw/Dqqvqa6.png
(看起来我该要求女巫面对镜子,但即使这样也还是有左右不对称。} https://meee.com.tw/pMEH4qL.png
https://meee.com.tw/j0zuVWi.png
(扣除模仿怪,正常的镜像也还是怪怪的) 总之至少目前我觉得镜像映射似乎是AI生图的一个弱项吧。 不知多久可跨越就是。 ※ 编辑: khara (114.37.214.142 台湾), 08/08/2025 19:48:51 再测了一个有点伪百合感的镜像测试 https://meee.com.tw/defsFnk.png
也许是我的提示词写得不够好? 不过目前看来似乎要造成镜像恰当反射的图形 似乎对目前的AI仍是难题。 一句简单的描述「某人对着镜子从事 画像/梳妆/哭泣」等行为, 背後涉及太多数学运算。 真人绘图可以以绘师的直觉来拿捏镜中该如何反映及角度如何, 但似乎对扩散模型就仍稍难? ※ 编辑: khara (1.161.60.67 台湾), 08/09/2025 12:59:02 亲吻镜子这个看来是我的英文 prompt 写得不好。 豆包测试的结果似乎还不错。 https://meee.com.tw/22nbzOv.png
https://meee.com.tw/LGPaSLq.png
不过让动作稍带偏态的结果似乎就还是失败了。 (或者也该在提示词中详细描述镜中的景象才好?) https://meee.com.tw/RT2OnFb.png
https://meee.com.tw/KvxzjUY.png
※ 编辑: khara (1.161.60.67 台湾), 08/09/2025 13:48:07
3F:→ Supasizeit: 幽灵猫 08/09 16:18
哈哈!真的!原来这只猫咪是幽灵,镜中无法照出! XD
4F:推 error405: 想到这个 https://youtu.be/2p0ibXdzXVI 08/09 16:28
镜子真的是看似简单实际上是超级难题啊! 倒是说到摄影避免穿帮的花招, https://reurl.cc/7V74bN 照片作假这典故当然大家都熟悉了。 不过镜像考验我又想到一个 https://reurl.cc/gY4enL 原本的设想是 侠客/武士 或任何类似脚色,闭目冥想的同时, 他水中的倒影心魔却睁开眼睛向他挑战的一瞬间。 这个倒影不难但难却难在倒影既与岸上对称(直接180度反转) 却又要不对称(倒影心魔睁开眼睛)。 我给豆包的中文描述 一位侠客,面向镜头,正於河岸边闭目双盘打坐,他的剑放在他右方草地上,河水中清晰 地映射出他以及岸上的倒影,但他的倒影的眼睛却睁开了。 但豆包直接把後方倒影睁开眼睛给忽略了。 (或许这个加上权重 ‘the eyes of the reflection are open’ 就可解决?) ChatGPT帮我设计的难倒AI的系列关卡 https://reurl.cc/Nx4b2Q ※ 编辑: khara (114.37.223.216 台湾), 08/09/2025 20:22:29
5F:推 Jotarun: 就是这样 影片也一样 看似进步神速 其实都在撞墙了 08/13 06:55
看似镜像若不刻意强化描述或以图修图,目前还真是难题! 还在想还有啥可以难倒目前模型的哈哈! XD ※ 编辑: khara (114.37.205.140 台湾), 08/13/2025 13:26:09
6F:推 Supasizeit: 靠Inference的就这样了 剩下就是推论性的AI 自己inpa 08/13 13:28
7F:→ Supasizeit: int这种 08/13 13:28







like.gif 您可能会有兴趣的文章
icon.png[问题/行为] 猫晚上进房间会不会有憋尿问题
icon.pngRe: [闲聊] 选了错误的女孩成为魔法少女 XDDDDDDDDDD
icon.png[正妹] 瑞典 一张
icon.png[心得] EMS高领长版毛衣.墨小楼MC1002
icon.png[分享] 丹龙隔热纸GE55+33+22
icon.png[问题] 清洗洗衣机
icon.png[寻物] 窗台下的空间
icon.png[闲聊] 双极の女神1 木魔爵
icon.png[售车] 新竹 1997 march 1297cc 白色 四门
icon.png[讨论] 能从照片感受到摄影者心情吗
icon.png[狂贺] 贺贺贺贺 贺!岛村卯月!总选举NO.1
icon.png[难过] 羡慕白皮肤的女生
icon.png阅读文章
icon.png[黑特]
icon.png[问题] SBK S1安装於安全帽位置
icon.png[分享] 旧woo100绝版开箱!!
icon.pngRe: [无言] 关於小包卫生纸
icon.png[开箱] E5-2683V3 RX480Strix 快睿C1 简单测试
icon.png[心得] 苍の海贼龙 地狱 执行者16PT
icon.png[售车] 1999年Virage iO 1.8EXi
icon.png[心得] 挑战33 LV10 狮子座pt solo
icon.png[闲聊] 手把手教你不被桶之新手主购教学
icon.png[分享] Civic Type R 量产版官方照无预警流出
icon.png[售车] Golf 4 2.0 银色 自排
icon.png[出售] Graco提篮汽座(有底座)2000元诚可议
icon.png[问题] 请问补牙材质掉了还能再补吗?(台中半年内
icon.png[问题] 44th 单曲 生写竟然都给重复的啊啊!
icon.png[心得] 华南红卡/icash 核卡
icon.png[问题] 拔牙矫正这样正常吗
icon.png[赠送] 老莫高业 初业 102年版
icon.png[情报] 三大行动支付 本季掀战火
icon.png[宝宝] 博客来Amos水蜡笔5/1特价五折
icon.pngRe: [心得] 新鲜人一些面试分享
icon.png[心得] 苍の海贼龙 地狱 麒麟25PT
icon.pngRe: [闲聊] (君の名は。雷慎入) 君名二创漫画翻译
icon.pngRe: [闲聊] OGN中场影片:失踪人口局 (英文字幕)
icon.png[问题] 台湾大哥大4G讯号差
icon.png[出售] [全国]全新千寻侘草LED灯, 水草

请输入看板名称,例如:BabyMother站内搜寻

TOP