作者khara (逝)
看板AI_Art
标题[讨论] 试图生成图片但失败
时间Wed May 21 11:29:08 2025
我试着让 ChatGPT 生成一幅
「眼镜女忍者掷手里剑失败挫折图」(奇怪的混搭但总之只是玩而已),
但结果是 ChatGPT 生成的图把靶放到人物背後:
https://meee.com.tw/plo8eXb.png
讨论的结果:
https://meee.com.tw/bQXGJWl.jpg
说是 DALL-E 无法精准控制靶标与人物的关系?
於是我自行改图後变成这副德性:
https://meee.com.tw/4Gn5hi8.png
就是地板塌塌米不协调且房间扭曲。
给 tensor.art 修改:
https://meee.com.tw/4okzskX.png
脸部变美了(不过其实缺乏原本的可爱感),
挫折的表情(prompt: frustrated expression)却看不出来,
反而似乎很愉悦?
是因为我之前训练都要求笑脸的缘故?
还是我的 prompt 不够精准?
--
Immer mit den einfachsten Beispielen anfangen.
David Hilbert
--
※ 发信站: 批踢踢实业坊(ptt.cc), 来自: 1.161.48.145 (台湾)
※ 文章网址: https://webptt.com/cn.aspx?n=bbs/AI_Art/M.1747798154.A.9D2.html
1F:推 AoWsL: GPT给你建议提示词用了逼真写实 05/21 11:43
2F:→ AoWsL: 动漫风的话可能要改一下 05/21 11:44
3F:→ AoWsL: 我是不清楚 你是不是用了动漫模型然後下了一个写实 05/21 11:45
啊……我试试改 prompt 看看。不过主要是靶的位置乱跑。
4F:推 Supasizeit: 你把靶纸拿在手上不就得了 05/21 12:15
靶纸拿在手上都还射不准这也太……好吧,特殊幽默?XDDD
※ 编辑: khara (1.161.48.145 台湾), 05/21/2025 12:31:12
5F:→ Supasizeit: 不是啦 你这个概念就算要拍照的话也很难拍正面和靶在 05/21 13:11
6F:→ Supasizeit: 一起 拿一张脱靶的白纸 比较好呈现 05/21 13:11
喔喔!了解。感谢!我朝这个方向试试看。:)
※ 编辑: khara (114.37.225.253 台湾), 05/21/2025 14:53:02
7F:推 bluefancy: 可能脸预设在前面 05/22 18:48
脸设在正面是还好。
问题确实可能是人与靶的相互关系在画面上不易协调。可能是我事先没考虑清楚。
然後报告一下
最近一直在尝试其他历史场景或其他作品(结果总有些失败的小节),
对这幅没再做多少改善了。
只丢两个新成果:
1.请ChatGPT把我改的图拿去重改
https://meee.com.tw/g53is3m.png
结果是和式房间到位了,人物的表情也还可以,
但原本的小装饰品消失还是小事,
太多的手里剑但靶上边缘都没擦到却似乎靶心有一个也有点怪。
2.直接用中文请豆包画
https://meee.com.tw/iOHQoV1.png
结果人物表情是还可以但
1.「手里剑」被误解了
2.「鸭子坐」也被误解了
豆包应该可以理解鸭子坐的,之前曾经生成成功过
https://i.imgur.com/LMqpz9x.png
但或许毕竟不稳定吧。
3.靶心还是中了一个,中了靶心就不会那麽沮丧了啊!
(我原本的设定是完全未中靶心)
然後我把我改过的图请豆包以图改图,还是得到那句
「我们换个话题聊吧」,不知何故。
另外附上Grok的成果。呃……
https://reurl.cc/bWg9x3
Grok以图改图做得还不错,但直接要求生图似乎还是弱了些。
※ 编辑: khara (114.37.223.166 台湾), 05/22/2025 20:09:19
8F:→ Vulpix: 对,Grok文生图很粗糙。 05/23 14:08