作者treasurehill (寶藏巖公社，你還未夠班S)

看板AI_Art

標題

Re: [閒聊] 負空間的由來

時間Mon Feb 23 09:00:01 2026

→ AoWsL: 那就是文字對齊問題啊你把世間以知的文字輸入產生圖像 02/23 08:41 → AoWsL: 得不到相同解 02/23 08:41 → AoWsL: http://i.imgur.com/Dx3BPC2.jpg 02/23 08:42 → AoWsL: http://i.imgur.com/2IxTlpA.jpg 02/23 08:42 用一個簡單的例子來說明二者不同，四不像就是最好的例子。它不是鹿、不是馬、不是牛、也不是羊，而是把各種特徵拆開再拼起來的東西。 AI 的生成其實也是這樣運作。 ======================== 如果只是文字對齊「狗 / dog / puppy」 → AI只會畫不同風格的正常狗。因為答案本來就在訓練資料裡。這只是換字而已。 =========================== 但我在講的是另一件事（負空間） AI學「狗」不是學一整隻狗，而是學很多特徵：毛茸茸四條腿某種表情某種生物感這些特徵在模型裡可以被拆開。當你給矛盾指令：「不要像狗，但要有狗感」 AI就會：不能用狗的形狀但要保留某些狗特徵被迫把特徵拆開再重組結果可能變成：有狗氣質的煙霧像狗皮的沙發有狗眼神的不明物體這些東西：訓練資料裡沒有，是 AI 自己算出來的。就像「四不像」。 ============================ 為什麼會這樣可以把 AI 想成一張地圖： https://i.meee.com.tw/bt91Pox.jpg

城市 → 已知物體（狗、人、貓）荒野 → 沒被定義的區域正常生成只走城市。矛盾指令會把 AI 推到荒野。那個荒野就是：負空間（訓練資料外的區域）總結文字對齊是「地圖導航」，它帶你去已經命名的地點；負空間是「地圖開拓」，它強迫 AI 用已有的零件，去組裝一個地圖上尚未標註的荒原。 https://i.meee.com.tw/bt91Pox.jpg

這就是為什麼「四不像」在 AI 藝術中反而更有生命力，因為它逃離了人類語言的定義，觸碰到了那個**「無法被命名、只能被計算出來」**的視覺深處。 -- --

※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 118.233.2.206 (臺灣) ※ 文章網址: https://webptt.com/m.aspx?n=bbs/AI_Art/M.1771808403.A.293.html

1^F：推 error405: 大哥哥...02/23 09:01

※ 編輯: treasurehill (118.233.2.206 臺灣), 02/23/2026 09:02:35 ※ 編輯: treasurehill (118.233.2.206 臺灣), 02/23/2026 09:09:43

2^F：推 Tosca: AI色色也是這樣就是用來做平常辦不到的色色02/23 09:12

3^F：→ Tosca: 好比在街上裸露這種你在大部分國家做都會被抓去關02/23 09:12

4^F：→ Tosca: 但你用AI做很輕鬆就能把一個女優在街上脫光嘻嘻02/23 09:12

5^F：→ Tosca: 用AI做色圖就是要做這種阿做全裸在沙發上拿手機幹嘛啦=.=02/23 09:13

6^F：→ AoWsL: http://i.imgur.com/bLKsqvR.jpg02/23 09:14

7^F：→ AoWsL: http://i.imgur.com/bYuhwME.jpg02/23 09:14

https://i.meee.com.tw/bt91Pox.jpg

這張圖已經說明得很清楚了 ============================= 資料密集、被文字標示的 cluster → 正空間 → 訓練資料多、語意穩定、模型最熟的區域。 cluster 之間未被明確標示的稀疏區 → 負空間 → 資料少或沒有定義，但向量仍然存在的邊界區。 ========================== 模型平常生成會往：高密度區（正空間）收斂。但當 prompt 有矛盾或限制時：模型會被推離高密度區，停在稀疏邊界。稀疏暗區 / 星際真空 / 邊緣荒野 → 負空間向量仍然存在，但樣本極少或完全沒有明確標註。這裡沒有「狗」的明確cluster，但有無數狗相關的特徵向量（毛、眼神、四肢姿態、生物氛圍）散落在附近。當prompt強制「遠離狗形狀，但保留狗的靈魂/凝視/毛茸茸存在感」時，denoising過程就被推離中心高密度區，掉進這些稀疏邊界，於是只好在「沒人住過的向量組合」裡找一個低能量（或相對合理的）落點 → 四不像就誕生了。 ※ 編輯: treasurehill (118.233.2.206 臺灣), 02/23/2026 09:17:55

8^F：推 Tosca: 與其說四不像我更喜歡用"混血"來描述02/23 09:18

9^F：→ Tosca: 我以前就常用這種技巧來生成很夢幻的美女02/23 09:18

10^F：→ Tosca: 同樣的情況可以生成像被繩子捆綁身體的新娘禮服02/23 09:19

11^F：→ Tosca: 或是新娘禮服風格的大熊外套等等02/23 09:20

12^F：→ Tosca: 這些就是"四不像"的結果也是現實中很難辦到的02/23 09:20

13^F：→ Tosca: 然後我覺得你的討論比較侷限的點就是你侷限在文字生圖02/23 09:21

14^F：→ Tosca: 所以你思維停留在文字prompt對AI產生的負空間這件事02/23 09:21

15^F：→ Tosca: 但其實圖形也是一種prompt 這也是為何文+圖prompt比較好玩02/23 09:21

16^F：→ Tosca: 更不用說現在修圖已經進展到多圖融合02/23 09:21

17^F：→ Tosca: 所以已經是圖+圖prompt 這對AI能產生的四不像效果更強02/23 09:22

※ 編輯: treasurehill (118.233.2.206 臺灣), 02/23/2026 09:28:47

18^F：→ AoWsL: http://i.imgur.com/gsD8Cuc.jpg02/23 09:28

19^F：→ AoWsL: 這是我對V7的理解喔你可以把圖像視為躁聲02/23 09:29

這個跟我講的「負空間」是兩回事。我講的負空間是： https://i.meee.com.tw/bt91Pox.jpg

模型內已形成的語意簇群（cluster）之外的稀疏區域，也就是沒有穩定標註、沒有明確物體定義、但向量仍然存在的殘餘空間。那是： cluster 外的邊界區資料密度極低的區域訓練資料沒有覆蓋的地方而你講的語意擾動或對齊問題，還是在 cluster 裡面的變動，只是已知語意內的偏移或風格差異，沒有跳出原本語意區域。簡單講：你講的是 cluster 內的變動我講的是 cluster 外的稀疏空間層次完全不同。 ※ 編輯: treasurehill (118.233.2.206 臺灣), 02/23/2026 09:36:55

20^F：→ AoWsL: 你可以當作我上面沒有整理納入的書籍就是你想探討的書也02/23 09:42

21^F：→ AoWsL: 許給它一個分類叫做課外讀物02/23 09:42

22^F：推 Tosca: 我覺得就生圖生的開心就好人家想生負空間style圖片02/23 09:50

23^F：→ Tosca: 不用太糾結到底負空間是三小02/23 09:50

24^F：→ Tosca: 何況人眼的可視光譜是很有限的02/23 09:50

25^F：→ Tosca: AI其實照理說可以生出可視光譜以外的圖片02/23 09:50

26^F：→ Tosca: 那就是人類肉眼已經看不到的負空間了02/23 09:51

27^F：→ AoWsL: http://i.imgur.com/teULb9Q.jpg02/23 11:44

28^F：→ AoWsL: https://i.urusai.cc/GAEDp.mp402/23 11:46

29^F：→ Jotarun: 自己用腦回答好嗎不要一直丟AI回02/24 23:43

30^F：推 yyykk: 我直覺這整篇就在一個白馬非馬的詭辯裡打轉。02/26 00:22

31^F：→ yyykk: 直接上圖吧，既然你用狗來作例子，拿個提示詞和成果出來02/26 00:23

32^F：→ yyykk: 看看到底「不像狗又有狗感」的圖到底長什麼樣子02/26 00:23

33^F：推 Tosca: 其實你開頭用狗來比喻就已經bias了因為狗是最不明確的概念02/26 09:45

34^F：→ Tosca: 狗是人類花幾萬年從狼訓養出來的純野外並沒有狗這種生物02/26 09:46

35^F：→ Tosca: 然後因為長期訓養混種所以狗的外型差異非常非常大02/26 09:46

36^F：→ Tosca: 簡單講就是並沒有"標準的狗"這種東西存在02/26 09:46

37^F：→ Tosca: "狗感"更是一個連人類都無法定義的抽象概念02/26 09:47

38^F：→ Tosca: 所以你用一個已經很抽象的概念來討論AI的負空間當然更抽象02/26 09:47

39^F：→ Tosca: 如果今天是一個明確的概念好比"邊長一公分的立方體"02/26 09:48

40^F：→ Tosca: 你要AI產生一個像是立方體又不像立方體的東西02/26 09:48

41^F：→ Tosca: 有立方體的感覺但又不是立方體類似這樣可能更有方向一點02/26 09:48

42^F：推 Tosca: 然後說真的這幾年玩AI生圖下來其實很明顯會發現一個兩面刃02/26 09:52

43^F：→ Tosca: 那就是當AI性能越強越懂人類在想啥其實越無聊02/26 09:53

44^F：→ Tosca: 很多時候其實是連人類自己都不知道自己在想三小XD02/26 09:53

45^F：→ Tosca: 好比你講一個狗你腦袋出現的狗跟我腦袋出現的狗02/26 09:53

46^F：→ Tosca: 一定是不一樣啊但你講一個邊長一公分立方體02/26 09:53

47^F：→ Tosca: 那大家腦袋出現的都是一樣的因為立方體是定義非常明確的02/26 09:54

48^F：推 Tosca: 所以其實是這樣人類用一個定義模糊的名詞要AI生圖02/26 10:00

49^F：→ Tosca: 好比狗女鬼等等這些其實沒有明確定義的名詞02/26 10:00

50^F：→ Tosca: 那AI當然生出沒有明確形體的東西因為那東西本來就模糊02/26 10:00

51^F：→ Tosca: 所以AI的發展過程說穿了就是要搞懂到你們人類想要三小02/26 10:01

52^F：→ Tosca: 然後相對地當AI性能卻強就越無聊了因為生出來就是那樣02/26 10:01

53^F：→ Tosca: 他在也生不出不像狗的狗不像鬼的鬼02/26 10:01

54^F：→ Tosca: 因為他搞懂人類想要甚麼永遠只會生出像狗的狗02/26 10:02

55^F：→ Tosca: 有時候回去玩SD1.5會覺得永遠不知道會生出三小還是很好玩XD02/26 10:02

56^F：推 galaxy4552: 觀點超強耶 BIAS旋鈕確實可以設計像"狗"率抽"狗"02/26 10:13

57^F：→ galaxy4552: token當一維訓練方式02/26 10:13

58^F：→ yyykk: 所以我一開始就說「畫鬼最易」，但顯然原po 沒看懂02/26 18:15

看不懂的人是你吧，數學式在這，自己好好研究一下，不要再雞同鴨講了，用自己主觀的東西來論證 https://i.meee.com.tw/Izyb6Sg.png

※ 編輯: treasurehill (101.10.58.207 臺灣), 02/26/2026 18:24:32

	[問題/行為] 貓晚上進房間會不會有憋尿問題
	Re: [閒聊] 選了錯誤的女孩成為魔法少女 XDDDDDDDDDD
	[正妹] 瑞典一張
	[心得] EMS高領長版毛衣.墨小樓MC1002
	[分享] 丹龍隔熱紙GE55+33+22
	[問題] 清洗洗衣機
	[尋物] 窗台下的空間
	[閒聊] 双極の女神1 木魔爵
	[售車] 新竹 1997 march 1297cc 白色四門
	[討論] 能從照片感受到攝影者心情嗎
	[狂賀] 賀賀賀賀賀！島村卯月！總選舉NO.1
	[難過] 羨慕白皮膚的女生
	閱讀文章
	[黑特]
	[問題] SBK S1安裝於安全帽位置
	[分享] 舊woo100絕版開箱!!
	Re: [無言] 關於小包衛生紙
	[開箱] E5-2683V3 RX480Strix 快睿C1 簡單測試
	[心得] 蒼の海賊龍地獄執行者16PT
	[售車] 1999年Virage iO 1.8EXi
	[心得] 挑戰33 LV10 獅子座pt solo
	[閒聊] 手把手教你不被桶之新手主購教學
	[分享] Civic Type R 量產版官方照無預警流出
	[售車] Golf 4 2.0 銀色自排
	[出售] Graco提籃汽座（有底座）2000元誠可議
	[問題] 請問補牙材質掉了還能再補嗎?(台中半年內
	[問題] 44th 單曲生寫竟然都給重複的啊啊！
	[心得] 華南紅卡/icash 核卡
	[問題] 拔牙矯正這樣正常嗎
	[贈送] 老莫高業初業 102年版
	[情報] 三大行動支付本季掀戰火
	[寶寶] 博客來Amos水蠟筆5/1特價五折
	Re: [心得] 新鮮人一些面試分享
	[心得] 蒼の海賊龍地獄麒麟25PT
	Re: [閒聊] (君の名は。雷慎入) 君名二創漫畫翻譯
	Re: [閒聊] OGN中場影片：失蹤人口局 (英文字幕)
	[問題] 台灣大哥大4G訊號差
	[出售] [全國]全新千尋侘草LED燈, 水草

WEB批踢踢(PTT)

AI_Art 板

Re: [閒聊] 負空間的由來

熱門看板

贊助商連結