作者treasurehill (宝藏岩公社,你还未够班S)
看板AI_Art
标题Re: [闲聊] 负空间的由来
时间Thu Feb 26 02:12:52 2026
根据你的实验,我把我的负空间理论修正成以下:
1.CLIP层的负空间
这边专注於语意对齐,是否能将描述prompt整理成一个完整的语意
而非落到语意簇集的稀疏区,导致语意梯度消失
2.Difussion层的负空间
根据CLIP层整理过後的语意梯度,作为稳定扩散模型的导引能否生成完整的图形
如果正常的话,一开始大爆炸的的尘埃(加噪过层)
会慢慢地凝聚收缩成一个稳定的星系(图片),这就是正常去噪过层
稳定扩散模型生一张正确的图形
如CHATGPT所产的图片(CLIP层加强语意对齐过後)
https://i.meee.com.tw/cAYP3cu.png
如果无法凝聚收缩成正常完整的图形,成为一片混乱的星云的话
如不做强语意对齐的MJ所生成的图
https://i.meee.com.tw/3GApD2E.jpg
这就是Difussion因语意梯度消失产生的负空间
这完全对应到Difussion Model的运算过层
https://i.meee.com.tw/EGgLkbv.jpg
https://i.meee.com.tw/Izyb6Sg.png
===============================
这里补上扩散模型的数学运算式,说明CLIP向量的确会影向模型收敛,所以不要再说这只
是我的幻想了。
扩散模型的逆过程 (Reverse Process)
扩散模型的生成核心在於从杂讯中逐步还原图像,其数学表示式如下:
$$x_{t-1} = x_t + \text{score}(x_t, c) dt + \text{noise}$$
$x_t$:目前时间点 $t$ 的特徵状态(带杂讯的图像)。
$\text{score}(x_t, c)$:代表梯度场(Gradient Field),它指引模型如何修正当前图
像以逼近目标数据分布。
$c$:代表 CLIP 条件向量(Conditioning Vector)。
$\text{noise}$:在过程中加入的随机杂讯,用於增加生成的随机性与多样性。
CLIP 的角色与功能
非生成主体:CLIP 本身并不直接生成像素,它主要负责语义理解。
决定语义方向场:CLIP 透过条件向量 $c$ 提供指导,决定了梯度场的方向,让模型知道
该朝哪个「语义方向」演化(例如:让生成的东西「看起来像一只猫」)。
====================================
你这个实验处理的是CLIP层的负空间
没有处理到Difussion层生图的负空间
※ 引述《galaxy4552 (无闻)》之铭言:
: 觉得这篇很有趣 刚好在做模型的PCA实验
: 而我score也许可以观测梯度
: 但梯度这个词有空间上的导数与方向场
: 只能说做了一个势能
: score=α*base +β*Δfield
: Δfield = global potential / bias
: β 控制 沿 potential 上/下坡
: α 控制 相似度吸引/排斥
: ---
: α=1 β=0
: https://meee.com.tw/ZwlvHfg
: 是什麽就是什麽 或接近什麽
: ---
: α=1 β=1
: https://meee.com.tw/HQ6jnhM
: 模型开始找意思 句子长的情况下几乎被"意思"霸版
: ---
: 原本只做上面两个 看到这篇文章後才做了这个
: α=1 β=-1
: https://meee.com.tw/3Pi0NyD
: 字词中已表达最强烈的意思?
: 还是说是 已经有强烈意思 不用有生成方向?
: 又或者是说 意思已经足够 不太需要生成?
: 又或者是说 不用生成 因为意思足够了
: 可爱的爱 被往上提
: 爱与恨的恨 被往上提 且痛恨 憎恨也都从向量底下捞出来
: β<0 等於抑制全域势能 head,使排序更依赖 query 本身的局部语义吸引。因此,在
组
: 合词中,最强语义成分(爱、恨)会浮出
: ---
: 这个我参数设错 但结果好像有点有趣
: α=-1 β=1
: https://meee.com.tw/pEefbxd
: 模型在"毁灭"这个词开始在找意思了 (反相似度检索)
: α<0 使系统刻意远离 query 的语义吸引,再加上 β>0 的势能偏置,会拉出语义最远
但
: Δfield 高的 token
: 不知道有没有说明为何prompt可以观测负空间到这件事
: 也许Δfield升级成向量场且是做出来时就是梯度了
--
--
※ 发信站: 批踢踢实业坊(ptt.cc), 来自: 118.233.2.206 (台湾)
※ 文章网址: https://webptt.com/cn.aspx?n=bbs/AI_Art/M.1772043174.A.3F4.html
※ 编辑: treasurehill (118.233.2.206 台湾), 02/26/2026 02:15:43
※ 编辑: treasurehill (118.233.2.206 台湾), 02/26/2026 02:23:11
※ 编辑: treasurehill (118.233.2.206 台湾), 02/26/2026 02:25:32
※ 编辑: treasurehill (118.233.2.206 台湾), 02/26/2026 02:27:50
1F:推 Tosca: 我想看色空间~~~~02/26 08:53
2F:推 galaxy4552: 我还蛮羡慕楼上能这麽诚实表达自己02/26 10:03
3F:→ galaxy4552: 我都觉得我有说话困难02/26 10:04
4F:推 hangtenboy: 很棒的讨论02/26 10:49
※ 编辑: treasurehill (101.10.58.207 台湾), 02/26/2026 18:10:07
※ 编辑: treasurehill (101.10.58.207 台湾), 02/26/2026 18:13:34
※ 编辑: treasurehill (101.10.58.207 台湾), 02/26/2026 18:16:39
※ 编辑: treasurehill (101.10.58.207 台湾), 02/26/2026 18:17:15