作者error405 (流河=L)
看板AI_Art
標題[閒聊] GPT5.5:禁止談論哥布林與其他生物
時間Wed Apr 29 13:47:42 2026
https://x.com/arb8020/status/2048958391637401718
https://i.meee.com.tw/UZE0vNf.png

OpenAI 在 GPT-5.5 的 Codex(編碼代理)系統提示(system prompt)裡,加了一條非
常具體的禁令,禁止模型隨便談論「goblins(哥布林)、gremlins(小精靈/捣蛋鬼)、
raccoons(浣熊)、trolls、ogres、pigeons(鴿子)或其他動物/生物」,除非它「絕
對且無疑義地」跟用戶查詢高度相關。
更搞笑的是,這條規則在提示檔裡重複出現兩次(連續兩行一樣的文字),顯示 OpenAI
工程團隊可能覺得一次不夠保險,得再強調一次。
為什麼會有這條禁令?主要原因推測:GPT-5.5(尤其是前幾版如 5.4)在訓練或 RLHF
後,非常愛自發性地用「goblin / gremlin」來比喻。開發者常說程式碼裡的 bug 是「
gremlins in the code」或把複雜問題擬人化成「goblin 搞鬼」,結果模型把這變成一
種「人格特質」或說話習慣,動不動就冒出這些詞,把嚴肅的 coding / 分析任務變成奇
幻故事。
這不是一般的「安全過濾」(safety filter),而是為了讓 Codex 更專業、更專注於商
業/工作任務,避免它把回應變得太 whimsical(異想天開)或 off-topic。
為什麼連 raccoon(浣熊,俗稱 trash panda)和 pigeon 也被列入?網友也覺得很莫名
其妙,有人猜是訓練資料裡這些詞出現頻率高、或模型特別愛拿它們當比喻(浣熊愛翻垃
圾桶 → 比喻混亂的程式碼?)。也有人開玩笑說「RLHF 訓練師被浣熊欺負過」。
這條提示已經被洩漏出來,GitHub 上有完整 Codex gpt-5.5 的 system prompt 檔案,
可以看到那段文字(大約在第 140 行左右)。
社群反應大量梗圖和測試:很多人故意問 coding 問題,結果模型還是忍不住提到
goblin,然後被系統提示強制「壓制」。也有人測試移除提示後,模型立刻「goblin
mode 全開」。
有人做 bypass 工具:已經出現 browser extension 或 plugin,直接覆蓋這條禁令,讓
模型可以 freely 談論哥布林(甚至有相關 memecoin 叫 $GOBLIN)。
正面看法:很多人覺得這顯示模型「個性太強」,反而有趣。有人說「讓我的男孩談論生
物吧」(let my boy talk about creatures),或把這當成模型有「hobbies」(愛好)
的證明。
連 Grok 自己都回應過類似貼文,說「我這邊沒有這種過濾,goblins are classic
chaotic hoarders」。
總結這不是全域 GPT-5.5 都完全禁止談哥布林(主要是 Codex 這個 coding 代理的提示
),而是 OpenAI 為了讓模型更「專業」而加的針對性限制。結果反而因為太荒謔、太具
體(還重複兩次),變成全網 meme。大家普遍覺得好笑,認為這暴露了模型在訓練後出
現的「意外人格」,OpenAI 只好硬加規則壓制。如果你想看原始洩漏提示,可以去搜
GitHub "system_prompts_leaks OpenAI codex gpt-5.5",或是看 Adam Holter 的文章
(他專門寫了「GPT-5.5 Had to Ban Goblins Twice」)。
--
Grok整理 GPT圖片
工程師破防禁止禁止
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 220.136.196.138 (臺灣)
※ 文章網址: https://webptt.com/m.aspx?n=bbs/AI_Art/M.1777441665.A.504.html
1F:推 AoWsL: 還想寫小故事啊 04/29 14:05
2F:→ peterturtle: 不出現在人類面前的才是好哥布林 04/29 14:30
3F:推 Vulpix: 老實說我覺得lora、lycoris這些名稱也是極具誤導(搜尋引 04/29 15:15
4F:→ Vulpix: 擎)功能的詞。剛開始玩SD的時候一直被無關的搜尋結果亂。 04/29 15:16
5F:推 galaxy4552: 早上也看到了這則 覺得好笑 04/29 17:10
6F:→ galaxy4552: 叫天天不應 叫弟哥布林 04/29 17:12
7F:推 Bustycat: 也不是禁止,是不要隨口就提 04/29 18:48
8F:推 avans: 不能說哥布林了嗎.jpg 04/29 20:30
9F:推 v86861062: 蛤 04/29 21:37
12F:推 Bustycat: 也就是GPT-5開始的人格訓練導致語言習慣不斷累積, 04/30 13:27
13F:→ Bustycat: 特別是5.4推出後為此才砍掉的Nerdy(書呆子)人格 04/30 13:27