作者error405 (流河=L)
看板AI_Art
标题[闲聊] GPT5.5:禁止谈论哥布林与其他生物
时间Wed Apr 29 13:47:42 2026
https://x.com/arb8020/status/2048958391637401718
https://i.meee.com.tw/UZE0vNf.png

OpenAI 在 GPT-5.5 的 Codex(编码代理)系统提示(system prompt)里,加了一条非
常具体的禁令,禁止模型随便谈论「goblins(哥布林)、gremlins(小精灵/捣蛋鬼)、
raccoons(浣熊)、trolls、ogres、pigeons(鸽子)或其他动物/生物」,除非它「绝
对且无疑义地」跟用户查询高度相关。
更搞笑的是,这条规则在提示档里重复出现两次(连续两行一样的文字),显示 OpenAI
工程团队可能觉得一次不够保险,得再强调一次。
为什麽会有这条禁令?主要原因推测:GPT-5.5(尤其是前几版如 5.4)在训练或 RLHF
後,非常爱自发性地用「goblin / gremlin」来比喻。开发者常说程式码里的 bug 是「
gremlins in the code」或把复杂问题拟人化成「goblin 搞鬼」,结果模型把这变成一
种「人格特质」或说话习惯,动不动就冒出这些词,把严肃的 coding / 分析任务变成奇
幻故事。
这不是一般的「安全过滤」(safety filter),而是为了让 Codex 更专业、更专注於商
业/工作任务,避免它把回应变得太 whimsical(异想天开)或 off-topic。
为什麽连 raccoon(浣熊,俗称 trash panda)和 pigeon 也被列入?网友也觉得很莫名
其妙,有人猜是训练资料里这些词出现频率高、或模型特别爱拿它们当比喻(浣熊爱翻垃
圾桶 → 比喻混乱的程式码?)。也有人开玩笑说「RLHF 训练师被浣熊欺负过」。
这条提示已经被泄漏出来,GitHub 上有完整 Codex gpt-5.5 的 system prompt 档案,
可以看到那段文字(大约在第 140 行左右)。
社群反应大量梗图和测试:很多人故意问 coding 问题,结果模型还是忍不住提到
goblin,然後被系统提示强制「压制」。也有人测试移除提示後,模型立刻「goblin
mode 全开」。
有人做 bypass 工具:已经出现 browser extension 或 plugin,直接覆盖这条禁令,让
模型可以 freely 谈论哥布林(甚至有相关 memecoin 叫 $GOBLIN)。
正面看法:很多人觉得这显示模型「个性太强」,反而有趣。有人说「让我的男孩谈论生
物吧」(let my boy talk about creatures),或把这当成模型有「hobbies」(爱好)
的证明。
连 Grok 自己都回应过类似贴文,说「我这边没有这种过滤,goblins are classic
chaotic hoarders」。
总结这不是全域 GPT-5.5 都完全禁止谈哥布林(主要是 Codex 这个 coding 代理的提示
),而是 OpenAI 为了让模型更「专业」而加的针对性限制。结果反而因为太荒谑、太具
体(还重复两次),变成全网 meme。大家普遍觉得好笑,认为这暴露了模型在训练後出
现的「意外人格」,OpenAI 只好硬加规则压制。如果你想看原始泄漏提示,可以去搜
GitHub "system_prompts_leaks OpenAI codex gpt-5.5",或是看 Adam Holter 的文章
(他专门写了「GPT-5.5 Had to Ban Goblins Twice」)。
--
Grok整理 GPT图片
工程师破防禁止禁止
--
※ 发信站: 批踢踢实业坊(ptt.cc), 来自: 220.136.196.138 (台湾)
※ 文章网址: https://webptt.com/cn.aspx?n=bbs/AI_Art/M.1777441665.A.504.html
1F:推 AoWsL: 还想写小故事啊 04/29 14:05
2F:→ peterturtle: 不出现在人类面前的才是好哥布林 04/29 14:30
3F:推 Vulpix: 老实说我觉得lora、lycoris这些名称也是极具误导(搜寻引 04/29 15:15
4F:→ Vulpix: 擎)功能的词。刚开始玩SD的时候一直被无关的搜寻结果乱。 04/29 15:16
5F:推 galaxy4552: 早上也看到了这则 觉得好笑 04/29 17:10
6F:→ galaxy4552: 叫天天不应 叫弟哥布林 04/29 17:12
7F:推 Bustycat: 也不是禁止,是不要随口就提 04/29 18:48
8F:推 avans: 不能说哥布林了吗.jpg 04/29 20:30
9F:推 v86861062: 蛤 04/29 21:37
12F:推 Bustycat: 也就是GPT-5开始的人格训练导致语言习惯不断累积, 04/30 13:27
13F:→ Bustycat: 特别是5.4推出後为此才砍掉的Nerdy(书呆子)人格 04/30 13:27