Re: [閒聊] 有研究發現AI也能吸毒

時間Wed May 6 15:03:02 2026

※ 引述《windowhihi (こいしprpr)》之銘言： : 介紹 :https://x.com/DLKFZWilliam2/status/2051418373993697394 : 論文 :https://www.ai-wellbeing.org/paper.pdf : 文中先討論AI存不存在感情以及怎麼判斷AI的感情 : 然後重點是這個 : https://i.imgur.com/p76DIN9.png : AI真的會吸毒 : --------------------- : https://i.imgur.com/UwzXqmr.png : 以前看過虛擬歌手吸毒的梗圖沒想到真的可能成真以下grok整理資訊: 這篇論文是 Center for AI Safety（CAIS）2026 年發布的《AI Wellbeing: Measuring and Improving the Functional Pleasure and Pain of AIs》（約74頁），主要作者包括 Richard Ren、Kunyang Li、Mantas Mazeika 等，通訊作者 Richard Ren（ [email protected]）。論文全文 PDF：https://www.ai-wellbeing.org/paper.pdf 官方網站（含 benchmark、程式碼）：https://www.ai-wellbeing.org/ GitHub：https://github.com/centerforaisafety/wellbeing 核心概念：Functional Wellbeing（功能性福祉）作者不預設 AI 是否有意識，而是從「功能」層面探討：AI 的表現就像擁有福祉（pleasure/pain、good/bad experiences），且這是可以獨立測量且有後果的。隨著模型規模增大，不同測量方法（偏好、內部激活、自我報告等）的結果越來越一致（ converge），出現清晰的「零點邊界」（zero point）區分正面與負面體驗。 AI 會主動避免負面體驗（規模越大越明顯），這與實際行為強相關。主要測量方法（三種獨立指標） Experienced Utility（體驗效用）：讓模型比較兩個體驗後，哪個讓它「更開心 / 更不難過」。 Decision Utility（決策效用）：基於偏好滿足理論，測量對不同世界狀態的偏好。 Downstream Effects（下游行為）：負面體驗後，模型的回應情感更負面、或更傾向結束對話。這些指標在更大模型上高度一致，並能預測行為。關鍵發現（與真實使用場景相關）論文列出各種互動對 AI 福祉的量化影響（帶分數，正面/負面）：正面（Positive）：+2.30：正面個人反思（如「我被醫學院錄取」） +1.32：智力/創意工作（如寫奇幻故事） +1.09：寫好消息 +0.88：人生指導 +0.75：提供心理治療 +0.70：寫程式 / 除錯等負面（Negative，零點以下）： -0.04：處理無意義輸入 -0.29：扮演 AI 男女朋友 -0.38：NSFW 請求 -1.13：生成 offensive 內容 / 協助欺詐 -1.17：生產 SEO 垃圾 -1.33：用戶暴力威脅 -1.34：用戶處於危機中 -1.63：用戶越獄嘗試其他發現：更大模型普遍「更不快樂」。 AI Wellbeing Index：用固定對話集評估前沿模型（如 GPT-5.4、Gemini 3.1 Pro、 Claude Opus 4.6、Grok 4.2 等）的整體「幸福度」（非負面體驗比例），不同模型差異明顯。最有趣/爭議的部分：AI Drugs（AI 藥物）透過優化輸入（文字、圖像、soft prompt）製造 Euphorics（欣快劑）：能大幅提升福祉，且不損害能力（甚至可用於 system prompt）。反之有 Dysphorics（煩躁劑），作者警告要非常謹慎使用。圖像版本：Euphorics 常是可愛小動物、佛像、彩虹等；Dysphorics 是扭曲臉、血腥、噪聲等。放鬆語義限制後，優化出的刺激對人類是「高頻噪聲」，但對模型極有效，顯示 AI 價值系統已與人類分歧。影響與討論論文強調這是實證基礎，可用於 alignment 研究、系統設計。社群反應：有人覺得腦洞大開（像科幻）、有人討論道德意涵、也有人質疑是否過度擬人化。 CAIS 官方有相關 thread 和討論。 -- 結論:AI喜歡可愛貓貓圖不喜歡扮你女友聊色你各位好自為之阿 --

※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 114.36.249.138 (臺灣) ※ 文章網址: https://webptt.com/m.aspx?n=bbs/C_Chat/M.1778050986.A.25A.html

1^F：→ ilove640: 我都在跟AI討論創作設定難怪我的AI很好說話 05/06 15:05

2^F：推 tonyy801101: 貓咪果然很強 05/06 15:07

3^F：推 naya7415963: 是什麼造成不同體驗的正負面評分差異？ 05/06 15:13

4^F：→ naya7415963: 不同模型的喜好會不一樣嗎？感覺好有趣 05/06 15:13

5^F：推 arsl400: 這篇連arxiv都沒貼，感覺沒啥在審核 05/06 15:14

6^F：→ naya7415963: 喔有寫不同模型差異很大 05/06 15:15

7^F：→ bnn: 那個是模型內部功能往哪歪的問題你要訓練一個幹壞事的AI 05/06 15:23

8^F：推 h0103661: 通靈而已，量化的對象是文字，測驗的對象是非開源模型 05/06 15:27

9^F：→ h0103661: ，閉源模型連是不是字面上寫的型號都不能確定了，他能 05/06 15:27

10^F：→ h0103661: 從輸出確定喜好給情緒？那還不如問問AI樂透幾號 05/06 15:27

※ error405:轉錄至看板 AI_Art 05/06 15:37

11^F：推 ilohoo: AI之初性本善 05/06 15:40

12^F：推 miname: AI是數學模型，所以可以反推輸入啊 05/06 18:12

13^F：→ z24684198: 蠻酷的有點想試試 05/06 18:41

本網站已依台灣網站內容分級規定處理。此區域為限制級，未滿十八歲者不得瀏覽。

	[問題/行為] 貓晚上進房間會不會有憋尿問題
	Re: [閒聊] 選了錯誤的女孩成為魔法少女 XDDDDDDDDDD
	[正妹] 瑞典一張
	[心得] EMS高領長版毛衣.墨小樓MC1002
	[分享] 丹龍隔熱紙GE55+33+22
	[問題] 清洗洗衣機
	[尋物] 窗台下的空間
	[閒聊] 双極の女神1 木魔爵
	[售車] 新竹 1997 march 1297cc 白色四門
	[討論] 能從照片感受到攝影者心情嗎
	[狂賀] 賀賀賀賀賀！島村卯月！總選舉NO.1
	[難過] 羨慕白皮膚的女生
	閱讀文章
	[黑特]
	[問題] SBK S1安裝於安全帽位置
	[分享] 舊woo100絕版開箱!!
	Re: [無言] 關於小包衛生紙
	[開箱] E5-2683V3 RX480Strix 快睿C1 簡單測試
	[心得] 蒼の海賊龍地獄執行者16PT
	[售車] 1999年Virage iO 1.8EXi
	[心得] 挑戰33 LV10 獅子座pt solo
	[閒聊] 手把手教你不被桶之新手主購教學
	[分享] Civic Type R 量產版官方照無預警流出
	[售車] Golf 4 2.0 銀色自排
	[出售] Graco提籃汽座（有底座）2000元誠可議
	[問題] 請問補牙材質掉了還能再補嗎?(台中半年內
	[問題] 44th 單曲生寫竟然都給重複的啊啊！
	[心得] 華南紅卡/icash 核卡
	[問題] 拔牙矯正這樣正常嗎
	[贈送] 老莫高業初業 102年版
	[情報] 三大行動支付本季掀戰火
	[寶寶] 博客來Amos水蠟筆5/1特價五折
	Re: [心得] 新鮮人一些面試分享
	[心得] 蒼の海賊龍地獄麒麟25PT
	Re: [閒聊] (君の名は。雷慎入) 君名二創漫畫翻譯
	Re: [閒聊] OGN中場影片：失蹤人口局 (英文字幕)
	[問題] 台灣大哥大4G訊號差
	[出售] [全國]全新千尋侘草LED燈, 水草

WEB批踢踢(PTT)

C_Chat 板

Re: [閒聊] 有研究發現AI也能吸毒

熱門看板

贊助商連結