Re: [討論] 大家會擔心 ai 寫 code 讓工程師飯碗不

時間Sat Nov 2 10:14:10 2024

※ 引述《angus850503 (安格斯)》之銘言： : 不過之前就一直對生成式 AI 有個疑問 : 就是"幻覺"到底有沒有根本上的解決方法? 目前還沒人能證明「有」，也還沒人能證明「沒有」。有興趣的話可以追蹤這個「 LLM 幻覺排行榜」： * https://github.com/vectara/hallucination-leaderboard/ * HN 相關討論： https://news.ycombinator.com/item?id=38286761 有興趣可以翻翻這排行榜的 Git 歷史，看看各 LLM 的進化歷程。然而，這排行榜的評鑑方式也是公開的，各 LLM 也有可能 (不自覺地) 針對這類評鑑方式去優化，所以這些資料只能做為參考。 --

※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 136.61.16.51 (美國) ※ 文章網址: https://webptt.com/m.aspx?n=bbs/Soft_Job/M.1730513653.A.0A9.html

1^F：→ angus850503: Cool 感謝提供網站 11/02 10:23

2^F：推 shortoneal: 竟然還有這種榜 11/02 19:21

3^F：推 abc21086999: 我記得昨天才在Reddit上面的OpenAI AMA串看到誰回覆 11/03 01:42

4^F：→ abc21086999: 說幻覺很難解決，因為人類也是有同樣的狀況 11/03 01:42

5^F：推 gino0717: 雲觀眾也是一種幻覺 11/03 01:46

6^F：→ abc21086999: https://i.imgur.com/772P8fS.png 11/03 01:49

*感覺上* pattern recognition/matching 的低垂水果已經摘得差不多了；就看資本/信仰能不能撐到下一個突破口，例如： Detecting hallucinations in large language models using semantic entropy https://news.ycombinator.com/item?id=40769496 ※ 編輯: AmosYang (136.61.16.51 美國), 11/03/2024 04:44:24

7^F：推 angus850503: 這就是我想詢問的幻覺沒解決 AI的下一步到底在哪 11/03 13:30

8^F：→ DrTech: 幻覺為什麼一定要解決才能做AI產生生產力？不用解決也可以 11/03 15:41

9^F：→ DrTech: 啊。不是所有任務都要靠LLM生成不可靠的資訊。例如很多人 11/03 15:41

10^F：→ DrTech: 做RAG+QA問答，都無腦用搜候選結果，然後用LLM生成最後答 11/03 15:41

11^F：→ DrTech: 案，當然一堆幻覺。架構上改成拿LLM當選擇器，或限定next 11/03 15:41

12^F：→ DrTech: tokens，只能輸出選擇1.2.3.4。在多個答案裡面挑一個，最 11/03 15:41

13^F：→ DrTech: 後靠程式輸出完全沒關鍵的答案。立刻解決幻覺問題。 11/03 15:41

14^F：→ DrTech: LLM當特定task模組(不要拿來當最後輸出結果),結合傳統NLP 11/03 15:44

15^F：→ DrTech: 各種解決方案，任何一個功能任務，都可以"完全沒幻覺"，能 11/03 15:44

16^F：→ DrTech: 力又比傳統NLP強很多。 11/03 15:44

17^F：推 neo5277: 樓上這個有專有名詞叫做rerank 我開發系統時有設計 11/03 16:33

18^F：推 Chinwei8562: 酷 11/04 14:22

	[問題/行為] 貓晚上進房間會不會有憋尿問題
	Re: [閒聊] 選了錯誤的女孩成為魔法少女 XDDDDDDDDDD
	[正妹] 瑞典一張
	[心得] EMS高領長版毛衣.墨小樓MC1002
	[分享] 丹龍隔熱紙GE55+33+22
	[問題] 清洗洗衣機
	[尋物] 窗台下的空間
	[閒聊] 双極の女神1 木魔爵
	[售車] 新竹 1997 march 1297cc 白色四門
	[討論] 能從照片感受到攝影者心情嗎
	[狂賀] 賀賀賀賀賀！島村卯月！總選舉NO.1
	[難過] 羨慕白皮膚的女生
	閱讀文章
	[黑特]
	[問題] SBK S1安裝於安全帽位置
	[分享] 舊woo100絕版開箱!!
	Re: [無言] 關於小包衛生紙
	[開箱] E5-2683V3 RX480Strix 快睿C1 簡單測試
	[心得] 蒼の海賊龍地獄執行者16PT
	[售車] 1999年Virage iO 1.8EXi
	[心得] 挑戰33 LV10 獅子座pt solo
	[閒聊] 手把手教你不被桶之新手主購教學
	[分享] Civic Type R 量產版官方照無預警流出
	[售車] Golf 4 2.0 銀色自排
	[出售] Graco提籃汽座（有底座）2000元誠可議
	[問題] 請問補牙材質掉了還能再補嗎?(台中半年內
	[問題] 44th 單曲生寫竟然都給重複的啊啊！
	[心得] 華南紅卡/icash 核卡
	[問題] 拔牙矯正這樣正常嗎
	[贈送] 老莫高業初業 102年版
	[情報] 三大行動支付本季掀戰火
	[寶寶] 博客來Amos水蠟筆5/1特價五折
	Re: [心得] 新鮮人一些面試分享
	[心得] 蒼の海賊龍地獄麒麟25PT
	Re: [閒聊] (君の名は。雷慎入) 君名二創漫畫翻譯
	Re: [閒聊] OGN中場影片：失蹤人口局 (英文字幕)
	[問題] 台灣大哥大4G訊號差
	[出售] [全國]全新千尋侘草LED燈, 水草

WEB批踢踢(PTT)

Soft_Job 板

Re: [討論] 大家會擔心 ai 寫 code 讓工程師飯碗不

熱門看板

贊助商連結