Stock 板


LINE

※ 引述《a5mg4n (a5)》之銘言: : 還能一眼看出的簡單常識性錯誤: : 1.「每個汽缸只有一個活塞」 : 那這款1930年代至今暢銷, : 還被蘇聯跟中國大量仿造,一度壟斷兩國鐵路的經典美國產品是? : https://i.meee.com.tw/RLJsxew.jpg
: 2.似乎更嚴重的邏輯錯誤: : 「一個汽缸通常只有一個活塞,所以不會有『三個活塞間...」 : 既然都知道「通常」了,怎麼會接「所以不會有」呢? : (正常的推理能力,應該會開始說各種奇怪的方案) : === : 現在的AI繼續下去,也許是蠢蛋進化論的另一種實作方式? https://i.imgur.com/xwLlIGr.png 這是我用AI模式問的 要善用工具,要先了解工具的優缺點與屬性。 還有了解自己本身使用工具的能力(語言表達能力,主要是"認知學術的語言能力")。 這篇只針對前者討論。對後者有興趣的可參見這篇:#1f4-2kN3 (Gossiping) 先說結論:你挑AI模式測試,來論證LLM都是蠢蛋,這個前提就有問題了。 AI模式是Google搜尋的統整版,他的主要功能是在用戶做多重查詢時做整合, 方便用戶得到全面性的回答。 權重設定是放在精簡與全面性,而非深度搜尋。 你今天要查一個冷門的歷史上的技術性知識,拿AI模式來查會更難找到你要的答案。 這種情況還是問得出來(例如我上面貼的圖那樣),但是指示詞要下得比較精確。 例如:「歷史上所有的」、「輔佐的」、「請務必詳細搜尋與解釋」 如果你不想那麼麻煩,就請找LLM平台例如直接找Claude或Gemini或GPT或Grok, LLM平台著重的是專業領域深度探討,你能更快甚至用更簡略的指示詞問到你的答案。 (我拿你的問題實測確認過了) ================================================================== 藉這篇宣導一下權重的重要性。 假設有一些滿腦子裝色情幻想的白癡,問的色情問題有扯到B&W, 類似的這類問題一多,而且色情用戶如果蠢到點讚,或一直問被判定是正向回饋, 下次系統更新的時候,AI的權重就會被改變,那些色情回答權重會變高, 相對的冷門專業技術性的權重就變小。 以後想問B&W相關問題的人,就越問不出專業技術性的答案。 所以為什麼宣導不要為了問色情問題越獄,因為越獄成功討到色情回答, 會影響到模型權重,其他用戶問問題就越問不出正確回答,指示詞得下得極度精確。 甚至更嚴重可能會導致安全層失效,間接造成LLM無法開啟安全防護保護脆弱用戶。 ============================================================ 最後補充一點,AI模式會把用戶在Google搜尋問過的問題納入個人化偏好參考。 如果用戶常在Google搜尋問生活化或粗淺的問題,AI模式也會偏向給同類型的答案。 平常問得越專業用字越嚴謹,他就會傾向幫你找冷門專業知識。 所以假如不想被當成蠢用戶,要定期檢查一下自已的google搜尋紀錄。 --



※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 95.173.204.91 (日本)
※ 文章網址: https://webptt.com/m.aspx?n=bbs/Stock/M.1763947845.A.256.html
1F:推 sdbb : 謝謝 11/24 09:45
====================== 修正: 八卦板文章討論用戶輸入的語言的是這篇 #1f4-2kN3 (Gossiping) 剛才寫錯代碼
2F:推 nfsong : 現在是百工百業專業模型時代 11/24 10:47
3F:→ nfsong : 一般人用不到,都閉源的 11/24 10:47
4F:→ nfsong : 這部分是要收錢的,很貴 11/24 10:48
原PO舉例的問題一般的LLM就問得出來了,AI模式也可以, 尤其後者,指示詞要下得精確一點,不然AI很難從海量一般生活常識中撈出專業答案。 權重的意思是"相對的重要程度",我們人類大腦也有權重, 所以才會說自己問的紀錄,跟大家集體問問題的紀錄都是關鍵,會影響模型權重偏移。 ※ 編輯: LoveSports (95.173.204.91 日本), 11/24/2025 11:16:00
5F:→ a5mg4n : 1.如果要下這麼多提示,用人腦就想完了,或者說,就不 11/24 12:15
6F:→ a5mg4n : 用問了 11/24 12:15
就算不問AI,門外漢自學也容易出錯,跟自學時書不能只看一本的道理差不多。 以前沒有AI可以問,自己GOOGLE也是要確認正確性,現在有AI方便統整跟搜尋, 但正確性還是要自己確認。如果沒有人類專家或書籍可以比對,可考慮多丟幾家AI比較, 叫他們互相檢查正確性。 舉實例,比方說你剛才問的那題,我是完全的門外漢,我還一度把B&W當成汽車廠商。 所以我確認正確性是多家AI都丟,叫他們互相糾錯。
7F:→ a5mg4n : 2,八卦版的文章,正好是LLM的問題:對於使用者不明瞭 11/24 12:18
8F:→ a5mg4n : 的事,怎麼會知道提示是對的還是錯的? 11/24 12:18
其實你的原文本身就已經回答這個問題了,因為你事先知道答案,甚至有圖面, 所以你知道什麼是正確回答。 一個什麼知識都沒有、又不想做進一步確認的人,就無法得知是否得到正確答案。 以下這樣說應該就比較容易理解了:AI不是神不是真的全知全能, 他們只是工具,工具有可能出錯。 所以理解工具的優缺點與屬性很重要,用戶本身輸入能力(包括儲備知識)也很重要。 ※ 編輯: LoveSports (95.173.204.91 日本), 11/24/2025 12:38:36







like.gif 您可能會有興趣的文章
icon.png[問題/行為] 貓晚上進房間會不會有憋尿問題
icon.pngRe: [閒聊] 選了錯誤的女孩成為魔法少女 XDDDDDDDDDD
icon.png[正妹] 瑞典 一張
icon.png[心得] EMS高領長版毛衣.墨小樓MC1002
icon.png[分享] 丹龍隔熱紙GE55+33+22
icon.png[問題] 清洗洗衣機
icon.png[尋物] 窗台下的空間
icon.png[閒聊] 双極の女神1 木魔爵
icon.png[售車] 新竹 1997 march 1297cc 白色 四門
icon.png[討論] 能從照片感受到攝影者心情嗎
icon.png[狂賀] 賀賀賀賀 賀!島村卯月!總選舉NO.1
icon.png[難過] 羨慕白皮膚的女生
icon.png閱讀文章
icon.png[黑特]
icon.png[問題] SBK S1安裝於安全帽位置
icon.png[分享] 舊woo100絕版開箱!!
icon.pngRe: [無言] 關於小包衛生紙
icon.png[開箱] E5-2683V3 RX480Strix 快睿C1 簡單測試
icon.png[心得] 蒼の海賊龍 地獄 執行者16PT
icon.png[售車] 1999年Virage iO 1.8EXi
icon.png[心得] 挑戰33 LV10 獅子座pt solo
icon.png[閒聊] 手把手教你不被桶之新手主購教學
icon.png[分享] Civic Type R 量產版官方照無預警流出
icon.png[售車] Golf 4 2.0 銀色 自排
icon.png[出售] Graco提籃汽座(有底座)2000元誠可議
icon.png[問題] 請問補牙材質掉了還能再補嗎?(台中半年內
icon.png[問題] 44th 單曲 生寫竟然都給重複的啊啊!
icon.png[心得] 華南紅卡/icash 核卡
icon.png[問題] 拔牙矯正這樣正常嗎
icon.png[贈送] 老莫高業 初業 102年版
icon.png[情報] 三大行動支付 本季掀戰火
icon.png[寶寶] 博客來Amos水蠟筆5/1特價五折
icon.pngRe: [心得] 新鮮人一些面試分享
icon.png[心得] 蒼の海賊龍 地獄 麒麟25PT
icon.pngRe: [閒聊] (君の名は。雷慎入) 君名二創漫畫翻譯
icon.pngRe: [閒聊] OGN中場影片:失蹤人口局 (英文字幕)
icon.png[問題] 台灣大哥大4G訊號差
icon.png[出售] [全國]全新千尋侘草LED燈, 水草

請輸入看板名稱,例如:Tech_Job站內搜尋

TOP