Stock 板


LINE

最近在想一個跟原po類似的問題 剛好也跟 AI 討論了一陣子,整理成一些自己的觀察 先拋結論: 這不太像什麼已經被設計好的套路,比較像是「科技樹還沒點到那裡」 目前 AI 發展其實有兩條很明顯的趨勢在同時發生: 一個是大模型持續變強,但邊際效益開始下降 模型變大還是會變強,但提升的幅度,跟投入的算力、成本相比,沒有以前那麼划算 另一個是小模型越來越強 透過 distillation、quantization,還有針對特定任務優化 小模型其實已經可以 cover 很多實用場景 所以就出現一個有趣的可能性: 未來「訓練大模型」這件事,可能還是只會集中在少數幾間大公司手上 但「推理」這件事,不一定需要一直依賴超大模型 有沒有可能變成 把任務拆開,交給多個小模型,在不同裝置上協作完成? 這個概念其實有點像公司運作: 公司不會全部都請通才,而是不同領域的專才組成不同 team,一起把事情完成 對應到模型也是一樣: 現在的大模型,其實有點像把各種能力(語言、邏輯、知識)全部塞在一起 但理論上,這些能力是可以被拆分、模組化的 問題就出在一個關鍵點:latency(延遲) 如果是一個大模型,你問問題,它可以一次 forward 就給答案 但如果是多個小模型協作,就會變成: 模型 A → 模型 B → 模型 C 中間需要傳遞資訊、同步狀態,甚至「討論」 這個過程的延遲,如果太高,就完全不可行 所以我現在的理解是: 未來架構會不會改變,關鍵不在模型大小,而在 latency 能不能壓下來 如果有一天: - 裝置間通訊延遲大幅下降(硬體 / network) - 模型之間的協作機制變成熟(software / protocol) 那多小模型協作,才有可能真的落地 到那個時候,整個生態可能會有一些變化: - GPU / memory 還是很重要,但需求不一定是「無限膨脹」 - 能源問題也可能被部分緩解(因為計算被分散) - 邊緣裝置(手機、桌機、筆電、車機、甚至穿戴裝置)的算力不再閒置 現在其實是: 我們在用雲端 server 跑 AI, 但身邊一堆裝置的算力都是閒置的 未來有沒有可能變成: 這些裝置一起參與推理,變成一種分散式 AI? 當然,這條路現在還卡在 latency、穩定性、還有系統複雜度,但我相信已經有人在研究了 所以短期內,大模型 + 雲端還是主流 但如果這些問題被解掉,現在這種「集中式算力 + 超大模型」的模式,未必是唯一解 大概就是這樣,算是一點還沒成熟的想法,拋出來看看大家怎麼想 --



※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 118.168.146.181 (臺灣)
※ 文章網址: https://webptt.com/m.aspx?n=bbs/Stock/M.1774141163.A.E2A.html
1F:推 Shiang1225 : 這篇正解 我們看太短了 明明就是要10年20年的東西 03/22 09:06
2F:推 sceleton : 歷史上來說就是這樣。Mainframe => PC => server => 03/22 09:09
3F:→ sceleton : smartphone 03/22 09:09
4F:推 CKRO : 這個想法很有意思 03/22 09:25
5F:推 masala : 終端產品的算力被架空了,淪為一個收發器而已 03/22 09:29
6F:→ bnn : 你這個就Edge想幹的 遲早的事 但現在沒必要 03/22 09:38
7F:→ bnn : 因為現在架Edge你付出的就你說的額外成本不如擴大dc 03/22 09:39
8F:→ bnn : 因為現在能回收的反而是小利基型特化 先證明能回收 03/22 09:40
9F:→ bnn : Edge是要到普及人手一支能回收的通用p2p-like串接 03/22 09:41
10F:→ bnn : 而目前對資料傳輸的需求連短距離都不能忍銅線要CPO 03/22 09:42
11F:→ bnn : 你要進步到無線能傳低功耗大資料量 科技樹還沒點到 03/22 09:43
12F:→ bnn : 就跟現在你可以幾張顯卡自架local(一台Edge主機) 03/22 09:44
13F:→ bnn : 但顯然這是上面的PC階段 距離smartphone還很遠 03/22 09:44
14F:→ bnn : 要解決完縮小 能耗 散熱 傳輸一堆問題 03/22 09:45
15F:→ layer0930 : 這個目前困難性太高了,還有成本問題 03/22 09:46
16F:→ Kayusumi : 目前一些手機上的ai運用就算是輕量化模型吧 03/22 09:54
17F:推 cphe : 一定會這樣吧 只能說AI才剛起步,硬體無法滿足 03/22 10:29
18F:→ cphe : 需求,未來一定會有需求緩和下來回歸正常的時候 03/22 10:29
19F:→ cphe : 至於Edge AI目前完全不夠力 03/22 10:29
20F:→ potionx : 兩者會並行 依照需求決定你使用什麼裝置 03/22 10:43
21F:推 CGDGAD : 現在不是有混合專家模型嗎?專門的問題會導向專門 03/22 11:16
22F:→ CGDGAD : 的推理路徑增加運算效率 03/22 11:16
23F:→ paimin : 結果你的小模型比大模型還廢 成本還高 繼續用大的 03/22 13:05
24F:→ stocktonty : 你是跟什麼等級的AI討論要先釐清 03/22 13:08
25F:推 japan428 : 你講的就是邊緣ai吧,其實Apple這些行動裝置廠商都 03/22 15:24
26F:→ japan428 : 著手佈局了啊 03/22 15:24
27F:→ japan428 : 但這跟CSP會有巨大需求不衝突,因為現在光看openc 03/22 15:28
28F:→ japan428 : law吃token 的量就很驚人 03/22 15:28
29F:推 mdkn35 : 個人覺得gemini已經是這樣了 要畫圖才切banana 03/23 06:54







like.gif 您可能會有興趣的文章
icon.png[問題/行為] 貓晚上進房間會不會有憋尿問題
icon.pngRe: [閒聊] 選了錯誤的女孩成為魔法少女 XDDDDDDDDDD
icon.png[正妹] 瑞典 一張
icon.png[心得] EMS高領長版毛衣.墨小樓MC1002
icon.png[分享] 丹龍隔熱紙GE55+33+22
icon.png[問題] 清洗洗衣機
icon.png[尋物] 窗台下的空間
icon.png[閒聊] 双極の女神1 木魔爵
icon.png[售車] 新竹 1997 march 1297cc 白色 四門
icon.png[討論] 能從照片感受到攝影者心情嗎
icon.png[狂賀] 賀賀賀賀 賀!島村卯月!總選舉NO.1
icon.png[難過] 羨慕白皮膚的女生
icon.png閱讀文章
icon.png[黑特]
icon.png[問題] SBK S1安裝於安全帽位置
icon.png[分享] 舊woo100絕版開箱!!
icon.pngRe: [無言] 關於小包衛生紙
icon.png[開箱] E5-2683V3 RX480Strix 快睿C1 簡單測試
icon.png[心得] 蒼の海賊龍 地獄 執行者16PT
icon.png[售車] 1999年Virage iO 1.8EXi
icon.png[心得] 挑戰33 LV10 獅子座pt solo
icon.png[閒聊] 手把手教你不被桶之新手主購教學
icon.png[分享] Civic Type R 量產版官方照無預警流出
icon.png[售車] Golf 4 2.0 銀色 自排
icon.png[出售] Graco提籃汽座(有底座)2000元誠可議
icon.png[問題] 請問補牙材質掉了還能再補嗎?(台中半年內
icon.png[問題] 44th 單曲 生寫竟然都給重複的啊啊!
icon.png[心得] 華南紅卡/icash 核卡
icon.png[問題] 拔牙矯正這樣正常嗎
icon.png[贈送] 老莫高業 初業 102年版
icon.png[情報] 三大行動支付 本季掀戰火
icon.png[寶寶] 博客來Amos水蠟筆5/1特價五折
icon.pngRe: [心得] 新鮮人一些面試分享
icon.png[心得] 蒼の海賊龍 地獄 麒麟25PT
icon.pngRe: [閒聊] (君の名は。雷慎入) 君名二創漫畫翻譯
icon.pngRe: [閒聊] OGN中場影片:失蹤人口局 (英文字幕)
icon.png[問題] 台灣大哥大4G訊號差
icon.png[出售] [全國]全新千尋侘草LED燈, 水草

請輸入看板名稱,例如:e-shopping站內搜尋

TOP