Stock 板


LINE

Nested Learning 的工程實例是 HOPE ,HOPE有分快系統跟慢系統兩部分 快系統應用Titan model 慢系統應用了CMS(連續體記憶系統) 現成硬體來說,最適合跑整個HOPE的是GPU,雖然也很勉強,NL流行後, GPU會針對這個改版 不過單獨CMS的部分,跟現有的LLM是相容的,model架構不變,可以拿訓練好 的權重接套用CMS 即使如此,谷歌應該也沒很大的動機現在就把CMS套用到Gemini3上 ※ 引述《curiserosi ()》之銘言: : 小弟不才,關於技術的部份看不懂 : 但還是想請教 : 1.現有transfomer架構因為需要死背硬記,所以需要超大規模記憶體 : 來對應長文本、圖像,甚至影片,到長影片所需的記憶體規模已經 : 不具備實際可行性或是沒有經濟價值 : 這部分Nested Learning具備絕對優勢,面對長文本、圖像,甚至長影片 : 對記憶體的需求成長可控 : 2.Nested Learning具備持續學習的能力,這點是transformer不具備的 : 基於以上兩點,即使現在還有很多缺點,未來也絕對有Nested Learning : 的一席之地(因為transformer在這些地方的劣勢是結構性的,無法改變) : 請問我這理解有沒有哪邊有問題? : 如果未來Nested Learning大規模佈署,在產業面上的影響 : 1.SRAM的需求會大幅增加,Nested Learning需要的不是大量的HBM來記憶 : 而是需要能快速響應的SRAM來對應CMS 照原PO的說法應該是如此,不過我不認為是這樣 我覺得用量增加最多的應該是DRAM,甚至是其他更慢的記憶體 你可以想,如果每個人的輸入都讓model更新參數,那雲端要保留多少個model? 這些model的參數都用最貴的SRAM?這太不現實了 而且如果更新參數只要針對個別用戶,多速記憶體的響應速度都夠快了,到時需 求的容量才會是關鍵,畢竟要服務太多用戶了 如果只是把CMS套用在現有的LLM上 HBM的需求基本應該維持跟現在差不多 : 2.算力的需求暴增,相比現在的transformer是卡在記憶體數量與頻寬 : Nested Learning因為需要Backward Pass,需要的是數倍的算力 是的,NL 比較適合用GPU跑,但要跑得好,GPU也得針對性的重新設計 : 3.由上面兩點推測,封裝需求也會改變,HBM+GPU的封裝需求成長減緩 : 如CoWoS,相對的interposer、載板也不需要那麼大,所以這些產業 : 成長會放緩 : 我腦容量不夠,這是我想像力的極限了 : 什麼雙曲空間已經超出我認知範圍 : 不過還是想問一下我這樣理解有沒有什麼問題 : 感謝 --



※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 118.150.246.41 (臺灣)
※ 文章網址: https://webptt.com/m.aspx?n=bbs/Stock/M.1765651058.A.74F.html
1F:推 avans : 推說明 12/14 02:50
2F:推 minazukimaya: 我原文是說邊緣端最快的那兩層用SRAM 雲端當然不可 12/14 03:08
3F:→ minazukimaya: 能是SRAM 雲端的慢層參數量都很高 SRAM塞不下的 12/14 03:08
4F:推 kuku951 : SRAM台廠好像只有華邦電有做 12/14 04:09
5F:推 curiserosi : 感謝回覆 12/14 07:18
6F:→ curiserosi : 請問mina,NL的記憶模糊、平行運算差的問題 12/14 07:22
7F:→ curiserosi : 目前有解嗎? 12/14 07:22
8F:推 curiserosi : edge端,機器人似乎就更適合NL而不是transformer 12/14 07:28
9F:→ bnn : 就...有些人的腦袋記憶力比較強(SRAM)有些人金魚腦 12/14 09:35
10F:→ bnn : (DRAM)有些人沒腦(transformer) 得加錢! 12/14 09:35







like.gif 您可能會有興趣的文章
icon.png[問題/行為] 貓晚上進房間會不會有憋尿問題
icon.pngRe: [閒聊] 選了錯誤的女孩成為魔法少女 XDDDDDDDDDD
icon.png[正妹] 瑞典 一張
icon.png[心得] EMS高領長版毛衣.墨小樓MC1002
icon.png[分享] 丹龍隔熱紙GE55+33+22
icon.png[問題] 清洗洗衣機
icon.png[尋物] 窗台下的空間
icon.png[閒聊] 双極の女神1 木魔爵
icon.png[售車] 新竹 1997 march 1297cc 白色 四門
icon.png[討論] 能從照片感受到攝影者心情嗎
icon.png[狂賀] 賀賀賀賀 賀!島村卯月!總選舉NO.1
icon.png[難過] 羨慕白皮膚的女生
icon.png閱讀文章
icon.png[黑特]
icon.png[問題] SBK S1安裝於安全帽位置
icon.png[分享] 舊woo100絕版開箱!!
icon.pngRe: [無言] 關於小包衛生紙
icon.png[開箱] E5-2683V3 RX480Strix 快睿C1 簡單測試
icon.png[心得] 蒼の海賊龍 地獄 執行者16PT
icon.png[售車] 1999年Virage iO 1.8EXi
icon.png[心得] 挑戰33 LV10 獅子座pt solo
icon.png[閒聊] 手把手教你不被桶之新手主購教學
icon.png[分享] Civic Type R 量產版官方照無預警流出
icon.png[售車] Golf 4 2.0 銀色 自排
icon.png[出售] Graco提籃汽座(有底座)2000元誠可議
icon.png[問題] 請問補牙材質掉了還能再補嗎?(台中半年內
icon.png[問題] 44th 單曲 生寫竟然都給重複的啊啊!
icon.png[心得] 華南紅卡/icash 核卡
icon.png[問題] 拔牙矯正這樣正常嗎
icon.png[贈送] 老莫高業 初業 102年版
icon.png[情報] 三大行動支付 本季掀戰火
icon.png[寶寶] 博客來Amos水蠟筆5/1特價五折
icon.pngRe: [心得] 新鮮人一些面試分享
icon.png[心得] 蒼の海賊龍 地獄 麒麟25PT
icon.pngRe: [閒聊] (君の名は。雷慎入) 君名二創漫畫翻譯
icon.pngRe: [閒聊] OGN中場影片:失蹤人口局 (英文字幕)
icon.png[問題] 台灣大哥大4G訊號差
icon.png[出售] [全國]全新千尋侘草LED燈, 水草

請輸入看板名稱,例如:Gossiping站內搜尋

TOP