Stock 板


LINE

原文標題:DeepSeek放大招!開源「新星」FlashMLA登場:大模型效率革命能否破解「AI芯片荒」? 原文連接:https://news.qq.com/rain/a/20250225A097R600 發布時間:2025-02-25 21:19 記者署名:朱成祥 原文內容: 2月24日上午,DeepSeek(深度求索)發布首個開源項目FlashMLA。根據DeepSeek在GitHub社區披露的信息,FlashMLA是適用於Hopper GPU(一種英偉達圖形處理器架構)的高效MLA(多頭潛註意力)解碼內核,針對可變長度序列服務進行了優化。在H800(一款英偉達芯片)上可以實現每秒處理3000GB(千兆字節)數據,每秒執行580萬億次浮點運算。 有業內觀點認為,目前限製DeepSeek推理的主要瓶頸就是顯存,FlashMLA則是「以算代存」,可解決推理過程中顯存容量不足的問題。 對此,PPIO派歐雲聯合創始人兼CTO王聞宇告訴《每日經濟新聞》記者:「(該觀點)不完全正確,MLA的本質是在基礎算法上的創新,通過將KV的權重矩陣轉換到潛空間,實現矩陣的大幅壓縮並且不造成精度損失。壓縮算法會引入微弱的計算量的增加,但是由此帶來的數據存儲開銷大幅下降,訓練及推理速度大幅提升,需要計算的數據總量減少了,總計算量反而減少了,相應的訓練和推理速度就會大幅提高。」 顯存容量成門檻 當下,外界普遍使用顯存來測算部署DeepSeek各類模型所需要的推理算力。比如根據民生證券研報,像DeepSeek-R1一個專註於實時推理的優化版本,擁有15B參數,推理時激活全部15B參數,顯存需求約為30GB(FP16精度),單張NVIDIA A100(英偉達顯卡)或單張RTX 4090(英偉達消費級顯卡)等顯卡可滿足需求。 像DeepSeek 67B是一個擁有67B參數的大型模型,推理時激活全部67B參數,顯存需求約為140GB(FP16精度)。推薦使用4張A100-80G GPU進行多卡並行推理。 照此計算,DeepSeek R1「滿血版」擁有671B參數,在FP16精度下,需要1.4TB(太字節)顯存;在FP8精度下,也需要約700GB顯存。如果按照一個服務器8張卡計算,單卡80GB的8卡服務器滿足不了「滿血版」的推理工作,可能需要多個服務器互連。 關於顯存是否為限製DeepSeek推理的主要瓶頸,王聞宇認為:「DeepSeek模型與其他主流模型相比,參數量更大,決定了其需要更大容量顯存以加載模型權重,顯存容量是門檻,不是瓶頸。」 那麽,參數量小得多的蒸餾模型是否滿足應用需求?王聞宇表示:「蒸餾版本與滿血版本相比,參數量少很多,比如Qwen-7B,只有滿血版671B的百分之一,參數量少,導致在模型性能上遠弱於滿血版,如何選擇模型取決於實際的應用場景,要求高的場景可能無法用蒸餾版本來滿足。」 一位不願具名的算力芯片廠商高管對《每日經濟新聞》記者表示:「AI行業從業者,不管是哪個環節的,包括模型公司、AI芯片公司等,都是圍繞一個三角形來做的,三角形的三個角分別是提高價值,提高或者保持用戶體驗,維持或者降低使用成本提高價值就是要能解決更多問題,能解決更難的問題;模型規模起來後,一般來說會降低用戶體驗、提高成本所以大家都在這個三角形中螺旋式地往上爬。」 圖片 圖片來源:受訪對象提供 大模型效率革命? 而FlashMLA,正是在大模型規模變大、能力變強後,在不降低用戶體驗的基礎上降低成本。 根據民生證券研報,傳統計算方式存在KV(鍵值)矩陣重復計算的問題,這不僅浪費了大量的計算資源,還會導致顯存消耗過大,影響模型的運行效率。而MLA技術解決了這個難題,它通過獨特的算法設計,減少了對KV矩陣的重復計算,大大降低了顯存的消耗。 需要註意的是,目前FlashMLA適配的是英偉達Hopper架構的GPU。若FlashMLA在CUDA生態大幅減少對顯存的占用,那麽未來應用到國內算力芯片領域,是否有助於「推理平價」,降低推理成本,推動國產算力芯片在推理領域的使用? 沐曦工作人員反饋:「這一周大家都忙著DeepSeek開源周的適配。」另據沐曦官方微信號:「沐曦技術團隊在FlashMLA開源後迅速響應,僅用2小時即完成與沐曦GPU的適配工作,並於當日將代碼提交至開源社區。」 此外,沐曦方面也表示:「FlashMLA通過MLA解碼優化與分頁KV緩存技術等顯著提升硬件利用率,可加速大語言模型解碼過程,有效提升響應速度與吞吐量,尤其適用於聊天機器人等實時生成場景。沐曦在適配中應用矩陣吸收算法將低秩投影融入Flash Attention 2核函數,在保證計算效率的同時顯著降低顯存占用。」 PPIO派歐雲王聞宇也表示:「FlashMLA對國內算力芯片具有很大的借鑒價值,通過技術創新,將FlashMLA移植到國內算力芯片上,也可以實現類似CUDA中的減少顯存占用和加速效果。」 事實上,除了通過算法領域的進步來減少顯存占用,也可以從芯片設計角度出發,通過定製化的芯片來增加顯存。 上述算力芯片公司高管稱:「核心問題是HBM(高帶寬存儲)每GB是DDR(雙倍速率同步動態隨機存儲器)的5x(5倍)價錢,用HBM來存所有權重不劃算。」 其給出的解決辦法是多級存儲。他表示:「需要模型來進一步改造,我認為比較理想的軟硬件,在未來應該是兩級或者多級存儲的,比如HBM和DDR都上,HBM更快,DDR更大,所以整個模型都存更大的DDR裏面,就像DeepSeek論文裏面寫的,他們每10分鐘刷新一批redundant expert(冗余專家),這批可以放在HBM裏面,用戶用的時候,大概率從這個redundant expert裏面取expert,這樣就可以既便宜又快了。」 關於MoE結構對算力硬件需求的變化,中金研報認為,可能帶來對處理器架構進一步的定製化需求,如更大的計算單元、和更高效的通信kernel(內核)相匹配的設計單元、近存計算單元等,利好DSA(領域專用架構)架構發展。 心得/評論: moE其實是上世紀90年代就有的人工智能思路,transformer也是2017年google發佈的論文 根本不是OPENai專美的東西 這兩天deepseek集中發佈的新開源技術,更證明deepseek全方位的技術及研究能力 深入到AI算法、gpu性能徹底釋放等AI每一個軟硬件及其鏈接接領域 DeepSeek開源MoE訓練、推理EP通信庫DeepEP,真太Open了 deepseek哪裏象是一個兩三年的大模型公司,綜合實力之强,涉及領域之深之廣,OPENAI顯然落在下風,ds有AI華爲的感覺了 大家都説,deepseek是對NVDIA短空長多,只是deepseek武器庫太充足了,每次新武器出現就是一次短空新周期,長多不知道何時才能來了XD -- 雪壓枝頭低,雖低不着泥 一朝紅日出,依舊與天齊 --



※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 123.52.214.97 (中國)
※ 文章網址: https://webptt.com/m.aspx?n=bbs/Stock/M.1740503434.A.D76.html
1F:噓 PureAnSimple: 好了啦 超大悲 可以了嗎? 02/26 01:11
2F:推 freshman : 你各位模型卷起來,伺服器繼續買 02/26 01:13
3F:推 allen0080 : 拿來殺股票已經沒用了。 02/26 01:13
※ 編輯: icrose (123.52.214.97 中國), 02/26/2025 01:15:27
4F:推 Alexstar : 蝦仁豬心的消息來惹 02/26 01:17
5F:推 what5566 : 鬼故事也太多了吧 這感覺下禮拜會全噴回來 02/26 01:18
6F:推 stcr3011 : 開源讓大家檢視 XDD 02/26 01:18
7F:噓 kausan : n卡買多少了? 多買一點比較有機會贏 02/26 01:22
8F:→ azhu : 好啦好啦 贏贏贏 隨便了 02/26 01:35
9F:噓 nayeonmywife: 所以晶片荒在哪裡? 中國而已? 02/26 01:38
10F:→ Lowpapa : CloseAI真的超鳥 02/26 01:42
11F:推 ImHoluCan : 中國伺服器GPU那麼猛,對岸遊戲GPU怎麼大家還用輝 02/26 01:49
12F:→ ImHoluCan : 達呢? 02/26 01:49
13F:噓 shiki1988 : 中吹給的禮物 謝謝都來不及了 02/26 01:50
14F:推 kentano : 母公司2015就搞AI資產管理投資 02/26 01:59
15F:推 liwae : 沒有錢就有沒有錢的解法 不是每人玩魔物都要5090 02/26 02:20
16F:推 liwae : steam小黃鴨 這軟體很神奇 02/26 02:23
17F:推 pkmu8426 : AI終歸還是要靠腦袋 02/26 02:26
18F:→ MTKer5566 : 台灣有沒有機殼組裝訂單? 02/26 02:47
19F:推 xeins : 找不金山在哪 鏟子再多也是浪費電 02/26 03:41
20F:噓 skyhawkptt : 阿里巴巴投資500億歐元布局AI與雲計算 股價一度暴跌 02/26 03:55
21F:噓 skyhawkptt : 超9% 02/26 03:55
22F:推 naligono : 又一個三角形大師 02/26 04:19
23F:推 hcwang1126 : 算力是很不夠的 在美語和簡中溢出前 02/26 06:04
24F:噓 baboosh : 盗版GPT 結案,下一題 02/26 07:10
25F:推 doranako : deepseek現在不讓人儲值用api 02/26 07:15
26F:推 capssan : 三個月前誰能想到真正的OpenAI居然在中國 呵呵 02/26 07:46
27F:推 keyneslan : 美國還是最強吧 02/26 07:46
28F:推 s213092921 : 美國的AI霸權已經沒了,只剩可超越的差距 02/26 08:11
29F:→ s213092921 : CloseAI想搞壟斷賺取暴利的算盤已經破滅了 02/26 08:11
30F:推 idletime : 開源但是快還要更快,好還要更好,所以鏟子繼續賣 02/26 08:18
31F:噓 jamesho8743 : 講啥小 deepseek不用NV? 不用NV了再來洗 02/26 08:21
32F:噓 EZTW0000 : 還不是繼續從新加坡進NV嘻嘻,這ID也不會有單,來 02/26 08:28
33F:→ EZTW0000 : 工作 02/26 08:28
34F:推 syk1104 : OK,中又贏 02/26 08:29
35F:推 ss218 : 感覺AI說不訂快泡沫化了 已經到了很多不懂的人出來 02/26 08:36
36F:→ ss218 : 裝專家侃侃而談的階段 02/26 08:37
37F:噓 deepdish : 阿講一堆 所以怎麼賺錢啊?花錢誰不會 02/26 08:37
38F:→ stanleyplus : 又贏麻 02/26 08:56
39F:噓 liliumeow : 華為是行業百草枯 沒跟這個"真"openai相提並論 02/26 08:56
40F:噓 johnny055279: 中吹去哪裡了?出來吹一下啊? 02/26 09:09
41F:→ Artymo : 不錯,坐等其它開源模型跟進! 02/26 09:14
42F:噓 r40491101 : 噁 02/26 09:16
43F:噓 zombiepigman: 盜版 02/26 09:31
44F:噓 Syg : 繼續唬 02/26 09:34
45F:→ billionaire : 支那人? 02/26 10:13
46F:→ Mytsb2421 : 對岸太厲害了 02/26 10:19
47F:推 g1254501 : 可憐哪 井蛙去問一下滿血版的DS用啥跑的好嗎。看完 02/26 22:52
48F:→ g1254501 : 了之後不要嚇到尿褲子 02/26 22:52
49F:噓 phoenixtwo : 吹牛很會 02/28 12:46
50F:噓 skyhawkptt : 陸首家棄用DeepSeek 遭網民攻擊!創辦人悲吐實情 03/10 15:59







like.gif 您可能會有興趣的文章
icon.png[問題/行為] 貓晚上進房間會不會有憋尿問題
icon.pngRe: [閒聊] 選了錯誤的女孩成為魔法少女 XDDDDDDDDDD
icon.png[正妹] 瑞典 一張
icon.png[心得] EMS高領長版毛衣.墨小樓MC1002
icon.png[分享] 丹龍隔熱紙GE55+33+22
icon.png[問題] 清洗洗衣機
icon.png[尋物] 窗台下的空間
icon.png[閒聊] 双極の女神1 木魔爵
icon.png[售車] 新竹 1997 march 1297cc 白色 四門
icon.png[討論] 能從照片感受到攝影者心情嗎
icon.png[狂賀] 賀賀賀賀 賀!島村卯月!總選舉NO.1
icon.png[難過] 羨慕白皮膚的女生
icon.png閱讀文章
icon.png[黑特]
icon.png[問題] SBK S1安裝於安全帽位置
icon.png[分享] 舊woo100絕版開箱!!
icon.pngRe: [無言] 關於小包衛生紙
icon.png[開箱] E5-2683V3 RX480Strix 快睿C1 簡單測試
icon.png[心得] 蒼の海賊龍 地獄 執行者16PT
icon.png[售車] 1999年Virage iO 1.8EXi
icon.png[心得] 挑戰33 LV10 獅子座pt solo
icon.png[閒聊] 手把手教你不被桶之新手主購教學
icon.png[分享] Civic Type R 量產版官方照無預警流出
icon.png[售車] Golf 4 2.0 銀色 自排
icon.png[出售] Graco提籃汽座(有底座)2000元誠可議
icon.png[問題] 請問補牙材質掉了還能再補嗎?(台中半年內
icon.png[問題] 44th 單曲 生寫竟然都給重複的啊啊!
icon.png[心得] 華南紅卡/icash 核卡
icon.png[問題] 拔牙矯正這樣正常嗎
icon.png[贈送] 老莫高業 初業 102年版
icon.png[情報] 三大行動支付 本季掀戰火
icon.png[寶寶] 博客來Amos水蠟筆5/1特價五折
icon.pngRe: [心得] 新鮮人一些面試分享
icon.png[心得] 蒼の海賊龍 地獄 麒麟25PT
icon.pngRe: [閒聊] (君の名は。雷慎入) 君名二創漫畫翻譯
icon.pngRe: [閒聊] OGN中場影片:失蹤人口局 (英文字幕)
icon.png[問題] 台灣大哥大4G訊號差
icon.png[出售] [全國]全新千尋侘草LED燈, 水草

請輸入看板名稱,例如:Boy-Girl站內搜尋

TOP