作者fly5566 (飛56)
看板Stock
標題[新聞] 研究稱DeepSeek的AI 訓練成本也很貴 至少
時間Mon Feb 3 11:37:23 2025
原文標題:研究稱DeepSeek的AI 訓練成本也很貴 至少430億台幣
原文連結:
https://reurl.cc/Q5odeM
發布時間:21:49 2025/02/01
記者署名:中時新聞網 江飛宇
原文內容:
https://i.imgur.com/hN2WEH9.jpeg
半導體行業分析公司指出,DeepSeek的基礎成本、伺服器搭建成本至少要13億美元。(圖
/shutterstock/達志)
最近上線的中國大陸AI軟體DeepSeek引發業界震撼,大陸聲稱建構DeepSeek的基礎成本很
低,僅是OpenAI的零頭,最廣為流傳的說法之一,是DeepSeek V3 的訓練成本約為 600萬
美元(1.9億新台幣)。不過這個說法被半導業行業研究公司 SemiAnalysis質疑,他們認為
DeepSeek的成本應該至少有13億美元(約430億新台幣)。
有趣的工程(Interesting Engineering)報導,SemiAnalysis 指出,它未能解釋幾個關鍵
因素。600 萬美元的估算,只考慮了 GPU 預訓練費用,忽略了公司在研發、基礎設施和
其他必要成本方面的大量投資。報告強調,DeepSeek 的總伺服器資本支出,就高達13億
美元。
根據報導,DeepSeek使用了大約 5萬張Hopper GPU(微架構的),這導致業界產生了一些誤
解。以為這就等於5萬張輝達H100 GPU(Nvidia Hopper H100 GPU)。
SemiAnalysis 澄清說,輝達的GPU 有多種型號,包括 H800、H100 以及 NVIDIA 為應對
美國出口限製而生產的 H20。也是中國大陸可以獲得的類型。
該報告稱,與一些較大的人工智慧實驗室不同,DeepSeek資料中心採用精簡模型,來提高
其靈活性和效率。這算是一種不錯的適應能力,分析顯示 DeepSeek 的 R1模型,表現出
與 OpenAI 的 o1 相當的推理能力。
然而,這不意味著DeepSeek在所有指標都性能領先。
雖然 DeepSeek 的定價策略引起了關注和讚譽,但有一個重要的警告:功能相似的
Google Gemini Flash 2.0 ,在API 服務存取時更加經濟。這使得 DeepSeek 處於一個十
字路口,平衡效能和成本是其未來成功的關鍵。
但是,DeepSeek的多頭潛在注意力(Multi-Head Latent Attention,MLA),是個頗具突
破性的創新,這種方法透過減少鍵值 (KV) 快取的使用,顯著降低了 93.3% 的推理成本
。不過, DeepSeek 帶來的創新,也很可能會被渴望保持競爭力的西方人工智慧實驗室迅
速採用。
報告推測,DeepSeek可能產生不錯的競爭環境,令其他同行也必須具有更快的適應能力。
總之,SemiAnalysis 描繪了 DeepSeek 在 AI 領域的當前地位。它的成本結構、GPU 利
用率,和創新能力,確實成為一名強大的AI參與者。
心得/評論:
上週由於Deepseek的橫空出世,宣稱能夠降低98%成本
殺得許多美股科技大頭血流成河,今天台股開盤也被連累
若到頭來低成本只是"號稱",又只能產出審查閹割後的不實內容
牛皮吹破被看破手腳的後果.....
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 218.164.83.160 (臺灣)
※ 文章網址: https://webptt.com/m.aspx?n=bbs/Stock/M.1738553847.A.69B.html
1F:→ auerbach : 繼續壯膽XD 02/03 11:38
2F:推 chord210 : 這兩天有用一下網頁版的看看,他有把思考過程寫出 02/03 11:38
3F:→ chord210 : 來比open 的好很多 02/03 11:38
4F:推 WTF55665566 : 講實話會讓鹿港仔不開心 02/03 11:39
5F:推 herculus6502: OpenAI一堆大老出走 想也知道有問題 02/03 11:39
6F:→ Leo4891 : 500萬鎂本來就只有一次的訓練成本 啥硬體人事都沒 02/03 11:39
7F:→ Leo4891 : 納進去 02/03 11:39
8F:→ WTF55665566 : Open一樣有思考過程啊 第一天用嗎?☺ 02/03 11:39
9F:→ tindy : 訓練成本就是訓練成本 全世界算法一樣 02/03 11:39
10F:推 puritylife : ㄟ 連公司基礎設施都要算進去? 02/03 11:40
11F:→ WenliYang : 好了啦…… 02/03 11:40
12F:→ tindy : 拿其他成本是要混搖什麼視聽 02/03 11:40
13F:→ Leo4891 : open ai 最近的一個版本不是也有邏輯推導 02/03 11:40
14F:推 kuosos520 : 原來如此,難怪中國人現在過這麼慘 02/03 11:41
15F:推 matlab1106 : 連員工成長過程的成本都沒算到吧 02/03 11:41
16F:→ realmd : 笑死 那麼下一次發新模型要說0成本嗎 02/03 11:41
17F:推 kotorichan : 喔喔 那他API定價怎麼這麼低 02/03 11:41
18F:→ MgEuCuLiZn : 是套了多少 真的可悲 02/03 11:41
19F:推 meta41110 : 浮木又來了0.0 02/03 11:41
20F:噓 ksjr : 把openai的那些成本一起拿進來比阿== 02/03 11:44
21F:推 gk1329 : 好了喇 02/03 11:44
22F:推 tanchuchan : 顯著降低了 93.3% 的推理成本 02/03 11:45
23F:推 daniel3658 : 青鳥浮木 笑死 02/03 11:45
24F:推 Roger5566 : 要這樣算 openai只會更貴 02/03 11:45
25F:推 almanch : 華爾街懂玩 02/03 11:47
26F:→ iamaq18c : XDDDDDDDDDDDDDDD 02/03 11:48
27F:→ m9315030 : 中時造反?? 02/03 11:48
28F:推 good200 : 才430億?麵線的系統造價便宜 02/03 11:48
29F:噓 squeakywheel: 該不會下一步就要說是解放軍出資吧? 02/03 11:48
30F:推 knml : ds思考過程超長的 02/03 11:48
31F:推 camp0102 : 百分百正確 02/03 11:49
32F:推 jimmy12332 : 那很便宜欸? 02/03 11:49
33F:→ jhnny : 現在就估值破口….容易懷疑資本支出.. 02/03 11:49
34F:推 shyshyan : 這樣第一個模型就超貴 後面模型就可以大幅降低成本 02/03 11:50
35F:→ shyshyan : 超聰明的 02/03 11:50
36F:推 s213092921 : 照同樣標準計算,CloseAI只會更貴XDD 02/03 11:50
37F:→ sheng76314 : CloseAI之前就在內鬥 02/03 11:51
38F:推 epephanylo : 對 DS超爛 還不快彎腰撿鑽石 02/03 11:52
39F:→ calmerrorans: 訓練成本和建置成本好像不同 02/03 11:52
40F:→ waijr : 是不是很多人不知道GPU可以用租的 02/03 11:53
41F:推 e446582284 : 那OpenAI的人事費、研發、基建要不要一起算? 繼續 02/03 11:53
42F:→ e446582284 : 壯膽 02/03 11:53
43F:推 taiwan1789 : 比closeAI便宜啦,不然closeai收啥貴貴的錢 02/03 11:54
44F:推 zonppp : 遙遙領先! 過三個月後再來看看吧~ 02/03 11:55
45F:推 Brioni : 那也太便宜,OpenAI 算上這些成本噴上天 02/03 11:55
46F:推 DREE : 第一個才叫創新~~之後的都是抄襲~~好聽點叫學習改良 02/03 11:56
47F:噓 samnpc : 訓練成本跟巡邏成本都不會分 02/03 11:56
48F:→ samnpc : 建置 02/03 11:56
49F:→ Brioni : 那也改良太多 02/03 11:57
50F:推 Howard000123: 好了啦 你OpenAI多少錢租伺服器 16億美元一年對不 02/03 11:58
51F:→ Howard000123: 對 02/03 11:58
52F:推 DREE : 第一個研發出來的花的錢絕對是最多的啊~這常識吧!! 02/03 11:58
53F:→ DREE : 一直講成本低不知道再吹什麼?? 5年後會更低~~ 02/03 11:59
54F:→ zerro7 : 想到那張釣魚的梗圖 突然覺得很貼切 02/03 12:00
55F:→ DREE : 軟體的成本絕對越來越低~~程式碼複製貼上~~ 02/03 12:00
56F:推 Flyingheart : 急了 同樣的東西ㄧ直洗 02/03 12:00
57F:→ pujos : 照這個估法,下個模型固定成本0元??? 02/03 12:01
58F:→ pujos : 哪一家財務估算是這樣估的 02/03 12:01
59F:→ easonli000 : 研發跟訓練混為一談 02/03 12:02
60F:噓 w28103566 : 重點是api成本低 還開源 02/03 12:02
61F:推 camoont : 香不香我不知道, 反正 openAI 很臭 02/03 12:03
62F:→ appledick : 全開源要黑真的有難度啊 02/03 12:03
63F:→ appledick : 美國仔應該很怕中國變民主國家 就此沒得嘴了 02/03 12:04
64F:噓 mangle : 同樣邏輯,美國大模型也比現在講得更貴數十數百倍 02/03 12:04
65F:→ mangle : ….美國光一個管理工程師就600萬美元了 02/03 12:04
66F:噓 set852064 : 繼續洗 02/03 12:06
67F:噓 hank81177 : 點麵線也很貴 02/03 12:06
68F:→ tayuplay : 青鳥浮木 02/03 12:07
69F:→ rooo2012 : open裡面的人賺了不少錢? 02/03 12:08
70F:推 ots625 : 點麵系統表示,我們cp值更高 02/03 12:09
71F:→ Lowpapa : 430e > 6000e 笑死 輸不起 02/03 12:09
72F:→ amd3dnow : 至少有成果出來,數發部這麼多預算,成果在哪??? 02/03 12:10
73F:推 sernidle : 是怕deepseek可以用低階GPU做到高階GPU的八成效果 02/03 12:13
74F:→ sernidle : ,那高階GPU是不是賣不掉了 02/03 12:13
75F:→ wholesaler : nv 的股價也沒彈回去… 02/03 12:14
76F:→ calmerrorans: 樹發布還在考察 別急 02/03 12:14
77F:推 kotorichan : 幻方有5萬張h100 那一定是阿共有支助 02/03 12:16
78F:推 taiwan1789 : AI股之前吹太凶了,達子回跌剛好 02/03 12:16
79F:→ kotorichan : 一定還是需要巨大算力 歐引就對了 02/03 12:16
80F:推 jojo396 : 少年AI股神咕嚕咕嚕 02/03 12:17
81F:→ QooSnow : (你又知道了?) 02/03 12:20
82F:→ piece1 : 所以open醬很便宜對吧?XD 02/03 12:20
83F:→ searchroy : 不用500億台幣,很便宜耶! 02/03 12:23
84F:→ matlab1106 : 對比200億點麵線 這錢花的很值得 02/03 12:26
85F:→ icome : 拿美國人薪水在估? 02/03 12:27
87F:→ janky : 看這個就懂 02/03 12:28
88F:推 yuenda : 急了 趕快發出貨文 02/03 12:29
89F:推 GOOGLEISGOD : 多久以前的新聞了... 02/03 12:34
90F:推 epicurious : 營運成本、租賃成本跟資本支出都分不清楚的菜雞 02/03 12:38
91F:→ dalmatian : 好了啦 美科技巨頭都認輸採納了。 02/03 12:38
92F:推 s213092921 : 還有美吹念念不忘DS抄襲CloseAI哈哈哈 02/03 12:38
93F:→ epicurious : 寫這篇的當大家都87,還真的不少87 02/03 12:39
94F:→ HAPPYISCASH : deepseek明明就是ai歷史中的一個偉大作品 02/03 12:39
95F:→ HAPPYISCASH : 成本就是你openai的10%而已 02/03 12:40
96F:噓 knives : 噁心 02/03 12:41
97F:→ knives : 這就跟某黨刪預算一樣,在那亂帶風向 02/03 12:41
98F:→ HAPPYISCASH : 這篇騙騙笨蛋標題檔可以 自己都偷偷承認推理成本降 02/03 12:42
99F:→ HAPPYISCASH : 低93% lol 02/03 12:42
100F:→ knives : 玩文字遊戲騙87 02/03 12:42
101F:推 ookkkkoo : 東拼西湊的$$去跟人家亂比較 ㄎㄎ 02/03 12:47
102F:推 a19851106 : gpt思考過程最近才有的哦,第一天用的嗎? 02/03 12:48
103F:推 c928 : 現在是川普利空 02/03 12:49
104F:推 deathoflove : semianalysis 不是之前出AMD和NV 效能比較的報告 02/03 12:50
105F:→ deathoflove : 嗎 應該還滿專業的吧 02/03 12:50
106F:→ w3160828 : 繼續吹下去可能說是5萬萬張 H100 02/03 12:51
107F:推 LipaCat5566 : 會員費600台幣變60塊就屌打了 02/03 12:51
108F:推 Rattlesnake : 難怪a股向下噴出 用腳投票 02/03 12:52
109F:→ Rattlesnake : 吹一堆多猛結果沒人買中國 02/03 12:53
110F:→ jim543000 : 現在實測所需資源就是少很多 02/03 12:56
111F:推 hcwang1126 : 500萬是ㄧ次 但還是低於同業 02/03 12:58
112F:噓 fashsboy : 就算13億美...也是很便宜阿... 02/03 12:59
113F:噓 shepherdd35 : 員工從小到大吃的奶粉錢算了沒? 02/03 13:01
114F:推 Derry20732 : 吹哨壯膽 02/03 13:01
115F:推 horb : Deepseek的算力是租的。只算租金。有點像半導體代工 02/03 13:01
116F:→ horb : 分散成本 02/03 13:01
117F:→ horb : 不過即使真的算機台設備。還是成本比較低 02/03 13:05
118F:推 suhhwanjen : 嗯 nvdia 和微軟都沒你懂 02/03 13:11
119F:推 capssan : DS的算力來源目前不可得 租的是指他們的算法結合 02/03 13:12
120F:→ capssan : 租金得出來的成本接近它們聲稱的成本 02/03 13:12
121F:→ RaiGend0519 : 430億台幣比起OpenAI…? 02/03 13:16
122F:推 StarTouching: 才兩倍點麵線系統 02/03 13:20
123F:→ a9564208 : 這個就在講幹話而已 02/03 13:26
124F:推 maxty : OpenAI零頭都不只 02/03 13:27
125F:→ saisai34 : 果然 , 430億成本吹成500萬 歐印NVDA @v@ 02/03 13:30
126F:噓 yesyesyesyes: 哈哈,算模型把硬體成本也算入唷? 02/03 13:35
127F:→ yesyesyesyes: 全世界就是只算訓練成本啦 02/03 13:36
128F:推 zonppp : 好多五毛~ 沒有open ai 根本就不會有 deepseek 02/03 13:39
129F:推 epicurious : 一直笑人中吹的趕快買硬體啦 02/03 13:41
130F:→ lpmybig : 好了啦 現實就是真的開殺了啊 是不是想騙我接刀 02/03 14:18
131F:推 nowitizki41 : 有跌就是買 02/03 14:36
132F:推 g9911761 : 人工費用美國比中國貴多少? 02/03 15:00
133F:噓 blackpork : 還在那邊審查內容...人家程式碼都開源了 不是很 02/03 15:25
134F:→ blackpork : 想戰,但可以請你先google一下開源的意思嗎?deepse 02/03 15:25
135F:→ blackpork : ek屌的不是他成本低,而是他號稱成本低的同時把程式 02/03 15:25
136F:→ blackpork : 碼丟出來,擺明了大家要抄來抄。這就是為啥各大廠都 02/03 15:25
137F:→ blackpork : 把他的模型導入,因為導入之後就能驗證是不是說大話 02/03 15:25
138F:→ blackpork : 。 02/03 15:25
139F:推 bella1815 : 中國人最愛的中時呢 02/03 15:53
140F:推 BruceChen227: 壯膽^^ 02/03 16:10
141F:噓 drimp : 這個分析很外行 忘記把員工出生時的醫療費用算進去 02/03 17:56
142F:→ drimp : 了 難道員工沒出生有辦法幫公司工作嗎? 02/03 17:56
143F:噓 fivemoonsky8: 不管怎麼算,都比Open ai便宜很多 02/04 00:54
144F:→ drmitseng : 問題是根本沒辦法證實他們真正花在算力上的成本啊 02/04 01:11