作者fly5566 (飞56)
看板Stock
标题[新闻] 研究称DeepSeek的AI 训练成本也很贵 至少
时间Mon Feb 3 11:37:23 2025
原文标题:研究称DeepSeek的AI 训练成本也很贵 至少430亿台币
原文连结:
https://reurl.cc/Q5odeM
发布时间:21:49 2025/02/01
记者署名:中时新闻网 江飞宇
原文内容:
https://i.imgur.com/hN2WEH9.jpeg
半导体行业分析公司指出,DeepSeek的基础成本、伺服器搭建成本至少要13亿美元。(图
/shutterstock/达志)
最近上线的中国大陆AI软体DeepSeek引发业界震撼,大陆声称建构DeepSeek的基础成本很
低,仅是OpenAI的零头,最广为流传的说法之一,是DeepSeek V3 的训练成本约为 600万
美元(1.9亿新台币)。不过这个说法被半导业行业研究公司 SemiAnalysis质疑,他们认为
DeepSeek的成本应该至少有13亿美元(约430亿新台币)。
有趣的工程(Interesting Engineering)报导,SemiAnalysis 指出,它未能解释几个关键
因素。600 万美元的估算,只考虑了 GPU 预训练费用,忽略了公司在研发、基础设施和
其他必要成本方面的大量投资。报告强调,DeepSeek 的总伺服器资本支出,就高达13亿
美元。
根据报导,DeepSeek使用了大约 5万张Hopper GPU(微架构的),这导致业界产生了一些误
解。以为这就等於5万张辉达H100 GPU(Nvidia Hopper H100 GPU)。
SemiAnalysis 澄清说,辉达的GPU 有多种型号,包括 H800、H100 以及 NVIDIA 为应对
美国出口限制而生产的 H20。也是中国大陆可以获得的类型。
该报告称,与一些较大的人工智慧实验室不同,DeepSeek资料中心采用精简模型,来提高
其灵活性和效率。这算是一种不错的适应能力,分析显示 DeepSeek 的 R1模型,表现出
与 OpenAI 的 o1 相当的推理能力。
然而,这不意味着DeepSeek在所有指标都性能领先。
虽然 DeepSeek 的定价策略引起了关注和赞誉,但有一个重要的警告:功能相似的
Google Gemini Flash 2.0 ,在API 服务存取时更加经济。这使得 DeepSeek 处於一个十
字路口,平衡效能和成本是其未来成功的关键。
但是,DeepSeek的多头潜在注意力(Multi-Head Latent Attention,MLA),是个颇具突
破性的创新,这种方法透过减少键值 (KV) 快取的使用,显着降低了 93.3% 的推理成本
。不过, DeepSeek 带来的创新,也很可能会被渴望保持竞争力的西方人工智慧实验室迅
速采用。
报告推测,DeepSeek可能产生不错的竞争环境,令其他同行也必须具有更快的适应能力。
总之,SemiAnalysis 描绘了 DeepSeek 在 AI 领域的当前地位。它的成本结构、GPU 利
用率,和创新能力,确实成为一名强大的AI参与者。
心得/评论:
上周由於Deepseek的横空出世,宣称能够降低98%成本
杀得许多美股科技大头血流成河,今天台股开盘也被连累
若到头来低成本只是"号称",又只能产出审查阉割後的不实内容
牛皮吹破被看破手脚的後果.....
--
※ 发信站: 批踢踢实业坊(ptt.cc), 来自: 218.164.83.160 (台湾)
※ 文章网址: https://webptt.com/cn.aspx?n=bbs/Stock/M.1738553847.A.69B.html
1F:→ auerbach : 继续壮胆XD 02/03 11:38
2F:推 chord210 : 这两天有用一下网页版的看看,他有把思考过程写出 02/03 11:38
3F:→ chord210 : 来比open 的好很多 02/03 11:38
4F:推 WTF55665566 : 讲实话会让鹿港仔不开心 02/03 11:39
5F:推 herculus6502: OpenAI一堆大老出走 想也知道有问题 02/03 11:39
6F:→ Leo4891 : 500万镁本来就只有一次的训练成本 啥硬体人事都没 02/03 11:39
7F:→ Leo4891 : 纳进去 02/03 11:39
8F:→ WTF55665566 : Open一样有思考过程啊 第一天用吗?☺ 02/03 11:39
9F:→ tindy : 训练成本就是训练成本 全世界算法一样 02/03 11:39
10F:推 puritylife : ㄟ 连公司基础设施都要算进去? 02/03 11:40
11F:→ WenliYang : 好了啦…… 02/03 11:40
12F:→ tindy : 拿其他成本是要混摇什麽视听 02/03 11:40
13F:→ Leo4891 : open ai 最近的一个版本不是也有逻辑推导 02/03 11:40
14F:推 kuosos520 : 原来如此,难怪中国人现在过这麽惨 02/03 11:41
15F:推 matlab1106 : 连员工成长过程的成本都没算到吧 02/03 11:41
16F:→ realmd : 笑死 那麽下一次发新模型要说0成本吗 02/03 11:41
17F:推 kotorichan : 喔喔 那他API定价怎麽这麽低 02/03 11:41
18F:→ MgEuCuLiZn : 是套了多少 真的可悲 02/03 11:41
19F:推 meta41110 : 浮木又来了0.0 02/03 11:41
20F:嘘 ksjr : 把openai的那些成本一起拿进来比阿== 02/03 11:44
21F:推 gk1329 : 好了喇 02/03 11:44
22F:推 tanchuchan : 显着降低了 93.3% 的推理成本 02/03 11:45
23F:推 daniel3658 : 青鸟浮木 笑死 02/03 11:45
24F:推 Roger5566 : 要这样算 openai只会更贵 02/03 11:45
25F:推 almanch : 华尔街懂玩 02/03 11:47
26F:→ iamaq18c : XDDDDDDDDDDDDDDD 02/03 11:48
27F:→ m9315030 : 中时造反?? 02/03 11:48
28F:推 good200 : 才430亿?面线的系统造价便宜 02/03 11:48
29F:嘘 squeakywheel: 该不会下一步就要说是解放军出资吧? 02/03 11:48
30F:推 knml : ds思考过程超长的 02/03 11:48
31F:推 camp0102 : 百分百正确 02/03 11:49
32F:推 jimmy12332 : 那很便宜欸? 02/03 11:49
33F:→ jhnny : 现在就估值破口….容易怀疑资本支出.. 02/03 11:49
34F:推 shyshyan : 这样第一个模型就超贵 後面模型就可以大幅降低成本 02/03 11:50
35F:→ shyshyan : 超聪明的 02/03 11:50
36F:推 s213092921 : 照同样标准计算,CloseAI只会更贵XDD 02/03 11:50
37F:→ sheng76314 : CloseAI之前就在内斗 02/03 11:51
38F:推 epephanylo : 对 DS超烂 还不快弯腰捡钻石 02/03 11:52
39F:→ calmerrorans: 训练成本和建置成本好像不同 02/03 11:52
40F:→ waijr : 是不是很多人不知道GPU可以用租的 02/03 11:53
41F:推 e446582284 : 那OpenAI的人事费、研发、基建要不要一起算? 继续 02/03 11:53
42F:→ e446582284 : 壮胆 02/03 11:53
43F:推 taiwan1789 : 比closeAI便宜啦,不然closeai收啥贵贵的钱 02/03 11:54
44F:推 zonppp : 遥遥领先! 过三个月後再来看看吧~ 02/03 11:55
45F:推 Brioni : 那也太便宜,OpenAI 算上这些成本喷上天 02/03 11:55
46F:推 DREE : 第一个才叫创新~~之後的都是抄袭~~好听点叫学习改良 02/03 11:56
47F:嘘 samnpc : 训练成本跟巡逻成本都不会分 02/03 11:56
48F:→ samnpc : 建置 02/03 11:56
49F:→ Brioni : 那也改良太多 02/03 11:57
50F:推 Howard000123: 好了啦 你OpenAI多少钱租伺服器 16亿美元一年对不 02/03 11:58
51F:→ Howard000123: 对 02/03 11:58
52F:推 DREE : 第一个研发出来的花的钱绝对是最多的啊~这常识吧!! 02/03 11:58
53F:→ DREE : 一直讲成本低不知道再吹什麽?? 5年後会更低~~ 02/03 11:59
54F:→ zerro7 : 想到那张钓鱼的梗图 突然觉得很贴切 02/03 12:00
55F:→ DREE : 软体的成本绝对越来越低~~程式码复制贴上~~ 02/03 12:00
56F:推 Flyingheart : 急了 同样的东西ㄧ直洗 02/03 12:00
57F:→ pujos : 照这个估法,下个模型固定成本0元??? 02/03 12:01
58F:→ pujos : 哪一家财务估算是这样估的 02/03 12:01
59F:→ easonli000 : 研发跟训练混为一谈 02/03 12:02
60F:嘘 w28103566 : 重点是api成本低 还开源 02/03 12:02
61F:推 camoont : 香不香我不知道, 反正 openAI 很臭 02/03 12:03
62F:→ appledick : 全开源要黑真的有难度啊 02/03 12:03
63F:→ appledick : 美国仔应该很怕中国变民主国家 就此没得嘴了 02/03 12:04
64F:嘘 mangle : 同样逻辑,美国大模型也比现在讲得更贵数十数百倍 02/03 12:04
65F:→ mangle : ….美国光一个管理工程师就600万美元了 02/03 12:04
66F:嘘 set852064 : 继续洗 02/03 12:06
67F:嘘 hank81177 : 点面线也很贵 02/03 12:06
68F:→ tayuplay : 青鸟浮木 02/03 12:07
69F:→ rooo2012 : open里面的人赚了不少钱? 02/03 12:08
70F:推 ots625 : 点面系统表示,我们cp值更高 02/03 12:09
71F:→ Lowpapa : 430e > 6000e 笑死 输不起 02/03 12:09
72F:→ amd3dnow : 至少有成果出来,数发部这麽多预算,成果在哪??? 02/03 12:10
73F:推 sernidle : 是怕deepseek可以用低阶GPU做到高阶GPU的八成效果 02/03 12:13
74F:→ sernidle : ,那高阶GPU是不是卖不掉了 02/03 12:13
75F:→ wholesaler : nv 的股价也没弹回去… 02/03 12:14
76F:→ calmerrorans: 树发布还在考察 别急 02/03 12:14
77F:推 kotorichan : 幻方有5万张h100 那一定是阿共有支助 02/03 12:16
78F:推 taiwan1789 : AI股之前吹太凶了,达子回跌刚好 02/03 12:16
79F:→ kotorichan : 一定还是需要巨大算力 欧引就对了 02/03 12:16
80F:推 jojo396 : 少年AI股神咕噜咕噜 02/03 12:17
81F:→ QooSnow : (你又知道了?) 02/03 12:20
82F:→ piece1 : 所以open酱很便宜对吧?XD 02/03 12:20
83F:→ searchroy : 不用500亿台币,很便宜耶! 02/03 12:23
84F:→ matlab1106 : 对比200亿点面线 这钱花的很值得 02/03 12:26
85F:→ icome : 拿美国人薪水在估? 02/03 12:27
87F:→ janky : 看这个就懂 02/03 12:28
88F:推 yuenda : 急了 赶快发出货文 02/03 12:29
89F:推 GOOGLEISGOD : 多久以前的新闻了... 02/03 12:34
90F:推 epicurious : 营运成本、租赁成本跟资本支出都分不清楚的菜鸡 02/03 12:38
91F:→ dalmatian : 好了啦 美科技巨头都认输采纳了。 02/03 12:38
92F:推 s213092921 : 还有美吹念念不忘DS抄袭CloseAI哈哈哈 02/03 12:38
93F:→ epicurious : 写这篇的当大家都87,还真的不少87 02/03 12:39
94F:→ HAPPYISCASH : deepseek明明就是ai历史中的一个伟大作品 02/03 12:39
95F:→ HAPPYISCASH : 成本就是你openai的10%而已 02/03 12:40
96F:嘘 knives : 恶心 02/03 12:41
97F:→ knives : 这就跟某党删预算一样,在那乱带风向 02/03 12:41
98F:→ HAPPYISCASH : 这篇骗骗笨蛋标题档可以 自己都偷偷承认推理成本降 02/03 12:42
99F:→ HAPPYISCASH : 低93% lol 02/03 12:42
100F:→ knives : 玩文字游戏骗87 02/03 12:42
101F:推 ookkkkoo : 东拼西凑的$$去跟人家乱比较 ㄎㄎ 02/03 12:47
102F:推 a19851106 : gpt思考过程最近才有的哦,第一天用的吗? 02/03 12:48
103F:推 c928 : 现在是川普利空 02/03 12:49
104F:推 deathoflove : semianalysis 不是之前出AMD和NV 效能比较的报告 02/03 12:50
105F:→ deathoflove : 吗 应该还满专业的吧 02/03 12:50
106F:→ w3160828 : 继续吹下去可能说是5万万张 H100 02/03 12:51
107F:推 LipaCat5566 : 会员费600台币变60块就屌打了 02/03 12:51
108F:推 Rattlesnake : 难怪a股向下喷出 用脚投票 02/03 12:52
109F:→ Rattlesnake : 吹一堆多猛结果没人买中国 02/03 12:53
110F:→ jim543000 : 现在实测所需资源就是少很多 02/03 12:56
111F:推 hcwang1126 : 500万是ㄧ次 但还是低於同业 02/03 12:58
112F:嘘 fashsboy : 就算13亿美...也是很便宜阿... 02/03 12:59
113F:嘘 shepherdd35 : 员工从小到大吃的奶粉钱算了没? 02/03 13:01
114F:推 Derry20732 : 吹哨壮胆 02/03 13:01
115F:推 horb : Deepseek的算力是租的。只算租金。有点像半导体代工 02/03 13:01
116F:→ horb : 分散成本 02/03 13:01
117F:→ horb : 不过即使真的算机台设备。还是成本比较低 02/03 13:05
118F:推 suhhwanjen : 嗯 nvdia 和微软都没你懂 02/03 13:11
119F:推 capssan : DS的算力来源目前不可得 租的是指他们的算法结合 02/03 13:12
120F:→ capssan : 租金得出来的成本接近它们声称的成本 02/03 13:12
121F:→ RaiGend0519 : 430亿台币比起OpenAI…? 02/03 13:16
122F:推 StarTouching: 才两倍点面线系统 02/03 13:20
123F:→ a9564208 : 这个就在讲干话而已 02/03 13:26
124F:推 maxty : OpenAI零头都不只 02/03 13:27
125F:→ saisai34 : 果然 , 430亿成本吹成500万 欧印NVDA @v@ 02/03 13:30
126F:嘘 yesyesyesyes: 哈哈,算模型把硬体成本也算入唷? 02/03 13:35
127F:→ yesyesyesyes: 全世界就是只算训练成本啦 02/03 13:36
128F:推 zonppp : 好多五毛~ 没有open ai 根本就不会有 deepseek 02/03 13:39
129F:推 epicurious : 一直笑人中吹的赶快买硬体啦 02/03 13:41
130F:→ lpmybig : 好了啦 现实就是真的开杀了啊 是不是想骗我接刀 02/03 14:18
131F:推 nowitizki41 : 有跌就是买 02/03 14:36
132F:推 g9911761 : 人工费用美国比中国贵多少? 02/03 15:00
133F:嘘 blackpork : 还在那边审查内容...人家程式码都开源了 不是很 02/03 15:25
134F:→ blackpork : 想战,但可以请你先google一下开源的意思吗?deepse 02/03 15:25
135F:→ blackpork : ek屌的不是他成本低,而是他号称成本低的同时把程式 02/03 15:25
136F:→ blackpork : 码丢出来,摆明了大家要抄来抄。这就是为啥各大厂都 02/03 15:25
137F:→ blackpork : 把他的模型导入,因为导入之後就能验证是不是说大话 02/03 15:25
138F:→ blackpork : 。 02/03 15:25
139F:推 bella1815 : 中国人最爱的中时呢 02/03 15:53
140F:推 BruceChen227: 壮胆^^ 02/03 16:10
141F:嘘 drimp : 这个分析很外行 忘记把员工出生时的医疗费用算进去 02/03 17:56
142F:→ drimp : 了 难道员工没出生有办法帮公司工作吗? 02/03 17:56
143F:嘘 fivemoonsky8: 不管怎麽算,都比Open ai便宜很多 02/04 00:54
144F:→ drmitseng : 问题是根本没办法证实他们真正花在算力上的成本啊 02/04 01:11