作者humbler (兽人H)
看板Stock
标题[新闻] 成本低廉 中国AI初创DeepSeek震撼矽谷
时间Mon Jan 27 14:30:41 2025
原文标题:
成本低廉 中国AI初创DeepSeek震撼矽谷
原文连结:
https://udn.com/news/story/6811/8516686
发布时间:
2025-01-27 14:17
记者署名:
无
原文内容:
中国AI新创公司「深度求索」(DeepSeek)近期先後发布「DeepSeek-V3」和「DeepSeek-R1
」两款大模型,由於成本低廉,性能与OpenAI相当,让矽谷震惊,甚至引发Meta内部的恐
慌。分析认为,总部位於杭州的DeepSeek可能将改写AI大模型领域的游戏规则。
财联社报导,甚至有投资者将辉达上周五重挫3.12%的原因指向DeepSeek的一夜爆火。德
国「世界报」知名市场评论员Holger Zschaepitz表示:「中国的DeepSeek可能代表对美
国股市的最大威胁,因为该公司似乎以极低的成本构建了一个突破性的人工智慧模型,并
且无需使用尖端晶片。这让人质疑投入该行业的数千亿美元资本支出的实际效用。」
据报导,DeepSeek仅用2048片H800显示卡 (GPU)、耗时两个月,就训练出了一个6710亿参
数的DeepSeek-V3。相较於Meta训练参数量4050亿的Llama 3,用了1万6384片更强的H100
显示卡,花了54天。DeepSeek的训练效率提升了11倍。
中媒「每日经济新闻」26日报导称,在川普总统宣布5000亿美元的「星际之门」
(Stargate)发展人工智慧基础建设计画之际,DeepSeek以极低的价格建立了突破性的AI模
型,且未使用尖端晶片,让人们质疑,AI行业数千亿美元资本的巨额投入,是否真为最有
效的方法?
报导回顾,去年12月27日,DeepSeek推出开源模型「DeepSeek-V3」。AI系统排名网站「
聊天机器人竞技场」(Chatbot Arena)显示,「DeepSeek-V3」在所有模型中排名第七,在
开源模型排第一。且「DeepSeek-V3」是全球前十中,性价比最高的模型。
不到一个月,今年1月20日,DeepSeek再推出「DeepSeek-R1」,24日「DeepSeek-R1」在
聊天机器人竞技场综合榜单上排名第三,与顶尖推理模型、OpenAI推出的o1并列。同时,
测评机构「Artificial-Analysis」对「DeepSeek-R1」的初始基准测试结果也显示,「
DeepSeek-R1」在AI分析质量指数中取得第二高分,价格则是o1的约30分之1。
「每日经济新闻」称,24日一篇发布在匿名平台teamblind上的文章疯传,一位自称是
Meta员工称,Meta内部因为DeepSeek模型进入恐慌模式,该文员工写道,「DeepSeek-V3
」在基准测试中,已经让(Meta推出的)Llama 4相形见绌,而更让人难堪的是,一家「仅
用550万美元训练预算的中国公司」就做到了这一点。
该匿名文指,工程师正争分夺秒分析DeepSeek,试图复制其中的一切可能技术。另外,「
DeepSeek-R1」的出现,也让情况更加严峻。
然而,美国人工智慧数据基础设施新创公司Scale AI执行长Alexandr Wang最近接受CNBC
采访时爆料,DeepSeek拥有大约五万个辉达最先进的H100 GPU,并指「但是很明显他们不
能说出来,因为这违反了美国所实施的出口管制,我相信他们拥有比外界想像的更多,他
们未来会被晶片管制,和出口管制所限制」。
心得/评论:
AI回归原点
还是比谁的模型写得更好
中国领先美国
DeepSeek证明
不用花大钱买一堆尖端晶片
仍然能得到好结果
矽谷圈难怪会恐慌
这波AI竞赛
终於从硬体回归到软体
--
如果还有来世,我想当一个兽人
--
※ 发信站: 批踢踢实业坊(ptt.cc), 来自: 1.169.247.64 (台湾)
※ 文章网址: https://webptt.com/cn.aspx?n=bbs/Stock/M.1737959443.A.78C.html
1F:→ TaiwanUp : 中国通缩真看不到尽头了 01/27 14:31
2F:→ breacal : 怎麽一堆罐头支吹文啦 01/27 14:31
3F:→ zer0319 : 美国是尽量提高毛利,中国是一直砍价 01/27 14:34
4F:推 julian42 : 原来ai 泡沫指的是硬体 01/27 14:35
5F:推 matlab1106 : 中国进入电车市场後才让人知道美国利润抓多高 01/27 14:35
6F:推 vindiesl2000: 拆穿国王的新衣 01/27 14:35
7F:推 ssdd740419 : 原本我1999吃到饱薛翻 现在跑出99元 慌了 01/27 14:37
8F:→ transfight : QQ豪抖啊啊啊啊啊啊啊啊啊啊啊啊啊啊! 01/27 14:37
9F:推 Usmall857 : 写文章的今天很忙还没放年假吗?cc 01/27 14:37
10F:推 kinki5566 : 会有人说不能问64跟习近平就是垃圾 01/27 14:37
11F:推 poeoe : AI时代技术革新就是这麽快 01/27 14:38
12F:推 matlab1106 : 直接让矽谷那些人噱资本市场的骗局曝光 01/27 14:39
13F:推 z23061542 : 丸子蒸的丸子 01/27 14:39
14F:→ ojh : 难怪nv惨崩 ai果然泡沫一场 01/27 14:39
15F:推 Goodanswer : 通缩搞不好还真的没像主流经济理论说的完全不利 01/27 14:40
16F:→ TaiwanUp : 核电厂骗局终於要爆了 01/27 14:40
17F:→ TaiwanUp : 投资一堆核电厂 根本弊大於利 01/27 14:41
18F:→ vicklin : 这个不是通缩是技术.. 01/27 14:41
19F:→ joe0934 : 太棒了。有低价欸唉 01/27 14:41
20F:→ vicklin : 先搞清楚定义 01/27 14:42
21F:推 slimak : 请教DS团队可以养活多少人? 01/27 14:42
22F:→ vicklin : 喔,对,如果这是真的那核电真的炸了 01/27 14:42
23F:推 redbeanbread: 炒房仔的报应 01/27 14:43
24F:→ slimak : 以後航海王可以直接套翻译 汉化组失业 01/27 14:43
27F:推 fishyki : 不爽自己花钱用贵的啊XD 01/27 14:45
28F:→ baka1412 : deep 01/27 14:48
29F:推 falken : 生命会找出路,美国强势打压最终还是让中国找到解法 01/27 14:49
30F:推 jerry10307 : 既电动车太阳能後,中AI又赢 01/27 14:49
31F:推 QQFU : 不要再浪费投资在台积那麽贵制程,爽 01/27 14:50
32F:推 nocash : 那我们台GG怎麽办? 01/27 14:52
33F:推 zxcv12300 : 看来AI股差不多了 01/27 14:52
34F:推 TaiwanUp : 绿能AI指日可待 01/27 14:52
35F:推 g27834618 : all in中股罗 嘻嘻 中吹大获全胜! 01/27 14:53
36F:推 gain : 本来可以卖100把铲子,没想到人家2把铲子一样挖的 01/27 14:54
37F:→ gain : 到金矿 01/27 14:54
38F:推 Usmall857 : 尼真的淫了 01/27 14:55
39F:→ CCNCCN : 吹起来 01/27 14:55
40F:→ matlab1106 : 最惨的事还是路边杂货店买的铲子就好了 完全不像 01/27 14:56
41F:推 tangolosss : 爱支病的开心死了 支那果然太强大 超英赶美 01/27 14:56
42F:→ matlab1106 : 皮衣老板说要他家最好的铲子 01/27 14:56
43F:推 jim543000 : 没挖到金矿 只能说挖的深度一样 01/27 14:56
44F:嘘 FireJ : 新闻吹成这样,人家上证指数都没变好吗 01/27 14:57
45F:→ aewul : 高端AI价格泡泡要被戳破了.. 01/27 14:59
46F:→ yang83329 : 直接爆开 01/27 15:00
47F:推 Jerry469 : 好多篇XD 01/27 15:00
48F:推 q541700 : 卷起来卷起来卷起来才有希望 01/27 15:00
49F:嘘 junior020486: 最後一段讲了啦,五万颗H100,好了啦支那不要再唬 01/27 15:00
50F:→ junior020486: 烂了 01/27 15:00
51F:→ Jerry469 : 到底多吉 01/27 15:00
52F:→ TaiwanUp : 上证指数在筑跳水台吧 科技大通缩欸 01/27 15:00
53F:推 QQFU : 卷起来好,辉达卖那麽贵,当盘子 01/27 15:02
54F:嘘 Demon6668 : 到底是要吹几篇啦,好啦,中国成最大赢家啦 01/27 15:02
55F:→ kululualex : 呃…最後一段不就是说他们的成本不是他们宣称的这麽 01/27 15:02
56F:→ kululualex : 低吗,其实是用被禁止的5万个H100在训练,所以美国 01/27 15:02
57F:→ kululualex : 之後要查更严了… 01/27 15:02
58F:嘘 xiaoyao : 利空买点 上次韩国常温超导体 抄底赚烂 01/27 15:03
59F:推 pttcatwei : 好奇问 为啥沪深300是跌的? 01/27 15:04
60F:推 Sweet83921 : 也是马上联想到韩国超导呼 XDD 01/27 15:04
61F:推 andy810306 : 就算是5万张也是便宜到不行,乖乖下去吧 01/27 15:04
62F:推 audic : 上篇有说ds就MoE架构的产品,降低成本但使用有局限 01/27 15:05
63F:→ audic : 性 01/27 15:05
64F:推 zxcv12300 : 我们护国神山GG要怎麽办 01/27 15:05
65F:嘘 FireJ : 今天上证 深证 创业 三大版都是收跌,再洗阿 01/27 15:05
66F:推 l11111111 : 模型成本不是用五万颗这样算的好吗 公司有五万张 01/27 15:05
67F:→ xiaoyao : 常温超导 就是让你上车AI好时机 01/27 15:05
68F:→ l11111111 : 但这个模型架构只需要用2048张 01/27 15:05
69F:→ ccdrv : 七巨头当盘子啦 01/27 15:05
70F:→ audic : 提高算力才是降低成本唯一途径 01/27 15:06
71F:推 xiaoyao : 阿姨 威盛集团 大概喷出 01/27 15:07
72F:→ ccw2013 : 等虚拟货币被算出来就下一个破灭的 01/27 15:08
73F:推 gowang19 : 不用职人菜刀切菜 大卖场的刀就能切了 01/27 15:08
74F:→ xiaoyao : 性价比真的好笑。好比iPhone 美国再次伟大 01/27 15:10
75F:推 s800525 : 看到推文才想到韩国超导体,真的经典XD 01/27 15:10
76F:推 gn7722 : 实际上是偷用辉达晶片训练的吧 01/27 15:11
77F:→ xiaoyao : 就故意找利空 杀AI再拉。散户被双巴 01/27 15:11
78F:推 andy810306 : 偷用又怎麽样,更好让巨头抄作业哦 01/27 15:11
79F:推 FIFI8488 : 中国真的是卷王 卷到不行 01/27 15:12
80F:→ andy810306 : 用中国国产你还要自己改模型耶,很难抄作业 01/27 15:12
81F:推 gn7722 : 老美又要开始抓谁走私辉达晶片了 01/27 15:12
82F:→ andy810306 : 给你抓,慢慢抓,反正中国有晶片了 01/27 15:12
84F:推 s881720 : AI is over! 01/27 15:13
85F:推 CaTkinGG : 开源又不是中国爽 是全世界拉近与美国的距离一起爽 01/27 15:13
86F:→ xiaoyao : 中概 金丽蚵 阿姨威盛要喷出啦 赞赞 01/27 15:13
88F:→ xiaoyao : 换个 习包子维尼 问问 01/27 15:15
89F:→ HKCs : 卷才好吧 看看老马 疯狂卷电动车 火箭 卫星通讯 老 01/27 15:16
90F:→ HKCs : 马不卷 资本集团还不知道要躺多久欸 01/27 15:16
91F:→ aloness : 铲子升级成挖土机当然好,但就贵到无法回收投资 01/27 15:18
92F:→ yymoya : 中国会爆炸、山寨和造假,台股不用怕 01/27 15:18
93F:推 gbman : 开源偷用根本没意义XD 01/27 15:18
94F:推 slimak : 兄弟 空军也要赚,我讲完了。 01/27 15:19
95F:推 watchmeisyou: 韩国超导体害我赔了一屁股 01/27 15:19
96F:推 poeoe : 中国在降成本上就是超强的 没办法 01/27 15:20
97F:推 FireJ : 台湾是不是国家都回答不出来 看来要被党修理了XD 01/27 15:21
98F:→ payneblue : 有中国价值的语言模型 01/27 15:26
99F:→ kotoyan : 通篇中国用语 01/27 15:26
100F:推 wmh1109 : 笑死,AI本来就一直是在骗外行人的垃圾,早就预言 01/27 15:26
101F:→ wmh1109 : 会泡沫化了。 01/27 15:26
102F:推 hamcea : 满满吹支文 有趣的是中国尿性就是很爱猛吹 01/27 15:28
103F:推 andy810306 : 推楼上,大夥儿都是聪明人 01/27 15:28
104F:→ andy810306 : 不过这年头傻子比较容易跟风赚到FOMO这一波 01/27 15:28
105F:→ s860703 : 演算法代表一切?硬体不用那麽多了? 01/27 15:30
106F:推 HAPPYISCASH : 用多少颗训练这骗不了人的 01/27 15:30
107F:→ HAPPYISCASH : 因为开源代码 01/27 15:30
108F:→ HAPPYISCASH : 每个人都能复现一次训练过程 01/27 15:30
109F:推 iwcuforever : 不太相信训练资源这麽少,已经是换代科技非技术革 01/27 15:31
110F:→ iwcuforever : 新 01/27 15:31
111F:推 ubei : 真的用二千片的h800?感觉胡烂的吧 01/27 15:31
112F:→ IBIZA : 晶片跌也就算了 AI应用成本降 跟着跌三小... 01/27 15:32
113F:→ HAPPYISCASH : 如果是唬烂的马上就被发现了 01/27 15:32
114F:→ HAPPYISCASH : 就像你的实验过程步骤都公开了 01/27 15:32
115F:→ HAPPYISCASH : 结果外界重做一次 01/27 15:32
116F:→ HAPPYISCASH : 马上可以发现你的实验结果数据对不对的上 01/27 15:32
117F:→ anaydh : 中国一向都是破坏市场的 01/27 15:35
118F:推 andy810306 : 破坏市场是好事啊,干嘛让废物赚到天才软体仔的钱 01/27 15:36
119F:推 vicccf : 不担心 美帝政治算计世界强 再来禁中国就好 01/27 15:37
120F:推 HAPPYISCASH : 这个deepseek对ai产业完全是利多 看不出利空在哪里 01/27 15:38
121F:→ HAPPYISCASH : 01/27 15:38
122F:→ HAPPYISCASH : 顶多是对卖铲子的业者 01/27 15:38
123F:→ HAPPYISCASH : 长期多空还不太确定而已 01/27 15:38
124F:→ HAPPYISCASH : 但是成本降低 让应用端准备百花齐放 01/27 15:38
125F:推 rockrock1127: 结果中国竟然是环保AI XDD 01/27 15:39
126F:→ tctv2002 : 本来只有前几大巨头的AI游戏 现在变得只要有一点 01/27 15:41
127F:→ tctv2002 : 钱就可以玩 硬体还很难说欸 01/27 15:41
128F:推 CaTkinGG : 云端服务商一定会推低成本的模型让市场去做选择的 01/27 15:42
129F:嘘 wayne61108 : 几篇了 好了啦 01/27 15:43
130F:→ CaTkinGG : 不然每个token都在喷钱新创公司玩起来很辛苦 01/27 15:43
131F:→ HAPPYISCASH : 而且ai不是只有语言模型 01/27 15:44
132F:→ HAPPYISCASH : 影像 图片 自动驾驶 又是另外一套训练了 01/27 15:44
133F:→ FreedomTrail: 给2把铲子能挖到金矿的人潜盾机,能挖到啥?也让只 01/27 15:45
134F:→ FreedomTrail: 买得起2把铲子的人看到希望。充满想像空间 01/27 15:45
135F:推 yogofresh : 中国是要用AI辅助工业发展,所以需降低成本 01/27 15:45
136F:→ yogofresh : 美国是要用AI炒股,当然成本要越大才能收割越多韭菜 01/27 15:46
137F:→ fywei : 这种东西跟搜寻引擎一样 没有第二名 zzz 01/27 15:48
138F:→ fywei : 先挖爆再说 中国一直都是玩自己的没差 01/27 15:49
139F:推 hunteryoyoyo: 完蛋啦快逃 01/27 15:50
140F:推 david3033 : 2048片算赢16384片 这我是不太信啦 01/27 15:53
141F:→ david3033 : 当初挖矿都是算力至上 01/27 15:53
142F:推 ots625 : 软体应用好,如同引擎同一颗,可以50匹改成500匹 01/27 15:53
143F:推 andy810306 : 挖矿是固定演算法,你跟创新的AI比,这智商… 01/27 15:53
144F:→ andy810306 : 要比也是比同样的加密货币,有的币不用那麽复杂也 01/27 15:55
145F:→ andy810306 : 能做到加密功能,那代表你设计的加密方式太烂 01/27 15:55
146F:推 andy3231 : 说AI是泡沫的肯定不是软体业的xd 01/27 15:56
147F:推 zx7860601 : 五万个H100是把老美的情报网当装饰吗 01/27 16:01
148F:推 cosmite : 所以是使用5万片H100, 而非2048片H800?那实际成本 01/27 16:06
149F:→ cosmite : 就是原来的70倍, 那DS的成本也没有想像中便宜了 01/27 16:06
151F:推 david3033 : 原来有5万片啊 那果然还是算力至上 01/27 16:09
152F:推 andy810306 : 到底哪来的傻子,5万片有可能全部用下去?其他团队 01/27 16:10
153F:→ andy810306 : 不用测试?新闻都明说只用2048片H800了还在装傻 01/27 16:10
156F:→ andy810306 : 还是有人以为google meta全公司只有一组模型在测试 01/27 16:12
157F:→ c928 : 等等被发现唬烂翻车 01/27 16:15
158F:嘘 TaiTY2021 : 他有说有5万张H100阿... 01/27 16:17
159F:推 renfro928 : 国外有团队完成R1验证,还在扯五万片GPU训练出来的 01/27 16:17
160F:→ renfro928 : 模型,承认别人做得好,很难吗? 01/27 16:17
162F:推 lonelyQQ : 台股要跌烂了 美股也准备完蛋 那些全职股神准备跑 01/27 16:18
163F:→ lonelyQQ : 路 01/27 16:18
164F:→ renfro928 : 实际上台美要担心的是,DS R1是何时完成训练的 01/27 16:18
165F:推 GN02209611 : 今天特特莫名中奖,可以多抄 01/27 16:22
166F:推 bigkuan : 中国创造ai泡沫,笑死了 矽谷 01/27 16:23
167F:推 eriker : 一个公司有5万张H100结果他说都用H800训练的 有人信 01/27 16:23
168F:→ eriker : 喔? 01/27 16:23
169F:→ eriker : AI这种需要爆搜参数的东西 一定是有多少资源用多少 01/27 16:24
170F:→ eriker : inference用多少资源一番两瞪眼 training随便他唬烂 01/27 16:26
171F:推 richjf : 一个竞争对手说deepseek有五万张h100,然後一堆人不 01/27 16:32
172F:→ richjf : 见meta紧张要死,就抓着5万嘲讽。 01/27 16:32
173F:推 tsukirit : 不用他说,开源自己试就知道,还在那边他说,你以 01/27 16:32
174F:→ tsukirit : 为 Meta AMD都白痴吗 01/27 16:32
175F:→ Casper50 : 玩了一下,根本就笨的要死,过滤一堆东西,东西也记 01/27 16:33
176F:→ Casper50 : 不起来 01/27 16:33
177F:推 notneme159 : 那拿他的模型改会更快吗 01/27 16:34
178F:推 I95D : 赢麻了,强到飞起,遥遥领先 01/27 16:40
179F:推 walker6765 : 中国的垃圾笑笑就好,跟华为三摺机一样笑话 01/27 16:45
180F:推 aa00788 : 战狼杀爆七巨头 01/27 16:45
181F:嘘 littleosi : 五万张H100从黑市买的价格多少呀?成本低?笑死! 01/27 16:53
182F:→ littleosi : 这个新闻是叫美国继续加强制裁吗?笑死! 01/27 16:53
183F:推 momochacha : 卷到後面大家都没钱赚 01/27 16:55
184F:推 horb : 逻辑有点怪。美国巨头落後了。不是应该买更多MV晶片 01/27 17:01
185F:→ horb : 来追赶吗 01/27 17:01
186F:→ horb : MV晶片 01/27 17:01
187F:→ horb : NV…苹果的自动修正真烂 01/27 17:02
188F:推 taikouhncheu: 但Deepseak 问到台湾会当机 还是得付费用o1 01/27 17:08
189F:推 cobrasgo : 是不是吹的市场会告诉你 01/27 17:14
190F:→ materu : 梁文锋自己都说缺晶片,剩乡民觉得不缺 01/27 17:23
191F:嘘 JOKO58802218: 高成本被打脸XDD 01/27 17:24
192F:推 totomo168 : 让阿美看看卷的恐怖 01/27 17:38
193F:推 kissa0924307: 巨头落後的是软体 写的烂 不是硬体问题 01/27 17:41
194F:→ kissa0924307: 市场是怕巨头意识到硬体也许不用这麽多 靠软体就能 01/27 17:43
195F:→ kissa0924307: 弄出可用的产品 然後砍资本支出 01/27 17:43
196F:→ hn84679402 : 你信这是初创?这根本就国家力量在搞好吗 看看马云 01/27 17:44
197F:→ hn84679402 : 看看萝莉如此相似 01/27 17:44
198F:推 jingbaby77 : 穿穿镇怒 01/27 17:53
199F:推 WTF55665566 : Deepseek别说问到敏感字眼就当机 多问几次 速度明 01/27 18:03
200F:→ WTF55665566 : 显下降 而且回答品质也完全不如ChatGPT 纯粹就是短 01/27 18:03
201F:→ WTF55665566 : 线影响炒作股票而已 01/27 18:03
203F:→ heinzblack : 还是要靠老黄 01/27 18:05
204F:→ s8721038 : Deepseed证明需要更多高阶伺服器,才能提供更多人服 01/27 18:13
205F:→ s8721038 : 务 01/27 18:13
206F:→ BoyceChu : 中国果然具有狼性 01/27 18:31
207F:推 FirePopcorn : 我个人觉得claude 比较好 01/27 18:41
208F:推 Roderickey : deepseek分析演算法论文重点整理也不错 01/27 18:42
209F:推 wingtoya : 唬烂居多 01/27 18:48
211F:嘘 haopig : 栅栏仔今天上班很勤劳 01/27 19:55
212F:推 tokight : 整天酸64,在台湾就是228。都是历史了,能不能「讲 01/27 19:59
213F:→ tokight : 」到底对你多重要?要知道历史不会去念历史系喔 01/27 19:59
214F:→ kougousei : 228台湾有不能讲? 楼上在瞎比啥 01/27 20:07
215F:推 cosmite : 用了R1 deep think, 等了几分钟还没给答案看起来像 01/27 20:31
216F:→ cosmite : 当机了?这正常的吗?太多人在用? 01/27 20:31
219F:→ m9315030 : 美国公想要的不是可用的东西.是能压倒对手的东西吧? 01/27 20:46
220F:→ m9315030 : 怎麽会软体输了就砍硬体支出去学中国?? 01/27 20:47
221F:→ patrickk : 228台湾还有放假 64不知道中国何时才会放假 01/27 20:48
222F:推 huabandd : 软体才是根本 01/27 21:04
223F:→ owenxeve : 但这种会洗脑你的ai,我不敢用啊 01/27 21:51
224F:推 bamm : 总觉得过几天就会翻车 先捡便宜的NVDA 01/27 22:56
225F:推 s0920151048 : 不用怕 台湾有 chatDPP 可以抗衡 01/28 00:15
226F:推 gostt : 美国产品利润如此高 为何支持他? 手机 电车 01/28 07:59
227F:→ seanidiot : 可以怀疑成本和走私晶片问题,但证据呢? 01/28 10:17