作者rexlin (Some like it hot!!)
看板Stock
标题[新闻] DeepSeek低成本破坏价格 恐让AI产业血流
时间Tue Jan 28 16:46:19 2025
-------------------------------发文提醒----------------------------------
1.发文前请先详阅[新闻]分类发文规范,未依规范发文将受处份。
2.连结过长请善用缩网址服务,连结不能点击者板规1-2-2处份。
3.心得/评论请尽量充实,心得过短或滥竽充数将以板规 1-2-3、4-4 水桶处份。
4.发文请依照格式文章标明段落,不符合格式者依4-1删文处分。
------------------------ 按ctrl+y
可删除以上内容。 ----------------------
原文标题:
DeepSeek低成本破坏价格 恐让AI产业血流成河?
原文连结:
https://www.chinatimes.com/realtimenews/20250128001030-260410?chdtv
发布时间:
13:58 2025/01/28
记者署名:
张珈睿
原文内容:
AI公司 DeepSeek继2024年12月底推出DeepSeek V3大语言模型後,2025年1月20日再推出
全新开源推理大模型 R1,同样在多项基准测试中表现卓越,甚至与 OpenAI所推出之o1系
列模型相媲美;此外,与V3一样为价格破坏者,R1更将矛头指向海外国际巨头,引发市场
对AI伺服器及半导体产业链的钜额资本支出未来无法回收之担忧。
DeepSeek-R1 推论输出与Token订价为Chat GPT o1之3%~4%,API服务定价为每百万输入
tokens为人民币1至4元,每百万输出tokens为人民币16元;从中国大陆的语言模型业者月
初开始降价,国际巨头OpenAI、Meta未来恐怕也将加入。
尽管法人认为,企业使用的 API用量增加,语言模型产品仍需要更多GPU来支撑。不过令
市场担心的是,大规模的AI伺服器资本支出尚未开始获利或产生正现金流,就开始面临终
端产品杀价竞争,恐怕使CSP业者未来在硬体上的投入越发保守。
科技业界指出,R1采用全新的训练方法,彻底颠覆传统大语言模型的训练流程。传统上,
大语言模型训练依赖「监督微调(SFT)」过程,即通过大量人工标注数据进行预训练,
再进一步利用强化学习来提升性能。
而DeepSeek直接采用在基础模型上进行强化学习方式,省略耗时耗力的监督微调环节,这
种方式不仅大幅降低对标注数据的需求,还让模型能够自由探索解决问题的多种路径,提
升广泛使用度和适应能力。
在技术设计上,R1 采用群组相对策略优化(Group Relative Policy Optimization,GRPO
)演算法,降低传统强化学习对计算资源的需求;另外,DeepSeek团队创新性地采用「准
确度奖励」与「格式奖励」相结合机制,确保模型生成的答案不仅正确,还具有规范性及
可读性。
R1在多项基准测试中展现惊人的能力。例如,在AIME 2024数学竞赛基准测试中,R1的平
均 pass@1分数达到 79.8%,超越 OpenAI o1-1217模型;在长文本理解、开放式问答等
多领域任务中,R1的性能亦超越前代模型 DeepSeek-V3。
更颠覆市场的是,为使更多用户能够享受到 R1 的强大推理能力,DeepSeek 团队进行模
型蒸馏,将 R1的能力迁移至小型模型,供不同资源需求的开发者或研究者使用,并采
MIT License将此免费开源。给予用户最大程度的使用自由,支持模型蒸馏,可将推理能
力蒸馏到更小的模型。
心得/评论:
白菜价直接抢市,不得不说中国搞内卷很有一套
这价格还真的没什麽好挑剔的
--
※ 发信站: 批踢踢实业坊(ptt.cc), 来自: 61.228.177.133 (台湾)
※ 文章网址: https://webptt.com/cn.aspx?n=bbs/Stock/M.1738053981.A.415.html
1F:推 sheng76314 : 乐观其成 一个月200镁真的太坑 01/28 16:46
2F:推 xiaoyao : 新闻利空连发 + 老谢看坏。稳了 01/28 16:47
3F:推 wiki67la : 恐慌什,美GG都在强弹了 01/28 16:47
4F:→ wiki67la : 世界离不开台积电,也离不开台湾 01/28 16:47
5F:推 Alphaz : 最好卷到免费 01/28 16:49
6F:→ HsihHan : 中时? 01/28 16:50
7F:→ arkin : 大陆真的是不管什麽产业都搞低价这招 01/28 16:53
8F:→ invidia : 血流成河 01/28 16:54
9F:→ walelile : 他不一个月两百美,会有一狗票人失业 01/28 16:54
10F:→ xiaoyao : 中时 常常唱衰台积 不意外 01/28 16:54
11F:→ walelile : 有几个菜鸟工程师能干的赢AI 01/28 16:55
12F:推 s213092921 : 怎麽会血流成河?DS这个收费价格还有盈利耶 01/28 16:55
13F:→ walelile : 两百美其实也是一狗票人失业XD 01/28 16:55
14F:→ HsihHan : 养套杀是承自管仲卖鹿的商战手法 他卷一时你卷一世 01/28 16:56
15F:推 a0808996 : ds白菜价还能获利 其他人卖这麽贵还要亏钱 01/28 16:56
16F:→ a0808996 : 钱是不是都被污走了 01/28 16:56
17F:→ DHC1115 : TSM大涨2%你怕是没看到喔 01/28 16:57
18F:→ tctv2002 : 是欧喷AI赚太大 01/28 16:59
19F:推 HAPPYISCASH : deepseek的意义 01/28 16:59
20F:→ HAPPYISCASH : 又不是叫大家都去用deepseek 01/28 16:59
21F:→ HAPPYISCASH : 而是大家会采用deepseek的演算法 01/28 16:59
22F:→ HAPPYISCASH : 脑残绿营全站到处贴自己跟deepseek的对话框 01/28 16:59
23F:→ HAPPYISCASH : 笑死 01/28 16:59
24F:→ elmer : 中国AI aka 中国足球 01/28 16:59
25F:→ elmer : 继续这样搞,真是可惜大好河山 01/28 16:59
27F:→ SRNOB : 台湾有台积电!! 01/28 17:04
28F:→ tctv2002 : deepseek适合比较一般人低阶需求 而欧喷AI比较适合 01/28 17:04
29F:→ tctv2002 : 高端需求 01/28 17:04
30F:→ lookapen : 打鸡血的高材生.. 会是天才吗 01/28 17:06
31F:嘘 AustinRivers: 怎麽不说推广快市场大 01/28 17:10
32F:→ eatbandott : 听君一席话.... 01/28 17:11
33F:→ flipflap : 笑了 01/28 17:23
34F:推 redbeanbread: 工程师炒房仔 失业没差 01/28 17:27
35F:推 simba1222 : 低成本让更多企业使用这样才好 01/28 17:32
36F:→ missucrystal: 太慢了吧 都在V了 01/28 17:34
37F:推 sion1993 : 传产未来大好? 01/28 17:42
38F:→ agoo : 一些敏感提问,不是答非所问,就是以党说法为准 01/28 17:44
39F:嘘 cityhunter04: 硬体价格就那样,是要怎麽低价血流成河? 01/28 17:56
40F:→ cosplayH : -13% 弹2%能算反弹的吗 开盘不要继续探险不错了 01/28 17:59
41F:推 ahlolha : 敏感问题还好啦 欧美模型遇到DEI也会出现窝不知道 01/28 18:12
42F:→ ataky : 这玩意一定是越便宜越好啊 01/28 18:17
44F:推 NaoGaTsu : R1真的蛮强的,又不需要现行这麽庞大的算力,的确是 01/28 18:24
45F:→ NaoGaTsu : 成本效益上很大的进步。 01/28 18:24
46F:→ qazwsx0128 : 美国人薪水拿那麽多,该调降了 01/28 18:30
47F:→ cerwvk : 降低入门, 不代表很ok, 用显卡的观念, 3060 5090的 01/28 18:31
48F:→ cerwvk : 市场区隔, 能用5090的话, 为啥要用3060? 01/28 18:31
49F:推 NaoGaTsu : 因为不是每个人都需要用到5090啊 不然3060谁在用? 01/28 18:33
50F:推 tenshou : 真的便宜好用 01/28 18:35
51F:推 sheng76314 : 因为3060 不到一万 5090要八万捏 01/28 18:43
52F:→ tsuneo : 反正都是让人失业..不用五十步笑百步 01/28 18:51
53F:推 ronga : 理论上受到冲击的也是大型语言模型 例如chat-gpt 01/28 18:58
54F:→ ronga : 他商业模式会被DeepSeek影响 逼得不降价 01/28 18:58
55F:→ Liberl : OpenAI之後应该会推出特定应用的中型模型 01/28 19:20
56F:→ Liberl : deepseek很明显在数学和程式上表现不错 01/28 19:20
57F:→ Liberl : 这就是被特定调教出来的 01/28 19:20
58F:推 freeclouds : 降价好啊 20美金真的太贵 01/28 19:43
59F:推 CaTkinGG : 软体才是AI的主角 硬体却圈走最多钱很奇怪啊 01/28 19:50