作者chesterhe (chesterhe)
看板Stock
标题Re: [新闻] DeepSeek 遇大规模网路攻击,暂时只支援
时间Wed Jan 29 17:26:08 2025
※ 引述《WinNOKIA (海神)》之铭言:
: 1. DeepSeek创办人梁文锋,少年股神变AI大神
: 2. 纽约时报指出,DeepSeek是由中国对冲基金幻方量化(High-Flyer)创办
: 3. DeepSeek 宣称,训练成本仅 557.6 万美元,几乎是其他科技巨头大型语言模型的十
: 分之一成本,这个费用也差不多是一位 AI 主管的年薪而已。
: 综合以上媒体报导与揭露来看,DeepSeek是什麽状况,不就很清楚了吗?
Musk赞同投资公司Atreides Management合夥人兼资讯长贝克(Gavin Baker)在X提到
DeepSeek的R1低成本来自在训练和推理效率上,取得了真正的算法突破
例如 FP8 训练、MLA(机器学习加速)和多 token 预测。
训练过程中涉及大量的知识蒸馏(distillation)
这意味着在没有无限制存取 GPT-4o 和 o1 的情况下,这项训练几乎不可能完成。
并提出质疑对中国限制最先进 GPU 的出口,却不阻止其蒸馏美国的顶尖 AI 模型
这基本上让出口限制变得毫无意义
AI 基础设施领域的现有赢家面临的最大风险是
两年内,R1的蒸馏版本可能会在高端智慧型手机上运行
Musk称AJ will be everywhere.(AJ应为笔误AI)
总之DeepSeek推出的模型低成本除了技术上突破外,很大基础是建立在GPT
但在高阶GPU管制下,要透过训练超越OpenAI是不可能的
而且如果之後OpenAI防堵知识蒸馏,连推新版本都有困难
所以吹牛大赛大概也差不多该接近尾声了
那竞争布局可能为何? GPT给了答案
https://imgur.com/wNCJOYB
「50B AI」指的是一个拥有500亿个参数的大型语言模型(LLM)
相当於 GPT-3.5 的规模
另川普於 2025 年 1 月 21 日发布启动5000 亿美元「Stargate」(星际之门)
人工智慧(AI)计画。参与的公司包括 OpenAI、软银 和 甲骨文。
而 DeepSeek 则於 2025 年 1 月 20 日推出了其新模型 「DeepSeek-R1」。
要说巧合也太巧,R1推出目的大概率除了宣示要走向AI设备端,防堵OpenAI垄断外
就是政治上的大外宣,中国可以用较少资本训练出竞争级别的AI
甚至影响美国AI产业的投资者信心,改变资本流向
--
※ 发信站: 批踢踢实业坊(ptt.cc), 来自: 61.71.244.40 (台湾)
※ 文章网址: https://webptt.com/cn.aspx?n=bbs/Stock/M.1738142770.A.3AC.html
1F:推 tw00172848 : 所以要多还是空? 股点是啥 01/29 17:28
2F:推 Sianan : 不就对岸一贯套路 在顶尖科技上跟你有差距 但在中 01/29 17:30
3F:→ Sianan : 低阶可以卷死你 01/29 17:30
4F:推 herculus6502: 铲子商笑而不语 01/29 17:32
5F:→ jo4 : 没gpt就生不出便宜的deepseek 成本都前人扛了 01/29 17:33
6F:推 gbman : DS开源就是卖模型!第一天上班XD 01/29 17:35
7F:→ gbman : 以後GOOGLE应该也要收费被查询太多次CC 01/29 17:36
8F:推 fujioqq : 从头到尾感觉越看越像做空AI股而炒的XD 01/29 17:36
9F:推 lpmybig : 是啊 那模型v2的时候还根本没人讲 01/29 17:39
10F:推 gbman : 效能被赶上又不是免费!赶快找理由安抚消费者CC 01/29 17:41
11F:→ Leo4891 : 意思就是美国可能会考虑不给你开源了 免得你中国 01/29 17:41
12F:→ Leo4891 : 公司都拿去优化 01/29 17:41
13F:→ gbman : OPENAI新模型没开源啊CC 01/29 17:42
14F:推 fgkor123 : 只有不给你用才能防堵,不给用=没钱钱 01/29 17:43
15F:→ CCH2022 : 做空,低接,大外宣,AI普及往前迈进,各种因素都 01/29 17:43
16F:→ CCH2022 : 有。每个国家都要有主权AI,未来要普及化,持续硬 01/29 17:43
17F:→ CCH2022 : 体建设还是需要。 01/29 17:43
18F:推 gbman : 美国封开源那应该是世界大笑话CC 01/29 17:45
19F:推 fgkor123 : 阿祖拿诈骗的钱一直开源一直爽 01/29 17:47
20F:推 NexusPrime : 难怪成本低,建立在别人的基础上再微调当然快又省 01/29 17:56
21F:→ NexusPrime : 钱 01/29 17:56
22F:推 gbman : 一堆都这样做啊!最先受害的是GOOGLE XD 01/29 17:59
23F:推 ctx705f : 马斯克跟贝克?什麽侧翼 01/29 18:01
24F:推 tr920 : 其实就先限制像祖克柏这种把LLM最尖端美国技术开源 01/29 18:04
25F:→ tr920 : 的害群之马就可以了 01/29 18:04
26F:推 s56565566123: 特准备崩烂 01/29 18:09
27F:推 pideo : 这篇的意思是说,一时蒸馏一时爽,一直蒸馏一直爽 01/29 18:21
28F:→ pideo : 吗 01/29 18:21
29F:推 dongdong0405: 这样听起来GG还是最後的赢家 01/29 18:25
30F:推 SpursDynasty: AIPC喷? 01/29 18:34
31F:→ turndown4wat: 手机跑得动这个? 01/29 19:01
短期不可能 但趋势要往这个方向 到时可能逼得OpenAI也要卖买断版的低阶AI了
32F:→ sellgd : 你自己生成式AI没盗用网路上图文创作? 01/29 21:33
※ 编辑: chesterhe (61.71.244.40 台湾), 01/29/2025 23:05:57
33F:推 GiPaPa : 不用两年 你现在抓1.5b的版本就能轻松跑了 02/10 15:59