作者chesterhe (chesterhe)
看板Stock
標題Re: [新聞] DeepSeek 遇大規模網路攻擊,暫時只支援
時間Wed Jan 29 17:26:08 2025
※ 引述《WinNOKIA (海神)》之銘言:
: 1. DeepSeek創辦人梁文鋒,少年股神變AI大神
: 2. 紐約時報指出,DeepSeek是由中國對沖基金幻方量化(High-Flyer)創辦
: 3. DeepSeek 宣稱,訓練成本僅 557.6 萬美元,幾乎是其他科技巨頭大型語言模型的十
: 分之一成本,這個費用也差不多是一位 AI 主管的年薪而已。
: 綜合以上媒體報導與揭露來看,DeepSeek是什麼狀況,不就很清楚了嗎?
Musk贊同投資公司Atreides Management合夥人兼資訊長貝克(Gavin Baker)在X提到
DeepSeek的R1低成本來自在訓練和推理效率上,取得了真正的算法突破
例如 FP8 訓練、MLA(機器學習加速)和多 token 預測。
訓練過程中涉及大量的知識蒸餾(distillation)
這意味著在沒有無限制存取 GPT-4o 和 o1 的情況下,這項訓練幾乎不可能完成。
並提出質疑對中國限制最先進 GPU 的出口,卻不阻止其蒸餾美國的頂尖 AI 模型
這基本上讓出口限制變得毫無意義
AI 基礎設施領域的現有贏家面臨的最大風險是
兩年內,R1的蒸餾版本可能會在高端智慧型手機上運行
Musk稱AJ will be everywhere.(AJ應為筆誤AI)
總之DeepSeek推出的模型低成本除了技術上突破外,很大基礎是建立在GPT
但在高階GPU管制下,要透過訓練超越OpenAI是不可能的
而且如果之後OpenAI防堵知識蒸餾,連推新版本都有困難
所以吹牛大賽大概也差不多該接近尾聲了
那競爭布局可能為何? GPT給了答案
https://imgur.com/wNCJOYB
「50B AI」指的是一個擁有500億個參數的大型語言模型(LLM)
相當於 GPT-3.5 的規模
另川普於 2025 年 1 月 21 日發布啟動5000 億美元「Stargate」(星際之門)
人工智慧(AI)計畫。參與的公司包括 OpenAI、軟銀 和 甲骨文。
而 DeepSeek 則於 2025 年 1 月 20 日推出了其新模型 「DeepSeek-R1」。
要說巧合也太巧,R1推出目的大概率除了宣示要走向AI設備端,防堵OpenAI壟斷外
就是政治上的大外宣,中國可以用較少資本訓練出競爭級別的AI
甚至影響美國AI產業的投資者信心,改變資本流向
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 61.71.244.40 (臺灣)
※ 文章網址: https://webptt.com/m.aspx?n=bbs/Stock/M.1738142770.A.3AC.html
1F:推 tw00172848 : 所以要多還是空? 股點是啥 01/29 17:28
2F:推 Sianan : 不就對岸一貫套路 在頂尖科技上跟你有差距 但在中 01/29 17:30
3F:→ Sianan : 低階可以卷死你 01/29 17:30
4F:推 herculus6502: 鏟子商笑而不語 01/29 17:32
5F:→ jo4 : 沒gpt就生不出便宜的deepseek 成本都前人扛了 01/29 17:33
6F:推 gbman : DS開源就是賣模型!第一天上班XD 01/29 17:35
7F:→ gbman : 以後GOOGLE應該也要收費被查詢太多次CC 01/29 17:36
8F:推 fujioqq : 從頭到尾感覺越看越像做空AI股而炒的XD 01/29 17:36
9F:推 lpmybig : 是啊 那模型v2的時候還根本沒人講 01/29 17:39
10F:推 gbman : 效能被趕上又不是免費!趕快找理由安撫消費者CC 01/29 17:41
11F:→ Leo4891 : 意思就是美國可能會考慮不給你開源了 免得你中國 01/29 17:41
12F:→ Leo4891 : 公司都拿去優化 01/29 17:41
13F:→ gbman : OPENAI新模型沒開源啊CC 01/29 17:42
14F:推 fgkor123 : 只有不給你用才能防堵,不給用=沒錢錢 01/29 17:43
15F:→ CCH2022 : 做空,低接,大外宣,AI普及往前邁進,各種因素都 01/29 17:43
16F:→ CCH2022 : 有。每個國家都要有主權AI,未來要普及化,持續硬 01/29 17:43
17F:→ CCH2022 : 體建設還是需要。 01/29 17:43
18F:推 gbman : 美國封開源那應該是世界大笑話CC 01/29 17:45
19F:推 fgkor123 : 阿祖拿詐騙的錢一直開源一直爽 01/29 17:47
20F:推 NexusPrime : 難怪成本低,建立在別人的基礎上再微調當然快又省 01/29 17:56
21F:→ NexusPrime : 錢 01/29 17:56
22F:推 gbman : 一堆都這樣做啊!最先受害的是GOOGLE XD 01/29 17:59
23F:推 ctx705f : 馬斯克跟貝克?什麼側翼 01/29 18:01
24F:推 tr920 : 其實就先限制像祖克柏這種把LLM最尖端美國技術開源 01/29 18:04
25F:→ tr920 : 的害群之馬就可以了 01/29 18:04
26F:推 s56565566123: 特準備崩爛 01/29 18:09
27F:推 pideo : 這篇的意思是說,一時蒸餾一時爽,一直蒸餾一直爽 01/29 18:21
28F:→ pideo : 嗎 01/29 18:21
29F:推 dongdong0405: 這樣聽起來GG還是最後的贏家 01/29 18:25
30F:推 SpursDynasty: AIPC噴? 01/29 18:34
31F:→ turndown4wat: 手機跑得動這個? 01/29 19:01
短期不可能 但趨勢要往這個方向 到時可能逼得OpenAI也要賣買斷版的低階AI了
32F:→ sellgd : 你自己生成式AI沒盜用網路上圖文創作? 01/29 21:33
※ 編輯: chesterhe (61.71.244.40 臺灣), 01/29/2025 23:05:57
33F:推 GiPaPa : 不用兩年 你現在抓1.5b的版本就能輕鬆跑了 02/10 15:59