作者Latte7 (nonono)
看板Stock
標題[請益] Deepseek v3 對台積電有影響嗎
時間Sat Dec 28 19:08:23 2024
https://www.ettoday.net/amp/amp_news.php7?news_id=2882228&ref=mw&from=google.c
om
中國展示了他們的新模型
重點在它極低的成本
好奇這樣是不是代表科技巨頭們不需要這麼多晶片?
會對台積電的晶片需求有影響嗎
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 114.137.70.92 (臺灣)
※ 文章網址: https://webptt.com/m.aspx?n=bbs/Stock/M.1735384105.A.C87.html
1F:→ SabreN : 所以微軟、谷歌、Meta、亞馬遜、馬斯克,他們都是 12/28 19:10
2F:→ SabreN : 傻瓜,中國這間最聰明,是這樣嗎? 12/28 19:10
3F:→ SabreN : 建議你放空美股七巨頭和台積電,一定賺大錢的 12/28 19:10
4F:推 jerrychuang : 樓上這想法很危險 12/28 19:11
5F:推 kkes0001 : 26的AI是真有點東西,這個看論文可以知道,但也僅 12/28 19:13
6F:→ kkes0001 : 就這樣 12/28 19:13
8F:→ cccict : 可以畫出屠殺最多中國人的人嗎? 12/28 19:15
9F:推 Heedictator : 泡沫 12/28 19:16
10F:→ kkes0001 : 吹和gpt 4o一個等級是他們論文的數據,寫過論文的 12/28 19:17
11F:→ kkes0001 : 都知道這邊論文肯定是挑最好的擺,實際如何還得實 12/28 19:17
12F:→ kkes0001 : 際驗證,到時候chatbot arena 或者hugging face 看 12/28 19:17
13F:→ kkes0001 : 看? 12/28 19:17
14F:推 aegis43210 : 表示兩國AI競爭更激進,是利多 12/28 19:18
15F:推 noahlin : 是不是剛聽完股癌XD 12/28 19:18
16F:推 keel90135 : 抖音的世界線核融合能電池都已經誕生了 12/28 19:21
17F:推 gladopo : 那這種再靠gb200跑不就爽到飛天 12/28 19:25
18F:推 hellophoenix: 等其他人複現出來再說吧 都忘記超導的論文了嗎 12/28 19:28
19F:推 matthewcheng: 那張圖? 12/28 19:31
20F:推 Lowpapa : AI已死 12/28 19:35
21F:→ payneblue : 能實際運用再說… 12/28 19:37
22F:推 nfsong : 要跑很久 12/28 19:43
23F:→ nfsong : 參數也比較少 12/28 19:43
24F:→ leo6315 : 對岸的碼農工作時數應該抵美國五個 12/28 19:54
25F:推 easyman : 對,用 55nm 就跑得動,all in 力積電 12/28 19:56
26F:推 jhnny : 短期內不會有什麼影響... 12/28 19:57
27F:推 chih5120 : 你是不是聽了今天的股癌 12/28 19:57
28F:推 Homeparty : 對普通人夠用了,scalling law比較重要 12/28 20:02
29F:推 nfsong : 很多人跳進去了 還有人在質疑ai 12/28 20:04
30F:→ aegis43210 : 西台灣因為算力不足,所以才需要模型剪枝,美國能用 12/28 20:05
31F:→ aegis43210 : 百萬顆GPU去硬幹,就不需要省成本 12/28 20:05
32F:→ aegis43210 : 西台灣是在為愈來愈難取得老黃的GPU做準備 12/28 20:06
33F:推 nfsong : 我記得 去年有人說 訓練大部分時間都在搬運 12/28 20:08
34F:→ nfsong : 所以時間差不了太多 12/28 20:08
35F:→ nfsong : 甚至有人開始考慮分散式訓練 12/28 20:09
36F:→ nfsong : 也才導致 後來出現HBM 記憶體 降低搬運 12/28 20:10
37F:→ nfsong : 重點是對岸每年有1200萬畢業的大學生 出來肝 12/28 20:10
38F:→ nfsong : 其他國家沒有 12/28 20:10
39F:→ nfsong : 對岸鮮肉多 還內卷.... 12/28 20:12
40F:→ homeworkboy : 搞不好可以用手連線出ai 12/28 20:14
41F:推 shaun851025 : 介殼在馬來西亞就可以買到GB200了 12/28 20:16
42F:→ bnn : 剪枝本身可能會加入人為bias 但不好說這模型變好壞 12/28 20:18
43F:推 cchh179 : 這個deepseek 對政治有特定立場 可以去試試看 嘻嘻 12/28 20:19
44F:→ cchh179 : 基本上是把黑的說成白的 12/28 20:19
45F:推 Lhmstu : 還不錯啊,就AI模型的戰爭 12/28 20:32
46F:→ Lhmstu : 但是都要晶片倒是真的 12/28 20:32
47F:推 Cliffx : 你是不是聽股癌講的 12/28 20:37
48F:推 sdbb : 丸子,下週ai股一根 12/28 20:40
49F:→ netsphere : inference time scale law 12/28 21:07
50F:→ JoeyChen : 7樓圖是真的嗎 12/28 21:11
51F:推 dani1992 : 7樓是真的,但只代表訓練資料偷的,模型應該是真的 12/28 21:17
52F:推 s56565566123: 股癌要獲利了結 12/28 21:29
53F:推 yrhhimamr : 其實是中國網站轉問GPT然後再改的 12/28 21:31
54F:推 sova0809 : 吹了半天 碼農跟中企還是乖乖架梯子想辦法弄GPT 12/28 21:48
55F:→ sova0809 : 用GPT 出錯了可以怪GPT 用中國垃圾 出錯就準備被告 12/28 21:51
56F:→ Latte7 : 我怎麼想都覺得這東西撼動不了hyperscaler , 12/28 22:17
57F:→ Latte7 : 看推文去聽股癌,感覺他講的沒什麼根據,歐美會拿 12/28 22:19
58F:→ Latte7 : 中國的東西challenge 自己嗎… 他們應該覺得這超low 12/28 22:19
59F:→ Latte7 : 吧.. 12/28 22:19
60F:推 lusifa2007 : 這個如果用先進製程會更猛 對面是沒先進製程只好這 12/28 22:35
61F:→ lusifa2007 : 樣玩 12/28 22:35
62F:推 WD640G : 擔心這個不如擔心日本搞出2奈米 12/28 22:38
63F:推 cute15825 : 他們不用考慮智慧財產權的話 訓練出來是真低猛 12/28 22:43
64F:噓 s910612 : 阿就股癌想出貨了啊 12/28 23:05
65F:→ nfsong : 都開源的 因為知道其他人訓練不了 12/28 23:07
66F:→ nfsong : xAI 開源當天 一堆人下載後發現要8張H100 就砍了 12/28 23:07
67F:推 nfsong : xAI Grok-1 model size 310B , deepseek 670B 12/28 23:15
68F:→ nfsong : 看起來模型參數不小 12/28 23:15
69F:噓 ohsexygirl : 上面講出貨的….出貨要吹好的,不是吹壞的… 12/28 23:18
70F:推 nfsong : 股癌 蠻有道理的阿 有人拿既有的模型優化 12/28 23:21
71F:→ nfsong : 像是GPT 4o 12/28 23:21
72F:→ nfsong : 或是最新的openAI o3 12/28 23:22
73F:→ nfsong : 只要有人願意餵AI 中文資料 應該都樂見 12/28 23:22
74F:→ nfsong : 把四庫全書 龍藏經 一堆古文全部餵進去 12/28 23:23
75F:→ nfsong : 反正對岸 破壞價格也不是一天兩天 12/28 23:23
76F:→ nfsong : 手機 面板 記憶體 電動車 只要內卷後都爛大街 12/28 23:24
77F:推 nfsong : 不過 openAI 看起來更重視 AGI指數 12/28 23:28
78F:→ nfsong : 不用知道太多 但是要符合人性 12/28 23:28
79F:推 energyy1104 : 誰出貨是放利空== 有夠韭 12/28 23:33
80F:推 nfsong : 通用AI 以後應該會偏向AGI 困難的都不回答 12/28 23:44
81F:→ nfsong : 都會叫你去問專業的 12/28 23:44
82F:→ nfsong : 然後就要收錢了 12/28 23:45
83F:→ nfsong : 資料中心蓋了也不是只訓練 通用模型 12/28 23:45
84F:→ nfsong : 專業模型才是有錢賺 而且不開源 12/28 23:45
85F:→ nfsong : 蛋白質 和 化學組成 12/28 23:46
86F:推 cowking520 : 整天妄想別人要出貨 真可悲 12/28 23:53
87F:推 FreedomTrail: 看他的商業模式跟如何獲利,再看模型優劣是否為致 12/28 23:58
88F:→ FreedomTrail: 命因素。 12/28 23:58
89F:推 jimmy12332 : 現在在搞知識蒸餾 之後語言模型一定會變小 12/29 00:05
90F:推 chang1248w : 這隻用moe才這麼省 12/29 00:43
91F:噓 gnckt : 講出貨的是87是不是?哪個主力會想要在自己出貨前 12/29 01:39
92F:→ gnckt : 股價先崩啊,傻逼是不是啊 12/29 01:39
93F:推 gn02620938 : 看到推文就可以安心放空了 一堆87 12/29 09:36
94F:推 clecer : GPU即將泡沫了 12/29 10:04
95F:噓 s910612 : 穩了 一堆沒聽仔cc 12/29 10:52
96F:推 aria0520 : GG幾年前就有在招AI人才了 我也被邀去面過 12/29 12:33
97F:→ aria0520 : 不過聽完覺得GG還沒準備在AI上下重本 或許這幾年又 12/29 12:34
98F:→ aria0520 : 有變化 12/29 12:34
99F:推 eriker : 對岸ai論文多就是敢說謊跟造假 12/29 12:57
100F:推 Mograine : 推文真的蠻好笑的 台灣啥屁都沒有 還有臉說別人XD 12/29 13:57
101F:推 epicurious : 股癌如果想出貨應該會講這個不用擔心吧,某樓快樂寶 12/29 18:09
102F:→ epicurious : 貝邏輯 12/29 18:09
103F:→ epicurious : 你如果要出貨,會提醒別人風險嗎?韭菜快樂寶貝的想 12/29 18:10
104F:→ epicurious : 法 12/29 18:10
105F:噓 Sana : 您股癌了嗎? 12/29 19:02
106F:→ Alwen : MoE模型也能被炒作能這樣= = 12/29 19:56
107F:→ Alwen : 這有點像是對岸缺乏算力的折衷方案 12/29 19:57
108F:→ Alwen : 跟羊駝那種Dense Model是不一樣的東西 12/29 19:57
109F:推 games : 配菜 12/29 21:33
110F:推 seagal : 先知 01/28 01:01
111F:推 Lolyster : 朝聖 01/28 03:00
112F:推 loveyou9527 : 先知 01/28 03:59
113F:推 SRNOB : 朝聖 一樓笑死 01/28 09:41
114F:推 Devenskorte : 還真會 01/28 09:42
115F:推 DevilEnvy : 先知寂寞 01/28 09:56
116F:→ s213092921 : 朝聖一樓,可以彎腰撿鑽石了 01/28 09:58
117F:推 anaydh : 先知 01/28 10:01
118F:推 jagger : 一樓先知 01/28 10:12
119F:推 raja98643667: 一樓猛 01/28 10:18
120F:推 LargerThanU : 搞半天一樓是預言家 01/28 11:23
121F:推 lasaieshy : 一樓先知 01/28 11:56
122F:推 TSMCfabXX : 如果一樓有放空這一波 應該財富自由了 01/28 15:03