作者exeex (人非腎鹹)
看板Stock
標題Re: [新聞] 與台積電不一樣!馬斯克公布地表最大晶
時間Tue Mar 24 14:56:11 2026
先別管晶片廠怎麼蓋
先來看一下老馬之前晶片設計怎麼翻車的
先貼個tesla dojo 2砍掉的新聞
https://techorange.com/2025/08/08/tesla-dojo-shut-down/
技術細節參考
https://electrek.co/2022/08/24/tesla-deep-dive-presentations-dojo-ai-supercomputer/
https://chipsandcheese.com/p/hot-chips-34-teslas-dojo-microarchitecture
他的架構是這樣
用354 riscv core組成一個die
再用25個die組成一個tile
最後tile組成運算節點
但這樣有個問題
他設計的功率密度太高 需要上水冷
然後die size很大 又要考慮壞點容錯
die to die也要考慮path失效的容錯
但不是只有晶片良率的壞點
高熱長期運轉本來就會經常掉點
尤其是這種大規模運算叢集
比如meta這篇
https://engineering.fb.com/2024/06/12/data-infrastructure/training-large-language-models-at-scale-meta/
練LLM基本上都在和節點失效搏鬥
神經網路的整個訓練流程
只要一個bit翻轉都有可能把整個訓練殺死
(梯度下降算法,錯誤會隨梯度傳播到整個模型)
他的技術只有考慮靜態失效
也就是練到一半突然壞一個core是無法處理的
(因為他的軟體根據晶片壞哪裡,去編譯出繞過壞點的程式
壞點必須事先知道)
不管你dojo 2算力多少,訓練流程跑不完,就是不能用的
我只能說Tesla還是太天真了
下次記得不要找印度人當主管
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 1.34.98.192 (臺灣)
※ 文章網址: https://webptt.com/m.aspx?n=bbs/Stock/M.1774335376.A.C90.html
1F:推 jaricho : 還給我火星 不要退成月球 03/24 14:57
2F:推 zaqimon : 節點失效 不能叫AI去debug嗎 反正現在AI很厲害 03/24 14:58
3F:推 mynumber55 : 靠腰原來是晶片太爛,我以為是成本幹不贏老黃 03/24 14:58
4F:推 aloness : 不要找印度人當主管是真的… 03/24 15:00
5F:→ aloness : 甚至當下屬都不要,印度人真的是來幫台灣人減壽的( 03/24 15:01
6F:→ aloness : 活活氣死 03/24 15:01
7F:推 qaz27966 : 專業說明推 03/24 15:02
8F:推 cloud7515 : 印度人接下來要征服日本了 03/24 15:02
9F:推 hosen : 專業推 03/24 15:03
10F:推 jceefailurer: 重壓台積,穩贏 03/24 15:04
11F:→ hosen : 總是有人以為設計只要堆料就好 03/24 15:04
12F:推 joygo : 印度人 很適合老馬其實 都是喊大然後無限延期 03/24 15:04
13F:→ dieorrun : 但是印度人的創意我是不懷疑的 像之前的AI無人商店 03/24 15:06
14F:→ dieorrun : 靠的是真人遠端當店員 這種創意我真的沒有 03/24 15:06
15F:推 aloness : 老馬做的最起碼會看到他朝著目標做失敗的樣子,印度 03/24 15:09
16F:→ aloness : 仔是不朝目標做也一樣失敗給你看 03/24 15:09
17F:→ j32072 : 看起來完全沒問題 期待雪茄漢堡產線 03/24 15:11
18F:→ VicLien : 特斯拉搞特規還是可以啦 跟三星拿貨也是堪用 自駕 03/24 15:13
19F:→ VicLien : 車先鋪好衝衛星 等資本進來鬼轉老黃也不是不可能 03/24 15:13
20F:→ VicLien : 反正誰要上太空目前很難繞過馬 03/24 15:13
21F:推 s800525 : 搞這個為了衝SPACEX IPO價格吧 03/24 15:14
22F:推 cowaksor : 翻小車已經不稀奇了 要翻世界級的大車 03/24 15:15
23F:→ Flyroach : 無人XX靠的是後方遠端搖控不是很多都這樣玩嗎 03/24 15:17
24F:推 s800525 : 在嘴無人工廠前,特斯拉先把上海廠搬回去美國吧 03/24 15:21
25F:→ s800525 : 連特斯拉一半產能靠中國,還在那畫大餅 03/24 15:22
26F:推 Usmall857 : 等合併SPACEX就會轉彎了 呵呵 03/24 15:27
27F:推 SkyPlus : 他的自傳就有很多畫大餅失敗的例子,不過也有工程師 03/24 15:28
28F:→ SkyPlus : 這三小KPI,事後卻成功的案例 03/24 15:28
29F:→ SkyPlus : 只能給時間證明這次是SpaceX還是boring company了 03/24 15:30
30F:→ SkyPlus : ^(工程師"覺得") 03/24 15:30
31F:推 PTTMAXQQ : 本來以為能移民火星 03/24 15:31
32F:→ PTTMAXQQ : 想不到變成在月球蓋工廠QQ 03/24 15:31
33F:推 Xargon0730 : 不要太粗暴 03/24 15:37
34F:推 DDhow : 跟印度阿三合作過就知道他們有多爛 03/24 15:47
35F:推 TISH12311 : 嗯嗯 世界首富翻100次車都不會有事吧 03/24 15:50
36F:→ cleanx : 只是要炒股票 03/24 15:50
37F:→ JKjohnwick : 總有人覺得代工很簡單 03/24 15:52
38F:推 hectorbibby : 好,特斯拉 空爆它 03/24 15:53
39F:推 donod : 人家有AI+機器人 這些問題給AI+機器人 輕鬆突破^^ 03/24 16:01
40F:推 DellSale999 : 相信老馬 不相信的褲子都被沖掉好幾條惹 產線吃薑母 03/24 16:05
41F:→ DellSale999 : 鴨 03/24 16:05
42F:推 darkangel119: 相信老馬 火星算什麼 十年後去仙女座星雲觀光 03/24 16:28
43F:推 dkfs789 : 不管你信不信反正特粉都會信 03/24 16:29
44F:推 linleex : 火箭跟ai比晶圓難那麼多都能成功了 03/24 17:29
45F:推 create8 : 難怪dojo被砍 03/24 17:41
46F:→ haopig : 馬粉真的很狂,居然覺得火箭比晶圓難很多 03/24 18:03
47F:→ fallinlove15: 最後可能只有能吃漢堡有達成 改開速食店之類的 那 03/24 18:07
48F:→ fallinlove15: 用機器人沒問題 03/24 18:07
49F:→ aegis43210 : 設計晶片這方面,臺灣有創意、世芯、聯發科…等公司 03/24 18:30
50F:→ aegis43210 : 可以花錢省事,但這些公司只想自己亂搞,自然容易失 03/24 18:30
51F:→ aegis43210 : 敗 03/24 18:30
52F:推 somanyee : ptt最不缺懂一些硬體/系統痛點的人,寫七成專業、 03/24 18:37
53F:→ somanyee : 三成情緒的唱衰文 03/24 18:37
54F:→ fallinlove15: 也不缺只會用信仰回應別人質疑的人 03/24 18:46
55F:→ haopig : ptt最不缺什麼都不懂只會喊神功護體的教徒 03/24 18:56
56F:→ southes : 火箭幾十年前很多國家就有 03/24 19:06
57F:→ southes : 門檻又不高 03/24 19:06
58F:→ twinmick : 老馬本來就失敗的業務也不少,但是造神嘛當然都歌頌 03/24 21:21
59F:→ twinmick : 成功的,而且沒辦法老馬成功的還都是能吸目光的.. 03/24 21:23
60F:推 cookies12 : -.-Ai只能用現有的資料訓練 你沒有的東西怎麼訓練? 03/25 01:46
61F:→ cookies12 : 另外AI對系統架構的實行性根本沒有感覺 都瞎掰 03/25 01:46