作者exeex (人非肾咸)
看板Stock
标题Re: [新闻] 与台积电不一样!马斯克公布地表最大晶
时间Tue Mar 24 14:56:11 2026
先别管晶片厂怎麽盖
先来看一下老马之前晶片设计怎麽翻车的
先贴个tesla dojo 2砍掉的新闻
https://techorange.com/2025/08/08/tesla-dojo-shut-down/
技术细节参考
https://electrek.co/2022/08/24/tesla-deep-dive-presentations-dojo-ai-supercomputer/
https://chipsandcheese.com/p/hot-chips-34-teslas-dojo-microarchitecture
他的架构是这样
用354 riscv core组成一个die
再用25个die组成一个tile
最後tile组成运算节点
但这样有个问题
他设计的功率密度太高 需要上水冷
然後die size很大 又要考虑坏点容错
die to die也要考虑path失效的容错
但不是只有晶片良率的坏点
高热长期运转本来就会经常掉点
尤其是这种大规模运算丛集
比如meta这篇
https://engineering.fb.com/2024/06/12/data-infrastructure/training-large-language-models-at-scale-meta/
练LLM基本上都在和节点失效搏斗
神经网路的整个训练流程
只要一个bit翻转都有可能把整个训练杀死
(梯度下降算法,错误会随梯度传播到整个模型)
他的技术只有考虑静态失效
也就是练到一半突然坏一个core是无法处理的
(因为他的软体根据晶片坏哪里,去编译出绕过坏点的程式
坏点必须事先知道)
不管你dojo 2算力多少,训练流程跑不完,就是不能用的
我只能说Tesla还是太天真了
下次记得不要找印度人当主管
--
※ 发信站: 批踢踢实业坊(ptt.cc), 来自: 1.34.98.192 (台湾)
※ 文章网址: https://webptt.com/cn.aspx?n=bbs/Stock/M.1774335376.A.C90.html
1F:推 jaricho : 还给我火星 不要退成月球 03/24 14:57
2F:推 zaqimon : 节点失效 不能叫AI去debug吗 反正现在AI很厉害 03/24 14:58
3F:推 mynumber55 : 靠腰原来是晶片太烂,我以为是成本干不赢老黄 03/24 14:58
4F:推 aloness : 不要找印度人当主管是真的… 03/24 15:00
5F:→ aloness : 甚至当下属都不要,印度人真的是来帮台湾人减寿的( 03/24 15:01
6F:→ aloness : 活活气死 03/24 15:01
7F:推 qaz27966 : 专业说明推 03/24 15:02
8F:推 cloud7515 : 印度人接下来要征服日本了 03/24 15:02
9F:推 hosen : 专业推 03/24 15:03
10F:推 jceefailurer: 重压台积,稳赢 03/24 15:04
11F:→ hosen : 总是有人以为设计只要堆料就好 03/24 15:04
12F:推 joygo : 印度人 很适合老马其实 都是喊大然後无限延期 03/24 15:04
13F:→ dieorrun : 但是印度人的创意我是不怀疑的 像之前的AI无人商店 03/24 15:06
14F:→ dieorrun : 靠的是真人远端当店员 这种创意我真的没有 03/24 15:06
15F:推 aloness : 老马做的最起码会看到他朝着目标做失败的样子,印度 03/24 15:09
16F:→ aloness : 仔是不朝目标做也一样失败给你看 03/24 15:09
17F:→ j32072 : 看起来完全没问题 期待雪茄汉堡产线 03/24 15:11
18F:→ VicLien : 特斯拉搞特规还是可以啦 跟三星拿货也是堪用 自驾 03/24 15:13
19F:→ VicLien : 车先铺好冲卫星 等资本进来鬼转老黄也不是不可能 03/24 15:13
20F:→ VicLien : 反正谁要上太空目前很难绕过马 03/24 15:13
21F:推 s800525 : 搞这个为了冲SPACEX IPO价格吧 03/24 15:14
22F:推 cowaksor : 翻小车已经不稀奇了 要翻世界级的大车 03/24 15:15
23F:→ Flyroach : 无人XX靠的是後方远端摇控不是很多都这样玩吗 03/24 15:17
24F:推 s800525 : 在嘴无人工厂前,特斯拉先把上海厂搬回去美国吧 03/24 15:21
25F:→ s800525 : 连特斯拉一半产能靠中国,还在那画大饼 03/24 15:22
26F:推 Usmall857 : 等合并SPACEX就会转弯了 呵呵 03/24 15:27
27F:推 SkyPlus : 他的自传就有很多画大饼失败的例子,不过也有工程师 03/24 15:28
28F:→ SkyPlus : 这三小KPI,事後却成功的案例 03/24 15:28
29F:→ SkyPlus : 只能给时间证明这次是SpaceX还是boring company了 03/24 15:30
30F:→ SkyPlus : ^(工程师"觉得") 03/24 15:30
31F:推 PTTMAXQQ : 本来以为能移民火星 03/24 15:31
32F:→ PTTMAXQQ : 想不到变成在月球盖工厂QQ 03/24 15:31
33F:推 Xargon0730 : 不要太粗暴 03/24 15:37
34F:推 DDhow : 跟印度阿三合作过就知道他们有多烂 03/24 15:47
35F:推 TISH12311 : 嗯嗯 世界首富翻100次车都不会有事吧 03/24 15:50
36F:→ cleanx : 只是要炒股票 03/24 15:50
37F:→ JKjohnwick : 总有人觉得代工很简单 03/24 15:52
38F:推 hectorbibby : 好,特斯拉 空爆它 03/24 15:53
39F:推 donod : 人家有AI+机器人 这些问题给AI+机器人 轻松突破^^ 03/24 16:01
40F:推 DellSale999 : 相信老马 不相信的裤子都被冲掉好几条惹 产线吃姜母 03/24 16:05
41F:→ DellSale999 : 鸭 03/24 16:05
42F:推 darkangel119: 相信老马 火星算什麽 十年後去仙女座星云观光 03/24 16:28
43F:推 dkfs789 : 不管你信不信反正特粉都会信 03/24 16:29
44F:推 linleex : 火箭跟ai比晶圆难那麽多都能成功了 03/24 17:29
45F:推 create8 : 难怪dojo被砍 03/24 17:41
46F:→ haopig : 马粉真的很狂,居然觉得火箭比晶圆难很多 03/24 18:03
47F:→ fallinlove15: 最後可能只有能吃汉堡有达成 改开速食店之类的 那 03/24 18:07
48F:→ fallinlove15: 用机器人没问题 03/24 18:07
49F:→ aegis43210 : 设计晶片这方面,台湾有创意、世芯、联发科…等公司 03/24 18:30
50F:→ aegis43210 : 可以花钱省事,但这些公司只想自己乱搞,自然容易失 03/24 18:30
51F:→ aegis43210 : 败 03/24 18:30
52F:推 somanyee : ptt最不缺懂一些硬体/系统痛点的人,写七成专业、 03/24 18:37
53F:→ somanyee : 三成情绪的唱衰文 03/24 18:37
54F:→ fallinlove15: 也不缺只会用信仰回应别人质疑的人 03/24 18:46
55F:→ haopig : ptt最不缺什麽都不懂只会喊神功护体的教徒 03/24 18:56
56F:→ southes : 火箭几十年前很多国家就有 03/24 19:06
57F:→ southes : 门槛又不高 03/24 19:06
58F:→ twinmick : 老马本来就失败的业务也不少,但是造神嘛当然都歌颂 03/24 21:21
59F:→ twinmick : 成功的,而且没办法老马成功的还都是能吸目光的.. 03/24 21:23
60F:推 cookies12 : -.-Ai只能用现有的资料训练 你没有的东西怎麽训练? 03/25 01:46
61F:→ cookies12 : 另外AI对系统架构的实行性根本没有感觉 都瞎掰 03/25 01:46