作者hesenberg (2030美食家 )
看板Stock
标题Re: [新闻] 联发科蔡力行示警AI恐撞「电力墙」 抛10
时间Mon Feb 23 11:01:01 2026
问ai很多事情影响力比电力大
以2022为基准
1. 软体架构 (Software Architecture:演算法优化)
原理:软体演算法是省电杠杆最大的一环。透过量化(Quantization),将模型从 16 位
元(FP16)降至 4 位元(INT4/FP4)甚至 1 位元,资料搬移与乘法运算的耗电会呈指数
级下降。此外,导入 MoE(混合专家架构)与稀疏化(Sparsity),让模型在每次生成文
字时只需唤醒 10%~20% 的参数,其余神经网路处於不耗电的休眠状态。
单位电力提升预估:约 4.0 倍(用极少的硬体工作量,达成同等的软体输出)。
2. Rubin + Groq 架构理念融合 (极致微架构与无控制冗余)
原理:
NVIDIA Rubin 代表了次世代极致的 Tensor Core 微架构,原生支援超低精度(FP4)运
算。
Groq(LPU) 的核心是「确定性执行(Deterministic Execution)」。传统 GPU 为了排
程,内部有极度耗电的动态调度器(Scheduler)与复杂快取;Groq 将这些控制逻辑全数
拔除,交由软体编译器排程,让矽晶片面积与电力近乎 100% 转化为纯数学运算。
结合两者(Rubin的运算密度 + Groq消除控制耗电),能消灭晶片内部的「无效耗能(Si
licon Tax)」。
单位电力提升预估:约 2.5 倍。
3. TSMC 台积电 2奈米制程 (TSMC N2 Process)
原理:从 5/4 奈米的 FinFET 跨入 2 奈米,台积电首度导入 GAA(环绕闸极奈米片电晶
体) 与 BSPDN(背面供电网路)。GAA 能从四面八方完美控制电流,彻底解决漏电问题
,并允许晶片在**更低的电压(Vdd)**下驱动。由於动态功耗与电压的平方成正比,降
低电压能带来庞大的节能红利。
单位电力提升预估:约 1.8 倍(纯半导体物理特性的跃进)。
4. TPU 架构采用 (Systolic Array 脉动阵列)
原理:Google TPU 等专用加速晶片(ASIC)的核心是**「脉动阵列(Systolic Array)
」**。在做 AI 最关键的矩阵相乘时,资料像水流一样在运算单元(ALU)之间直接传递
并累加,不需要每次都将中间结果写回极耗电的暂存器(Registers)。舍弃通用 GPU 的
包袱,换来矩阵运算的极致省电。
单位电力提升预估:约 1.5 倍。
5. HBM 采用 (High Bandwidth Memory 高频宽记忆体)
原理:打破「记忆体墙」。在 AI 运算中「搬运资料」的耗电往往大於「计算本身」。HB
M 透过 3D 矽穿孔(TSV)与 2.5D 封装,将记忆体紧紧叠在运算晶片旁边,并用「超宽
通道、低时脉」传输。这使每传输 1 bit 资料的能耗(pJ/bit)远低於传统 GDDR,且晶
片不再因为「等资料」而白白空转耗电。
单位电力提升预估:约 1.5 倍。
6. 液冷架构 (Liquid Cooling)
原理:
系统层次:传统气冷机房的 PUE(电力使用效率)约 1.5(伺服器吃 1 瓦,冷气与暴力
风扇要耗 0.5 瓦)。改用水冷或浸没式液冷,能将 PUE 降至 1.05~1.1。
晶片层次:半导体具有「漏电流(Leakage Current)」,温度越高漏电越严重。液冷将
晶片压制在 50蚓 以下低温,直接减少晶片 10%~15% 的无效静态功耗。
单位电力提升预估:约 1.3 倍。
7. 光通讯技术 (Silicon Photonics / CPO 共同封装光学)
原理:在庞大的 AI 丛集中,高达 20%~25% 的系统功耗用於「晶片与晶片间的网路传输
」。传统铜线在超高频宽下的传输能耗极高(约 15~20 pJ/bit)。改用矽光子技术将电
讯号转为光子传递,传输能耗可暴降至 2~5 pJ/bit。省下的庞大网路耗电,全数释放还
给运算核心。
单位电力提升预估:约 1.2 倍。
在系统工程学中,这 7 项技术由於作用在完全独立的不同物理层级(软体演算法、硬体
架构、半导体制程、电路设计、封装距离、物理降温、光学传输),它们解决的是一条生
产线上的不同瓶颈。因此,这些技术带来的效能提升是**「相乘(Multiplicative)」**
的乘数效应,而非单纯相加。
我们将上述预估值进行连乘计算:
软体 (4.0) 휠架构 (2.5) 휠2奈米 (1.8) 휠TPU (1.5) 휠HBM (1.5) 휠液冷 (1.3) 휊光通讯 (1.2)
4.0휲.5=10.0
10.0휱.8=18.0
18.0휱.5=27.0
27.0휱.5=40.5
40.5휱.3=52.65
52.65휱.2=63.18Í뼊
其实今年ai变现大概1000亿美金
比如沃尔玛 reels anthropic cat
如果单位电力运算效率提升十倍不够用
那意味着ai产值将突破兆美元
--
※ 发信站: 批踢踢实业坊(ptt.cc), 来自: 111.71.72.222 (台湾)
※ 文章网址: https://webptt.com/cn.aspx?n=bbs/Stock/M.1771815663.A.743.html
1F:→ Howard2 : 我昨天问AI 它说今天台股会因为川普关税大跌 02/23 11:02
2F:嘘 cityhunter04: 人类整天问Ai喔….. 02/23 11:04
3F:推 arthur7 : 台积电讲错了A16才有背部供电 02/23 11:10
4F:嘘 EnosKP : 你觉得这些是AI想出来的还是被喂的? 02/23 11:22
5F:嘘 rebel : 要贴AI结果也整理好 4.0?2.5是什麽鬼东西 02/23 11:27
6F:嘘 roseritter : 问AI 丢一堆名词出来 跟热力学课本有啥两样 02/23 11:28
7F:推 okderla : 好险本科生略懂略懂这些名词 02/23 11:37
8F:嘘 prussian : 这些哪个不在蔡明介说的关键方向里? 没有阅读能力 02/23 11:49
9F:→ prussian : ,ai喂再多人蔘给你也是当饲料吃 02/23 11:49
10F:推 guk : 这人2008年可是干了大事 02/23 12:00
11F:嘘 breathair : 你讲的跟电力墙没关系,你讲的是电力/Token比值,这 02/23 12:20
12F:→ breathair : 个一直在降没错。 02/23 12:20
13F:→ breathair : 什麽是电力墙?假设一块GPU可以用五年而且仍然需求 02/23 12:20
14F:→ breathair : 远大於供给,那麽这五年内生产的所有GPU,机柜等等 02/23 12:20
15F:→ breathair : 全部都会同时满载状况,而台积电生产速度越来越快, 02/23 12:20
16F:→ breathair : 每颗晶片耗能越来越多,散热系统也耗电越来越多,晶 02/23 12:20
17F:→ breathair : 片机柜制造的速度远大於电力扩充的速度,在物理上遇 02/23 12:20
18F:→ breathair : 到的电力墙,跟能效比一点关系也没有 02/23 12:20
19F:→ aloness : 新的油电混合车油耗20km/L,路上就没有旧车来占用 02/23 12:30
20F:→ aloness : 道路容量了吗,这是一样的概念 02/23 12:30
21F:→ aloness : 新的运算能力升级,旧的成本摊提完了还是照样用 02/23 12:31
22F:嘘 cityhunter04: 普通人不懂热力学正常啦…但ai帮你整理好还看不懂 02/23 12:36
23F:→ cityhunter04: !白问.. 02/23 12:36
24F:推 towe77 : 不懂PUE说没关...看新加坡很难吗 02/23 12:38