作者strlen (strlen)
看板Stock
标题Re: [新闻] 迪士尼大规模裁员千人 曾获奥斯卡肯定「
时间Thu Apr 16 02:37:15 2026
很多人不晓得这波的严重性
AI的第二次GPT时刻已经到了
以下是 semianalysis 的文
https://tinyurl.com/yhtreuc2
以下是GPT整理的重点:
近来 GPU 租赁市场正进入新一轮明显的供不应求阶段,其中最具代表性的指标,就是
H100 一年期租赁价格在短短几个月内大幅上升。从 2025 年 10 月的每小时每颗 GPU
1.70 美元,到了 2026 年 3 月已涨到 2.35 美元,涨幅约达 40%。这不只是单一型号的
现象,H200、B200 等其他高阶 GPU 的租赁资源同样相当难找,甚至连随选型的
on-demand GPU 也几乎全面售罄。整体市场呈现出一种很鲜明的状态:价格持续垫高,但
供给依然极度吃紧。
这一波需求暴增,并不是由单一因素造成,而是多股力量同时叠加的结果。首先,像
Claude Code、agentic AI 与多代理工作流这类新型应用,正在快速推高 token 消耗与
整体算力需求。其次,开放模型的扩散也进一步扩大了市场需求,例如 GLM、Kimi K2.5
这类模型,让更多企业与开发者更容易导入 AI,进而带动 GPU 使用量攀升。除此之外,
影像与影片生成的需求持续成长,也让推论端的算力压力不断升高。同时,Anthropic、
OpenAI 等大型 AI 公司本身仍在高速扩张,它们对 GPU 资源的持续吸纳,也让市场更难
回到宽松状态。
更值得注意的是,市场原本的预期其实和现在的发展方向完全不同。先前不少人认为,随
着 Blackwell 平台逐步上线,旧一代的 Hopper GPU,也就是 H100 与 H200,租赁价格
应该会逐渐走低。但实际情况却恰恰相反。Hopper 产品的需求不但没有转弱,某些场景
下甚至变得更强。背後的原因在於,不同工作负载适合的 GPU 并不相同,较新一代的产
品并不会自动取代所有旧卡的市场位置。换句话说,新 GPU 的推出,并没有让旧 GPU 失
去价值,反而因为整体 AI 算力需求太强,让各世代产品都持续处於高需求状态。
除了需求端强劲之外,供给端的情况也没有好转,反而变得更加严峻。DRAM、NAND 等记
忆体价格上涨,直接推高了 AI 伺服器的整体成本,导致部分原本预计部署的新丛集被延
後,甚至被取消。另一方面,Blackwell 新平台的交期也被拉长,许多原本预计在 2026
年中以前陆续上线的产能,早就已经被市场预订完毕。这代表即使新硬体正在进场,短期
内也很难真正缓解市场压力,因为新增供给一出现就立刻被需求吸收掉了。
从市场结构来看,GPU 租赁市场其实可以分成几个不同层次。短期租赁主要包括
on-demand、spot,以及三个月以下的合约,这一层的价格平常可能维持稳定,但只要使
用率冲到极限,就可能突然跳涨。中期合约涵盖三个月到三年以上的区段,这是整体市场
中最重要、也最能反映价格变化趋势的部分。至於四到五年的长期承购,则主要由大型
AI Labs 主导,它们往往一次锁定非常大量的算力资源。也因为如此,现在市场主导权已
经明显转移到 Neocloud 与 hyperscalers 手中。过去供应商彼此竞争激烈,现在却已经
成为卖方市场,供应商不只可以要求更高预付款、更长租期与更好的价格条件,甚至还能
主动挑选客户与安排合约时程。GPU 算力在当前环境下,已经不再只是可以慢慢议价的商
品,而是极具稀缺性的战略资源。
这样的趋势,又因为 AI Labs 大量锁定长约产能而进一步加剧。许多四到五年的大型承
购合约,规模可以达到 50MW、100MW 甚至更高。这些 AI Labs 不只吃掉新上线的大型丛
集,也会选择续租既有的 H100 与 H200 产能,使原本有机会重新流回市场的资源被继续
锁住。这样的结果,就是中短期市场变得更加缺货,供需失衡的情况更难缓解。
在短期内,GPU 租赁价格继续上涨的可能性,仍然高於下跌。
接下来的观察重点,主要在於三件事:
第一,GB300 等新一代丛集上线的速度,是否足以追上需求成长;
第二,AI 硬体供应链的短缺问题会不会进一步恶化;
第三,AI Labs 的营收规模与 AI 工具的实际使用量,是否还会持续快速扩张。
如果这三个方向没有出现明显降温讯号,那麽 GPU 租赁市场维持高价、甚至继续上行,仍然
是相对更可能发生的情境。
--
这篇文章是在 4/2 就上线的
但那时大家注意力还在战争上
这波因为 claude code 带起来的 agents 热潮
算力需求是过去预估的好几倍以上
甚至 Anthropic 自己都错估需求
没有在更早的时候布局更多算力
以至於现在嘎不过来
模型被迫降智
服务也整天当机
而欧喷酱那边看到
整间公司也急转弯欧硬 codex
应该过两天就会推终极版 agents 和新模型
就是准备要跟 opus 和 claude code 大干一场
事实上目前成绩也相当不错
codex app 2月到现在已经三百多万活跃用户
然後去年吉普力之乱让欧喷酱吓到
疯狂抄算力抄到一堆人觉得肯定泡沫
但赛翁之马 现在 Claude 服务端那边整天出包 当机
https://i.meee.com.tw/Wuv1tHp.png
而 codex 稳如老狗
https://i.meee.com.tw/Vnya8Dm.png
Anthropic 看到这样 会做什麽事?
当然是他X的买爆算力啊
买!都买!买给他爆!
欧喷酱本来就花钱不手软了
其它像狗家阿祖甚至老马的xAI一样也是通通都买爆
然後 agents 也绝不会只让 codex 和 claude code 专美於前
最後通通一定都会跑进来卷死大家
中国这边
最失败的就是买个H200还在那边扭扭捏捏
再不赶快差距只会进一步扩大
而且落後的速度非常非常快
就算模型本身再强
没有算力也没办法把需求吃下来
最後只能白白让对手抢得先机
现在看到算力相关的千万不要再迟疑了
目前市场上意识到这件事的人还相对很少
还有一群像贝瑞这样SB在唱衰算力概念股
他完全不懂 claude code 和 codex 有多恐怖
--
※ 发信站: 批踢踢实业坊(ptt.cc), 来自: 1.160.5.18 (台湾)
※ 文章网址: https://webptt.com/cn.aspx?n=bbs/Stock/M.1776278241.A.592.html
1F:推 GX90160SS : 第一线软体工程师最早知道死定了 AI准备取代绝大 04/16 03:00
2F:→ GX90160SS : 多数人类 时间问题而已 04/16 03:00
3F:推 a0808996 : 我只觉得ai的出现 会让软体业获利加速下降 04/16 03:02
4F:→ a0808996 : 如果进入行业门槛进入变低了 那竞争者只会更多 04/16 03:03
5F:→ a0808996 : 竞争者一多就是加速内卷 最後拚价格 04/16 03:03
6F:→ a0808996 : 最後搞到 大家都赚不了钱 04/16 03:04
7F:→ ASKA : 这几个月来 agent 用量大的应该都能感觉到各大厂都 04/16 03:47
8F:→ ASKA : 在 token 紧缩。之前一个月 20镁等级的还蛮够用, 04/16 03:47
9F:→ ASKA : 现在很容易一下子就乾了要等 cd 时间到 04/16 03:47
10F:→ ASKA : openai 还把 sora 停掉,就知道其实事情有点大条。 04/16 03:49
11F:→ ASKA : 当然把 token 拿来卖真的有钢需可以赚钱的 04/16 03:49
12F:→ ASKA : 前几个星期都是工作到紧要关头要 cd 一两个小时。 04/16 03:51
13F:→ ASKA : 只好课金增加临时 token,之前都不会这样,就算要 04/16 03:51
14F:→ ASKA : Cd 也是一个小时内。 04/16 03:51
15F:→ ASKA : 最近就乾脆加钱升级订阅等级了。我觉得这种应该不 04/16 03:52
16F:→ ASKA : 少... 04/16 03:52
17F:→ mtmmy : 不急 後面大概还有17次GPT时刻 04/16 04:25
18F:推 herculus6502: 蒜粒不够 太太太 04/16 06:59
19F:推 onekoni : 空蛙:不管啦泡沫就是泡沫淹死我都算泡沫 04/16 08:06
20F:推 h311013 : Claude:我们将提供1000镁/月的增量token订阅 04/16 08:45
21F:推 Ashand : 所以NBIS最近在涨这个? 04/16 08:57
22F:→ godzella : 用ai整理ai生成的文章、我们还要花时间去读? 04/16 09:26
23F:→ godzella : 一天才24小时还要睡觉、等那些疯子卷完吧 04/16 09:27
24F:推 offstage : 以前软体工程师薪资高,是靠着资讯不对称,让一般 04/16 09:29
25F:→ offstage : 有想法、有领域专业知识,但不懂得怎麽让电脑替他 04/16 09:29
26F:→ offstage : 工作赚钱的人,付费请软体工程师帮他跟电脑沟通, 04/16 09:29
27F:→ offstage : 也就是写程式,现在AI做得更快。把软体工程师换成 04/16 09:30
28F:→ offstage : 绘图设计师也可以。 04/16 09:30
29F:推 ronga : 想太多了 你没有软体工程师的知识 终究会遇到天花板 04/16 09:39
30F:→ ronga : 我美术朋友就遇到了,还不是要我帮他收尾 04/16 09:39
31F:推 VScode : 同意 现在想买mac studio顶规还买不到 AI的需求太 04/16 10:52
32F:→ VScode : 夸张了 无止境的成长 买的装备根本跟不上 04/16 10:52
33F:→ bndan : 取代(X) 浓缩(O) 就这样 要跨下一个时期时间未知 04/16 11:14
34F:→ bndan : 换句话说 卷不是AI自己来 是人拿着AI互卷 输的掰掰 04/16 11:15
35F:→ bndan : 赢的拿x1.5~2倍薪吧 (因为卷掉3~4人) 04/16 11:16
36F:推 offstage : AI不会取代所有的工程师,顶多取代9成。 04/16 11:45
37F:→ offstage : 剩下那一成的人,用来解决AI解决不了的问题。 04/16 11:45
38F:→ offstage : 就像插秧机不会取代所有的农夫,因为至少要有一个 04/16 11:46
39F:→ offstage : 人留下来操作插秧机。 04/16 11:46
40F:推 yesyesyesyes: 软体工程师应该都心知肚明,这条路已经死了 04/16 12:57