Stock 板


LINE

原文标题: MU、WDC、SNDK下跌:为何Google的TurboQuant令记忆体股震荡 来源: https://myppt.cc/FlidrY 内文: 2026.03.25 Investing.com - 尽管科技板块整体表现强劲,记忆体股周三仍然下跌。在Google推出Tur boQuant这项可能降低AI系统记忆体需求的新压缩演算法後,相关股价应声下挫。 SanDisk Corporation(NASDAQ:SNDK)下跌5.7%,美光科技(NASDAQ:MU)下跌3%,西部数据(NA SDAQ:WDC)下跌4.7%,希捷科技(NASDAQ:STX)下跌4%。这些跌幅出现在纳斯达克100指数上 涨之际。 Google推出了TurboQuant,这是一项旨在降低大型语言模型和向量搜寻引擎记忆体消耗的 压缩技术。该演算法解决了键值快取的瓶颈问题,键值快取用於储存AI系统中经常存取的 资讯。 根据Google的公告,TurboQuant可以将键值快取压缩至3位元,无需训练或微调,同时保持模 型准确性。在包括Gemma和Mistral在内的开源模型上进行的测试显示,该技术实现了键值 记忆体大小6倍的缩减。该演算法还在H100 GPU加速器上展现了比未量化键值高达8倍的效 能提升。 该技术透过两个步骤运作:应用PolarQuant方法透过旋转资料向量实现高品质压缩,以及使 用量化Johnson-Lindenstrauss演算法消除残余误差。Google表示,传统的向量量化方法在 记忆体开销中每个数字增加1至2个额外位元,部分抵消了压缩优势。 TurboQuant将在ICLR 2026上发表,而PolarQuant计划在AISTATS 2026上发表。Google在包 括LongBench、Needle In A Haystack、ZeroSCROLLS、RULER和L-Eval在内的基准测试中 测试了这些演算法。 该技术的应用范围超越了AI模型,还包括为大规模搜寻引擎提供动力的向量搜寻功能。 记忆体股今年迄今已大幅上涨,使其容易受到可能降低需求的发展影响。 心得: 虽然我不是专家但让记忆体使用更有效率 听起来很不错吧 目前Google的测试成果斐然 未来真的能这样发展 想必对边缘AI有很大的助力 至於会不会对记忆体需求下降 倒也未必 Google研究底加 窝看不懂 https://myppt.cc/UtVx89 ----- Sent from JPTT on my Google Pixel 7 Pro. --



※ 发信站: 批踢踢实业坊(ptt.cc), 来自: 36.231.153.90 (台湾)
※ 文章网址: https://webptt.com/cn.aspx?n=bbs/Stock/M.1774449572.A.5B4.html
1F:推 OGoTTe : 抓到凶手了 03/25 22:40
2F:推 chocoball : 以後每年都推出新演算法 稳03/25 22:42
3F:推 sdbb : 楼下waitrop03/25 22:42
4F:推 turndown4wat: GOOG也一起下去了 03/25 22:42
5F:→ tomdavis : 照抄deepseek的说法 唉呦省资源 硬体股要完蛋了03/25 22:42
6F:→ sdbb : 楼下LDPC?03/25 22:43
7F:嘘 Marshalkobe2: 自己也下去 厉害03/25 22:43
8F:→ c928 : 谷狗,我活不了你们也给我下来03/25 22:43
9F:推 TureCooler : SpaceX都要IPO了,台股上呀 03/25 22:44
10F:推 handfoxx : GOOG 怎麽也下去了03/25 22:44
11F:嘘 heko77923 : 放屁 google自己也跌惨了03/25 22:46
12F:推 alonzohorse : 看来只剩六分之一价格,牙套50,华崩20 03/25 22:46
13F:→ heko77923 : 要是这麽神早就喷了03/25 22:46
14F:推 Evenpan : 不是因为NVIDIA KVTC吗?03/25 22:46
15F:推 KS571 : 哭啊 阿怎麽自己跟着下去03/25 22:47
16F:推 chachabo : 狗狗式自杀=.=03/25 22:48
※ 编辑: baddaddy (36.231.153.90 台湾), 03/25/2026 22:48:35
17F:推 itwt : 乱讲,是真的Google这样要喷啊,一起下去耶 03/25 22:48
18F:嘘 matlab1106 : 这波能源危机会让这些高耗能的被处理吧 03/25 22:51
19F:→ bnn : 公开演算法的话不会喷啊 别人看论文照抄 03/25 22:52
20F:推 az0102 : 台积电利多 03/25 22:52
21F:推 grayeric : 记忆体 is over 03/25 22:55
22F:推 DWR : 只会用更多的参数 模型越来越大而已 记忆体实际上 03/25 22:56
23F:→ DWR : 不会减少的 03/25 22:56
24F:推 harpuia : 爽啦,狗狗不爽自己下去,也把其他人一起拉下去 03/25 23:00
25F:推 PerfectWorld: 笑死论文都公开了要喷什麽? 一堆没念过研究所是不 03/25 23:01
26F:→ PerfectWorld: 是? 03/25 23:01
27F:嘘 EDFR : OVERBOOKING 03/25 23:02
28F:→ strife : 那用原本的大小不就效能更高 sorry 我有美光 干 03/25 23:02
29F:推 dannpptt : 估狗伤敌一千自损八百 03/25 23:02
30F:推 bs167512 : 一场AI大戏,继续看它们怎麽演 03/25 23:03
31F:推 dennis50253 : 救救南亚科 03/25 23:04
32F:→ receivable : 我以为是SORA停止的消息,存图/影音比文字存储需求 03/25 23:04
33F:→ receivable : 大多了 03/25 23:04
34F:推 HarukaLM : google也跟着下去... 03/25 23:04
35F:→ baka1412 : https://i.imgur.com/CenWqyJ.jpeg 03/25 23:06
36F:推 Barefoot24 : GoogleAI吹那麽大,结果Gemini连个Excel都读不出来 03/25 23:07
37F:→ Barefoot24 : ,白痴 03/25 23:07
38F:推 bcismylove : 都2026了EXCEL PAY还没普及 03/25 23:09
39F:推 spencer222 : 不可能是这个啦 这篇论文2月5号就发了 主要目的是要 03/25 23:11
40F:→ spencer222 : 用不足的缓存跑大模型 压缩资料是要经过encode/deco 03/25 23:11
41F:→ spencer222 : de的 会影响运算速度 03/25 23:11
42F:推 bs167512 : 真正会赚钱的东西没人会告诉你,消息满天飞的东西就 03/25 23:13
43F:→ bs167512 : 是缺钱,叫大家赶快来投资 03/25 23:13
44F:推 bala045 : 压缩不就代表可以布建更多 那跟需求下降有什麽关系 03/25 23:14
45F:推 pornpig32 : KVTC 是 NVIDIA 解决 AI 「记忆力太贵」问题的关键 03/25 23:16
46F:→ pornpig32 : 技术 03/25 23:16
47F:推 letyouselfgo: 估狗不是有自研AI晶片吗怎麽还在用H100 (讽刺 03/25 23:16
48F:→ rooo2012 : 下跌不是因为中东金主的数据中心无法盖 暂时需求没 03/25 23:18
49F:→ rooo2012 : 这麽多? 03/25 23:18
50F:推 yyyyaaaa44 : 明天空南亚科会赢吗 03/25 23:19
51F:推 Samurai : 这像是去年说deepseek算法进步,AI天花板已到一样 03/25 23:20
52F:→ Samurai : 蠢 03/25 23:20
53F:推 pornpig32 : Google 做的 实验时测试硬体是 NVIDIA H100 GPU 03/25 23:22
54F:→ gladopo : 那为什麽NV涨,老黄又可以COSTDOWN了吗 03/25 23:25
55F:推 cosmo7897 : 谷歌这次的突破好像是因为KV cache压缩 推理速度变 03/25 23:25
56F:→ cosmo7897 : 快且记忆体需求降低 03/25 23:25
57F:推 eno03 : 记忆卡娃逃难潮开始了 03/25 23:25
58F:→ ksuenjjr : Google自己也在跌 03/25 23:27
59F:→ bndan : 跟去年那个DEEPSEEK不同 就先不说从已完成的水桶捞 03/25 23:27
60F:推 NEX4036 : 顺势压下去收筹码 03/25 23:28
61F:推 holysong : 下跌找理由,照历史cpu cache跟主机板的记忆体只会 03/25 23:28
62F:→ holysong : 越来越多 03/25 23:28
63F:→ bndan : 答案这件事..就节省效能本身是让整体能扩大使用能量 03/25 23:28
64F:→ bndan : 所以当然不会改变NV 台G 等卖铲子一条龙的情况 03/25 23:29
65F:→ OxFFFFFFFF : 这什麽野鸡算法 03/25 23:29
66F:→ holysong : 然後下一代的模型又变更大了 03/25 23:29
67F:→ bndan : 但记忆体不同 本来假设 AI大基建瓶颈是记忆体好了 03/25 23:29
68F:嘘 NEX4036 : 现在不就V了 03/25 23:30
69F:→ bndan : 现在可以用1/6的记忆体量能建AI基建 这时瓶颈应该要 03/25 23:30
70F:→ OxFFFFFFFF : 不管算法有多牛只要使用率越高就会越缺货 03/25 23:30
71F:推 jean0914 : 好好笑的鬼故事 03/25 23:31
72F:→ bndan : 变成缺GPU了..应该说记忆体终究是配件 主要的还是看 03/25 23:31
73F:推 holysong : 我的感觉是只要1/6的cache,一样的效率 03/25 23:32
74F:→ bndan : GPU搭配...更不用说如果本来AI基建瓶颈就是GPU的情 03/25 23:32
75F:→ OxFFFFFFFF : 会跌的原因就是 前阵子股票涨太多会跌而已不用找什 03/25 23:32
76F:→ OxFFFFFFFF : 麽烂理由 03/25 23:32
77F:推 robinlee : 省愈多用更多啊,杀这个超怪 03/25 23:32
78F:→ bndan : 况 那再缩成1/6 记忆体跟本会变成供>>需了..除非GPU 03/25 23:33
79F:推 otsuka123 : ds是蒸馏啊 所以回来 但谷狗大神就难讲了 03/25 23:34
80F:→ bndan : 制造速度"提升"的比记忆体快..但问题是GPU的生产难 03/25 23:34
81F:推 holysong : 云供应商一样还是主机板的记忆体插满 03/25 23:34
82F:→ bndan : 度远大於记忆体 而且像这类顶端IC生产还是台G独霸的 03/25 23:34
83F:推 xm3u4vmp6 : 欸原本5090 32g算法六倍 等效192g 很爽欸 03/25 23:35
84F:→ bndan : 情况..记忆体再屌也是好几家能产..在这情况记忆体怎 03/25 23:35
85F:→ bndan : 可能扩产比GPU慢 = = 03/25 23:35
86F:→ xm3u4vmp6 : DDR 记忆体会更卖爆 因为一堆人想自组 03/25 23:35
87F:推 waiting101 : 长期还是有需求…他们只是省 不代表不继续买ㄚ ㄅ 03/25 23:38
88F:推 BlairWang : goog 把mu 搞下去後 自已也下去了 03/25 23:40
89F:嘘 ice80712 : 欸不是 谷歌自己先破底 03/25 23:40
90F:→ bndan : 长期有需求 == 用PC来假设好了 假设CPU生产量永远是 03/25 23:41
91F:→ bndan : 瓶颈 那其他配件例如 记忆体 主机版 机壳等等 需求 03/25 23:41
92F:→ bndan : 上限其实就被锁住了..不管当地多缺PC拿去玩大资讯基 03/25 23:42
93F:推 ppuuppu : qq狗狗 霸脱 03/25 23:42
94F:→ bndan : 建 需求上限就是看CPU生产量阿= = 又不会忽然变成一 03/25 23:43
95F:→ bndan : 台电脑1个CPU然後装4张主机版+4个机壳之类的 =_= 03/25 23:43
96F:推 wei683 : 演算法目前有办法快到挡得了全世界的需求吗 03/25 23:44
97F:推 lnonai : 上下文需求几乎是无穷尽的,只要还有KV 快取需求H 03/25 23:46
98F:→ lnonai : BM就是多 03/25 23:46
99F:→ lnonai : 这也会加速边缘AI的发展 03/25 23:46
100F:→ OxFFFFFFFF : 算力是越多越好 跟PC还有手机需求是不一样的 03/25 23:47
101F:→ bndan : 算力当然是效率越高越好 越多越好 能做的事越堆越高 03/25 23:48
102F:→ bndan : 但记忆体不是 他是附件 终究会有效能提升的边际效应 03/25 23:50
103F:→ bndan : 递减 而这个演算法更是这边际再缩小6倍 03/25 23:50
104F:推 bs167512 : 别再想记忆体的事了,油都没了,还再记忆体 03/25 23:54
105F:→ BoyceChu : 等於同样规格下,可以做更多事 03/25 23:56
106F:推 afacebook : 压缩不是一直都有在做吗 03/25 23:57
107F:推 KY1998 : 看股价说故事,这跟泄金河有啥不同?? 03/26 00:00
108F:→ OxFFFFFFFF : 记忆体是AI瓶颈之一,非附加品,影响效能关键 演算 03/26 00:01
109F:→ OxFFFFFFFF : 法可优化但需求同步成长,难以降低记忆但的需求 03/26 00:01
110F:→ OxFFFFFFFF : 记忆体的需求 03/26 00:02
111F:→ amd3dnow : cpu/gpu 就是要搭配记忆体...需求怎麽可能减少 03/26 00:02
112F:推 bloodzzero : Zip问世有降低硬体需求? 03/26 00:03
113F:嘘 Tatsuya72 : 只想炒作缺货就下去吧zzz 03/26 00:07
114F:推 k128345 : 别说需求降低,但需求放缓呢?然後对於低阶记忆体的 03/26 00:08
115F:→ k128345 : 需求是不是会放缓更多,想确认这点。 03/26 00:08
116F:→ ezorttc : 塞满好几T 的片子能压缩吗? 03/26 00:11
117F:→ ezorttc : Google 还要解压缩,效能不就落後一节 03/26 00:11
118F:→ allenbret : 杂讯 03/26 00:12
119F:推 HiuAnOP : 99狗狗99我! 03/26 00:13
120F:→ mtmmy : 开发者大概会觉得 可以读更多上下文太棒了 03/26 00:20
121F:→ mtmmy : 而不是减少用量 03/26 00:20
122F:嘘 jay3u7218 : 就涨多了....扯那麽多干嘛? 03/26 00:23
123F:→ liangnet : 节省记忆体,多出来的记忆体继续压榨做更多事。谁 03/26 00:26
124F:→ liangnet : 会嫌记忆体太多的。 03/26 00:26
125F:→ liangnet : 在软体开发里,有时会使用更多记忆体来换取最好效 03/26 00:33
126F:→ liangnet : 能。有时会用压缩牺牲效能换取节省记忆体。 03/26 00:33
127F:→ amd3dnow : ai处理流程最佳化跟需求降低是两回事.... 03/26 00:33
128F:推 goodbad : 咕噜咕噜 03/26 00:33
129F:→ liangnet : 无论如哪种,记忆体都是多多益善。 03/26 00:33
130F:→ k798976869 : 学yo叔绕过记忆体就能跑AI 03/26 00:38
131F:→ re365339 : 造福终端而已,基建端只会买更多 03/26 00:54
132F:推 jumilin927 : 记忆体崩! 03/26 00:56
133F:推 j0987 : 推 03/26 01:00
134F:推 Jaspercool : 不是阿 狗哥你跟着跌欸 03/26 01:01
135F:推 jason61105 : 相片至今储存效能变好 所需容量还是暴增 03/26 01:11
136F:推 joygo : 现在有ai之後什麽都不要说的太死 03/26 01:16
137F:推 ansinlee : 这个就像改车子的电脑 让马力变大,但是对硬体的规 03/26 01:35
138F:→ ansinlee : 格要求 并不会因此减少,只是让买不到或买不起最新 03/26 01:35
139F:→ ansinlee : 的ai伺服器 也能有不错的马力输出 03/26 01:35
140F:→ OxFFFFFFFF : 大家都有AI了 去花个两分钟讨论一下就知道到底记忆 03/26 01:40
141F:→ OxFFFFFFFF : 体需求会变多还变少 03/26 01:40
142F:推 randy890924 : Jevons Paradox了解一下 03/26 01:44
143F:推 sunrise1748 : 结果谷歌自己也跌破均线 03/26 01:51
144F:→ g9911761 : 这条演算法价值多少 03/26 01:53
145F:→ lise1017 : 微软最搞笑 当年呛谷哥说什麽要抢浏览器 广告市场 03/26 01:55
146F:推 wettland5566: 就只是新的演算法可以把原来记忆体减低为6分之一的 03/26 01:55
147F:→ wettland5566: 用量而已,妈的没有写过程式啊,因为AI中要用到大 03/26 01:55
148F:→ wettland5566: 量的记忆体,节省记忆体是必然的,这根本就不影响 03/26 01:55
149F:→ wettland5566: 记忆体股好不好 03/26 01:55
150F:→ lise1017 : 结果自己的商业套装软体反而被抄家 03/26 01:55
151F:推 wettland5566: 怎麽会有人把它解读成因为这项技术出来记忆体的采 03/26 02:01
152F:→ wettland5566: 购量就变六分之一好像不是这样吧 03/26 02:01
153F:→ weiman0702 : 省下来的资源就会被更大的模型补充上== 03/26 02:04
154F:→ peterors : 明天能亮几个灯让我捡吗~~ 03/26 02:15
155F:推 sim3000 : 跌下来就是捡 情绪反应 03/26 02:23
156F:→ budaixi : 不是海力士ADR吗 03/26 02:30
157F:推 Belial1991 : gemini错误还是挺多的 优点就免费 03/26 02:35
158F:推 mutsutakato : 我的妈呀 一堆文组 人家是说键值记忆体缩为6分之一 03/26 03:25
159F:→ mutsutakato : 不是整体记忆体缩为1/6 搞笑吗? 03/26 03:25
160F:→ mutsutakato : 这只是让搜寻速度更快一点而已啦 03/26 03:26
161F:→ mutsutakato : 键值快取就只占了整体记亿体的一小块而已 03/26 03:35
162F:→ mutsutakato : 怎麽会把他想成以後牙科出货量变1/6? 笑死我也 03/26 03:36
163F:推 ravelson : 之後上涨,就会发新闻说此技术不影响记忆体需求, 03/26 06:21
164F:→ ravelson : 诈骗真的是永恒不死的产业,总有人喜欢被骗还帮数 03/26 06:21
165F:→ ravelson : 钱。 03/26 06:21
166F:推 Tenging : 那就更需要了不是吗 03/26 07:06
167F:→ Tenging : 1+1>2 03/26 07:06
168F:推 richaad : https://i.mopix.cc/i2Ct2Z.jpg 03/26 07:13
169F:→ richaad : 一年前就发表的技术,根本找理由杀多而已 03/26 07:13
170F:→ fallinlove15: 别乱找理由耶 不就开财报後被玩 03/26 07:22
171F:→ dslite : 不就是pooling? 03/26 07:55
172F:→ angusyu : Google自己都在下跌是三小 03/26 08:30
173F:嘘 yiyi0916789 : 不是,google自己跟着跌是哪招 03/26 09:55
174F:推 z83420123 : 就故意找理由啊 XD 03/26 10:10
175F:推 joy2105feh : 放个产品在家股价也下去 03/26 12:16
176F:→ fmp1234 : 重回以前想方设法降低记忆体使用量 03/26 13:26
177F:推 eknbz : 这当利空我还真不信 03/26 13:52
178F:→ tw19930419 : 唬烂 演算法永远都在更新 有人因为这个跌烂喔 03/26 14:57
179F:推 cfesun : 吓唬人用的,每次大跌都说原因,然後又涨回来 03/26 20:41







like.gif 您可能会有兴趣的文章
icon.png[问题/行为] 猫晚上进房间会不会有憋尿问题
icon.pngRe: [闲聊] 选了错误的女孩成为魔法少女 XDDDDDDDDDD
icon.png[正妹] 瑞典 一张
icon.png[心得] EMS高领长版毛衣.墨小楼MC1002
icon.png[分享] 丹龙隔热纸GE55+33+22
icon.png[问题] 清洗洗衣机
icon.png[寻物] 窗台下的空间
icon.png[闲聊] 双极の女神1 木魔爵
icon.png[售车] 新竹 1997 march 1297cc 白色 四门
icon.png[讨论] 能从照片感受到摄影者心情吗
icon.png[狂贺] 贺贺贺贺 贺!岛村卯月!总选举NO.1
icon.png[难过] 羡慕白皮肤的女生
icon.png阅读文章
icon.png[黑特]
icon.png[问题] SBK S1安装於安全帽位置
icon.png[分享] 旧woo100绝版开箱!!
icon.pngRe: [无言] 关於小包卫生纸
icon.png[开箱] E5-2683V3 RX480Strix 快睿C1 简单测试
icon.png[心得] 苍の海贼龙 地狱 执行者16PT
icon.png[售车] 1999年Virage iO 1.8EXi
icon.png[心得] 挑战33 LV10 狮子座pt solo
icon.png[闲聊] 手把手教你不被桶之新手主购教学
icon.png[分享] Civic Type R 量产版官方照无预警流出
icon.png[售车] Golf 4 2.0 银色 自排
icon.png[出售] Graco提篮汽座(有底座)2000元诚可议
icon.png[问题] 请问补牙材质掉了还能再补吗?(台中半年内
icon.png[问题] 44th 单曲 生写竟然都给重复的啊啊!
icon.png[心得] 华南红卡/icash 核卡
icon.png[问题] 拔牙矫正这样正常吗
icon.png[赠送] 老莫高业 初业 102年版
icon.png[情报] 三大行动支付 本季掀战火
icon.png[宝宝] 博客来Amos水蜡笔5/1特价五折
icon.pngRe: [心得] 新鲜人一些面试分享
icon.png[心得] 苍の海贼龙 地狱 麒麟25PT
icon.pngRe: [闲聊] (君の名は。雷慎入) 君名二创漫画翻译
icon.pngRe: [闲聊] OGN中场影片:失踪人口局 (英文字幕)
icon.png[问题] 台湾大哥大4G讯号差
icon.png[出售] [全国]全新千寻侘草LED灯, 水草

请输入看板名称,例如:Soft_Job站内搜寻

TOP