作者zxwxz (zxwxz)
看板Stock
标题Re: [心得] DeepSeek将是刺破本轮泡沫的那根钉子
时间Tue Jan 28 02:00:45 2025
DeepSeek其实真正的创新在model的高效设计,其真正的关键在efficient MOE还有MLA设计
这其实是2024年初DeepSeek V2就发表的东西
R1是把这个高效model设计+O1推理模型的LLM+RL合并出来的效应
我觉得欧美厂商因为本钱大所以忽略了降本增效的飞轮效应,所以第二个推理模型反而是中
国公司出圈了,推理模型的Test Time Compute对模型效率的敏感性就非常强烈了,训练中
大概会涵盖超大量的推理成本,成本降低25倍相当於研发加速25倍,我想这是OpenAI没预料
到的,现在应该很後悔公开Reasoning 的concept
我必须说AI HW相关厂商个股近期会被严重打折
华尔街是很现实的,短期内一定被认定供过於求
至少要等到下阶段Agent有显着实用性才会拉回
美国AI公司应该被吓到,中国人cost down到极致又免费开源,云端厂商应该会减缓硬体采
购,但其他大模型发展的公司会double down下去,因为成本降低表示应用会更快成型
要知道,这设计已经公开,大家都可以照做,所以应用端会更快有进展,而且是Transforme
r 架构的优化,各种应用都会吃到将本增效的成果
长远来说,中美竞争的枪声响起
模型还是会一直长大
要跑完整版R1至少还是要10张H100
且R1的论文有说,大模型做RL再Distill
比小模型做RL有效的多,所以要突破智力上限,模型还是会越扩越大,但更大的模型应该就
有更多降本增效的设计机会
※ 引述 《LaLFGF》 之铭言:
: 标题: Re: [心得] DeepSeek将是刺破本轮泡沫的那根钉子
: 时间: Tue Jan 28 01:08:51 2025
:
:
: 想太多了
: deepseek是一个成本大降幅下降的gpt
: 现在好像气势很旺 似乎带给gpt极大的威胁 也让nvda、tsm一起下去
: 但这只是投资者、投机者的视角 跟 惊恐过度反应
:
: deepseek除了成本下降 性能也跟着阉割
: 回头看一下还没被阉割的现况gpt
: 日常有在中、重度以上gpt的人都不难知道
: 它的回覆有时候都可以让user气到想吐血了
: 完整版的都尚且如此了 更何况是阉割版的东西
:
: user包容gpt的百般错误 是因为在90%时机可以带来便利 只得容忍10%脑残
: 但当使用阉割版导致错误脑残变成20%机率出现时
: 那还真的是 与其省那预算 不如乾脆不用
:
: 自动化与AI的应用 绝对是以正确性为唯一出路
: 阉割版只有死路一条
:
:
:
: ※ 引述《steven961302 (阿哲)》之铭言:
: : 从DeepSeek腾空出世,在到今天Nvidia (以下简称NV) 等一票AI概念股的下杀,这轮的
: 科技
: : 股估值修正才正刚开始,谁能引爆华尔街炒作了整整一年的AI神话泡泡?或许DeepSeek
: 就会
: : 是刺破本轮AI泡沫的那根钉子。
: : 记得2021 Nvidia显卡被炒作的神话吗?那时候以太币涨到一颗4500,NV的RTX3060显卡
: 从24
: : 99美元被炒作到6000美元以上,後来的故事大家都知道了,随着2022那轮币圈的泡沫暴
: 跌跟
: : 以太币改为质押共识制,挖矿无利可图,NV的显卡在市场上直接暴跌,那些矿场大量的
: 显卡
: : 甚至有打一折卖出的,NV的市值也从巅峰的340跌到100,将近70%的跌幅,然而2023年
: 的这
: : 波AI浪潮又让算力的需求增加,NVDA无疑是这波卖铲子中风口上最大的赢家,凭藉着市
: 场独
: : 有的高阶算力,股价整整翻了10倍。
: : NV之所以享有那麽高的估值,那就是AI浪潮暴发以来,美国这些科技巨头走的就是依靠
: 硬体
: : 算力来提升AI的路线,而NV恰好垄断了所以的高阶算力硬体,所有的AI公司必须找NV购
: 买硬
: : 体,囤GPU,这就导致了NV的股价飙升,美国目前正利用政策等垄断高阶算力硬体的方
: 式来
: : 实现称霸AI产业的目标,我们可以看到在这过程中,中国无疑是被排斥在外的,从2021
: 以来
: : 的各种的禁令也无疑是针对中国的。
: : 但Deepseek的出现,如果能证明「以优化算法搭配中低端硬体+少量高端硬体」的路线
: 是可
: : 行的,那麽美国自身的AI公司及其投资者,是不是会停止花那麽多钱来堆积高端算力硬
: 体?
: : 这是否跟当年囤显卡挖矿的场景有同样的既视感?
: : 假如NVDA市值的支撑是建立在高端算力硬体的垄断上,那Deepseek 的影响就是巨大的
: ,代
: : 表市场根本不需要那麽多高端算力的GPU,这是彻底的Overbooking,包含其关联的的供
: 应链
: : 公司都要遭到市场的本益比重新估值了。
: : NVDA -14%
: : TSM -13%
: : AMD -6%
: : AVGO -15%
:
: --
:
※ 发信站: 批踢踢实业坊(ptt.cc), 来自: 123.195.44.27 (台湾)
: ※ 文章网址: https://webptt.com/cn.aspx?n=bbs/Stock/M.1737997733.A.F3B.html
: 推 joggingwang : 重点是老美一直要封锁老共,但老共一家幻方还是囤了 01/28 01:11
: → joggingwang : 5万片NV晶片,不就打脸老美过去2年的政策失败 01/28 01:11
: → chasegirl : 急了 01/28 01:11
: → qazsd : 联想到一只常当机出错的手机或App,你会想用吗 01/28 01:11
: → dferww55 : 而且还超级卡 01/28 01:11
: 推 ragochen : NFLXdeepseek的性能阉割到比肩o1? 01/28 01:11
: 推 soome : 这只是刚开始,不知道後面中国会卷出什麽东西 01/28 01:12
: 推 joggingwang : 一家幻方可以透过转手买这麽多片,NV跟GG最好都不 01/28 01:12
: → joggingwang : 知,为了钱,商人无祖国,接下来就看川哥会不会对这 01/28 01:12
: → joggingwang : 2家下更重的禁令 01/28 01:12
: 推 CaTkinGG : 没关系 开源後全世界会帮它弄得更好 01/28 01:13
: 嘘 KISS1979 : 中吹者又在幻想了 台湾数位部还没出手咧 01/28 01:14
: 推 Lebrono : 不就一堆重课大佬买了一堆顶装 结果发现只比一个平 01/28 01:16
: → Lebrono : 民微课强一点点的崩溃感 01/28 01:16
: → shomingchang: 重点就不是deepseek好不好用 是可能可以用更少资源 01/28 01:17
: 推 yoshian886 : 蒸馏出来的东西也达不到AGI,还是参数再多其实也达 01/28 01:18
: → yoshian886 : 不到呢? 01/28 01:18
: 嘘 speedman : 还在阉割版 01/28 01:18
: → zer0319 : 开源了你可以自己练啊 01/28 01:19
: 嘘 s1612316 : 那是你个人的感受 所有人都要最强最完整的版本? 01/28 01:19
: 推 ksjr : 下禁令的话又要跌了 01/28 01:19
: → sa87a16 : 到现在还搞不清楚状况 01/28 01:20
: 推 ImHoluCan : 短空长多,美股不能看空 01/28 01:20
: → s1612316 : 卡顿手机整个印度几亿支 你说呢? 01/28 01:20
: 推 bior1234 : 就是阉割版啊,MoE模型就是将模型能力线索到特定领 01/28 01:20
: → bior1234 : 域,追求在特定领域达到跟你接近的效能,跳脱专家 01/28 01:20
: → bior1234 : 领域就打回原形了 01/28 01:20
: → sa87a16 : 用最小成本能独立训练出来而且有一定成果你不用? 01/28 01:21
: → sa87a16 : 那你肯定NV买到150的天才 01/28 01:21
: 推 prestigejoM : https://i.imgur.com/eb9BUsn.jpeg 01/28 01:21
: 推 supereva : 以股价来说的确是泡沫啦 但我反而更期待的是应用 01/28 01:23
: → supereva : 的加速 自动驾驶和机器人会更早实现 如果真的强 01/28 01:23
: → supereva : 50倍的话 01/28 01:23
: 嘘 sa87a16 : 准确度能训练,现在是模型被屌打了,现在还搞不清 01/28 01:23
: → sa87a16 : 状况 01/28 01:23
: → heavensun : 必然的阿 晶片用比较便宜 性能必然弱 01/28 01:23
--
※ 发信站: 批踢踢实业坊(ptt.cc), 来自: 42.73.112.255 (台湾)
※ 文章网址: https://webptt.com/cn.aspx?n=bbs/Stock/M.1738000847.A.540.html
1F:推 CaTkinGG : 泡沫的是硬体厂不是AI本身 01/28 02:07
2F:→ zxwxz : 短空长多,不是真泡沫,大模型的优势还在,重点是 01/28 02:21
3F:→ zxwxz : 更高效的大模型,可以把尺度推得更大 01/28 02:21
4F:推 Carloslin : 半导体业大概要跌一阵子了 01/28 02:22
5F:推 DLHZ : 正解 01/28 02:27
6F:推 crowley : 推这篇 01/28 02:30
7F:→ fitenessboyz: 只能说应用大战的时代加速来临 01/28 02:34
8F:推 baddaddy : 推 01/28 02:35
9F:推 fake : 当初开源的时侯就应该想得到会有更强大的的对手出 01/28 02:55
10F:→ fake : 现了吧 对於热爱技术的人来说ds的出现应该是让他们 01/28 02:55
11F:→ fake : 兴奋而不是烦恼? 01/28 02:55
12F:→ fake : 同样的DS也是开源应该也是基於此理由 应该吧 01/28 02:56
13F:→ fake : 他们追求的是全世界的人才一起发展AI而不是商业壁 01/28 02:57
14F:→ fake : 垒 01/28 02:57
15F:推 kobe760903 : 现在是有投资的在烦恼… 01/28 03:16
16F:推 bj45566 : 对於技术宅和科研宅来说 DS 的出现本来就让他们更 01/28 03:32
17F:→ bj45566 : 兴奋,去 Reddit 看英文讨论就知道什麽是专业 -- 01/28 03:32
18F:→ bj45566 : 反而 PTT 最热门的反应是:DS 纯粹是吹牛、DS 偷 01/28 03:32
19F:→ bj45566 : 接 OpenAI API、DS 不能问 8964 所以是垃圾、DS 是 01/28 03:32
20F:→ bj45566 : 中国做的我才不想碰,... 相比之下真的笑死人 01/28 03:32
21F:推 KiwiSoda01 : 加速ai costdown怎麽看都是利多 跌只是反应已经投 01/28 04:15
22F:→ KiwiSoda01 : 注多余成本在model的公司上 既然开源 到时候大家还 01/28 04:15
23F:→ KiwiSoda01 : 是看谁算力多 买铲子的不会输 01/28 04:15
24F:→ jokerlin7026: 短空长多? 01/28 04:32
25F:推 achinyu : 中肯 01/28 04:58
26F:→ pooiuty : 感谢DS,让我有机会买到便宜的NV和TSM。拜托,再多 01/28 05:56
27F:→ pooiuty : 杀点,最好能腰斩,我一定买爆 01/28 05:56
28F:推 Prof68 : 推!终於有技术讨论文了。台湾完全压台积电的缺点浮 01/28 07:39
29F:→ Prof68 : 现出来。竹科很快就要大裁员了。 01/28 07:39