作者LDPC (Channel Coding)
看板Stock
标题Re: [新闻] 我们必须去竞争 黄仁勳:中国晶片仅落後
时间Tue Sep 30 02:39:18 2025
生态系这边除了平台 还有模型生态系
现在大概就是进入模型比赛下半场 做模型大概开始有分界了
在2023以前 所有科学家的浪漫就是 自己打造自己模型 也就是自己从无到有训练模型
因为该死的scale law出现後 开始出现高品质的原始基础模型(Foundation Model)
基础模型大体就是 高品质数据 好scalable训练的模型 以及大量GPU
科学家开始出现 菁英跟杂鱼
菁英就去碰基础大模型 (Pre-Training)
杂鱼负责把基础大模型 去加工成他们要的模型产品(Post-Trainig -> Application)
这也是为何面试要去碰千万年薪的越来越难 因为能碰pre-training基础模型
大概就是等於去打NBA 只有那一搓天选之人 post-training相对好碰 因为就是
我之前说的廖化调参大师 每个调参大师大概都是用8~64 H100就足够
前者pre-train就是你看到上千颗GPU 从无盖到有的基石模型科学家
然後Meta以前内部都还会只用自家的基础大模型 直到LLama-4之後
内部使用效率急剧下降
然後中国的基础大模型 这几年就做得真好 我前镇自己盖了一个擅长的基础小模型
QQ 玩了一下 完全被alibaba狂虐 然後基础模型LLM这边alibaba的 qwen 真的做得好
剩下杂鱼大概就是 找上游基础模型 然後套些数据fine-tune (等於是做加工部份)
然後上游基础模型大概就是 狗家跟中国....那个meta已经出局了
opean-ai不释放他们基础模型 所以没人有办法加工 (有少部分有释放 像是whisper)
Nvdia也最近疯狂释放他们基础模型 (Nemo)
这就是模型的生态圈 其他新创啥Perplexity Anthropic 都不会释放他们基础模型
以他们员工数量 应该是有在盖他们自家的基础模型
※ 引述《Kroy (Joy)》之铭言:
: 这老黄有说过,主要是平台以及生态系的竞争
: 如果完全杜绝中国使用NVDA的晶片,那中国势必会发展自己的AI开发平台
: 如此,中国有天在这领域就跟美国脱勾了,到时就变得不可控
: 如果是其他领域也就算了,偏偏中国的AI人才仅次於美国。
: NVDA晶片主要优势不是单纯的晶片,而是 CUDA + NVLink 以及因此带来的
: 全球开发者生态,这些开发者,中国人也占了很大一块
: ※ 引述《huabandd (我是阿肥巴你头)》之铭言:
: : 我实在很看不懂,按照他的说法的话
: : 那ASML是不是也别限制了?
: : 反正要开放竞争嘛,别再搞中国了
: : 大家皆大欢喜,老黄有钱赚,中国有机台
: : 美国也能因此和中国利益交换
: : 是这样的意思吗?
--
※ 发信站: 批踢踢实业坊(ptt.cc), 来自: 76.21.72.78 (美国)
※ 文章网址: https://webptt.com/cn.aspx?n=bbs/Stock/M.1759171160.A.4E4.html
1F:→ Kroy : 真的是这样,没有中国人对开源的贡献,AI发展慢很多 09/30 02:44
※ 编辑: LDPC (76.21.72.78 美国), 09/30/2025 02:46:08
2F:推 waitrop : 我就是杂鱼,负责做擦边球打杂的,杂鱼的工作已经 09/30 02:53
3F:→ waitrop : 好几年了,不是只有现在,那个资料标签也是杂鱼的 09/30 02:53
4F:→ waitrop : 脏活,但是人家有本事在粪坑里头挑出黄金,科技业 09/30 02:53
5F:→ waitrop : 职场几十年来的问题一直都是好的工作很少,1%的工 09/30 02:53
6F:→ waitrop : 作都不到,大部分99%+的工作都是在干脏活,只有天 09/30 02:53
7F:→ waitrop : 选之人才能碰有价值的工作 09/30 02:53
※ 编辑: LDPC (76.21.72.78 美国), 09/30/2025 02:56:48
8F:推 a0808996 : LDPC大一定是NBA等级的 09/30 03:01
QQ 不是唷 我是杂鱼廖化调餐大师 专门加工业味精那种
※ 编辑: LDPC (76.21.72.78 美国), 09/30/2025 03:02:21
9F:推 askl817 : 但中国没有算力不是还在石器时代,不用太担心吧 09/30 03:02
10F:推 bj45566 : 感谢 L 大和 W 大分享业内心得 09/30 03:03
11F:→ bj45566 : 而且两位都太谦虚了 09/30 03:04
12F:→ bj45566 : 中国怎麽会「没有算力」?!好烂的反串wwww 09/30 03:05
13F:推 truelove356 : Meta花很多钱打造名星队耶 09/30 03:24
14F:推 truelove356 : 阿里联手英伟达 啊里买得到GB200吗 09/30 03:31
15F:推 bj45566 : 美国就有超级知名的 YouTuber 做了一小时多的影片, 09/30 03:35
16F:→ bj45566 : 亲自追踪到(新加坡 + 香港 + 台湾)这个 NVDA 高阶 09/30 03:35
17F:→ bj45566 : 晶片输入中国的铁三角啊! 09/30 03:35
18F:→ bj45566 : 然後那只影片莫名其妙的很快被 YouTube 删除了wwww 09/30 03:36
19F:推 bj45566 : 粪川不知道为什麽对新加坡超级软,和对俄罗斯差不多 09/30 03:39
20F:→ bj45566 : ,明明知道新加坡是 NVDA 高阶晶片流入中国的最关 09/30 03:39
21F:→ bj45566 : 键破口,却始终当作没看到 TA-TA-TACO wwww 09/30 03:39
22F:推 skyhawkptt : @楼上!李家兄弟阋墙就有些资料漏馅!还有E...rrr 09/30 04:10
23F:推 as6633208 : 经过之前那个deepseek 事件股价崩跌,大家狂喊ai泡 09/30 04:12
24F:→ as6633208 : 沫,米国大模型公司不可能没意识到风险,如果一直开 09/30 04:12
25F:→ as6633208 : 放模型,被中国拿过来tune出来一个接近的,只会让自 09/30 04:12
26F:→ as6633208 : 己限於不利,身为需要砸最多钱搞基础模型开发的公司 09/30 04:12
27F:→ as6633208 : ,投资者一撤资他们就没$$了。所以我认为大模型公司 09/30 04:12
28F:→ as6633208 : 搞封闭的决心应该只会越来越高,尤其後面agi asi出 09/30 04:12
29F:→ as6633208 : 来,肯定不可能开放免费给人自己调,或要马就是很难 09/30 04:12
30F:→ as6633208 : 调差异化出来一律每月收$$不给买断,品牌厂要用就是 09/30 04:12
31F:→ as6633208 : 收购公司,收购後就更不可能开放,人都是要赚钱的。 09/30 04:12
32F:→ aewul : 美国打到中国人的自尊了,为时已晚 09/30 04:16
33F:推 sdbb : 谢谢 09/30 04:30
34F:推 as6633208 : 这ai竞赛,一直喊说要开源的,大概率都是没能力研发 09/30 04:36
35F:→ as6633208 : 的,阿反正现阶段勒,nvda很爽,前提是如果算力真的 09/30 04:36
36F:→ as6633208 : 就是所谓的圣杯的话。目前看起来,米国搞的星际之门 09/30 04:36
37F:→ as6633208 : ,就是搞超级算力中心,奥特曼和川普看起来不是笨蛋 09/30 04:36
38F:→ as6633208 : ,算力如果有机率真的是圣杯,加上封闭模型,另一边 09/30 04:36
39F:→ as6633208 : 看到又会模仿建立一个算力中心,晶片伺服器品牌厂、 09/30 04:36
40F:→ as6633208 : 铲子帮、能源帮又赢麻了,但如果又横空出世一个算法 09/30 04:36
41F:→ as6633208 : 大於算力的asi agi,那这星际之门就是ai最後一舞了 09/30 04:36
42F:→ as6633208 : ,会发生吗?不知道,但现在的席勒本益比已经快跟. 09/30 04:36
43F:→ as6633208 : com 泡沫一样高了xD 09/30 04:36
44F:推 bj45566 : 还是有点不一样,网路泡沫时代的新创公司光是做出漂 09/30 05:00
45F:→ bj45566 : 漂亮亮的 PPT 就可以轻松骗到一大笔创投资金了,现 09/30 05:00
46F:→ bj45566 : 在的 AI 新创公司没能拿出些实测绩效是很难骗到钱 09/30 05:00
47F:→ bj45566 : 的 09/30 05:00
48F:推 as6633208 : 台积电现在技术壁垒蛮高的,但被美国这样一搞,就不 09/30 05:10
49F:→ as6633208 : 知道了,之前被美国搞的是日本,然後日本被搞到失落 09/30 05:10
50F:→ as6633208 : 30年,台积电我只能说,岌岌可危。假设未来算力真的 09/30 05:10
51F:→ as6633208 : 重要、加上自动驾驶汽车晶片、机器人晶片、然後军武 09/30 05:10
52F:→ as6633208 : 科技、无人机等晶片、现在投资晶片品牌厂不错,铲子 09/30 05:10
53F:→ as6633208 : 代工厂最大问题,一直是晶片品牌厂可以选择其他间铲 09/30 05:10
54F:→ as6633208 : 子厂,然後美国现在又一直想搞,究竟台湾会不会被美 09/30 05:10
55F:→ as6633208 : 国搞到变成日本失落30年2.0呢? 09/30 05:10
56F:推 yogofresh : 美国在赌国运,赌算力与电力可以达到AGI 09/30 05:45
57F:→ aewul : 以前日本从半导体第一被搞到失落30年 09/30 06:21
58F:推 ksjr : 那grok呢?没搞头吗 09/30 06:23
59F:推 jerrychuang : 所以各家LLM的差异越来越小了... 09/30 06:40
60F:推 roseritter : 那这样的话,等模型之争定案,还会需要这麽多铲子吗 09/30 06:47
61F:→ roseritter : ? 09/30 06:47
62F:推 carolgilbert: 台湾自己的模型呢? 09/30 06:51
63F:→ WenliYang : 台湾好好组装机子吧 还模型哩 09/30 07:38
64F:→ zzahoward : 台湾模型就是拿中国做出来的train一下不要有支语XD 09/30 07:40
65F:推 ADS1 : 台湾有台积电就够了 09/30 07:46
66F:→ tenka92417 : 电力=算力 09/30 07:56
67F:→ tenka92417 : 没有足够的电力去驱动,拥有再先进的AI晶片也无法 09/30 07:57
68F:→ tenka92417 : 发挥效能吧 09/30 07:57
69F:推 apple123773 : 算力也是要有运用才是有效的算力....就目前台湾使 09/30 08:34
70F:→ apple123773 : 用,高品质的使用,台湾就大概卖铲子,卖到被美国 09/30 08:34
71F:→ apple123773 : 抢xdd,还好就这规模的扩大,谈不上失落的时代xdd 09/30 08:34
72F:推 doverdover : 把搞应用的说成是杂鱼,真桑心QQ 09/30 08:37
73F:推 shawshien : 要有做应用的 AI才能落实 09/30 08:49
QQ 窝随口说说的 请把杂鱼滤掉 因我做应用层 我是杂鱼 所以就挖苦一下自己
※ 编辑: LDPC (76.21.72.78 美国), 09/30/2025 08:52:02
74F:推 metallolly : AI应用豪难喔 呜呜呜 我才杂鱼吧 连用都不会 09/30 09:04
75F:推 sdbb : 跪求当杂鱼 09/30 09:05
76F:推 staytuned74 : 不能开源透明,不然这些大厂要被告到翻了,多数资 09/30 09:13
77F:→ staytuned74 : 料训练都侵权 09/30 09:13
78F:推 cosmite : 推分享 09/30 10:21
79F:→ ActionII : 现在做应用的比使用者还多QQ 09/30 10:33
80F:→ ActionII : 到处都是调侃梗图 09/30 10:33
81F:推 mdkn35 : 我以为perplexity 还在用llama @@ 09/30 10:52
82F:推 louner : 不是 真正的杂鱼是连post train的机会都没有 只能c 09/30 11:10
83F:→ louner : all API套一些agent的框架去解决商业需求 09/30 11:10
84F:推 eknbz : 会调餐调不错已不算杂鱼了 上面说call api的才是 09/30 12:28
85F:推 ProTrader : 文中的杂鱼廖化 最烂也都是台清交电资硕甚至更强 09/30 15:33
86F:→ ProTrader : 台清交电资博去当杂鱼廖化比较有机会 09/30 15:35
87F:推 KimomiKai : 我的GPU都被杂鱼乱砍价的意思?我上次才被弃单Pro 09/30 16:09
88F:→ KimomiKai : 6000 09/30 16:09
89F:推 staytuned74 : 上面推文说调用API解商业需求才是真杂鱼,所以curs 09/30 17:22
90F:→ staytuned74 : or 创办人也算杂鱼??! 09/30 17:22
91F:推 louner : 从科学的角度只call API含金量就是很低啊 那些硕博 10/01 13:12
92F:→ louner : 花了多少时间了解模型结构 背後的数学 就是为了用p 10/01 13:12
93F:→ louner : retrain/SFT/RL能让模型更好 结果跑去跟没data sci 10/01 13:12
94F:→ louner : ence背景的人竞争call API 那我他妈花这麽多时间学 10/01 13:12
95F:→ louner : 那些是要冲三小 10/01 13:12