作者JQK2 (ACE)
看板Stock
标题[新闻] 绕开辉达护城河 陆媒传DeepSeek可改适配
时间Mon Feb 3 08:26:50 2025
绕开辉达护城河 陆媒传DeepSeek可改适配中国国产GPU晶片
22:352025/02/02
中时新闻网 卢伯华
据外媒报导,深度求索(DeepSeek)在研发大模型时绕过了辉达的软硬体整合技术「统一计
算架构」(CUDA)这道AI技术护城河,这种用新的演算法高效利用硬体层面加速,能提高模
型效果。只要有足够擅长写PTX语言的内部开发者,就能让大陆开发的AI模型更容易适配
中国国产GPU晶片,这让美国不少AI巨头们感受到极大的威胁。
据《快科技》报导,DeepSeek真的绕过了辉达的计算架构CUDA,北京航空航太大学黄雷副
教授接受采访时表示,绕过CUDA意味着DeepSeek可以直接根据GPU的驱动函数做一些新的开
发,从而实现更加细细微性的操作。
黄雷指出,譬如DeepSeek在多节点通信时绕过了CUDA,直接使用并行线程执行代码(
Parallel Thread Excution, PTX),其最多只能实现以演算法的方式来高效利用硬体层
面的加速。一旦速度变得更快,这就意味着别人的模型要训练10天,而DeepSeek只需要训
练5天,那麽就能给模型喂更多的资料,即能让模型在同等时间内看到更多的资料,间接
提高模型的效果。
因此,透过PTX虽然可以进行更多专门的最佳化调整,但缺点是很难维持稳定,需要人力
大量除错,因此也显示出 Deepseek 工程师的设计功力。
报导说,Deepseek 的出现,打破了矽谷巨头在人工智慧竞争中的军备竞赛局面,AI 开发
或许不一定非要追求最强晶片和庞大晶片数量,透过精细的程式设计也能让低规设备跑出
高效结果,这可能也是前日美国科技股市震荡的主要原因。
报导引述消息人士指出,DeepSeek拥有一些擅长写PTX语言的内部开发者,假如它之後使
用中国国产GPU,其在硬体适配方面将会更得心应手,其只要了解这些硬体驱动提供的一
些基本函数介面,就可以仿照辉达GPU硬体的程式设计介面去写相关的代码,从而让自家
大模型更加容易适配国产硬体。
https://reurl.cc/74NOd9
之前就在想晶片被制裁逼使自己搞,那Ai绘图晶片GPU不也能自产?靠自己最实在!
--
※ 发信站: 批踢踢实业坊(ptt.cc), 来自: 180.217.39.246 (台湾)
※ 文章网址: https://webptt.com/cn.aspx?n=bbs/Stock/M.1738542412.A.85A.html
1F:推 ggian123 : 这下真东升西降了 02/03 08:28
2F:推 picaroon : Nv真的只能去夜市摆摊了02/03 08:29
3F:推 whc760123 : PTX也是辉达语言 确定不会禁? 02/03 08:29
4F:推 gk1329 : 7nm就够惹 只是很耗电02/03 08:30
5F:推 uxy82 : 绕来绕去还是没绕开辉达吧?02/03 08:30
6F:→ fbiciamib123: 中国牛逼 02/03 08:31
8F:→ truelove356 : 昇腾改良板出来了 华为7nm yield 90%02/03 08:31
9F:→ jayemshow : 语言是要怎麽禁...02/03 08:32
10F:推 supisces : AMD 也可以啊 02/03 08:33
11F:→ poru : 美国还想扯台积电.也不想想现在美国就硬体赢中国了 02/03 08:33
12F:→ poru : 美国扯台积电後腿.让中国硬体有追赶机会 02/03 08:34
13F:→ poru : 别到时几年後软体硬体皆输02/03 08:34
14F:→ idernest : Voodoo卡也要涨价了02/03 08:35
15F:推 ymlin0331 : 有保时捷不开,开头又大,怎麽赢? 02/03 08:35
不用赢啊!只要在中国使用市场就够了,看看百度腾讯
16F:→ poru : 中国真的很强机器人.飞行车.太空船...太多了02/03 08:35
17F:推 gk1329 : 中国也是政府在扯企业後腿鸭 02/03 08:36
18F:→ gk1329 : 像之前手游补教被打成狗02/03 08:37
19F:→ otaku690 : 笑了 PTX更hardware dependent02/03 08:37
20F:→ gk1329 : 阿里巴巴集团被一棒打屎02/03 08:37
21F:→ gk1329 : 还有房地产 繁多不及备载02/03 08:38
22F:→ poru : 赖政府真的要去跟川普沟通美国就真的硬体晶片赢中国 02/03 08:38
※ 编辑: JQK2 (180.217.39.246 台湾), 02/03/2025 08:38:34
23F:→ poru : 要是扯台积电後腿真的让中国渔翁得利 02/03 08:38
24F:→ flipflap : 文组中吹继续吹 PTX没有NV硬体也用不了 02/03 08:39
25F:→ LMgogo : 的确 特司拉用烂晶片也能开 ai没理由不行 02/03 08:40
26F:推 panghsing : 美国的民主自由就是打压他国 02/03 08:40
27F:嘘 andyher : 假新闻 台积电天下无敌 02/03 08:40
28F:→ s860703 : 神话要破了? 02/03 08:40
29F:推 ptta : 服务都已经上线了好吗?硅基流动用 910c 02/03 08:41
30F:→ poru : 事实是台积电美国赚大钱.台积电代工辉达赚50几% 02/03 08:41
31F:→ poru : 辉达转手卖7倍 02/03 08:42
32F:推 sunpedro0202: 专门在nv上左佳化,怎麽可能绕过nv 02/03 08:43
33F:→ ptta : 用来推理应该可以,训练新模型,应该没有一家敢赌吧 02/03 08:43
34F:→ otaku690 : Inference本来就是进入机会多多 用非NV根本没啥奇怪 02/03 08:43
35F:→ ptta : !花钱小事,训练失败落後半年,可是要团灭的 02/03 08:43
36F:推 gk1329 : 美国也没多自由 对AI其实限制很多 02/03 08:45
37F:→ gk1329 : 祖克柏都出来喊话惹 02/03 08:45
38F:嘘 bairn : 摇摇领先,不要偷用 02/03 08:45
39F:嘘 ketter : 国产GPU 又要找人磨掉公司名称了吗 02/03 08:46
40F:推 patrol : 需要人力大量除错... 02/03 08:46
41F:→ patrol : 我可能对ai的定义出现了什麽误解 02/03 08:48
42F:→ patrol : 对岸ai的定义其实是人矿是吧,嗯,的确也是人造的, 02/03 08:48
43F:→ patrol : 有智慧 02/03 08:48
44F:推 centaurjr : 下次lib多包一点看你怎麽绕XD 02/03 08:49
45F:→ samuelyen : 为什麽不直接转用openCL就好 02/03 08:50
46F:→ samuelyen : openCL还相对更high level 02/03 08:51
47F:推 squelch : AMD啊 嘻嘻 02/03 08:51
48F:推 macbook12 : PTX也是老黄的东西....这...新闻吹过头了 02/03 08:52
49F:推 assian : 重点是效率,让他们慢慢跑呗 02/03 08:52
50F:→ macbook12 : 西台湾的GPU厂商 ...摩尔线程....XD 02/03 08:52
51F:→ Xanphenir : 绕得过CUDA,晶片硬算力差绕得过吗 02/03 08:54
52F:→ tctv2002 : 这就唬烂了 02/03 08:54
53F:嘘 bella1815 : 中时不意外 02/03 08:54
54F:嘘 justplay : 看到 PTX 用在非NV 的东西上就直接end 比较快y 02/03 08:55
56F:推 mike7689 : 摩尔线程是游戏卡 跟现在讨论的运算卡差很多 华为 02/03 08:59
57F:→ mike7689 : 昇腾才是这类产品 02/03 08:59
58F:推 redbeanbread: 西台湾不缺电也不缺土地 02/03 08:59
59F:→ ActionII : 果果的gpu也能跑大模型,怎没人说能绕开 02/03 08:59
60F:→ agoodjob : 昨天看X传,把显卡上的记忆体改大就好根本不用买很 02/03 09:00
61F:→ agoodjob : 贵的gpu不知道真假 02/03 09:00
62F:→ cta : 1,2楼很急 02/03 09:00
63F:→ ActionII : 已经能跑拉玛一年了,可怜啊meta apple 02/03 09:00
64F:嘘 catboost : 文组 02/03 09:01
65F:→ cablate : 这真的是假新闻== 根本没有绕开 02/03 09:04
66F:推 s213092921 : 早就说过了,DS可以自适应在不同GPU平台上,你以为P 02/03 09:08
67F:→ s213092921 : TX很难写,结果DS团队用自家DS推理模型写PTX 02/03 09:08
68F:→ s213092921 : 重点是华为昇腾的运行效果输给NV算卡5%,成本降低70 02/03 09:09
69F:→ s213092921 : % 02/03 09:09
71F:嘘 haha7456 : 这就有点吹牛了吧 02/03 09:12
72F:推 s213092921 : 继续制裁NV算卡出口吧,美国压不住DS成长茁壮了 02/03 09:12
74F:→ s213092921 : 所以27日辉达崩盘後,老黄赶快出来喊话DS需要购买更 02/03 09:14
75F:→ s213092921 : 多N卡,急了 02/03 09:14
76F:推 obtundent : 红梅帐号真多 02/03 09:15
77F:→ s213092921 : 更正:老黄说AI晶片需求只会更多,但他不敢说N卡已 02/03 09:15
78F:→ s213092921 : 非独此一家 02/03 09:15
79F:→ enjoythegame: 想太多 02/03 09:17
80F:嘘 mp5good : 中时乱写就算了,怎麽推文也躲一堆不懂装懂的中吹 02/03 09:21
81F:嘘 seanidiot : 用现有机台量产7nm? 要搞死中芯吗 02/03 09:23
82F:嘘 hilele : 要吹的可以先问问deepseek PTX跟CUDA的关系再来吹 02/03 09:27
83F:嘘 TFK822 : 又弯道超车了 02/03 09:31
84F:推 alomar2000 : 耗电对中国来说不是问题,民生用电可以牺牲的,面 02/03 09:31
85F:→ alomar2000 : 子不能输! 02/03 09:31
86F:推 ChikanDesu : 绕不开辉达 不代表辉达不会崩个20-30% 02/03 09:32
87F:推 decorum : 美国还是有办法制裁 对半导体生产原料、设备下手 02/03 09:33
88F:→ decorum : 就可以了 不准供应厂商维护设备 中芯能怎样 02/03 09:34
89F:嘘 NEX4036 : 中或又最赢! 02/03 09:34
90F:嘘 ImHoluCan : 又在乱写笑死 02/03 09:35
91F:→ ImHoluCan : 辉达上次崩到90,这次怎可能不再崩 02/03 09:36
92F:推 lain2002 : 台湾GG了 02/03 09:40
94F:推 tony1768 : 拜托还我6w5090拜托别抢 02/03 09:46
95F:→ WTF55665566 : 结果支那国产显卡厂都在跌 吹牛一次有用第二次开始 02/03 09:50
96F:→ WTF55665566 : 越骗越少人 02/03 09:50
97F:嘘 mp5good : cuda绕不开的原因是生态系,不是适不适配的问题 02/03 09:55
99F:→ s213092921 : 制裁才有DS横空出世,谢啦川普拜登 02/03 10:01
100F:→ raku : 中国GPU。。。是啥? 02/03 10:01
101F:嘘 jackliao1990: PTX也是辉达的东西 哪有"绕过"去?? 02/03 10:02
102F:→ jackliao1990: DEEPSEEK还是只能用辉达的架构和生态系 02/03 10:03
103F:→ jackliao1990: 况且改PTX是针对特定型号GPU做优化 02/03 10:04
104F:→ jackliao1990: 换到其他GPU会跑不了 超不划算 02/03 10:04
105F:嘘 bifox : ptx? 02/03 10:07
106F:推 jimmy12332 : PTX是开放的 02/03 10:11
107F:推 agpc : 都拿去作3无车用安卓机啦 02/03 10:11
108F:推 s213092921 : 丢给DS推理模型自行写各算卡的PTX就好了,傻子才会 02/03 10:15
109F:→ s213092921 : 用人力 02/03 10:15
110F:嘘 r40491101 : 这跟他们白痴的andriod一样,被锁了後 play store, 02/03 10:21
111F:→ r40491101 : 结果用open source andriod 改了一套四不像的鸿蒙, 02/03 10:21
112F:→ r40491101 : 然後说自己研发的,有够瞎,还有好多例子,像盗用日 02/03 10:21
113F:→ r40491101 : 本德国的高铁,通通都是自己造的啦 02/03 10:21
114F:推 opop1133 : 现阶段够用就好 先杀一波 02/03 10:21
115F:→ opop1133 : 但终究还是要靠硬体突破 永远做多 02/03 10:22
116F:推 ImHoluCan : 上次140-90,台股全部跌停,这次怎麽还没全部跌停 02/03 10:24
117F:推 patrol : 拿需要大量人除错的东西去除错自己,很勇喔,大概就 02/03 10:30
118F:→ patrol : 跟文组除错自己数学考卷一样 02/03 10:30
119F:推 Rattlesnake : 好棒喔 那a股一定井喷罗?疑 怎麽跟大家一起向下 02/03 10:44
120F:推 waeting : 多吹一点不制造恐慌怎买 02/03 10:45
121F:推 jackliao1990: @patrol 文组小粉红以为ptx很好写 还ds去跑xddddd 02/03 11:05
122F:嘘 eriker : 喔 怎麽不开源出来 结果程式码用pytorch 这不就cuda 02/03 11:27
123F:→ eriker : 吗 02/03 11:27
124F:推 jamesho8743 : 牛逼个小 就算能跑有屁用? 慢的跟龟一样 看看3A大 02/03 11:42
125F:→ jamesho8743 : 作在中国显卡上跑成什麽样子? 02/03 11:42
126F:推 suzu1 : 中国能做就不要给美国做,不然川普又继续乱搞了 02/03 12:06
127F:推 mdkn35 : 我看这次真的完蛋了 02/03 12:30
128F:→ mdkn35 : pytorch只是个介面 後面要接cpu或cuda可以自己选… 02/03 12:30
129F:推 ImHoluCan : 显卡对岸要是行,对岸早就把Nvidia 台积电干掉,当 02/03 12:31
130F:→ ImHoluCan : 初对岸政府花多少人力物力都搞不起来 02/03 12:31
131F:推 lusifa2007 : 别闹了 寒武纪都快倒了 02/03 12:59
132F:→ pziix : 老黄一开始就是在骗盘仔 卖贵死人的GPU 02/03 13:27
133F:推 mamorui : PTX只有NV卡看得懂 ˊ_>ˋ 02/03 13:48
134F:推 brendon7831 : 要讲绕过这件事情你有问过yo叔吗 02/03 14:52
135F:→ heinzblack : 意思就是花时间绕过也不要amd 02/03 17:35
136F:推 doranako : 很难维护,换一张卡要重写,不是,还是得买nv显卡 02/03 21:21
137F:→ doranako : 啊,不然你要用amd? 02/03 21:21