作者jk21234 ( 1569 11 /47)
站内PC_Shopping
标题Re: [情报] 改架构 拼28nm,AMD显卡7000呼之欲出
时间Wed Jun 29 18:04:00 2011
这个解读似乎有很大的误解......
如果前一个泄漏的HD7000设计的投影片不是假造的话,
那麽HD7000并非放弃VLIW架构,反而是VLIW/SIMD双模式.
但这种设计还比纯粹的VLIW复杂一点...可能不太多啦,
毕竟以复杂度以及弹性来说VLIW高於SIMD,所以它的骨子
里面仍然是VLIW.
可是增加一个SIMD的支援有甚麽好处?SIMD能做的VLIW也通
通能做啊...
例如,SIMD帮四组资料作加法:
ADD (x1,x2,c1),(x3,x4,c4),(x7,x9,c8),(x9,x10,c3)
VLIW下就是:
ADD (x1,x2,c1);ADD (x3,x4,c4);ADD (x7,x9,c8);ADD (x9,x10,c3)
最明显的差别就是SIMD只要指定做一个ADD,四组资料会一样的动作,
可是缺点就是它这四组得做同样的动作.要想两个去做加法两个去做乘法
就不行了......实际对应到硬体实作,就是SIMD版本的指令会使用比较少的byte,
VLIW的会比较多,这其实有不少的好处,因为DirectX下的shader code有限制指令
buffer的长度,能用SIMD模式的话,例如原本塞800个指令是上限,可以多个1.5~2X,
做出更复杂的特效.搭配指令快取也会有比较好的效率....不过好处仅此为止.
把所有可能性都纳入考虑的话,HD7000的改变有可能为:
1.VLIW/SIMD双模仅是过渡期,VLIW是相容,未来才会被取消掉.
老实说不太可能,跳去作纯SIMD会造成灾难性的问题.
我不用理论举例好了...R600(HD2000)就是一个与其说VLIW但因为限制较大
还稍为接近SIMD的指令架构,R600跟R770(HD4000)的性能对比如何相信大家
都很清楚.....比R600更接近纯SIMD会怎样?
而且改成SIMD,编译器不会比较好作,加上DX GPU现在是拿虚拟的组合语言
去喂给driver,driver帮你最佳化重排.这个在纯SIMD模式下不会省掉最佳化的
需求.只会更难做.假设以往的5D VLIW的compiler(IL to 硬体)复杂度是10,
那nVidia那边的架构也会依赖(ptx to硬体),但简单一点复杂度可能只有2
纯SIMD下对compiler的依赖度可能一下跳到30以上.
要是这样只能期待每个开发者都有一堆手写组合语言大军支持你....
不过ATI/AMD的GPU过去不管(只算n+A)市占6成还是4成,业余开发者以ATI/AMD
GPU为标准的差不多都是2成上下.....那这方面还是它在现实中的弱势.
所以放弃掉VLIW的确是不合理.....
2.VLIW/SIMD双模式是新架构.
好处就是前面说的做某些事情的指令可以变短,但考虑到会因此增加指令编码
的复杂度,也会增加硬体上指令解码的额外复杂度.所以相抵之下可能不会比原有的
VLIW多塞入到2X的指令数量....再说现有的指令缓冲区大小,如果只是Pixel Shader
以及Vertex Shader等绘图特效,指令上限数是很够用很难用完的.
但是GPGPU,或者是想在游戏上拿GPU帮你计算物理模拟的时候,这时候需要的指令
总数可能会比硬体一次能塞的多非常多......由於分段载入多少还会影响效能,
因此这个扩充到SIMD的方向在GPGPU以及物理模拟上会有很大的好处....
还有一个好处是在愿意手写GPU code的人上,假设新版的IL提供了SIMD的指令版本,
那花脑力手动写IL,就可以在平行度很高的地方自行通通用SIMD版本下去写,跳过
compiler的最佳化....
==
其实nV那边就是一个说VLIW也可以但这因素不重要的硬体架构啦...
--
※ 发信站: 批踢踢实业坊(ptt.cc)
◆ From: 114.37.171.58
1F:推 quarter411:看不懂 哈哈 06/29 18:05
2F:推 friedpig:看不懂 推就对了!!! 06/29 18:06
3F:推 Lansbury:快推 免得被人发现看不懂......疑? 有人自招了 06/29 18:10
4F:推 ICEFTP:推完还是不懂,应该可以吧?XD 06/29 18:12
5F:推 qioip:呱呱呱呱 (轰隆~~ 06/29 18:13
6F:推 batschris:看不懂 推就对了!!! 06/29 18:14
7F:推 ArSaBuLu: 看不懂 推就对了!!! 06/29 18:16
8F:推 ChangWufei: 不懂 推就对了!!! 06/29 18:17
9F:推 zxcvbnm00316: 懂 推就对了!!! 06/29 18:18
10F:推 batschris:楼上好厉害~看得懂~ 06/29 18:21
11F:推 celestialgod: 懂 推就对了!!! 06/29 18:23
12F:推 silver2012:专业推 还是看不懂 06/29 18:24
13F:→ rex105:原来是这样! 专业推 06/29 18:25
14F:推 ebolalala:看不懂 推就对了!!! 06/29 18:27
15F:推 biostrike:看不懂 推就对了!!! 06/29 18:30
16F:推 Ekmund:...只能推了 06/29 18:35
17F:推 louis0407:只看的懂结论 还是推!! 06/29 18:45
18F:推 halow: 连看都没看 推就对了!!! (喂 06/29 18:48
19F:推 maplemeowcat:看不懂 推就对了!!! 06/29 18:48
20F:推 Alertme:爷~ 这是二进位的IO码吗@@? 06/29 18:50
21F:→ Nappa:naruhodo 06/29 18:50
22F:推 lyt316:快推 不然人家以为我们不懂 06/29 18:54
23F:推 Cadia:看不懂推就对了 06/29 18:56
24F:→ HSKao:看不懂 只给箭头...XD 06/29 18:57
25F:推 MK47:看不懂 推就对了!!! 06/29 18:59
26F:推 james1201:不推人家以为我们看不懂 06/29 19:07
27F:推 karl7238:好专业推一个 06/29 19:13
28F:推 EndlessYearn:有神快拜 我承认文章80%都不懂 06/29 19:17
29F:推 taipeiliu:让我想到了矩阵~ 06/29 19:36
30F:推 AXby:快推 不然人家以为我们不懂 06/29 19:37
31F:推 H264:快推 不然人家以为我们不懂 06/29 19:38
32F:推 vitoman:INTEL表示: 06/29 19:39
33F:推 justlovenene:看不懂 推就对了!!! 06/29 19:43
34F:推 chugliang:XDD 推 06/29 19:44
35F:→ a3939889:请问SIMD的全名是??? 06/29 19:49
37F:推 Umol:快推 不然人家以为我们不懂 06/29 19:56
38F:推 virus2007:力洗勒公杀小~~~推啦!!! 06/29 19:57
39F:推 shiyeh:为什麽一篇90%以上的乡民都看不懂的文章会被M阿 XD 06/29 20:22
40F:→ Nappa:因为版主看得懂 06/29 20:24
41F:推 suzukihiro:就是因为看不懂才会被M www 06/29 20:24
42F:推 Egami:不M的话 板主会被怀疑看不懂XD 06/29 20:25
43F:→ tsukiyomi:快推 不然人家以为我们不懂 06/29 20:31
44F:→ q0325:就像一毕卡索的画一样 很多看不懂也说名画 误 06/29 20:32
45F:推 RHTZ:谁...谁说我看不懂得 (? 06/29 20:32
46F:推 suzukihiro:不然你解释一下甚麽是VLIW 06/29 20:33
47F:→ suzukihiro:不要偷GOOGLE 06/29 20:33
48F:→ RHTZ:Very long instruction word 06/29 20:34
49F:推 suzukihiro:你的鸟跟我说你远端GOOGLE 06/29 20:36
50F:推 atana:有看没有懂 06/29 20:42
51F:推 davidbright:请jk大说明,所以7000有啥实际上的大突破呢? 06/29 20:56
我觉得没有 就是一代一代的慢慢作改变下去,走VLIW/SIMD双模式是种渐进的发展.
DX以来的显卡晶片很少在一代就有重大的革命,唯一的例子是在踏入DX10的时候,
改US等於砍掉重来.结果就是我们看到的HD2900还有8600GT的晶片面积/效能比......
从旧有的VLIW过渡到VLIW/SIMD双模式,平均每个SP占用的面积会增加一些,
不过它的好处如上所示.就算GPGPU的增益可能最大(附带搭配HD7000其余的
改进.可以发现它的改变程度不下於当初的Fermi),这部分在绘图性能上也
会有好处.还有就是愿意手动最佳化的开发者也可以得到比原有VLIW架构
更好的效果..
但是放弃掉VLIW变成纯SIMD除了简化硬体设计很多以外,坏处更多.
再说若是SIMD模式可行的话,别说今天的GPU厂商不会门槛高到只有n+A,
连Cell都有可能担任GPU了.
另走途径放弃掉VLIW架构不是不可能,但可能出现的模式应该是深度管线
或者是类似nV的架构的模式...
52F:推 hollynight:还是好复杂 给个推好了 囧 06/29 21:46
53F:推 mimimaster:太专业了吧 @@ 06/29 21:50
54F:推 ttyyoop2003:太棒了.... 可以说白化文吗. 06/29 22:05
55F:→ tkuallen:我看得懂你说的每个字! 06/29 22:12
56F:推 PhenomII:看不懂反正推就对了 06/29 22:14
57F:推 tkuallen:补推!! 06/29 22:15
58F:推 landattack:这篇文章值得留起来... 06/29 22:47
59F:→ a1234957:赞XD 06/29 23:10
60F:推 tipi0212: 懂一半 推就对了!!! 06/29 23:29
61F:推 TassadarGau:专业文推一个,虽然几乎看不懂XD 06/29 23:35
62F:推 a9734329:所以对玩家来说,南方的效能增加不多罗?28nm的优势? 06/30 00:02
28nm的优势就是至少再塞入两倍的电晶体数量.而显示晶片
电晶体数量加倍时性能也几乎增加了一倍.
63F:推 Lansbury:都写着每一代都是多一点多一点了 这两家都一样 06/30 00:02
64F:推 a9734329:被楼上点醒了,6950=5870!!! 06/30 00:12
65F:推 Lansbury:6代是大改 所以有阵痛期 不过如果7又大改的话 06/30 00:34
66F:→ Lansbury:对手则是刚好4到5收割期 现在显卡又NV上风去了 06/30 00:35
HD6900的4D以此文的标准不算大改.因为HD7900的改变会大於5870<-->6970
中间的差别.虽说两者都是微架构上有一定的变化.
67F:→ justice2008:纯SIMD是不是生产成本比较低? 06/30 02:00
应该需要的电晶体数量少多了.但是这时影响晶片面积的还有一个因素是暂存器
需要几个Read/Write的port.
68F:推 yoyodawning:推就对了 06/30 06:04
69F:推 neofire:完全看不懂,多来点嘴炮文让我发挥吧。 06/30 07:51
※ 编辑: jk21234 来自: 114.37.133.91 (06/30 09:10)
70F:推 Treant:看懂10% 还是要推!! 06/30 16:08
71F:推 hillcheng:看不懂 推就对了!!! 07/01 07:20
72F:→ freakclaw:请问那是GPU的Assembly吗? 07/01 22:08
73F:→ freakclaw: 看起来是 07/01 22:08
74F:→ jk21234:那不是真的GPU asm,是示意.... 07/02 22:54
75F:推 HD5566:看不懂 推就对了!!! 07/07 20:57
76F:推 davidbright:jk兄您是做显卡的吗?@@ 10/20 22:46