Re: [请益] 最近的显示卡

时间Fri Oct 12 19:50:59 2007

大家都知道DirectX 8 将3D处理分成Vertex Shader 跟 Pixel Shader (DirectX 9只是增加精度) 一次处理都是四个资料像Vertex Shader 空间三轴跟单位向量(XYZW) Pixel Shader 红绿蓝跟透明度 (RGBA) 因为像素跟顶点当作向量处理所以又称为"向量运算单元" (vector-4) 这是早期 Geforce 4 跟 Radeon 8的做法但是这就会衍伸出一个问题如果我要处理一个材质譬如说从红色变成淡红色那我RGBA 四个运算单元只要改一个透明度就好了这样就会造成其他三个运算单元没事干所以为了提高运算单元的使用率 Vector-4 被拆开成Vector-3 加一个Scalar (1D纯量) 这样一次还是可以送四个资料但是如果有需要一次送一个资料时也是可以虽然整体运算总数不变但是使用效率却提高了这是Geforce6 Radeon 9 一直到 Geforce 7 Radeon X1000都是不同的是Geforce 6/7还可以拆成 2D+2D 进一步增加使用率不论你是3D+1D 2D+2D 都会有运算单元被闲置在切下去就没有第二条路了所以DirectX 10 最大的改变就是把Vertex Shader 跟 Pixel Shader取消直接变成 Unnifed Shader 管你是3D或4D 全部拆成1D去计算这样就可以避免 Shader被闲置但这样就衍伸出需要更复杂的控制单元来监控附载状况所以在DirectX 10多加了一个 Geomerty Shader (几何运算) 几何运算的单元称为串流处理器(Stream Precessor 简称SP) R600有320SP G80有128个数字大并不是就好因为两个的设计理念完全不同 G80的想法很简单就是有一个独立的硬体把4D拆成1D 128个SP里有谁闲置就丢进去运算而R600的状况就比较特殊他是利用VLIW架构64个五路超纯量单元逻辑上拆成 320个1D SP单元再组合成4个SIMD组群 VLIW这个功能是原本用在CPU上做运算指令平行化的技术这有点像在玩俄罗斯方块如果本来有1D 2D 3D 4D各一个透过驱动程式排列後拆成两个5D超长指令串再送进运算单元(SP)里资料排列纯粹看驱动程式的写法必要的时候还可以打散资料再重排用VLIW来重新排列组合其实是满冒险的因为驱动程式的平行化是满费工夫的由於没有硬体路线使用率要到达90%是非常难的不是不可能是非常难得要靠驱动程式改版个十几次才有可能达成 G80是靠纯硬体有专门拆散或组合资料与重组之後平行运算相依性的部分 R600要靠驱动程式而且得确保不会占太多CPU资源 R600与G80还有个不同之处就是SIMD 无论是R600的超纯量单元与G80的1D纯量单元都不可能让64个或128个运算单元各自处理不同的指令这样线路会复杂到爆表分成组群是必要的每个组群在单一周期内执行相同的指令这就是SIMD R600是320分四组 G80是128分8组由於是SIMD 同组群只运算相同的资料型态 (像素几何或顶点)这样可以简化线路且确保高效能但对使用率就会有一定的影响因为相同指令的资料有可能永远塞不满群组而R600就是在SIMD里在做一次简化让SIMD组群再拆成五路超纯量单元 G80是SIMD切得更细一点用复杂的线路来换取单元使用率总结一下 R600 G80 Unifed shader 架构相同支援DirectX10 360个1D纯量单元内部为 128个1D运算单元 64个五路超纯量单元 VLIW架构用驱动程式重组纯硬体架构资料核心时脉742MHZ 1.35GHZ 512位元记忆体介面 384位元 32个材质存取单元 32个 16个材质过滤单元 64个材质过滤单元 R600特性是利用驱动程式来重组资料这样会比纯硬体的G80成本来的低效能会随着驱动程式不同而有很大的差距如果驱动程式写得好的话 R600的效能是可能超越G80 有些人会觉得说为什麽ATI不用像Nvidia那样直观的方法去做显卡反而要用比较困难的驱动程式来重组资料 ATI的想法很明显逻辑运算单元其实是不复杂的超纯量单元而且少了重组指令的硬体线路由於简单所以可以大量复制成64个相当於有320个1D scalar 理论运算值超高但实际的利用率是取决於驱动程式的VLIW上将重排指令的电晶体成本转嫁到软体上先把硬体做出来靠简单的设计快速缩小在65nm的晶片上压低晶片成本再利用定期更新驱动程式来提升效能好处是随着驱动程式更新会有意想不到的惊喜(?) 照理来说若驱动程式写得好执行1D的效能会是4D的四倍因为VLIW会想办法填满超纯量单元来增加使用率 NVIDIA的想法是完全靠硬体排成打散资料控制单元非常复杂但可强化128SP 性能在内部切出许多阶(stage) 缩短每一阶的工作时脉让运算单元变成核心二倍速的高时脉好处是驱动程式的开发成本不高且65nm後时脉可以拉得更高 ATI跟NVIDIA的目的都是在降低成本但不同的是一个在软体一个在硬体写到这里可能大家都会看出下一个高阶显示卡的决战点会在"成本"与"使用率" 如何降低成本提高SP的使用率是ati跟Nvidia是否的打败对手的关键 R600是设计简单数量多(320SP) 跑得慢(7XXMHZ) G80是线路复杂数量少 (128SP) 跑得快(1.35GHZ) 到底谁优谁劣其实很难说出来以未来性来说 R600简化了线路有助於缩小制成可以塞进更多的SP 而且驱动程式效能应该会设计的越来越好(应该啦) G80在缩小制成後设计很难像R600那麽简单(因为还要塞进控制单元的电路) 但有立即可得的高效能未来只能看它们在中低阶产品所做的成本控制了反正对大家来说规格多好并不是很重要要如何做的便宜又效能好谁就赢了 --

※ 发信站: 批踢踢实业坊(ptt.cc) ◆ From: 122.126.34.181

1^F：推 david31408:顶!!驱动一直是ATI的............ 140.112.1.188 10/12 20:28

2^F：推 loALoa:推!! 61.231.133.252 10/12 20:40

3^F：推 Demohunter:太专业啦~推一个 61.62.114.85 10/12 20:44

4^F：推 ceming:重组资料XD 61.231.232.56 10/12 20:53

5^F：推 deani:精辟 59.126.134.34 10/12 20:54

6^F：推 com9:原po打到最後都累了XD 122.127.56.43 10/12 21:14

7^F：推 playerkilled:同意1f说的，虽说近年来有改进，但.. 125.225.37.2 10/12 21:26

8^F：推 kuchibue:专业！ 124.10.93.91 10/12 22:01

9^F：推 lordmi:1F讲的正是Ati永远的痛，所以..实现不可能? 220.133.61.8 10/12 22:09

10^F：推 WishIsland:大家都知道@@? 我不晓得耶? 长知识 219.68.237.210 10/12 22:20

11^F：推 needhp:推一个，希望Ati要加油啊 163.24.253.18 10/13 01:19

12^F：推 fenix1983:这篇就稍稍看的懂了!学机械的都看懂ㄟ!! 59.112.116.13 10/13 01:30

13^F：推 cowbaying:赞 203.68.15.98 10/13 13:12

14^F：推 chordee:在vista...ATI driver的技术已经逆转了... 220.132.56.130 10/13 18:00

15^F：推 fa18e:我装ATI驱动都没遇到问题 61.57.128.42 10/13 20:46

16^F：推 onlySN:推 163.25.118.131 10/19 11:14

※ 编辑: gogoabc 来自: 118.168.232.182 (05/23 18:26)

	[问题/行为] 猫晚上进房间会不会有憋尿问题
	Re: [闲聊] 选了错误的女孩成为魔法少女 XDDDDDDDDDD
	[正妹] 瑞典一张
	[心得] EMS高领长版毛衣.墨小楼MC1002
	[分享] 丹龙隔热纸GE55+33+22
	[问题] 清洗洗衣机
	[寻物] 窗台下的空间
	[闲聊] 双极の女神1 木魔爵
	[售车] 新竹 1997 march 1297cc 白色四门
	[讨论] 能从照片感受到摄影者心情吗
	[狂贺] 贺贺贺贺贺！岛村卯月！总选举NO.1
	[难过] 羡慕白皮肤的女生
	阅读文章
	[黑特]
	[问题] SBK S1安装於安全帽位置
	[分享] 旧woo100绝版开箱!!
	Re: [无言] 关於小包卫生纸
	[开箱] E5-2683V3 RX480Strix 快睿C1 简单测试
	[心得] 苍の海贼龙地狱执行者16PT
	[售车] 1999年Virage iO 1.8EXi
	[心得] 挑战33 LV10 狮子座pt solo
	[闲聊] 手把手教你不被桶之新手主购教学
	[分享] Civic Type R 量产版官方照无预警流出
	[售车] Golf 4 2.0 银色自排
	[出售] Graco提篮汽座（有底座）2000元诚可议
	[问题] 请问补牙材质掉了还能再补吗?(台中半年内
	[问题] 44th 单曲生写竟然都给重复的啊啊！
	[心得] 华南红卡/icash 核卡
	[问题] 拔牙矫正这样正常吗
	[赠送] 老莫高业初业 102年版
	[情报] 三大行动支付本季掀战火
	[宝宝] 博客来Amos水蜡笔5/1特价五折
	Re: [心得] 新鲜人一些面试分享
	[心得] 苍の海贼龙地狱麒麟25PT
	Re: [闲聊] (君の名は。雷慎入) 君名二创漫画翻译
	Re: [闲聊] OGN中场影片：失踪人口局 (英文字幕)
	[问题] 台湾大哥大4G讯号差
	[出售] [全国]全新千寻侘草LED灯, 水草

WEB批踢踢(PTT)

VideoCard 板

Re: [请益] 最近的显示卡

热门看板

赞助商连结