作者Disjoint (I'm Neil, Not Anderson!)
看板nb-shopping
标题[讨论]关於显示卡效能的比较
时间Mon Jul 25 01:14:27 2011
换个标题重发..再整理一下并上色
并且继续关於显示卡记忆体的讨论...
======================前文提要==============================
看来还是很多人不知道显卡的比较方式
就让我来赚一下P币...
要比较显示卡效能..
一般最常见的方式就是比较
显示卡晶片
那怎麽比哩?..拿尺量?测温度?还是跑 3DMark?
一般大家认为最公正的方式就是实际跑游戏跟测试软体(3DMark)
但是你又不可能真的去买两张来比较,所以只能看文章打嘴炮
然後又分nvidia跟ATI两大阵营..晶片之外还有RAM的比较...
要比真的比不完阿!但是还是有比较快速而不用到处找资料的方式!!
注意!接下来的方式是单纯比较显示卡晶片!!
记忆体的部分後面再提!!不要搞混!!
那要如何最快速的比出两个显示晶片的效能呢??
小弟就在这献丑啦!!其实有一个很公正的比较方式
就在下面这两个网页
http://en.wikipedia.org/wiki/Comparison_of_Nvidia_graphics_processing_units
http://en.wikipedia.org/wiki/Comparison_of_AMD_graphics_processing_units
阿~~靠腰全英文...英文没学好怎麽办??
其实没这麽复杂啦!!
这两个网页是有关两大阵营"
所有GPU(显示晶片)的公版设定&测试数值"
绝对绝对是最最完整的比较资料~~
那要怎麽比较呢??
前面那些MEMORY的设定就不提了
至於Clock speed则是原厂设定,除非超频版不然就应该不会差太多
主要的数值在
Pixel Fillrate、Texture Fillrate、Memory Bandwidth跟GFLOPs
1.Pixel Fillrate => 就是平均一秒可以画出多少像素
2.Texture Fillrate => 就是一秒可以画出多少图形(Texture)
3.Memory Bandwidth => 记忆体的频宽流量
4.GFLOPs => 显示卡的运算速度(跟CPU同样)
基本上就是越高越好
1&2决定晶片的绘图能力
(越高当然就是可以画得更快.FPS就高)
3决定晶片的输出效率&上限
(运算快or画得快但是被Bandwidth限制住而没办法达到效能上限就没意义)
4决定运算的速度
(现在的技术来说对一般运算影响不大,主要是3D运算)
有了上面的基础应该很快就可以比出显示卡晶片的优劣了吧!!
SO...GT520M跟GT540M怎麽比呢??
GT520M GT540M
Pixel Fillrate 2.96 2.68
Texture Fillrate 5.92 10.75
Memory Bandwidth 12.8 28.8
GFLOPs 142.08 258.04
结果呢??就算Fillrate没差..光Bandwidth就差一倍有余
更何况Texture Fillrate跟GFLOPs也差了快一倍
所以估计效能大约会差将近1倍左右
然後对照一下置底文的3DMark分数比较
GT520M GT540M
置底文分数 4700~5100 8400~9100
如何?是不是不用实测就可以知道效能了??
补充一些额外的.....
以上当然是只有对公版的比较(什麽是公版..这个..就当他是最初的初版吧!)
各家厂商会再针对GPU时脉、记忆体、散热作不同的改装
所以效能的差异就出来了!
会变动的,最主要是晶片时脉的差异,直接影响Fillrate
记忆体要注意时脉跟汇流排数(就是一般说的128bit、64bit)
这会影响Memory Bandwidth
散热..只要不要太糟就好
再来关於记忆体部分...下次再说好了!!
只要大家有个基本的认识:
1.记忆体不是多就好!(显示尺寸不大100M跟1G效果一样)
2.不是记忆体快就一定会快(要看晶片够不够力)
3.频宽才是影响显示卡效能的重大因素
就这样!!先去忙了!!
===========================前文结束=========================
上面说的是不用实测,而且可以大略、快速的推估显示卡晶片效能的方法
这部分是关於记忆体的讨论...
先简单介绍一下RAM在显示卡中扮演的脚色
CPU(收到图形显示要求)
↓
发指令给GPU进行运算,同时将图形材料(Texture跟Pixel)传入显示卡记忆体
↓↑(
注意!贴图不是一次到位的)
GPU将运算结果+贴图之後的画面资料放入记忆体
↓
从记忆体将最後的结果输出到显示器画面
而在这个架构下,记忆体对於整体显示卡的效能提升在哪里?
当然就是他的存取速度啦!!也就是Bandwidth
如果他可以同一时间进出更多画面资料,整个画面就会流畅
记忆体的Bandwidth怎麽算呢?
Bandwidth = 记忆体汇流排数 x 记忆体时脉
(就是常说的bit啦) (这不用说吧!!)
那记忆体大小呢??
抱歉!影响真的不大!
用简单的例子说明一下
假如你的是现在最高画质1920*1080p+全彩
意思是每张画面的大小是1920*1080*32bit=7.9MB
姑且算一张画面占你8MB的记忆体
但换个角度来看,图形的输出流程图其实是像这样:
记忆体 空白 第一层贴图 第二层贴图 反锯齿後的画面 最後画面=>输出
↘ ↗ ↘ ↗ ↘..........↗ ↘ ↗
GPU 贴图运算 贴图运算 依此类推 反锯齿运算 最後加工
你发现了什麽??就算你2GRAM可以一次放250张画面
但每一张画面都是快速的在GPU跟记忆体之间进进出出
很少有机会让你把记忆体用到完,真正消耗的反而是Bandwidth
光一张图来来回回的处理就吃掉大量的Bandwidth
所以GPU的运算效能跟Bandwidth才是主导显示卡效能的两大因素
再来针对上一篇最後提到的迷思做个讨论:
1.记忆体越大越好
错!!大错特错!!!!!
影响显示卡效能的主要因素是显示卡晶片
晶片效能不好给你1000GB显卡还是垃圾
再来就算晶片效能好,你Memory Bandwidth不够记忆体给你1000GB也还是垃圾
记忆体的多寡主要在於高解析度画面&&特殊运算需要记忆体空间时的效果较好
其他时候真的只要够用就好,效能完全取决於GPU晶片跟Bandwidth
多的空间都只是让你跟小朋友走比较远
低阶析度的话!RAM再怎麽大也只要到达GPU跟Bandwidth上限剩下空间都没用
其实现在就算1920*1080的解析度玩一般3D游戏1GB差不多刚好
至於那种1366*768解析度的笔电...1GB都很够
更何况NB多半都是被阉割的GPU,RAM的大小根本不是重点
2.记忆体快效能就一定好
记忆体主要是用来存放运算画面的,当然速度快有助於效能
但是GPU才是真正影响效能的大重点(特别是3D画面),
而且还要考虑到汇流排的大小
所以同款晶片只要搭配能压榨出GPU效能的最高Bandwidth就好
记忆体DDR-400MHz+512bit还是可以胜过DDR5-1600MHz+32bit
3.Bandwidth才是影响显示卡效能的最大因素
其实前面讲很多了!显示卡主要效能的两大因素就显示晶片+Bandwidth
在记忆体中讨论的当然就是Bandwidth啦!!
不要被市面上什麽DDR5.2GRAM骗倒了
等等给你DDR5-800MHZ+32bit就让你欲哭无泪,2GRAM根本无用
以上,一点心得分享!希望对大家有帮助!
--
7/25续补充
有人提到主机板对显示卡的因素,容许美术不好的我画一张图表示一下
这才是所谓的Memory Bandwidth!!
↗
└─┬────────
↗─────────┐
│ 画面输出
↗ ┌───────┐│
┌┤←←←←←←←
←←│ ││
││ ┌───┐→
→→│ ││
DVI││ │ │←
←←│ ││
└╡ │GPU│→
→→│记 忆 体 阵 列││
│ │ │←
←←│ ││
│ └───┘→
→→│ ││
│ ↑ ┌
→→│ ││
│ ↑ ↑ └───────┘│
∣
∥∥∥∥∥∥∥∥∥∥∥∥∥∥∥∥∥∥┘=>与主机板传输的介面
↑ ↑
↑ └←←←←
Pixel跟Texture的资料
└←←←←←←←
CPU送给GPU的运算指令
OK!我知道画很丑!但是大概能表达出我要表达的意思了
基本上与主机板传输的频宽(Bandwidth)是固定的
看用什麽介面就决定了他的Bandwidth大小,假如是PCI-E 16X就是固定16GB/s
但是因为他只是简简单单传Pixel跟Texture还有平面2D的图像
其实很够了,真正影响到效能的一直都是Memory Bandwidth!!
另外,这不是什麽"我的理论",
这是现行computer architecture中针对Display这一部分的简单介绍
只要没有重大的创新与突破,这些计算方法都是可以一直使用的
实测只是通盘数值化,方便理解,但是资源不足的我们可以用理论推估实测结果
如果是要提各家的显示卡厂商的效能差异,
我之前也说过了,效能的重点是晶片跟Bandwidth
晶片主要就是时脉跟绘图晶元的组合
Pixel Fillrate跟Texture Fillrate的算法简单讲就是时脉*晶元数
(P.S.实际上当然没这麽简单,只是简化来说可以这麽比较)
当晶片相同(意即晶元数不变),时脉调高,效能当然是正比提升
而GFLOPs也是随着时脉的提高会有正比的提升
所以当你提高时脉10%,晶片的效能就可以约略提升10%
Memory Bandwidth前面也提过,就是汇流排数*记忆体时脉
SO...记忆体大小一直都不是效能的重点
不同厂商做的显示卡,只要没有调GPU时脉、改汇流排数跟记忆体时脉
基本上的效能不会相差超过5%,如果有改,那就看怎麽改了
调高时脉基本上就是提升效能,只是会提高温度跟降低稳定性
汇流排改高就是提升效能,反之则将低
另外常常有人说到"开管",可以提升显示卡效能
这是什麽东西??
简单讲就是打开被厂商封印住的晶元管线(非常简化的讲法)
会封印的原因多半是晶片为不良品或者没通过完全测试
所以封印一些管线提高稳定度当作中阶产品出售
"开管"就是解除那些封印,增加晶元数,
就可以提升Pixel Fillrate跟Texture Fillrate
但要注意的是GFLOPs不会提升!
而且有可能造成显示卡不稳或热当
--
※ 发信站: 批踢踢实业坊(ptt.cc)
◆ From: 114.37.108.104
※ 编辑: Disjoint 来自: 114.37.108.104 (07/25 01:15)
1F:→ afgb28:照这样讲来 GT525跟540效能的差距算大吗? 07/25 01:16
2F:→ afgb28:因为在考虑L740或是4750 07/25 01:16
3F:推 pertonas:不小 07/25 01:17
4F:→ Disjoint:回楼上.差距颇大.以桌机来说就是8600GT vs 6600GT的差距 07/25 01:19
5F:→ Disjoint:XD.有误.540跟520有差距.但跟525的差距不大... 07/25 01:21
6F:→ Disjoint:但GT540m还是小胜GT525m的 07/25 01:21
7F:→ afgb28:我知道540比较强 可是...一个说不大 一个说不小 我该..? 07/25 01:26
8F:推 pertonas:玩游戏 GT540M 07/25 01:28
9F:推 aakkman:540大概笔525强个10-15%左右 07/25 01:29
10F:推 thai0907:to afgb 上面说的是跟520差不小跟525差不大 这样 07/25 01:34
11F:→ Disjoint:差不多就10%吧...不知道这样的差距你觉得大或小呢?? 07/25 01:34
12F:→ afgb28:喔喔 大概知道了 我在评估看看吧^^ 感谢楼上各位 07/25 01:36
13F:推 davidyao:NVS 4200M跟GT 520M会差很多吗? 跑游戏.... 07/25 01:57
14F:推 QuentinHu:基底是同一张卡 但是价格不同... 07/25 01:58
15F:→ QuentinHu:你只要打游戏的话可以不用买那张 07/25 01:58
16F:→ QuentinHu:买T420S打电动也太奢侈了点 07/25 01:58
17F:推 davidyao:所以意思是很够用罗? 那些mark的分数可以不用理会吗? 07/25 02:00
18F:→ davidyao:其实是看上他的重量跟USB3.0 还有保固 07/25 02:00
19F:推 QuentinHu:看你要打什麽电动 07/25 02:06
20F:→ Disjoint:比起来我是觉得4200M应该赢20%~25%吧 07/25 02:07
21F:推 ohruha:推!!!!!! 07/25 02:14
22F:推 davidyao:星海二罗~~~ 要打4v4 特效中就可 07/25 02:15
23F:推 ohruha:用这篇打个比方 就好比个女生明明只有A罩杯的胸围 她偏偏要 07/25 02:23
24F:→ ohruha:买个D罩杯的胸罩穿 她原本A胸也不会因为穿了D罩杯就长出肉 07/25 02:24
25F:→ ohruha:来啊XD 也就是说 电脑本身支援不到 就算给你100GB也没用 07/25 02:25
26F:推 QuentinHu:楼上为啥一定要用罩杯比喻 >///< 07/25 02:43
27F:→ QuentinHu:4 V 4特效中 请买GT540M机种 07/25 02:43
28F:推 davidyao:意思是NVS 4200M推不起来吗? 07/25 02:48
29F:→ ohruha:与其太多专有名词 不如这个比喻比较浅显易懂的多~~XD 07/25 02:50
30F:推 QuentinHu:GT540M都很勉强了 你说呢 07/25 03:03
31F:→ QuentinHu:别忘了GT540M还没比9600GT、4670强 ... 07/25 03:03
32F:推 dhzzzj:先推了再说 看NB-S长知识 07/25 03:05
33F:推 ad0960:请问一下可以请原po进一步定义一下什麽是bandwidth好吗? 07/25 03:19
34F:→ ad0960:原本不太懂电脑零件 看了这篇有不小长进 就差这个定义= = 07/25 03:20
35F:推 ad0960:应该说 对於bandwidth的定义在想像上有困难 07/25 03:22
36F:→ ad0960:高的bandwidth的显卡可以让cpu一次放进更大张或更细致的图 07/25 03:23
37F:→ ad0960:是吗?( 假设CPU够快(从这里倒是可想像CPU插有显卡也没用) ) 07/25 03:24
38F:→ ad0960: 差 07/25 03:25
39F:→ ad0960:所以好像一般笔电的规格显卡和CPU的等级都是齐高齐低 07/25 03:26
40F:→ ad0960:其中一个高根本没用 不知道这样理解o不ok 07/25 03:27
41F:推 davidyao:那特效开低好了XD 那ATI6630呢? 4v4特效中 推得动吗? 07/25 03:31
42F:推 jason112412:看完罩杯的比喻就懂了 07/25 07:53
43F:推 ericinttu: 更不懂 (被打 07/25 08:45
44F:推 ff181:推~想请问一下 所以中度玩家 GT540 1G跟2G没什麽差别? 07/25 08:50
45F:推 QuentinHu:GT540M配2G 绝对是行销端想出来的 不是工程端... 07/25 09:08
46F:推 ff181:囧...感谢楼上大大 我还是继续做功课T.T 07/25 09:13
47F:推 gn00330501:显卡等级+DDR高 才是影响这张显卡强度的主要原因 07/25 09:19
48F:推 gn00330501:那个甚麽 2G 3G显卡不是影响游戏卡效能主要因素 07/25 09:27
49F:→ ericinttu:写程式有用到GPU的ram的话, 2G比较好用 XDDD 07/25 09:53
50F:推 ff181:恩恩 感谢Q大 gn大 e大 我知道自己的需求了 感恩~ 07/25 09:54
51F:推 FlandreUFF:其实有用到gddr5时,因时脉增加总传输速度增加 07/25 11:31
52F:推 QuentinHu:没想到我这样隐喻 你也看得懂 XDDD 07/25 12:43
53F:→ Disjoint:Bandwidth的定义:拿捷运来做比喻.人潮当作传输的资料 07/25 14:04
54F:→ Disjoint:车子的速度就像时脉:时脉高=>车速快、发车间距短 07/25 14:06
55F:→ Disjoint:车厢多寡就像记忆体大小:一次可以乘载的最大上限 07/25 14:06
56F:→ Disjoint:而Bandwidth就像月台数:月台多=>人(资料)进出就快 07/25 14:08
57F:→ Disjoint:所以当GPU全速运转、资料不断涌进,要让画面顺畅 07/25 14:09
58F:→ Disjoint:重要的是月台多、间距短、车厢多寡反而不是重点 07/25 14:11
59F:→ Disjoint:十节车厢只有一个进出口,人的流动还是缓慢 07/25 14:12
60F:→ Disjoint:不知道这样解释大家有没有清楚一点??? 07/25 14:12
61F:→ EAFZCO:噗哧 迟早有人会来发一篇「各家主机板设计对频宽的影响」 07/25 15:17
62F:→ EAFZCO:对照你的理论 实测才有意义 因为你没测根本不知道机板设计 07/25 15:18
63F:→ EAFZCO:对bandwidth的影响有多大...除非各家都套intel公板... 07/25 15:18
64F:推 ad0960 :比喻上是听得懂 那我说的究竟是对的吗? 07/25 18:34
65F:→ ad0960 :dis大的比喻似乎和我实际地问法不谋而合 07/25 18:35
66F:→ ad0960 :另外 显卡和CPU的运算速度都是用"时脉"一词吗? 07/25 18:37
67F:推 geniusshiun :我查了一下Intel 2代内显HD3000 bandwidth 是21.3 07/25 19:00
68F:→ geniusshiun :所以是还可以瞜? 07/25 19:00
69F:推 avonboy :我爱D罩杯~ 07/25 19:09
70F:推 YoshihiroK :推!反正显示卡再差,可以用Office套装软体就好^^ 07/25 19:42
71F:→ Disjoint :有人误会我的意思了..可能我没说清楚吧...修一下文 07/25 21:04
※ 编辑: Disjoint 来自: 114.37.88.119 (07/25 22:25)
72F:推 O87 :推推! 07/25 21:38
※ 编辑: Disjoint 来自: 114.37.88.119 (07/25 22:51)
73F:推 jasontai :请问(举手), 那绘图(solidworks)有必要用NV QD2000M? 07/25 23:10
74F:→ EAFZCO:你讲的东西是纯理论,但是实际上lay线路不是你想像那麽简单 07/26 14:39
75F:→ EAFZCO:照你的理论,同样显示晶片/GDDR配置,在不同机器的测试结果 07/26 14:39
76F:→ EAFZCO:会是相同的?我个人觉得你可以拿双A的机器跟MSI机器来比比 07/26 14:39
77F:→ EAFZCO:看,同款显示晶片在不同机板上的测试差距有多少... 07/26 14:40
78F:→ Disjoint:楼上.我的标题是显示卡比较.不是显示卡+主机板的比较 07/26 18:19
79F:→ Disjoint:不讲理论.那来讲实测..在不同平台测两张不同显示卡来比较 07/26 18:21
80F:→ Disjoint:聪明如你.想也知道不公平..而我只针对显示卡卡的比较. 07/26 18:23
81F:→ Disjoint:当然是指在相同平台下各个显示卡的效能差异..... 07/26 18:23
82F:→ Disjoint:我也没有说,同样显卡在不同机器上的效能会一样.... 07/26 18:25
83F:→ Disjoint:再来.To jasontai:以往专业绘图卡的优势在对openGL的支援 07/26 18:27
84F:→ Disjoint:以及针对绘图需求作细部、透视、旋转..etc的最佳化 07/26 18:29
85F:→ Disjoint:而其实绘图卡的GPU跟一般大众化的显示卡是一样低 07/26 18:32
86F:→ Disjoint:只是取向不同罢了,绘图卡跑游戏不见得比一般卡好 07/26 18:33
87F:→ Disjoint:也不知道他到底在贵什麽??如果真的不是很大量需要绘图 07/26 18:34
88F:→ Disjoint:那笔钱拿去买高阶的游戏卡其实比较有效益一点 07/26 18:35
89F:推 jasontai:SOGA! 多谢解答^^ 07/27 00:02
90F:→ EAFZCO:显示卡没有主机板是无法运作的...所以担讨论显卡无意义... 08/06 19:57
91F:推 redlance:推 03/03 11:12