作者Disjoint (I'm Neil, Not Anderson!)
看板nb-shopping
標題[討論]關於顯示卡效能的比較
時間Mon Jul 25 01:14:27 2011
換個標題重發..再整理一下並上色
並且繼續關於顯示卡記憶體的討論...
======================前文提要==============================
看來還是很多人不知道顯卡的比較方式
就讓我來賺一下P幣...
要比較顯示卡效能..
一般最常見的方式就是比較
顯示卡晶片
那怎麼比哩?..拿尺量?測溫度?還是跑 3DMark?
一般大家認為最公正的方式就是實際跑遊戲跟測試軟體(3DMark)
但是你又不可能真的去買兩張來比較,所以只能看文章打嘴砲
然後又分nvidia跟ATI兩大陣營..晶片之外還有RAM的比較...
要比真的比不完阿!但是還是有比較快速而不用到處找資料的方式!!
注意!接下來的方式是單純比較顯示卡晶片!!
記憶體的部分後面再提!!不要搞混!!
那要如何最快速的比出兩個顯示晶片的效能呢??
小弟就在這獻醜啦!!其實有一個很公正的比較方式
就在下面這兩個網頁
http://en.wikipedia.org/wiki/Comparison_of_Nvidia_graphics_processing_units
http://en.wikipedia.org/wiki/Comparison_of_AMD_graphics_processing_units
阿~~靠腰全英文...英文沒學好怎麼辦??
其實沒這麼複雜啦!!
這兩個網頁是有關兩大陣營"
所有GPU(顯示晶片)的公版設定&測試數值"
絕對絕對是最最完整的比較資料~~
那要怎麼比較呢??
前面那些MEMORY的設定就不提了
至於Clock speed則是原廠設定,除非超頻版不然就應該不會差太多
主要的數值在
Pixel Fillrate、Texture Fillrate、Memory Bandwidth跟GFLOPs
1.Pixel Fillrate => 就是平均一秒可以畫出多少像素
2.Texture Fillrate => 就是一秒可以畫出多少圖形(Texture)
3.Memory Bandwidth => 記憶體的頻寬流量
4.GFLOPs => 顯示卡的運算速度(跟CPU同樣)
基本上就是越高越好
1&2決定晶片的繪圖能力
(越高當然就是可以畫得更快.FPS就高)
3決定晶片的輸出效率&上限
(運算快or畫得快但是被Bandwidth限制住而沒辦法達到效能上限就沒意義)
4決定運算的速度
(現在的技術來說對一般運算影響不大,主要是3D運算)
有了上面的基礎應該很快就可以比出顯示卡晶片的優劣了吧!!
SO...GT520M跟GT540M怎麼比呢??
GT520M GT540M
Pixel Fillrate 2.96 2.68
Texture Fillrate 5.92 10.75
Memory Bandwidth 12.8 28.8
GFLOPs 142.08 258.04
結果呢??就算Fillrate沒差..光Bandwidth就差一倍有餘
更何況Texture Fillrate跟GFLOPs也差了快一倍
所以估計效能大約會差將近1倍左右
然後對照一下置底文的3DMark分數比較
GT520M GT540M
置底文分數 4700~5100 8400~9100
如何?是不是不用實測就可以知道效能了??
補充一些額外的.....
以上當然是只有對公版的比較(什麼是公版..這個..就當他是最初的初版吧!)
各家廠商會再針對GPU時脈、記憶體、散熱作不同的改裝
所以效能的差異就出來了!
會變動的,最主要是晶片時脈的差異,直接影響Fillrate
記憶體要注意時脈跟匯流排數(就是一般說的128bit、64bit)
這會影響Memory Bandwidth
散熱..只要不要太糟就好
再來關於記憶體部分...下次再說好了!!
只要大家有個基本的認識:
1.記憶體不是多就好!(顯示尺寸不大100M跟1G效果一樣)
2.不是記憶體快就一定會快(要看晶片夠不夠力)
3.頻寬才是影響顯示卡效能的重大因素
就這樣!!先去忙了!!
===========================前文結束=========================
上面說的是不用實測,而且可以大略、快速的推估顯示卡晶片效能的方法
這部分是關於記憶體的討論...
先簡單介紹一下RAM在顯示卡中扮演的腳色
CPU(收到圖形顯示要求)
↓
發指令給GPU進行運算,同時將圖形材料(Texture跟Pixel)傳入顯示卡記憶體
↓↑(
注意!貼圖不是一次到位的)
GPU將運算結果+貼圖之後的畫面資料放入記憶體
↓
從記憶體將最後的結果輸出到顯示器畫面
而在這個架構下,記憶體對於整體顯示卡的效能提升在哪裡?
當然就是他的存取速度啦!!也就是Bandwidth
如果他可以同一時間進出更多畫面資料,整個畫面就會流暢
記憶體的Bandwidth怎麼算呢?
Bandwidth = 記憶體匯流排數 x 記憶體時脈
(就是常說的bit啦) (這不用說吧!!)
那記憶體大小呢??
抱歉!影響真的不大!
用簡單的例子說明一下
假如你的是現在最高畫質1920*1080p+全彩
意思是每張畫面的大小是1920*1080*32bit=7.9MB
姑且算一張畫面佔你8MB的記憶體
但換個角度來看,圖形的輸出流程圖其實是像這樣:
記憶體 空白 第一層貼圖 第二層貼圖 反鋸齒後的畫面 最後畫面=>輸出
↘ ↗ ↘ ↗ ↘..........↗ ↘ ↗
GPU 貼圖運算 貼圖運算 依此類推 反鋸齒運算 最後加工
你發現了什麼??就算你2GRAM可以一次放250張畫面
但每一張畫面都是快速的在GPU跟記憶體之間進進出出
很少有機會讓你把記憶體用到完,真正消耗的反而是Bandwidth
光一張圖來來回回的處理就吃掉大量的Bandwidth
所以GPU的運算效能跟Bandwidth才是主導顯示卡效能的兩大因素
再來針對上一篇最後提到的迷思做個討論:
1.記憶體越大越好
錯!!大錯特錯!!!!!
影響顯示卡效能的主要因素是顯示卡晶片
晶片效能不好給你1000GB顯卡還是垃圾
再來就算晶片效能好,你Memory Bandwidth不夠記憶體給你1000GB也還是垃圾
記憶體的多寡主要在於高解析度畫面&&特殊運算需要記憶體空間時的效果較好
其他時候真的只要夠用就好,效能完全取決於GPU晶片跟Bandwidth
多的空間都只是讓你跟小朋友走比較遠
低階析度的話!RAM再怎麼大也只要到達GPU跟Bandwidth上限剩下空間都沒用
其實現在就算1920*1080的解析度玩一般3D遊戲1GB差不多剛好
至於那種1366*768解析度的筆電...1GB都很夠
更何況NB多半都是被閹割的GPU,RAM的大小根本不是重點
2.記憶體快效能就一定好
記憶體主要是用來存放運算畫面的,當然速度快有助於效能
但是GPU才是真正影響效能的大重點(特別是3D畫面),
而且還要考慮到匯流排的大小
所以同款晶片只要搭配能壓榨出GPU效能的最高Bandwidth就好
記憶體DDR-400MHz+512bit還是可以勝過DDR5-1600MHz+32bit
3.Bandwidth才是影響顯示卡效能的最大因素
其實前面講很多了!顯示卡主要效能的兩大因素就顯示晶片+Bandwidth
在記憶體中討論的當然就是Bandwidth啦!!
不要被市面上什麼DDR5.2GRAM騙倒了
等等給你DDR5-800MHZ+32bit就讓你欲哭無淚,2GRAM根本無用
以上,一點心得分享!希望對大家有幫助!
--
7/25續補充
有人提到主機板對顯示卡的因素,容許美術不好的我畫一張圖表示一下
這才是所謂的Memory Bandwidth!!
↗
└─┬────────
↗─────────┐
│ 畫面輸出
↗ ┌───────┐│
┌┤←←←←←←←
←←│ ││
││ ┌───┐→
→→│ ││
DVI││ │ │←
←←│ ││
└╡ │GPU│→
→→│記 憶 體 陣 列││
│ │ │←
←←│ ││
│ └───┘→
→→│ ││
│ ↑ ┌
→→│ ││
│ ↑ ↑ └───────┘│
∣
∥∥∥∥∥∥∥∥∥∥∥∥∥∥∥∥∥∥┘=>與主機板傳輸的介面
↑ ↑
↑ └←←←←
Pixel跟Texture的資料
└←←←←←←←
CPU送給GPU的運算指令
OK!我知道畫很醜!但是大概能表達出我要表達的意思了
基本上與主機板傳輸的頻寬(Bandwidth)是固定的
看用什麼介面就決定了他的Bandwidth大小,假如是PCI-E 16X就是固定16GB/s
但是因為他只是簡簡單單傳Pixel跟Texture還有平面2D的圖像
其實很夠了,真正影響到效能的一直都是Memory Bandwidth!!
另外,這不是什麼"我的理論",
這是現行computer architecture中針對Display這一部分的簡單介紹
只要沒有重大的創新與突破,這些計算方法都是可以一直使用的
實測只是通盤數值化,方便理解,但是資源不足的我們可以用理論推估實測結果
如果是要提各家的顯示卡廠商的效能差異,
我之前也說過了,效能的重點是晶片跟Bandwidth
晶片主要就是時脈跟繪圖晶元的組合
Pixel Fillrate跟Texture Fillrate的算法簡單講就是時脈*晶元數
(P.S.實際上當然沒這麼簡單,只是簡化來說可以這麼比較)
當晶片相同(意即晶元數不變),時脈調高,效能當然是正比提升
而GFLOPs也是隨著時脈的提高會有正比的提升
所以當你提高時脈10%,晶片的效能就可以約略提升10%
Memory Bandwidth前面也提過,就是匯流排數*記憶體時脈
SO...記憶體大小一直都不是效能的重點
不同廠商做的顯示卡,只要沒有調GPU時脈、改匯流排數跟記憶體時脈
基本上的效能不會相差超過5%,如果有改,那就看怎麼改了
調高時脈基本上就是提升效能,只是會提高溫度跟降低穩定性
匯流排改高就是提升效能,反之則將低
另外常常有人說到"開管",可以提升顯示卡效能
這是什麼東西??
簡單講就是打開被廠商封印住的晶元管線(非常簡化的講法)
會封印的原因多半是晶片為不良品或者沒通過完全測試
所以封印一些管線提高穩定度當作中階產品出售
"開管"就是解除那些封印,增加晶元數,
就可以提升Pixel Fillrate跟Texture Fillrate
但要注意的是GFLOPs不會提升!
而且有可能造成顯示卡不穩或熱當
--
※ 發信站: 批踢踢實業坊(ptt.cc)
◆ From: 114.37.108.104
※ 編輯: Disjoint 來自: 114.37.108.104 (07/25 01:15)
1F:→ afgb28:照這樣講來 GT525跟540效能的差距算大嗎? 07/25 01:16
2F:→ afgb28:因為在考慮L740或是4750 07/25 01:16
3F:推 pertonas:不小 07/25 01:17
4F:→ Disjoint:回樓上.差距頗大.以桌機來說就是8600GT vs 6600GT的差距 07/25 01:19
5F:→ Disjoint:XD.有誤.540跟520有差距.但跟525的差距不大... 07/25 01:21
6F:→ Disjoint:但GT540m還是小勝GT525m的 07/25 01:21
7F:→ afgb28:我知道540比較強 可是...一個說不大 一個說不小 我該..? 07/25 01:26
8F:推 pertonas:玩遊戲 GT540M 07/25 01:28
9F:推 aakkman:540大概筆525強個10-15%左右 07/25 01:29
10F:推 thai0907:to afgb 上面說的是跟520差不小跟525差不大 這樣 07/25 01:34
11F:→ Disjoint:差不多就10%吧...不知道這樣的差距你覺得大或小呢?? 07/25 01:34
12F:→ afgb28:喔喔 大概知道了 我在評估看看吧^^ 感謝樓上各位 07/25 01:36
13F:推 davidyao:NVS 4200M跟GT 520M會差很多嗎? 跑遊戲.... 07/25 01:57
14F:推 QuentinHu:基底是同一張卡 但是價格不同... 07/25 01:58
15F:→ QuentinHu:你只要打遊戲的話可以不用買那張 07/25 01:58
16F:→ QuentinHu:買T420S打電動也太奢侈了點 07/25 01:58
17F:推 davidyao:所以意思是很夠用囉? 那些mark的分數可以不用理會嗎? 07/25 02:00
18F:→ davidyao:其實是看上他的重量跟USB3.0 還有保固 07/25 02:00
19F:推 QuentinHu:看你要打什麼電動 07/25 02:06
20F:→ Disjoint:比起來我是覺得4200M應該贏20%~25%吧 07/25 02:07
21F:推 ohruha:推!!!!!! 07/25 02:14
22F:推 davidyao:星海二囉~~~ 要打4v4 特效中就可 07/25 02:15
23F:推 ohruha:用這篇打個比方 就好比個女生明明只有A罩杯的胸圍 她偏偏要 07/25 02:23
24F:→ ohruha:買個D罩杯的胸罩穿 她原本A胸也不會因為穿了D罩杯就長出肉 07/25 02:24
25F:→ ohruha:來啊XD 也就是說 電腦本身支援不到 就算給你100GB也沒用 07/25 02:25
26F:推 QuentinHu:樓上為啥一定要用罩杯比喻 >///< 07/25 02:43
27F:→ QuentinHu:4 V 4特效中 請買GT540M機種 07/25 02:43
28F:推 davidyao:意思是NVS 4200M推不起來嗎? 07/25 02:48
29F:→ ohruha:與其太多專有名詞 不如這個比喻比較淺顯易懂的多~~XD 07/25 02:50
30F:推 QuentinHu:GT540M都很勉強了 你說呢 07/25 03:03
31F:→ QuentinHu:別忘了GT540M還沒比9600GT、4670強 ... 07/25 03:03
32F:推 dhzzzj:先推了再說 看NB-S長知識 07/25 03:05
33F:推 ad0960:請問一下可以請原po進一步定義一下什麼是bandwidth好嗎? 07/25 03:19
34F:→ ad0960:原本不太懂電腦零件 看了這篇有不小長進 就差這個定義= = 07/25 03:20
35F:推 ad0960:應該說 對於bandwidth的定義在想像上有困難 07/25 03:22
36F:→ ad0960:高的bandwidth的顯卡可以讓cpu一次放進更大張或更細緻的圖 07/25 03:23
37F:→ ad0960:是嗎?( 假設CPU夠快(從這裡倒是可想像CPU插有顯卡也沒用) ) 07/25 03:24
38F:→ ad0960: 差 07/25 03:25
39F:→ ad0960:所以好像一般筆電的規格顯卡和CPU的等級都是齊高齊低 07/25 03:26
40F:→ ad0960:其中一個高根本沒用 不知道這樣理解o不ok 07/25 03:27
41F:推 davidyao:那特效開低好了XD 那ATI6630呢? 4v4特效中 推得動嗎? 07/25 03:31
42F:推 jason112412:看完罩杯的比喻就懂了 07/25 07:53
43F:推 ericinttu: 更不懂 (被打 07/25 08:45
44F:推 ff181:推~想請問一下 所以中度玩家 GT540 1G跟2G沒什麼差別? 07/25 08:50
45F:推 QuentinHu:GT540M配2G 絕對是行銷端想出來的 不是工程端... 07/25 09:08
46F:推 ff181:囧...感謝樓上大大 我還是繼續做功課T.T 07/25 09:13
47F:推 gn00330501:顯卡等級+DDR高 才是影響這張顯卡強度的主要原因 07/25 09:19
48F:推 gn00330501:那個甚麼 2G 3G顯卡不是影響遊戲卡效能主要因素 07/25 09:27
49F:→ ericinttu:寫程式有用到GPU的ram的話, 2G比較好用 XDDD 07/25 09:53
50F:推 ff181:恩恩 感謝Q大 gn大 e大 我知道自己的需求了 感恩~ 07/25 09:54
51F:推 FlandreUFF:其實有用到gddr5時,因時脈增加總傳輸速度增加 07/25 11:31
52F:推 QuentinHu:沒想到我這樣隱喻 你也看得懂 XDDD 07/25 12:43
53F:→ Disjoint:Bandwidth的定義:拿捷運來做比喻.人潮當作傳輸的資料 07/25 14:04
54F:→ Disjoint:車子的速度就像時脈:時脈高=>車速快、發車間距短 07/25 14:06
55F:→ Disjoint:車廂多寡就像記憶體大小:一次可以乘載的最大上限 07/25 14:06
56F:→ Disjoint:而Bandwidth就像月台數:月台多=>人(資料)進出就快 07/25 14:08
57F:→ Disjoint:所以當GPU全速運轉、資料不斷湧進,要讓畫面順暢 07/25 14:09
58F:→ Disjoint:重要的是月台多、間距短、車廂多寡反而不是重點 07/25 14:11
59F:→ Disjoint:十節車廂只有一個進出口,人的流動還是緩慢 07/25 14:12
60F:→ Disjoint:不知道這樣解釋大家有沒有清楚一點??? 07/25 14:12
61F:→ EAFZCO:噗哧 遲早有人會來發一篇「各家主機板設計對頻寬的影響」 07/25 15:17
62F:→ EAFZCO:對照你的理論 實測才有意義 因為你沒測根本不知道機板設計 07/25 15:18
63F:→ EAFZCO:對bandwidth的影響有多大...除非各家都套intel公板... 07/25 15:18
64F:推 ad0960 :比喻上是聽得懂 那我說的究竟是對的嗎? 07/25 18:34
65F:→ ad0960 :dis大的比喻似乎和我實際地問法不謀而合 07/25 18:35
66F:→ ad0960 :另外 顯卡和CPU的運算速度都是用"時脈"一詞嗎? 07/25 18:37
67F:推 geniusshiun :我查了一下Intel 2代內顯HD3000 bandwidth 是21.3 07/25 19:00
68F:→ geniusshiun :所以是還可以瞜? 07/25 19:00
69F:推 avonboy :我愛D罩杯~ 07/25 19:09
70F:推 YoshihiroK :推!反正顯示卡再差,可以用Office套裝軟體就好^^ 07/25 19:42
71F:→ Disjoint :有人誤會我的意思了..可能我沒說清楚吧...修一下文 07/25 21:04
※ 編輯: Disjoint 來自: 114.37.88.119 (07/25 22:25)
72F:推 O87 :推推! 07/25 21:38
※ 編輯: Disjoint 來自: 114.37.88.119 (07/25 22:51)
73F:推 jasontai :請問(舉手), 那繪圖(solidworks)有必要用NV QD2000M? 07/25 23:10
74F:→ EAFZCO:你講的東西是純理論,但是實際上lay線路不是你想像那麼簡單 07/26 14:39
75F:→ EAFZCO:照你的理論,同樣顯示晶片/GDDR配置,在不同機器的測試結果 07/26 14:39
76F:→ EAFZCO:會是相同的?我個人覺得你可以拿雙A的機器跟MSI機器來比比 07/26 14:39
77F:→ EAFZCO:看,同款顯示晶片在不同機板上的測試差距有多少... 07/26 14:40
78F:→ Disjoint:樓上.我的標題是顯示卡比較.不是顯示卡+主機板的比較 07/26 18:19
79F:→ Disjoint:不講理論.那來講實測..在不同平台測兩張不同顯示卡來比較 07/26 18:21
80F:→ Disjoint:聰明如你.想也知道不公平..而我只針對顯示卡卡的比較. 07/26 18:23
81F:→ Disjoint:當然是指在相同平台下各個顯示卡的效能差異..... 07/26 18:23
82F:→ Disjoint:我也沒有說,同樣顯卡在不同機器上的效能會一樣.... 07/26 18:25
83F:→ Disjoint:再來.To jasontai:以往專業繪圖卡的優勢在對openGL的支援 07/26 18:27
84F:→ Disjoint:以及針對繪圖需求作細部、透視、旋轉..etc的最佳化 07/26 18:29
85F:→ Disjoint:而其實繪圖卡的GPU跟一般大眾化的顯示卡是一樣低 07/26 18:32
86F:→ Disjoint:只是取向不同罷了,繪圖卡跑遊戲不見得比一般卡好 07/26 18:33
87F:→ Disjoint:也不知道他到底在貴什麼??如果真的不是很大量需要繪圖 07/26 18:34
88F:→ Disjoint:那筆錢拿去買高階的遊戲卡其實比較有效益一點 07/26 18:35
89F:推 jasontai:SOGA! 多謝解答^^ 07/27 00:02
90F:→ EAFZCO:顯示卡沒有主機板是無法運作的...所以擔討論顯卡無意義... 08/06 19:57
91F:推 redlance:推 03/03 11:12