作者jk21234 (BL2400PT真不錯)
站內PC_Shopping
標題Re: [情報] Intel admits Ivy B chips run hotter
時間Sat May 5 22:15:01 2012
推 arrenwu:以 GTX680 的情況來看,6系列通用計算應該是大輸 5系列 05/04 00:59
推 cluohy75118: GK110 05/04 01:36
→ cluohy75118:架構問題我比較想看jk神闡釋 可以確定的是maxwell會是 05/04 01:36
→ cluohy75118:nv這幾年來真正想表現的最終型態 05/04 01:37
GTX680的GPGPU表現其實基於一個很簡單的原因......
Register:SP數量比以往減少很多.
G80/G92的時候,8個SP總共使用16,384個reg,GK104則是192個SP使用65,536個reg.
比例大概是從2,048降到341,足足少了6倍.
這邊要說明一下,register的數量和每個block(SMp)對應的thread數量有關.
假如CUDA程式設定成128個thread的話,在G80/G92上就是同一個thread下真正使用
到16,384/128=128個register,這樣每個SP平均有16個reg可以用.算是蠻寬裕的.
而thread拉長,就是可以有效的隱藏Video RAM存取的延遲
常態來說這個video RAM的延遲都是100出頭個cycle,不同卡會不太一樣
所以舊的CUDA程式要求效能會以64~256個thread為主流.假定最主流的是128個thread
的話...
那這個程式在GK104上,每個thread就是192個SP分配到512個register.
由於每個SP每個CYCLE都要二讀一寫........好啦 中間計算就省略一下.
一般而言指令要有良好的平行度,不會浪費太多時間在register allocation
的時候作spill out(專有名詞,register不夠用所以把舊的資料存入記憶體)
那麼register最好是ALU總數(GPU下的例子是SP)的6~8倍.低於這數值平行度就會
很差,比這高當然效能還會好一點,但高過16倍又不一定會看到好處...因此換算起來,
192個SP分配512個register,真正的利用率可能只有1/2~1/3...意思是
和96 or 64個SP的效能差不多
那麼GTX680的1536個SP,除以這比例就剩下768~512,再除以沒有hot clock
的計算量減半.結果GK104的GPGPU表現就可能和GF104差不多會是同時脈下同等級.
實際上GK104的時脈高了一點.應該會領先少許.但約只有gtx580的75%吧.
[呂布:當我不用分心在謀權之上,誰可以敢說在武力上穩勝過我]
這個問題不能說整個Kepler系列設計不重視GPGPU,應該是只有GK104如此
很有可能是因為GK104的定位可以讓他只專注在Graphics不要管GPGPU.
nVidia策略上作的到HD7900作不到的一件事情.一個產品當陳宮一個產品當呂布.
只要GK110的register:SP比例提高兩倍以上(當然這就無法在同面積內塞入相同數量的
SP,大量register非常的佔面積).這樣的晶片的GPGPU表現並不會差.當然可能Graphics
的表現就不會明顯領先一截了....
--
※ 發信站: 批踢踢實業坊(ptt.cc)
◆ From: 140.114.78.54
1F:→ coldline96:看不懂.....sad......... 05/05 22:18
2F:推 ang728:頭推 05/05 22:18
3F:推 kill0210:推一下。 05/05 22:20
4F:推 batschris:推 05/05 22:25
5F:推 condition0:看不太懂..... 05/05 22:30
6F:推 NeedGem:不過說真的, 這樣 NV 每次改版都要重 tune 一次很累的. 05/05 22:31
7F:推 maply0703:請問貂嬋在哪裡? 05/05 22:33
8F:推 evonre:據說GK110就是專為GPGPU設計的,大部分面向Tesla計算卡 05/05 22:34
9F:推 pomelo168168:看不懂 但必推 05/05 22:43
10F:推 yourfuntime:快推免得被說不懂 05/05 22:43
11F:推 seeya08:嗯嗯 我也是這麼認為 呂布很強 05/05 22:45
12F:推 gdsword:喔喔 原來如此 05/05 22:46
13F:→ medama:原來如此 看不懂 05/05 22:51
14F:→ bluesapphire:顯卡真多register@@"難怪那麼燙@@"""""""""""""""""" 05/05 22:52
15F:推 chen20:火鳳火鳳 05/05 22:53
16F:推 undeathelf:看不懂 推! 05/05 22:54
17F:推 lsslss:簡單講針對產品定位特化 05/05 22:58
18F:推 Sousake:推 05/05 23:00
19F:推 fautumn:喔喔 原來如此 看不懂快推 05/05 23:00
20F:推 pkmu8426:大概可理解差異.... 05/05 23:08
21F:推 s25g5d4:jk神大推 05/05 23:10
22F:→ checheng:沒錯 就是這樣 05/05 23:17
23F:→ IamEuropean:恩恩 根想得差不多 05/05 23:29
24F:推 cluohy75118:神推 總記得看過情報可是找不到 看jk神闡釋就是爽! 05/05 23:36
25F:→ cluohy75118:不知jk神可不可為普羅眾生預言一下maxwell! 05/05 23:38
26F:推 hollynight:雖然看不懂 不過有神就要快推 orz 05/05 23:51
27F:推 arrenwu:推推~~~~ 05/05 23:54
28F:推 azumanga:推。 05/06 00:48
29F:推 QuentinHu:PUSH PUSH 05/06 01:11
30F:推 davidbright:...推呂布 05/06 08:10
31F:推 grayeric:太深澳 05/06 13:48
32F:推 kesa:我看的懂火鳳那一段@_@ 05/06 22:23
33F:推 timeboy:喔喔喔 完全看不懂 05/07 11:18