作者jk21234 (BL2400PT真不错)
站内PC_Shopping
标题Re: [情报] Intel admits Ivy B chips run hotter
时间Sat May 5 22:15:01 2012
推 arrenwu:以 GTX680 的情况来看,6系列通用计算应该是大输 5系列 05/04 00:59
推 cluohy75118: GK110 05/04 01:36
→ cluohy75118:架构问题我比较想看jk神阐释 可以确定的是maxwell会是 05/04 01:36
→ cluohy75118:nv这几年来真正想表现的最终型态 05/04 01:37
GTX680的GPGPU表现其实基於一个很简单的原因......
Register:SP数量比以往减少很多.
G80/G92的时候,8个SP总共使用16,384个reg,GK104则是192个SP使用65,536个reg.
比例大概是从2,048降到341,足足少了6倍.
这边要说明一下,register的数量和每个block(SMp)对应的thread数量有关.
假如CUDA程式设定成128个thread的话,在G80/G92上就是同一个thread下真正使用
到16,384/128=128个register,这样每个SP平均有16个reg可以用.算是蛮宽裕的.
而thread拉长,就是可以有效的隐藏Video RAM存取的延迟
常态来说这个video RAM的延迟都是100出头个cycle,不同卡会不太一样
所以旧的CUDA程式要求效能会以64~256个thread为主流.假定最主流的是128个thread
的话...
那这个程式在GK104上,每个thread就是192个SP分配到512个register.
由於每个SP每个CYCLE都要二读一写........好啦 中间计算就省略一下.
一般而言指令要有良好的平行度,不会浪费太多时间在register allocation
的时候作spill out(专有名词,register不够用所以把旧的资料存入记忆体)
那麽register最好是ALU总数(GPU下的例子是SP)的6~8倍.低於这数值平行度就会
很差,比这高当然效能还会好一点,但高过16倍又不一定会看到好处...因此换算起来,
192个SP分配512个register,真正的利用率可能只有1/2~1/3...意思是
和96 or 64个SP的效能差不多
那麽GTX680的1536个SP,除以这比例就剩下768~512,再除以没有hot clock
的计算量减半.结果GK104的GPGPU表现就可能和GF104差不多会是同时脉下同等级.
实际上GK104的时脉高了一点.应该会领先少许.但约只有gtx580的75%吧.
[吕布:当我不用分心在谋权之上,谁可以敢说在武力上稳胜过我]
这个问题不能说整个Kepler系列设计不重视GPGPU,应该是只有GK104如此
很有可能是因为GK104的定位可以让他只专注在Graphics不要管GPGPU.
nVidia策略上作的到HD7900作不到的一件事情.一个产品当陈宫一个产品当吕布.
只要GK110的register:SP比例提高两倍以上(当然这就无法在同面积内塞入相同数量的
SP,大量register非常的占面积).这样的晶片的GPGPU表现并不会差.当然可能Graphics
的表现就不会明显领先一截了....
--
※ 发信站: 批踢踢实业坊(ptt.cc)
◆ From: 140.114.78.54
1F:→ coldline96:看不懂.....sad......... 05/05 22:18
2F:推 ang728:头推 05/05 22:18
3F:推 kill0210:推一下。 05/05 22:20
4F:推 batschris:推 05/05 22:25
5F:推 condition0:看不太懂..... 05/05 22:30
6F:推 NeedGem:不过说真的, 这样 NV 每次改版都要重 tune 一次很累的. 05/05 22:31
7F:推 maply0703:请问貂婵在哪里? 05/05 22:33
8F:推 evonre:据说GK110就是专为GPGPU设计的,大部分面向Tesla计算卡 05/05 22:34
9F:推 pomelo168168:看不懂 但必推 05/05 22:43
10F:推 yourfuntime:快推免得被说不懂 05/05 22:43
11F:推 seeya08:嗯嗯 我也是这麽认为 吕布很强 05/05 22:45
12F:推 gdsword:喔喔 原来如此 05/05 22:46
13F:→ medama:原来如此 看不懂 05/05 22:51
14F:→ bluesapphire:显卡真多register@@"难怪那麽烫@@"""""""""""""""""" 05/05 22:52
15F:推 chen20:火凤火凤 05/05 22:53
16F:推 undeathelf:看不懂 推! 05/05 22:54
17F:推 lsslss:简单讲针对产品定位特化 05/05 22:58
18F:推 Sousake:推 05/05 23:00
19F:推 fautumn:喔喔 原来如此 看不懂快推 05/05 23:00
20F:推 pkmu8426:大概可理解差异.... 05/05 23:08
21F:推 s25g5d4:jk神大推 05/05 23:10
22F:→ checheng:没错 就是这样 05/05 23:17
23F:→ IamEuropean:恩恩 根想得差不多 05/05 23:29
24F:推 cluohy75118:神推 总记得看过情报可是找不到 看jk神阐释就是爽! 05/05 23:36
25F:→ cluohy75118:不知jk神可不可为普罗众生预言一下maxwell! 05/05 23:38
26F:推 hollynight:虽然看不懂 不过有神就要快推 orz 05/05 23:51
27F:推 arrenwu:推推~~~~ 05/05 23:54
28F:推 azumanga:推。 05/06 00:48
29F:推 QuentinHu:PUSH PUSH 05/06 01:11
30F:推 davidbright:...推吕布 05/06 08:10
31F:推 grayeric:太深澳 05/06 13:48
32F:推 kesa:我看的懂火凤那一段@_@ 05/06 22:23
33F:推 timeboy:喔喔喔 完全看不懂 05/07 11:18