PC_Shopping 板


LINE

推 arrenwu:以 GTX680 的情况来看,6系列通用计算应该是大输 5系列 05/04 00:59 推 cluohy75118: GK110 05/04 01:36 → cluohy75118:架构问题我比较想看jk神阐释 可以确定的是maxwell会是 05/04 01:36 → cluohy75118:nv这几年来真正想表现的最终型态 05/04 01:37 GTX680的GPGPU表现其实基於一个很简单的原因...... Register:SP数量比以往减少很多. G80/G92的时候,8个SP总共使用16,384个reg,GK104则是192个SP使用65,536个reg. 比例大概是从2,048降到341,足足少了6倍. 这边要说明一下,register的数量和每个block(SMp)对应的thread数量有关. 假如CUDA程式设定成128个thread的话,在G80/G92上就是同一个thread下真正使用 到16,384/128=128个register,这样每个SP平均有16个reg可以用.算是蛮宽裕的. 而thread拉长,就是可以有效的隐藏Video RAM存取的延迟 常态来说这个video RAM的延迟都是100出头个cycle,不同卡会不太一样 所以旧的CUDA程式要求效能会以64~256个thread为主流.假定最主流的是128个thread 的话... 那这个程式在GK104上,每个thread就是192个SP分配到512个register. 由於每个SP每个CYCLE都要二读一写........好啦 中间计算就省略一下. 一般而言指令要有良好的平行度,不会浪费太多时间在register allocation 的时候作spill out(专有名词,register不够用所以把旧的资料存入记忆体) 那麽register最好是ALU总数(GPU下的例子是SP)的6~8倍.低於这数值平行度就会 很差,比这高当然效能还会好一点,但高过16倍又不一定会看到好处...因此换算起来, 192个SP分配512个register,真正的利用率可能只有1/2~1/3...意思是 和96 or 64个SP的效能差不多 那麽GTX680的1536个SP,除以这比例就剩下768~512,再除以没有hot clock 的计算量减半.结果GK104的GPGPU表现就可能和GF104差不多会是同时脉下同等级. 实际上GK104的时脉高了一点.应该会领先少许.但约只有gtx580的75%吧. [吕布:当我不用分心在谋权之上,谁可以敢说在武力上稳胜过我] 这个问题不能说整个Kepler系列设计不重视GPGPU,应该是只有GK104如此 很有可能是因为GK104的定位可以让他只专注在Graphics不要管GPGPU. nVidia策略上作的到HD7900作不到的一件事情.一个产品当陈宫一个产品当吕布. 只要GK110的register:SP比例提高两倍以上(当然这就无法在同面积内塞入相同数量的 SP,大量register非常的占面积).这样的晶片的GPGPU表现并不会差.当然可能Graphics 的表现就不会明显领先一截了.... --



※ 发信站: 批踢踢实业坊(ptt.cc)
◆ From: 140.114.78.54
1F:→ coldline96:看不懂.....sad......... 05/05 22:18
2F:推 ang728:头推 05/05 22:18
3F:推 kill0210:推一下。 05/05 22:20
4F:推 batschris:推 05/05 22:25
5F:推 condition0:看不太懂..... 05/05 22:30
6F:推 NeedGem:不过说真的, 这样 NV 每次改版都要重 tune 一次很累的. 05/05 22:31
7F:推 maply0703:请问貂婵在哪里? 05/05 22:33
8F:推 evonre:据说GK110就是专为GPGPU设计的,大部分面向Tesla计算卡 05/05 22:34
9F:推 pomelo168168:看不懂 但必推 05/05 22:43
10F:推 yourfuntime:快推免得被说不懂 05/05 22:43
11F:推 seeya08:嗯嗯 我也是这麽认为              吕布很强 05/05 22:45
12F:推 gdsword:喔喔 原来如此 05/05 22:46
13F:→ medama:原来如此 看不懂 05/05 22:51
14F:→ bluesapphire:显卡真多register@@"难怪那麽烫@@"""""""""""""""""" 05/05 22:52
15F:推 chen20:火凤火凤 05/05 22:53
16F:推 undeathelf:看不懂 推! 05/05 22:54
17F:推 lsslss:简单讲针对产品定位特化 05/05 22:58
18F:推 Sousake:推 05/05 23:00
19F:推 fautumn:喔喔 原来如此 看不懂快推 05/05 23:00
20F:推 pkmu8426:大概可理解差异.... 05/05 23:08
21F:推 s25g5d4:jk神大推 05/05 23:10
22F:→ checheng:没错 就是这样 05/05 23:17
23F:→ IamEuropean:恩恩 根想得差不多 05/05 23:29
24F:推 cluohy75118:神推 总记得看过情报可是找不到 看jk神阐释就是爽! 05/05 23:36
25F:→ cluohy75118:不知jk神可不可为普罗众生预言一下maxwell! 05/05 23:38
26F:推 hollynight:虽然看不懂 不过有神就要快推 orz 05/05 23:51
27F:推 arrenwu:推推~~~~ 05/05 23:54
28F:推 azumanga:推。 05/06 00:48
29F:推 QuentinHu:PUSH PUSH 05/06 01:11
30F:推 davidbright:...推吕布 05/06 08:10
31F:推 grayeric:太深澳 05/06 13:48
32F:推 kesa:我看的懂火凤那一段@_@ 05/06 22:23
33F:推 timeboy:喔喔喔 完全看不懂 05/07 11:18







like.gif 您可能会有兴趣的文章
icon.png[问题/行为] 猫晚上进房间会不会有憋尿问题
icon.pngRe: [闲聊] 选了错误的女孩成为魔法少女 XDDDDDDDDDD
icon.png[正妹] 瑞典 一张
icon.png[心得] EMS高领长版毛衣.墨小楼MC1002
icon.png[分享] 丹龙隔热纸GE55+33+22
icon.png[问题] 清洗洗衣机
icon.png[寻物] 窗台下的空间
icon.png[闲聊] 双极の女神1 木魔爵
icon.png[售车] 新竹 1997 march 1297cc 白色 四门
icon.png[讨论] 能从照片感受到摄影者心情吗
icon.png[狂贺] 贺贺贺贺 贺!岛村卯月!总选举NO.1
icon.png[难过] 羡慕白皮肤的女生
icon.png阅读文章
icon.png[黑特]
icon.png[问题] SBK S1安装於安全帽位置
icon.png[分享] 旧woo100绝版开箱!!
icon.pngRe: [无言] 关於小包卫生纸
icon.png[开箱] E5-2683V3 RX480Strix 快睿C1 简单测试
icon.png[心得] 苍の海贼龙 地狱 执行者16PT
icon.png[售车] 1999年Virage iO 1.8EXi
icon.png[心得] 挑战33 LV10 狮子座pt solo
icon.png[闲聊] 手把手教你不被桶之新手主购教学
icon.png[分享] Civic Type R 量产版官方照无预警流出
icon.png[售车] Golf 4 2.0 银色 自排
icon.png[出售] Graco提篮汽座(有底座)2000元诚可议
icon.png[问题] 请问补牙材质掉了还能再补吗?(台中半年内
icon.png[问题] 44th 单曲 生写竟然都给重复的啊啊!
icon.png[心得] 华南红卡/icash 核卡
icon.png[问题] 拔牙矫正这样正常吗
icon.png[赠送] 老莫高业 初业 102年版
icon.png[情报] 三大行动支付 本季掀战火
icon.png[宝宝] 博客来Amos水蜡笔5/1特价五折
icon.pngRe: [心得] 新鲜人一些面试分享
icon.png[心得] 苍の海贼龙 地狱 麒麟25PT
icon.pngRe: [闲聊] (君の名は。雷慎入) 君名二创漫画翻译
icon.pngRe: [闲聊] OGN中场影片:失踪人口局 (英文字幕)
icon.png[问题] 台湾大哥大4G讯号差
icon.png[出售] [全国]全新千寻侘草LED灯, 水草

请输入看板名称,例如:Boy-Girl站内搜寻

TOP