作者alvinli (alvin)
看板VideoCard
标题Re: [问题] Bit数
时间Tue Nov 7 00:32:47 2006
※ 引述《alvinli (alvin)》之铭言:
: ※ 引述《FiveAaaa ([5A]aaa)》之铭言:
: : 此处提到了记忆体时脉, 那核心时脉又有什麽影响呢?
: : 是指: 用 [ (记忆体时脉) * (传输频宽) ] bps传入GPU, GPU再用xxxMHz来运算吗?
: : 谢谢!
1F:推 FiveAaaa:那麽VRAM时脉还是GPU时脉决定fill rate?140.113.140.149 11/06 23:16
2F:→ FiveAaaa:然後fill rate就决定效能对吧?140.113.140.149 11/06 23:17
在这里在解释一下,
fill rate只是代表这整个晶片可以做到一秒钟画几个点,
而实际上能做到多少, 就要看整个应用程式的流程,
事实上前一篇写的只是理想状态, 很多数据应该要更低才是,
但是还有另一个决定GPU可以瞬间产出多少像素填充的关键就是管线数量.
以我们自己的东西来说, handshaking要做到1 tick?
没问题, 但是问题会出在整体稳定度, 因为记忆体未必能达到这样,
通常正常设定大概是要handshaking 7 tick ~ 8 tick, (也就是上篇举例中的上限)
加上一些记忆体延迟, 有效时脉是实际时脉的1/10也是有可能的~
所以其实可以观察一下常见的GPU, 管线越多的其像素填充率会有一定的比例提升~
而前一篇所提到的overhead有多大, 也是要看那个frame做的是什麽事情,
如果是做shader的全场light effect那麽可能会占很多时间,
如果是划一个三角形的话那麽可能下一个tick就拿回使用权了也说不定,
如果一个管线的有效时脉只有1/8 (3-read ack/4-write ack/1 tick action)
^^^^^^^^^^^^^
我说的overhead
那麽以上篇的例子来说的话,每个管线其实只能有0.56 Billion的能力,
以晶片能力来说, 以上篇的例子而言, 560Mhz全部有效的时候能力为4.48Billion,
那麽1/8的能力就只有0.56 Billion pix/sec的能力, 12管线呢?
6.72 Billion pixels/sec. (=> 不小心猜对晶片设定了?XD)
好了, 回到FiveAaaa的问题,
以目前来说, nV跟ATi(AMD!?)都是GPU远超过记忆体能耐的情形,
i公司跟S公司的话嘛..嗯..呃..了解了吧. 就不多说了XD
以7600GT的能力来说, 一秒中最多可以处理6.7billion pix,
那麽换算成1280x1024的画面的话, 哇! 5111.69 fps!
不过事实上有可能吗?
举个例子来说吧, 世纪帝国玩过吧?
他的画面如果是1280x1024的话, 那麽他真的可以到5111.69fps?
不可能, 因为, 假设一个人物的图片站的空间大概是64x64好了,
那麽100个人的话一个frame就要多画64x64x100次,
然後底下状态列假设1280x200吧, 那麽又要多这麽多个点画,
在多十个建筑物如何? 假设一个建筑物128x128,
那麽画面上总共要更新的像素就有2140160点, 剩下3130fps.
可是如果在家个半透明效果呢? 不好意思, 底下原来的点要重新取一次,
要贴上去效果的点又要重新取一次, 作混色的动作又要取一次,
所以每画一个半透明效果就会需要三倍的像素填充,
如果是世纪三这种纯立体的话就更不一样了, 还要考虑远近的问题,
作立体投影到viewport(也就是实际上看到的2d buffer)上时经过的所有点,
都必须要再重新取样一次, 所以说每个frame"重复填充"的机率其实很高,
这时候如果晶片polygon rate又不够高的话呢? 不好意思, 请idle一小段时间吧!
至於效能到底决定在哪? 其实很多地方都有差,
像是blending效果硬体怎麽作呀, 是用状态机来省gate还是独立做省时间呢?
light矩阵弹性设计如何呢? 浮点数加速演算法做的怎样呢?
硬体架构是否好呢? polygon rate能多少呢?
这些都要根据主流游戏设计或者图学领域的研究来做最佳化~
fill rate只是限制了"最高frame rate"可以到多少,
实质上意义....要看他跟polygon rate合在一起的参考值才比较有意义XD
所以结论还是一样, 好的游戏就会利用场景规划的演算法减低这种重复填充的状况发生,
所以呢, 买显示卡时还是评估一下自己要玩的游戏是什麽吧 !
如果是游戏引擎做的很好的游戏的话显示卡其实不需要顶级的,
拿PS2的例子就知道啦, 去google查一下他的硬体spec,
你会发现....写pc game的人真是逊毙了XD
--
※ 发信站: 批踢踢实业坊(ptt.cc)
◆ From: 210.85.196.121
3F:推 gb20015:未看先推,这应该可以请大王m了 218.168.184.12 11/07 00:35
4F:推 Haiker:你会发现....写pc game的人真是逊毙了XD 211.74.251.67 11/07 00:40
5F:推 dingyuchi:ps只有一种规格阿 220.133.158.48 11/07 01:03
6F:推 Clovertown:是硬体等级不怎麽样 但是画面却很棒 220.134.230.47 11/07 01:13
7F:推 Clovertown:推荐原PO可以去巴哈的TVGAME版 220.134.230.47 11/07 01:22
8F:推 Clovertown:一堆魔人在战硬体..战画面 220.134.230.47 11/07 01:25
※ 编辑: alvinli 来自: 210.85.196.121 (11/07 02:10)
9F:推 sway0000:推!真是人外有人,又上了美好的一课 220.135.74.221 11/07 03:01
10F:→ sway0000:请问你是哪家...喔!太敏感了... 220.135.74.221 11/07 03:03
11F:→ sway0000:那这样好了,请推荐显卡厂商!谢谢 220.135.74.221 11/07 03:03
12F:推 quamtum:i公司等igp还要和大家共用主记忆体频宽, 61.31.168.194 11/07 07:18
13F:→ quamtum:要效能高还要低成本,实在是强人所难 61.31.168.194 11/07 07:20
14F:推 quamtum:顺便问一下,handshaking 7~8t是指req出去 61.31.168.194 11/07 07:23
15F:→ quamtum:到data回来吗?在igp上这就不容易做到 61.31.168.194 11/07 07:23
16F:→ quamtum:mem有burst功能,所以记忆体若能连续hit到 61.31.168.194 11/07 07:25
17F:→ quamtum:资料一直回来,效能就比较不会卡在这 61.31.168.194 11/07 07:27
18F:推 FiveAaaa:谢谢! 获益良多!218.168.214.122 11/07 13:46