作者jk21234 ( 1569 11 /47)
站内PC_Shopping
标题Re: [情报] 17款09年游戏汇聚 CPU多核支持大检验
时间Tue Dec 8 22:21:11 2009
※ 引述《gt1724 (天野神无伊欧斯)》之铭言:
: 处理器时提供有价值的参考。
: http://www.inpai.com.cn/doc/hard/112001.htm
: 明年也许就是四核基本需求了吧!? 不知OLG这方面如何
: 话说为何游戏会发生只对三核做优化这种情况?
问题要这样看,不是只对三核心作最佳化.
而是它的thread排出来的结果就只能这样.
假定某个游戏核心写成multi-thread,有6个thread,其中最大的A占了
40%,B,C,D,E,F分别是20%,10%......先不管每个thread中间的相依关系
(实际上会发生比如F thread必须要等C thread处理完的情况).
三核心
1 2 3
A| B| D|
| | E|
| C|
| F|
四核心
1 2 3 4
A| B| D| C|
| | E| F|
|
|
基本上是一样快的.
实际上最基本的问题则是,DX 10以前是以Single Thread render为基础.
对多cpu的增进,一小部分来自於OS/API中一些次要的I/O,
一部分是程式开发的时候,把一些工作移到另外一个thread作.
Main Main Assist
A| A| B|
B| D| C|
C| ===> F| E|
D| G|
E|
F|
G\
这样1-->2的thread的重新撰写相对之下比较简单,
也容易得到不错的效果.只要移走33%的工作量就等於提升1.5倍(1-33%的倒数),
移走40%的工作量是1.66倍,移走50%的工作量(最佳的情况)才是2倍.
但是即使只有少数可以移出,效能数字看起来也会漂亮多了.
可是如果是想在三核心,四核心上有加速效果.那麽必须尝试
1--> 3 thread,1--> 4 thread的重写,而且.....
a. 保留在各thread的计算时间要远低於50%,33%.才能分别在三核心,四核
心上看到加速.
b. Thread分配每个Task的Critical Path计算,本身是NP-Hard问题.
而且每个Task的时间可能又因为硬体差别产生不等.载入档案的因为
硬碟速度不同而不同.计算的因素cpu速度不同而时间长度不等....
实务上可能没有甚麽直观的解决方式,只能不断的拿实机测量後再看怎麽排会最好
不过DX11增加了Multithreading rendering,所以对这个问题就不同以往,
可以预期以DX11开发的游戏,会享受到对3/4核心以上cpu的效能增进.
而且这点并不需要安装DX11显示卡才可以得到.
--
※ 发信站: 批踢踢实业坊(ptt.cc)
◆ From: 114.32.237.63
1F:推 three456:JK大未看先推 12/08 22:23
2F:推 ang728:专业 12/08 22:23
3F:推 HiJimmy:难怪我用tmpgenc转档 xeon跟p4差不多 只是xeon可做其他事 12/08 22:23
这部份有点误解.我猜你指的是478 XEON,相当於P4 with HT ??
一般来说压缩,解压缩等都不会像游戏这样难处理.
会看到很接近核心数量的成长.
假定游戏中处理一个frame分别要A,B,C,D,E,F,G七个动作.
那麽游戏要在多核心上加速,就必须要让A,B,C,D,E,F,G七个平均分配
在30个ms内完成.越快越好......
不过如果是压缩的话,假设我压缩h.264,每一个frame同样要A,B,C,D,E,F,G几个动作.
而我想要在4核心上有最好的结果......
那就定四个thread,四个分别处理一个frame,就会很容易得到加速效果.
(当然会因为一些竞争资源等无法达到线性的加速结果)
这是最简单的做法,所以说这类的应用程式只有很古早的才不支援multi-thread.
4F:→ ang728:只能说是JK神了 12/08 22:24
5F:→ AXby:专业推 orz 12/08 22:25
6F:推 ChangWufei:<(_ _)> 拜一下 12/08 22:26
7F:→ PlayStation3:推神 12/08 22:26
8F:推 ascendant7:推 12/08 22:28
9F:推 eggy1008:强大 12/08 22:28
10F:推 wurenben:推 12/08 22:28
11F:推 three456:所以还是把XP丢掉吧XD 换装WIN7 12/08 22:31
而且XP Pro在核心上由於小幅修改自Windows 2000 Pro,它是以双cpu为基础的
排程.因此XP Pro使用四核心cpu,即使是rar压缩等.也会比Vista/Win7
的结果差.之前有看过实测....
※ 编辑: jk21234 来自: 140.114.78.62 (12/08 22:45)
12F:推 ryu2964:win7虽然说有优化,但是用xp还是觉得有比较快.. 12/08 22:37
13F:推 ajkre1:jk大未看先推阿~ 12/08 22:54
14F:推 HiJimmy:不是喔 我说的是604的xeon2.66/533跟478的p4 2.6/800 12/08 22:55
15F:→ HiJimmy:软体就是最新 我再试试看 12/08 22:56
16F:→ jk21234:604/478有一样的核心,只差HT支援有无... 12/08 22:58
17F:推 AXby:没推到,补 12/08 22:59
18F:推 HiJimmy:所以差不多快是正常的? 12/08 23:00
19F:→ HiJimmy:其实我俩个都有看到ht功能 12/08 23:00
20F:→ kuninaka:只有WINRAR有差吗 XD 12/08 23:05
印象中就是...XP/Vista下,双核心对Winrar的加速都是1.9X倍
可是4核心的时候,XP只有单核心的2.5倍左右,Vista是单核心的3.5倍
21F:推 HiJimmy:硬碟在转当时有差吗? 一个是st 8gb的 一个是wd160gb 12/08 23:08
22F:→ HiJimmy:因为我在想转档写入档案速度因该不会很快 所以没差 12/08 23:08
※ 编辑: jk21234 来自: 140.114.78.62 (12/08 23:43)
23F:推 wch6858:JK推! 12/08 23:43
24F:推 suzukihiro:不错 12/08 23:56
25F:推 darkmoon:大推 图解真容易懂 12/09 00:36
26F:推 VictorTom:jk大真的是太强了, 拜....<(_ _)> 12/09 00:53
27F:推 mp44stg44:大推! 12/09 00:55
28F:→ mp44stg44:应该收进 12/09 00:55
29F:推 VictorTom:只是看到XP对四核心效率没那麽好, 换U的欲望又下降了. 12/09 01:02
30F:推 suzukihiro:换WIN 7吧 连硬碟一些基本传输都是有增无减的 12/09 01:05
31F:→ kuninaka:有人测过SERVER 2008 R2吗 也是WIN7延伸的XD 12/09 02:14
32F:推 bettery:(笔记) 推! 12/09 07:12
33F:推 pkcqwe:专业文 不推不行! 12/09 08:05
34F:推 soulblue:推j大专业 12/09 08:59
35F:推 david13587:专业@@ 12/09 09:16
36F:推 pao0111:推推推! 12/09 10:35
37F:推 dreamroyc:专业 12/09 10:46
38F:推 jack089452:专业推 12/09 11:17
39F:推 gt1724:原来是排程问题 推! 12/09 12:35
40F:→ kuninaka:好像DX11对CPU多执行绪的效率又增进了 12/09 13:23
41F:→ lewisgb:水~~~推一个 12/09 15:33
42F:推 athlun:专业 推 12/09 20:15
43F:推 Sousake:好专业.... (看不懂苦思中 需要时间消化 囧> 12/09 23:49
44F:推 tentryway:.....太强大了 12/14 11:14