作者nfsong (图书馆我来了)
标题[转录]Innovation@Intel Larrabee的消息
时间Sun Oct 18 14:28:38 2009
※ [本文转录自 nfsong 信箱]
作者: AXby (A纸) 站内: PC_Shopping
标题: Innovation@Intel Larrabee的消息
时间: Sat Oct 17 08:55:29 2009
实际的官方测试报告…有兴趣的可以看一下。
http://techresearch.intel.com/UserFiles/en-us/File/terascale/
Mayo_IEEE_VIS2009_FINAL.PDF
短网址
http://tinyurl.com/yknmy32
只看结论:
16,32,64核以1G的时脉模拟的结果。
16核@1G的拉拉比理论演算性能只有GTX280的一半(约0.5T?),
但平均模拟的结果还是GTX280的1.5倍快,单核Harpertown的10倍快。
32核或64核的话,CPU与拉拉比间的档案传输速度会成为瓶颈。
如果没有这个问题的话32核,64核会是24倍,42倍快(基准是啥…)
但是放置不管的话只能达到11倍快。
将传送档案以可压缩SIMD型式传送,可以压到1/3以下,
解压缩所花的时间也只要30%以下。(这边看不太懂…)
总之压缩传送所需的时间可削减至不压缩时的20至30%。
如此的话32核可以得到19倍的性能,64核时则有31倍。
再来,就麻烦板上各位高手们来读读这篇论文再来分享一下心得了XD
--
纯白の吸血鬼が微笑む:
「あたしを杀した责任,取って贳うからね。」
--
※ 发信站: 批踢踢实业坊(ptt.cc)
◆ From: 218.179.144.37
1F:推 suzukihiro:讲到32和64核..我看会引出大师....(抖 10/17 09:13
2F:推 ChangWufei:这是一个RAID的世界 科科 10/17 09:15
3F:推 gt1724:拉拉拉拉拉拉~ 10/17 09:16
4F:→ BlackCalibre:3d大是今天回来吗?好久没看到他贴的情报文了说.... 10/17 09:18
5F:推 gt1724:对阿 3D大勒 我想看产品消息.. 10/17 09:23
6F:推 HsiaoCC:快速瞄了一下,他的压缩应该是指邻近的data值都很相近 10/17 10:54
7F:→ HsiaoCC:所以只存一个 base value,其余的存差值,节省空间… 10/17 10:55
8F:→ HsiaoCC:传到GPU上时,再同时还原多笔资料,并将多笔资料pack成 10/17 10:56
9F:→ HsiaoCC:一道 SIMD instruction 来加速运行,同时减少了指令数 10/17 10:56
10F:推 HsiaoCC:只是我也不知道volume rendering alg.的特性… 10/17 10:58
11F:→ HsiaoCC:所以,也没有办法评断 paper 上写的东西的可信度… :~~ 10/17 10:59
12F:推 StylishTrade:基准是单核Harpertown 10/17 11:51
13F:推 StylishTrade:瓶颈是CPU和GPU传输?我看瓶颈是硬碟吧~~~ 10/17 11:56
14F:→ StylishTrade:再说拉拉比是x86架构~~~不需要CPU做前置处理~~~ 10/17 11:58
15F:→ StylishTrade:资料全塞给拉拉比就好了~~不用经过CPU处理~~ 10/17 11:59
16F:推 mike0227: ^^ 说塞就塞 真厉害 10/17 12:24
17F:→ mike0227:晚点再来看 不过照现有架构应该还是要走pci-e 10/17 12:25
18F:→ AXby:大师来推文了,在下真倍感荣耀 orz 10/17 13:29
19F:→ jubilee2:看第二遍才知道啦啦比是在说什麽 10/17 13:33
20F:推 no1no1leo:大师知道RAID是什麽了吗? 10/17 14:17
21F:推 no1no1leo:大师有兴趣可以10/29来112听整天的多核心论坛 10/17 14:39
23F:→ AXby:我还挺想听的,可惜人不在台湾 orz 10/17 14:46
24F:→ jikanson:不需要前置处理!? 连DRIVER都还没出来的东西你现在就知道 10/17 15:53
25F:→ jikanson:大师果然是在INTEL位高权重的要人 说话不同凡响 10/17 15:54
--
※ 发信站: 批踢踢实业坊(ptt.cc)
◆ From: 218.161.52.228