作者nfsong (圖書館我來了)
標題[轉錄]Innovation@Intel Larrabee的消息
時間Sun Oct 18 14:28:38 2009
※ [本文轉錄自 nfsong 信箱]
作者: AXby (A紙) 站內: PC_Shopping
標題: Innovation@Intel Larrabee的消息
時間: Sat Oct 17 08:55:29 2009
實際的官方測試報告…有興趣的可以看一下。
http://techresearch.intel.com/UserFiles/en-us/File/terascale/
Mayo_IEEE_VIS2009_FINAL.PDF
短網址
http://tinyurl.com/yknmy32
只看結論:
16,32,64核以1G的時脈模擬的結果。
16核@1G的拉拉比理論演算性能只有GTX280的一半(約0.5T?),
但平均模擬的結果還是GTX280的1.5倍快,單核Harpertown的10倍快。
32核或64核的話,CPU與拉拉比間的檔案傳輸速度會成為瓶頸。
如果沒有這個問題的話32核,64核會是24倍,42倍快(基準是啥…)
但是放置不管的話只能達到11倍快。
將傳送檔案以可壓縮SIMD型式傳送,可以壓到1/3以下,
解壓縮所花的時間也只要30%以下。(這邊看不太懂…)
總之壓縮傳送所需的時間可削減至不壓縮時的20至30%。
如此的話32核可以得到19倍的性能,64核時則有31倍。
再來,就麻煩板上各位高手們來讀讀這篇論文再來分享一下心得了XD
--
純白の吸血鬼が微笑む:
「あたしを殺した責任,取って貰うからね。」
--
※ 發信站: 批踢踢實業坊(ptt.cc)
◆ From: 218.179.144.37
1F:推 suzukihiro:講到32和64核..我看會引出大師....(抖 10/17 09:13
2F:推 ChangWufei:這是一個RAID的世界 科科 10/17 09:15
3F:推 gt1724:拉拉拉拉拉拉~ 10/17 09:16
4F:→ BlackCalibre:3d大是今天回來嗎?好久沒看到他貼的情報文了說.... 10/17 09:18
5F:推 gt1724:對阿 3D大勒 我想看產品消息.. 10/17 09:23
6F:推 HsiaoCC:快速瞄了一下,他的壓縮應該是指鄰近的data值都很相近 10/17 10:54
7F:→ HsiaoCC:所以只存一個 base value,其餘的存差值,節省空間… 10/17 10:55
8F:→ HsiaoCC:傳到GPU上時,再同時還原多筆資料,並將多筆資料pack成 10/17 10:56
9F:→ HsiaoCC:一道 SIMD instruction 來加速運行,同時減少了指令數 10/17 10:56
10F:推 HsiaoCC:只是我也不知道volume rendering alg.的特性… 10/17 10:58
11F:→ HsiaoCC:所以,也沒有辦法評斷 paper 上寫的東西的可信度… :~~ 10/17 10:59
12F:推 StylishTrade:基準是單核Harpertown 10/17 11:51
13F:推 StylishTrade:瓶頸是CPU和GPU傳輸?我看瓶頸是硬碟吧~~~ 10/17 11:56
14F:→ StylishTrade:再說拉拉比是x86架構~~~不需要CPU做前置處理~~~ 10/17 11:58
15F:→ StylishTrade:資料全塞給拉拉比就好了~~不用經過CPU處理~~ 10/17 11:59
16F:推 mike0227: ^^ 說塞就塞 真厲害 10/17 12:24
17F:→ mike0227:晚點再來看 不過照現有架構應該還是要走pci-e 10/17 12:25
18F:→ AXby:大師來推文了,在下真倍感榮耀 orz 10/17 13:29
19F:→ jubilee2:看第二遍才知道啦啦比是在說什麼 10/17 13:33
20F:推 no1no1leo:大師知道RAID是什麼了嗎? 10/17 14:17
21F:推 no1no1leo:大師有興趣可以10/29來112聽整天的多核心論壇 10/17 14:39
23F:→ AXby:我還挺想聽的,可惜人不在台灣 orz 10/17 14:46
24F:→ jikanson:不需要前置處理!? 連DRIVER都還沒出來的東西你現在就知道 10/17 15:53
25F:→ jikanson:大師果然是在INTEL位高權重的要人 說話不同凡響 10/17 15:54
--
※ 發信站: 批踢踢實業坊(ptt.cc)
◆ From: 218.161.52.228