作者noahsark430 (沧海无限 我的船渺小)
看板C_and_CPP
标题Re: [问题] 将平行处理的CUDA和MPI做结合
时间Fri Jan 4 23:43:41 2013
各位版友好:
小弟最近正在学cuda,我想请教我们实验室有两张卡(C2050)
如果程式由CPU直接分data给两张GPU同时执行(我知道GPU之间
的资料交流是要用MPI,还是有什麽方法?),但如果我的程式
比如说先产生1~256*256个乱数,然後每个乱数叠代100次
假设D是device上的变数, D(x)=sin(D(x)) => 100次
我是否可以将1~32768 传送给GPU1做叠代,32769~256*256给GPU2做叠代
而且是同时传送,同时运算,整个运算的时间是跟一个GPU运算的差不多呢?
我有参考
http://ppt.cc/WEF~ 第82页的做法
istat = cudaSetDevice(0)
......
istat = cudaSetDevice(1)
.....
但运算时间是单一GPU运算的两倍.... 不平行 = =
--
--
※ 发信站: 批踢踢实业坊(ptt.cc)
◆ From: 182.155.14.216
※ noahsark430:转录至看板 Fortran 01/04 23:44
1F:→ akasan:power 够力的话插在同一台主机上 然後参考cuda openmp范例 01/05 00:05
2F:→ zhouer:量一下时间是不是都花在搬资料了。 01/06 10:48