作者FermiDirac (善恶边缘)
看板CodeJob
标题[发案]
时间Thu May 24 04:35:44 2018
发案人:男
联络方式1:站内信
联络方式2:
所在地区 :新竹或网路上
有效时间:之後1礼拜内
专案说明:我所有kernel都写完了,也有利用blockDim※blockIdx等错开方式优
化过kernel。
目前我想让60种不同参数的同个演算法跑的更快,每一种参数依序跑太慢了,不知到有没
有更快的方式可以一起下去跑,进而节省时间。
我是交大的学生,教我怎麽做或是帮我做使我的Monte carlo演算法可以跑的更快。
-----------------------------------------
目前程式码
for(i=0;i<100000;i++)
{
kernel1()
cudaDeviceSynchronize();
kernel2() <--会用到kernel1算出来的值
cudaDeviceSynchronize();
kernel3() <--会用到kernel2算出来的值
cudaDeviceSynchronize()
kernel4() <--会用到kernel3算出来的值
cudaDeviceSynchronize()
}
预算:2500~3000
接案者要求:
附注:
--
※ 发信站: 批踢踢实业坊(ptt.cc), 来自: 49.216.199.227
※ 文章网址: https://webptt.com/cn.aspx?n=bbs/CodeJob/M.1527107747.A.C50.html
※ 编辑: FermiDirac (49.216.199.227), 05/24/2018 04:37:14
※ 编辑: FermiDirac (49.216.199.227), 05/24/2018 04:37:58
※ 编辑: FermiDirac (49.216.199.227), 05/24/2018 04:38:18
1F:推 zeus83157: 开多台机器跑平行 05/24 23:28