C_and_CPP 板


LINE

不知道有没有高手可以解答以下问题? 资料形式: 600列800行的随机数 目的: 把每一行的数据加起来 初始化: sum[600]={0.0} data[600x800]= 上述资料 CUDA程式1: 成功 // dim3 gridsize(1, 1, 1); // dim3 blocksize(600, 1, 1); for (int j = 0; j < 800; j+= 1){ sum[(blockDim.x*bdx + tdx)] = sum[(blockDim.x*bdx + tdx)] + data[600*j + (blockDim.x*bdx +tdx)]; } CUDA程式2: 失败 // dim3 gridsize(40, 1, 1); // dim3 blocksize(600, 1, 1); for (int j = 0; j < 800; j+= 40){ sum[0*(j + bdx) +tdx] = sum[0*(j + bdx) +tdx] + data[600*(j + bdx) +tdx]; } 请问程式2失败的原因是?可以怎麽写呢? 我自己猜测是: 例如, sum[1]无法同时处理40笔资料 请教大家, 谢谢 --
QR Code



※ 发信站: 批踢踢实业坊(ptt.cc), 来自: 42.72.113.11 (台湾)
※ 文章网址: https://webptt.com/cn.aspx?n=bbs/C_and_CPP/M.1684424338.A.607.html
1F:→ goodzey: 抱歉, 资料形式: 800列600行的随机数 05/18 23:41
2F:→ goodzey: 目的: 把每一列的数据加起来 05/18 23:44
3F:→ goodzey: int bdx = blockIdx.x; int tdx = threadIdx.x; 05/18 23:48
4F:推 ManOfSteel: 每一行600个数据,对吗? 05/19 00:07
5F:推 ManOfSteel: 然後600个数据相加? 05/19 00:10
6F:→ ManOfSteel: 喔,我懂了,是800个数据相加XD 05/19 00:14
7F:→ ManOfSteel: data[600*(j + bdx) +tdx] access资料会超出边界吧? 05/19 00:21
8F:→ ManOfSteel: blockidx最大不是可以到39? 05/19 00:22
9F:推 celestialgod: 要不要考虑用cuda blas可能比较快 05/19 00:43
10F:推 celestialgod: cublasSgemv 05/19 00:46
11F:→ celestialgod: 具体例子可以问chatGPT 05/19 00:46
12F:推 etgood1478: 为什麽不用reduction 05/19 02:33
13F:推 johnjohnlin: atomic add 05/19 19:13
14F:→ goodzey: 实验结果: main func中用cublasSdot作很慢(时间需100倍) 05/23 22:05
15F:→ goodzey: 在__global__ 中用cublasSdot难编译 (makefile需修正) 05/23 22:07
16F:→ goodzey: 在我用的.cu程式(ubuntu环境)好像没办法用std::函式 05/23 22:09
17F:推 mikemike1021: 错误的原因应该是 race condition,有叙述在论坛内 05/25 04:58
18F:→ mikemike1021: 无广告 https://forum.community.tw/t/topic/525 05/25 04:58
19F:→ mikemike1021: 欢迎大家多多利用来交流 05/25 04:59
20F:→ amike: threads从600改成15 05/25 13:38
21F:→ goodzey: thanks!! 05/26 23:10







like.gif 您可能会有兴趣的文章
icon.png[问题/行为] 猫晚上进房间会不会有憋尿问题
icon.pngRe: [闲聊] 选了错误的女孩成为魔法少女 XDDDDDDDDDD
icon.png[正妹] 瑞典 一张
icon.png[心得] EMS高领长版毛衣.墨小楼MC1002
icon.png[分享] 丹龙隔热纸GE55+33+22
icon.png[问题] 清洗洗衣机
icon.png[寻物] 窗台下的空间
icon.png[闲聊] 双极の女神1 木魔爵
icon.png[售车] 新竹 1997 march 1297cc 白色 四门
icon.png[讨论] 能从照片感受到摄影者心情吗
icon.png[狂贺] 贺贺贺贺 贺!岛村卯月!总选举NO.1
icon.png[难过] 羡慕白皮肤的女生
icon.png阅读文章
icon.png[黑特]
icon.png[问题] SBK S1安装於安全帽位置
icon.png[分享] 旧woo100绝版开箱!!
icon.pngRe: [无言] 关於小包卫生纸
icon.png[开箱] E5-2683V3 RX480Strix 快睿C1 简单测试
icon.png[心得] 苍の海贼龙 地狱 执行者16PT
icon.png[售车] 1999年Virage iO 1.8EXi
icon.png[心得] 挑战33 LV10 狮子座pt solo
icon.png[闲聊] 手把手教你不被桶之新手主购教学
icon.png[分享] Civic Type R 量产版官方照无预警流出
icon.png[售车] Golf 4 2.0 银色 自排
icon.png[出售] Graco提篮汽座(有底座)2000元诚可议
icon.png[问题] 请问补牙材质掉了还能再补吗?(台中半年内
icon.png[问题] 44th 单曲 生写竟然都给重复的啊啊!
icon.png[心得] 华南红卡/icash 核卡
icon.png[问题] 拔牙矫正这样正常吗
icon.png[赠送] 老莫高业 初业 102年版
icon.png[情报] 三大行动支付 本季掀战火
icon.png[宝宝] 博客来Amos水蜡笔5/1特价五折
icon.pngRe: [心得] 新鲜人一些面试分享
icon.png[心得] 苍の海贼龙 地狱 麒麟25PT
icon.pngRe: [闲聊] (君の名は。雷慎入) 君名二创漫画翻译
icon.pngRe: [闲聊] OGN中场影片:失踪人口局 (英文字幕)
icon.png[问题] 台湾大哥大4G讯号差
icon.png[出售] [全国]全新千寻侘草LED灯, 水草

请输入看板名称,例如:WOW站内搜寻

TOP