C_and_CPP 板


LINE

抱歉 原本的数据有错 已修改 各位前辈好 最近在使用GPGPU-Sim 3.2.2来模拟CUDA程式,想了解block大小对於程式的影响 我挑选模拟器附的Benchmark BFS来改 原本程式中的block数为256,而每个block中有256个thread 而我修改成2048个block,每个block有32个thread 原本预想thread总数相同,模拟结果应该OK,顶多执行速度变慢 但是模拟器吐出的讯息显示修改後的模拟cycle以及指令数量与原本相差许多 原本: gpu_tot_sim_cycle = 773568 gpu_tot_sim_insn = 15889228 gpgpu_simulation_time = 0 days, 0 hrs, 4 min, 23 sec (263 sec) 修改後: gpu_tot_sim_cycle = 697192 gpu_tot_sim_insn = 14920542 gpgpu_simulation_time = 0 days, 0 hrs, 2 min, 47 sec (167 sec) 模拟的数值差了一些 这是有问题的吗? 而且比对输出的result也不同 请问问题出在哪? 是因为block数量不同 而blockID影响结果? 我对於block数量与程式的关系还不熟悉 应该怎麽调整block以及thread的数量,而不影响程式结果呢 另外想请教GPGPU-Sim使用上遇到问题有哪里可以发问吗 目前只有看到GOOGLE Group,不过似乎不太热络? --



※ 发信站: 批踢踢实业坊(ptt.cc), 来自: 140.118.155.204
※ 文章网址: https://webptt.com/cn.aspx?n=bbs/C_and_CPP/M.1474287759.A.F6E.html
1F:→ johnjohnlin: block size 32 会造成 occupancy 低落,导致效能不佳 09/19 22:02
2F:→ johnjohnlin: 但是改了 block size 之後差那麽多我觉得应该是 bug 09/19 22:03
恩恩 我知道occupancy会不好 官方建议block size128~256,不过我是想量测每个大小的效能影响。 所以我改的地方是对的? 我是修改<<<block, thread, shared memory>>>(参数...);这边 不过差这麽多让我觉得怪怪的 执行时间也少了一半.. ※ 编辑: v00623 (114.25.14.78), 09/19/2016 22:33:24 ※ 编辑: v00623 (140.118.155.204), 09/20/2016 10:43:10
3F:→ freef1y3: 如果要确认是 benchmark 还是 gpgpu-sim 的问题 09/20 10:44
4F:→ freef1y3: 我会建议用真正的 GPU 跑一次看看 09/20 10:44
5F:→ freef1y3: block 和 thread 数量这有时候是跟 benchmark 有关的 09/20 10:45
6F:→ freef1y3: 甚至有的 CUDA 程式必须 block 大小是 2 的次方才能跑 09/20 10:46
後来用模拟器多跑几种block大小 下图为结果 http://imgur.com/a/mMjkr 只看IPC的话 原本256threads的相对比较不好 有点不知道如何解释这个状况 猜想原本benchmark是否考虑到john大讲的occupancy之类的层面 ※ 编辑: v00623 (140.118.155.204), 09/20/2016 11:01:50
7F:→ freef1y3: 多个小 block 比少数大 block 好 09/20 14:16
8F:→ freef1y3: 我会猜是因为 __syncthreads() 造成的 overhead 09/20 14:17
9F:→ freef1y3: 若是 occupancy 的关系,应该多个小 block 会比较差 09/20 14:18
10F:→ freef1y3: 但是看这 IPC 的差异,执行时间似乎不该差这麽多 09/20 14:19
11F:→ freef1y3: 除非执行的 Instruction 总数也会随着 block size 改变 09/20 14:20
12F:→ freef1y3: 若你的学校有授权 visual studio,且你有实体显示卡 09/20 14:23
13F:→ freef1y3: 可用 nvidia visual profiler 测测看 09/20 14:23
14F:→ freef1y3: 我没用过 gpgpu-sim,所以这方面的问题就无法回答了 09/20 14:25
程式中没有使用到__syncthreads() https://github.com/gpgpu-sim/ispass2009-benchmarks/tree/master/BFS 後来我发现他kernel的执行次数有差 所以inst数量才会不同 http://imgur.com/a/nwIjN 不过我有个疑问 就算kernel跑的次数相同 那inst数量一定会一样吗? (这方面还不太熟悉 上图第二第四列都是跑8次kernel 不过inst还是有差一些 虽然我觉得应该还要看程式怎麽写... ※ 编辑: v00623 (140.118.155.204), 09/21/2016 10:50:20







like.gif 您可能会有兴趣的文章
icon.png[问题/行为] 猫晚上进房间会不会有憋尿问题
icon.pngRe: [闲聊] 选了错误的女孩成为魔法少女 XDDDDDDDDDD
icon.png[正妹] 瑞典 一张
icon.png[心得] EMS高领长版毛衣.墨小楼MC1002
icon.png[分享] 丹龙隔热纸GE55+33+22
icon.png[问题] 清洗洗衣机
icon.png[寻物] 窗台下的空间
icon.png[闲聊] 双极の女神1 木魔爵
icon.png[售车] 新竹 1997 march 1297cc 白色 四门
icon.png[讨论] 能从照片感受到摄影者心情吗
icon.png[狂贺] 贺贺贺贺 贺!岛村卯月!总选举NO.1
icon.png[难过] 羡慕白皮肤的女生
icon.png阅读文章
icon.png[黑特]
icon.png[问题] SBK S1安装於安全帽位置
icon.png[分享] 旧woo100绝版开箱!!
icon.pngRe: [无言] 关於小包卫生纸
icon.png[开箱] E5-2683V3 RX480Strix 快睿C1 简单测试
icon.png[心得] 苍の海贼龙 地狱 执行者16PT
icon.png[售车] 1999年Virage iO 1.8EXi
icon.png[心得] 挑战33 LV10 狮子座pt solo
icon.png[闲聊] 手把手教你不被桶之新手主购教学
icon.png[分享] Civic Type R 量产版官方照无预警流出
icon.png[售车] Golf 4 2.0 银色 自排
icon.png[出售] Graco提篮汽座(有底座)2000元诚可议
icon.png[问题] 请问补牙材质掉了还能再补吗?(台中半年内
icon.png[问题] 44th 单曲 生写竟然都给重复的啊啊!
icon.png[心得] 华南红卡/icash 核卡
icon.png[问题] 拔牙矫正这样正常吗
icon.png[赠送] 老莫高业 初业 102年版
icon.png[情报] 三大行动支付 本季掀战火
icon.png[宝宝] 博客来Amos水蜡笔5/1特价五折
icon.pngRe: [心得] 新鲜人一些面试分享
icon.png[心得] 苍の海贼龙 地狱 麒麟25PT
icon.pngRe: [闲聊] (君の名は。雷慎入) 君名二创漫画翻译
icon.pngRe: [闲聊] OGN中场影片:失踪人口局 (英文字幕)
icon.png[问题] 台湾大哥大4G讯号差
icon.png[出售] [全国]全新千寻侘草LED灯, 水草

请输入看板名称,例如:BuyTogether站内搜寻

TOP