[问题] OpenGL Compute Shader同步不同group

时间Fri Dec 23 04:34:15 2016

开发平台(Platform): (Ex: Win10, Linux, ...) Win10 编译器(Ex: GCC, clang, VC++...)+目标环境(跟开发平台不同的话需列出) VS2015 额外使用到的函数库(Library Used): (Ex: OpenGL, ...) OpenGL 4.3 问题(Question)：我想利用compute shader做一个global index array 假设我每个在 compute shader 中的 work group 有一个 shared variable, 叫做local index array, array长度固定, 但是里面内含的有效index 数量并非固定, 例如说: shared int array[1024]; // 每一个work group 自己具有的array group 1: length = 3, array = 3, 4, 2, -1, -1, -1, -1.... (-1代表无效值) group 2: length = 5, array = 1, 5, 3, 4, 6, -1, -1, -1,.. group 3: length = 1, array = 2, -1, -1, -1, -1.... 因为我想要节省记忆体, 所以我想把这些group的local index array merge到 global index array, 也就是一个Shader Storage Buffer Object , 并且让他长成以下这个样子: global index array = 3, 4, 2, 1, 5, 3, 4, 6, 2, -1, -1, ..... 此array 为group 依序将自己的 index array 接到前一个group的 array後方我现在的问题是, 是否有办法做到这件事情? 困难点在於, group 2必须要等到 group 1贴完array(或至少要更新一个offset让group 2 知道他要从哪边开始贴) ,group 3 也要等到group 2 更新玩global index array的offset才知道要从哪里开始但是 OpenGL 的barrier 只有同步同一个group的thread功能, 并无法同步不同 group, 所以我想请问有甚麽方法可以达到我的要求? 我原本的想法是用一块Shader Storage Buffer Object 来记录说最後一个更新 list offset group的编号是多少, 还没有轮到你的group就在一个while loop 里面等, 但是我在想这个方法是不是没甚麽效率, 会不会有比较好的解法? 请各位前辈帮忙回答一下, 感谢! 程式码(Code)：(请善用置底文网页, 记得排版) 补充说明(Supplement)：其实我想实作Forward Plus Rendering, 但是一直不知道linked list 该怎麽做.. --

※ 发信站: 批踢踢实业坊(ptt.cc), 来自: 65.186.78.215 ※ 文章网址: https://webptt.com/cn.aspx?n=bbs/C_and_CPP/M.1482438858.A.089.html ※ 编辑: Ninja5566 (65.186.78.215), 12/23/2016 04:34:43

1^F：推 Sidney0503: 为何不使用vao vbo? 12/23 08:03

2^F：→ Ninja5566: compute shader完全不相容rendering pipeline 12/23 08:16

※ 编辑: Ninja5566 (65.186.78.215), 12/23/2016 09:48:19 ※ 编辑: Ninja5566 (65.186.78.215), 12/23/2016 11:49:56 ※ 编辑: Ninja5566 (65.186.78.215), 12/23/2016 11:51:28

3^F：→ johnjohnlin: 基本上要 2-pass，用 parallel prefix sum 作 12/23 15:30

因为我不是很熟compute shader, 所以这边我是用猜的, 有错请指正如果用两个pass, local index array势必无法宣告成shared, 因为一旦第一个pass (算local index array)执行完, shared variable会被回收, 所以 local index array 就必须要存在 SSBO. 但是这样一来做所谓的prefix sum就没有意义了, 因为 1. 我直接要存取的话就读local index array的SSBO就好, 何必读global index array? 2. 既然local index array都存在SSBO了, 省下记忆体的目标基本上也失败了 ※ 编辑: Ninja5566 (65.186.78.215), 12/23/2016 21:58:40

4^F：→ johnjohnlin: 第一个 pass 只产生 element 数量，prefix sum 之後 12/23 23:06

5^F：→ johnjohnlin: 就是 offset 了，gpu 几乎不会有 global sync thread 12/23 23:07

6^F：推 johnjohnlin: 如果不 care order 的话，用 atomic add 应该还行 12/23 23:10

只产生数量会造成计算浪费, 因为要得到数量前必须要先算local index array 有哪些, 所以第二阶段虽然有了正确的offset, 但是还要再算一次local index有哪些才能update global index array 其实我这边没讲清楚是我的疏忽, 每个rendering cycle中, 每个work group所产生的 index array 有效长度都会变动, 所以不能假设它们数量是固定的 ※ 编辑: Ninja5566 (65.186.78.215), 12/23/2016 23:38:29 ※ 编辑: Ninja5566 (65.186.78.215), 12/23/2016 23:41:02

	[问题/行为] 猫晚上进房间会不会有憋尿问题
	Re: [闲聊] 选了错误的女孩成为魔法少女 XDDDDDDDDDD
	[正妹] 瑞典一张
	[心得] EMS高领长版毛衣.墨小楼MC1002
	[分享] 丹龙隔热纸GE55+33+22
	[问题] 清洗洗衣机
	[寻物] 窗台下的空间
	[闲聊] 双极の女神1 木魔爵
	[售车] 新竹 1997 march 1297cc 白色四门
	[讨论] 能从照片感受到摄影者心情吗
	[狂贺] 贺贺贺贺贺！岛村卯月！总选举NO.1
	[难过] 羡慕白皮肤的女生
	阅读文章
	[黑特]
	[问题] SBK S1安装於安全帽位置
	[分享] 旧woo100绝版开箱!!
	Re: [无言] 关於小包卫生纸
	[开箱] E5-2683V3 RX480Strix 快睿C1 简单测试
	[心得] 苍の海贼龙地狱执行者16PT
	[售车] 1999年Virage iO 1.8EXi
	[心得] 挑战33 LV10 狮子座pt solo
	[闲聊] 手把手教你不被桶之新手主购教学
	[分享] Civic Type R 量产版官方照无预警流出
	[售车] Golf 4 2.0 银色自排
	[出售] Graco提篮汽座（有底座）2000元诚可议
	[问题] 请问补牙材质掉了还能再补吗?(台中半年内
	[问题] 44th 单曲生写竟然都给重复的啊啊！
	[心得] 华南红卡/icash 核卡
	[问题] 拔牙矫正这样正常吗
	[赠送] 老莫高业初业 102年版
	[情报] 三大行动支付本季掀战火
	[宝宝] 博客来Amos水蜡笔5/1特价五折
	Re: [心得] 新鲜人一些面试分享
	[心得] 苍の海贼龙地狱麒麟25PT
	Re: [闲聊] (君の名は。雷慎入) 君名二创漫画翻译
	Re: [闲聊] OGN中场影片：失踪人口局 (英文字幕)
	[问题] 台湾大哥大4G讯号差
	[出售] [全国]全新千寻侘草LED灯, 水草

WEB批踢踢(PTT)

C_and_CPP 板

[问题] OpenGL Compute Shader同步不同group

热门看板

赞助商连结