作者doomhammer (流浪者)
看板C_and_CPP
标题[问题] 关於CUDA/C的问题...
时间Mon Nov 1 13:03:02 2010
( *[1m *[m 为色码,可以按 Ctrl+V 预览会显示的颜色 )
( 未必需要依照此格式,文章条理清楚即可 )
遇到的问题: (题意请描述清楚)
看CUDA程式码时看到关於Kernel处理阵列的方式有疑问...
希望得到的正确结果:
在kernel能正确执行阵列运算
程式跑出来的错误结果:
invalid types 'int[int]' for array subscript(单用pointer function,在function
中用 a[i][j]这样的宣告)
开发平台: (例: VC++ or gcc/g++ or Dev-C++, Windows or Linux)
Windows 7 + Dev C++ V4.9.9.2 不过我写的是c code.
有问题的code: (请善用置底文标色功能)
__global__ void MatrixMulKernel(float* Md, float* Nd, float* Pd, intWidth)
{
// Calculate the row index of the Pd element and M
int Row = blockId.y * TILE_WIDTH + threadId.y;
// Calculate the column idenx of Pd and N
Int Col = blockId.x * TILE_WIDTH + threadId.x;
Pvalue = 0;
// each thread computes one element of the block sub-matrix
for (int k = 0; k < Width; ++k)
Pvalue += Md[Row][k] * Nd[k][Col]; //单看程式码产生的问题
Pd[Row][Col] = Pvalue; //这一行也是
}
补充说明:
在看CUDA的程式码的时候产生的问题...他在设计kernel的时候传入的是pointer,确能在
里面以一般二维阵列的方式使用?!
一般的c function我试过下列的写法:
宣告一二维阵列 m[3][3];
int* a;
a=&m[0][0]; //a指向m阵列的第一个位置
void f( int t[][] , int row , int col) //compile不过,会要求你指定後面index
void f( int* a , int row , int col) //单用pointer,没有问题
{
int i,j;
for(i=0;i<row;i++ )
{
for(j=0; j<col; j++)
printf("%d ", *(a+col*i+j));
}
}
//用double pointer的话:
pt_a = (int**) malloc(4 * sizeof(int*));
int i;
for( i=0 ; i<4 ; i++)
{
pt_a[i]= (int* )malloc( 4 * sizeof(int));
}
void f(int** a , int row, int col) //这样我也试过.可以!
{
for(int i=0 ; i<row; i++)
{
for(int j=0; j<col)
printf("%d ", a[i][j]);
}
}
不过这就表示要传2d阵列进function里要用double pointer,有任何可能用pointer就
做到吗(当然除了我上面的例子之外)?有可能用
f(int a[][], int row , int col)这种方式做到吗?
--
※ 发信站: 批踢踢实业坊(ptt.cc)
◆ From: 72.229.53.41
※ 编辑: doomhammer 来自: 72.229.53.41 (11/01 13:06)
1F:→ akasan:把 2d 压成 1d 然後自己算正确的 offset 11/01 20:18
2F:→ akasan:去 google "cuda 2d array" 就会有范例 11/01 20:19
3F:→ doomhammer:我在google上找到一些用cuda处理2维阵列的范例,也看过 11/01 22:46
4F:→ doomhammer:了,不过我只是想问C的部份有没有可能像上述那样传入指 11/01 22:47
5F:→ doomhammer:标,不是double pointer确可以像一般处理多维阵列一样的 11/01 22:48
6F:→ doomhammer:方法a[i][j]去写? 11/01 22:48
7F:→ akasan:那请去请去看第 12 戒吧 11/01 22:49
8F:→ doomhammer:因为看了那个别人写的cuda码突然产生的疑问,他只用指标 11/01 22:51
9F:→ doomhammer:确用Md[i][j]这样的用法...我自已写c code去compile也 11/01 22:52
10F:→ doomhammer:不过...是只有CUDA才能这样用吗?想不透... 11/01 22:53
11F:→ doomhammer:看了第十二戒後,我得到的结论...还是用一维阵列的观点 11/01 22:58
12F:→ doomhammer:去看二维阵列(用算的算出他的位置*(m+col*i+j))这样去 11/01 22:59
13F:→ doomhammer:写. 11/01 22:59