指针数组 - c++指针详解




为什么cudaMalloc()使用指针指针? (2)

在C中,数据可以通过值或通过模拟传递引用 (即通过指向数据的指针)传递给函数。 值是一种单向方法,通过指针允许函数与其调用环境之间的双向数据流。

当数据项通过函数参数列表传递给函数,并且该函数需要修改原始数据项以便修改后的值显示在调用环境中时,正确的C方法是传递数据项通过指针。 在C中,当我们通过指针时,我们获取要修改的项的地址,创建一个指针(在这种情况下可能是指向指针的指针)并将地址交给函数。 这允许该函数在调用环境中修改原始项(通过指针)。

通常malloc返回一个指针,我们可以在调用环境中使用赋值将此返回值赋给所需的指针。 在cudaMalloc的情况下,CUDA设计者选择使用返回值来携带错误状态而不是指针。 因此,调用环境中指针的设置必须通过引用(即通过指针)传递给函数的参数之一来进行。 由于它是我们想要设置的指针值 ,我们必须获取指针的地址(创建指针指针)并将该地址传递给cudaMalloc函数。

例如, cudaMalloc((void**)&device_array, num_bytes);

之前已经asked过这个问题,回复是“因为cudaMalloc返回错误代码”,但是我没有得到它 - 什么有双指针与返回错误代码有关? 为什么一个简单的指针不能完成这项工作?

如果我写

cudaError_t catch_status;
catch_status = cudaMalloc((void**)&device_array, num_bytes);

错误代码将放在catch_status ,并返回一个指向分配的GPU内存的简单指针就足够了,不应该吗?


我想通过一个例子可以更好地解释cudaMalloc函数的签名。 它基本上通过指向该缓冲区的指针(指向指针的指针)分配缓冲区, 下面的方法:

int cudaMalloc(void **memory, size_t size)
{
    int errorCode = 0;

    *memory = new char[size];

    return errorCode;
}

如您所见,该方法采用指向指针的memory指针,在指针上保存新分配的内存。 然后它返回错误代码(在这种情况下是一个整数,但它实际上是一个枚举)。

cudaMalloc函数可以按照以下方式设计:

void * cudaMalloc(size_t size, int * errorCode = nullptr)
{
    if(errorCode)
        errorCode = 0;

    char *memory = new char[size];

    return memory;
}

在第二种情况下,错误代码通过隐式设置为null的指针设置(对于人们根本不打扰错误代码的情况)。 然后返回分配的内存。

可以使用第一种方法,就像现在的cudaMalloc

float *p;
int errorCode;
errorCode = cudaMalloc((void**)&p, sizeof(float));

而第二个可以使用如下:

float *p;
int errorCode;
p = (float *) cudaMalloc(sizeof(float), &errorCode);

这两种方法在功能上是等价的,虽然它们有不同的签名,cuda的人决定使用第一种方法,返回错误代码并通过指针分配内存,而大多数人说第二种方法是更好的选择。





cuda