CUDA中cudeMallocHost函数使用方法。
发布网友
发布时间:2022-04-29 07:18
我来回答
共2个回答
热心网友
时间:2022-06-21 01:43
你好,
你的kernel应该用__global__啊,用__device__只是定义了一个让device来调用的函数而已。而且你的 d_result是按值传递底,必须按地址传递才行,应该改成*d_result。
望采纳,谢谢。
热心网友
时间:2022-06-21 01:44
你好,
cuda默认的都是pageabled的memory,page-locked也就是pinned
memory可以加快host和device之间的数据传输速度,但是使用太多的page-locked的memory会带来整个程序的效率降低。如果程序中存在频繁的cudamemcpy