CUDA中device kernel和host程序是异步还是同步的
发布网友
发布时间:2022-04-29 07:18
我来回答
共1个回答
热心网友
时间:2022-06-21 01:43
没错,device和host是异步的,当CPU调用device函数后就返回了!
需要注意的是cudaMemcpy函数是个同步函数,当CPU执行到这里的时候会等待GPU完成工作后开始内存拷贝!
你上面这段程序是由CPU调用了10次GPU内核函数,每次调用完CPU就返回执行下一个循环中的调用,直到循环结束。device函数将会由GPU安排进队列依次执行直到完成,也就是说CPU不会考虑GPU是否完成了上一次的计算工作,会把新的计算工作安插到队列里,而GPU则会依次执行队列中所有的任务!追问按照您的逻辑,就是说上面这段程序的printf语句很有可能在device未全部完成的情况下就已经输出了?
追答不错,是这样的,如果你的kernel执行时间够长的话!当然你可以写个kernel里做个死循环做测试,就明白了!