如何在GPU上并行执行几个反斜杠操作?

4次浏览(最近30天)
是否可能在GPU上并行多个反斜杠操作?
我将MATLAB代码转换为CUDA代码。
我原以为这三个反斜杠操作是并行执行的,但似乎代码是串行执行的。
函数[z]=反斜杠(A, A, B, B, C, C)
% # codegen
coder.gpu.kernelfun ();
z = [A\ A;B\ B;C\ C]
结束
我用代码生成命令生成了一个mex文件。
cfg = coder.gpuConfig (墨西哥人的
codegen-config cfg -args {A, b, b, b, C, C}反斜杠

答案(2)


神骑士
神骑士 2020年11月2日
试着用 gpuArray / pagefun 在使用代码生成之前。
1评论
沃尔特·罗伯森
沃尔特·罗伯森 2020年11月2日
不过,Pagefun将要求所有的系统都是相同的大小。
我发布的解决方案要求所有右侧的列数相同,但不要求系统大小相同。我认为要求它们具有相同数量的列是合理的,因为如果不是这样,那么用户的函数将在vertcat阶段失败。

登录评论。

类别

了解更多内核创建从MATLAB代码帮助中心而且文件交换

社区寻宝

在MATLAB Central中找到宝藏,并发现社区如何帮助您!

开始狩猎!