一些为什么GPU编码器™产生预期的代码不执行的最常见的原因是:
CUDA®不创建内核。
主机到设备和装置的主机存储器之间的传输(cudaMemcpy
)的节流性能。
没有足够的并行或设备的问题。
这些主题阐述了这些症状的常见原因,并说明如何利用内置的筛选来检测这些问题。你可以找到关于如何解决这些问题,并产生更高效的CUDA代码信息。
代码生成 |
生成从C / C ++代码MATLAB码 |
gpucoder |
打开GPU编码器应用 |
coder.gpu.kernel |
编译该地图对于 -loops到GPU内核 |
coder.gpu.kernelfun |
附注映射功能,GPU内核 |
coder.gpu.nokernel |
编译到内核中禁用创作for循环 |
gpucoder.profile |
创建用于生成CUDA代码执行概况报告 |
coder.gpuConfig |
配置参数CUDA从代码生成MATLAB使用代码GPU编码器 |
coder.CodeConfig |
配置参数用于从C / C ++代码生成MATLAB码 |
coder.EmbeddedCodeConfig |
配置参数用于从C / C ++代码生成MATLAB与代码嵌入式编码 |
coder.gpuEnvConfig |
创建包含传递给参数配置对象coder.checkGpuInstall 用于执行GPU代码生成环境检查 |
GPU编码器的故障处理流程。
创建和查看代码生成过程中生成的报告。
的MATLAB代码高亮区间在GPU上运行。
创建和探索GPU的静态代码度量报告。
建议用于产生高效的CUDA内核。
使用GPU编码器时减少内存瓶颈问题。
细晶纹的MATLAB算法,并通过SIL其产生的CUDA代码。
通过使用从NVIDIA探查(nvvp)中获得的信息来提高性能。
见GPU编码器的电流限制。