性能

故障排除的代码生成的问题,提高代码执行时间,并减少产生的代码的内存使用情况

一些为什么GPU编码器™产生预期的代码不执行的最常见的原因是:

  • CUDA®不创建内核。

  • 主机到设备和装置的主机存储器之间的传输(cudaMemcpy)的节流性能。

  • 没有足够的并行或设备的问题。

这些主题阐述了这些症状的常见原因,并说明如何利用内置的筛选来检测这些问题。你可以找到关于如何解决这些问题,并产生更高效的CUDA代码信息。

应用

GPU编码器 从生成代码GPUMATLAB
检查GPU安装 验证并建立了GPU代码生成环境

功能

代码生成 生成从C / C ++代码MATLAB
gpucoder 打开GPU编码器应用
coder.gpu.kernel 编译该地图对于-loops到GPU内核
coder.gpu.kernelfun 附注映射功能,GPU内核
coder.gpu.nokernel 编译到内核中禁用创作for循环
gpucoder.profile 创建用于生成CUDA代码执行概况报告

对象

coder.gpuConfig 配置参数CUDA从代码生成MATLAB使用代码GPU编码器
coder.CodeConfig 配置参数用于从C / C ++代码生成MATLAB
coder.EmbeddedCodeConfig 配置参数用于从C / C ++代码生成MATLAB与代码嵌入式编码
coder.gpuEnvConfig 创建包含传递给参数配置对象coder.checkGpuInstall用于执行GPU代码生成环境检查

主题

工作流程

GPU编码器的故障处理流程。

代码生成报告

创建和查看代码生成过程中生成的报告。

跟踪生成CUDA代码和MATLAB源代码之间

的MATLAB代码高亮区间在GPU上运行。

从生成MATLAB代码生成的代码GPU的代码度量报告

创建和探索GPU的静态代码度量报告。

内核分析

建议用于产生高效的CUDA内核。

内存瓶颈分析

使用GPU编码器时减少内存瓶颈问题。

分析生成代码的执行简介

细晶纹的MATLAB算法,并通过SIL其产生的CUDA代码。

分析NVIDIA探查

通过使用从NVIDIA探查(nvvp)中获得的信息来提高性能。

GPU编码器限制

见GPU编码器的电流限制。

精选示例