内核创建

创建CUDA的算法结构和模式®GPU内核

CUDA内核是在GPU设备上执行的函数。这些内核由许多GPU线程并行执行。通过高效地将算法的计算密集型部分映射到内核,您可以利用GPU计算技术提供的性能改进。可以触发GPU编码器™为MATLAB中的特定算法结构和模式创建CUDA内核®代码。

应用程序

GPU编码器 生成GPU代码MATLAB
检查显卡安装 验证并设置GPU代码生成环境

功能

一半 构造半精度的数值对象
coder.checkGpuInstall 验证GPU代码生成环境
coder.gpuConfig 配置参数CUDA代码生成的MATLAB使用代码GPU编码器
codegen 生成从C / C ++代码MATLAB
gpucoder 开放GPU编码器应用程序
coder.gpu.kernel 编译指示映射-对GPU内核的循环
coder.gpu.kernelfun 附注映射功能,GPU内核
coder.gpu.nokernel 为循环禁用内核创建
coder.gpu.constantMemory 将一个变量映射到GPU上的常量内存的Pragma
gpucoder.stencilKernel 创建CUDA模具功能代码
gpucoder.matrixMatrixKernel 优化GPU实现包含矩阵矩阵操作的函数
gpucoder.batchedMatrixMultiply 优化GPU实现批量矩阵乘法运算
gpucoder.stridedMatrixMultiply 优化GPU实现跨步矩阵乘法和批处理矩阵乘法运算
gpucoder.batchedMatrixMultiplyAdd 用加法运算优化GPU批量矩阵乘法的实现
gpucoder.stridedMatrixMultiplyAdd 优化GPU实现的大步,成批矩阵乘法与加法操作
gpucoder.sort 优化的GPU实现的MATLAB排序函数
coder.gpu.iterations 附注是对代码生成提供信息的变量绑定循环进行并行化决定
gpucoder.transpose 优化的GPU实现的MATLAB转置矩阵函数
gpucoder.reduce 优化的GPU实现减少操作
coder.ceval 调用外部C / C ++函数

对象

coder.gpuConfig 配置参数CUDA代码生成的MATLAB使用代码GPU编码器
coder.CodeConfig 配置参数用于从C / C ++代码生成MATLAB
coder.EmbeddedCodeConfig 配置参数用于从C / C ++代码生成MATLAB代码与嵌入式编码
coder.gpuEnvConfig 创建包含传递给参数配置对象coder.checkGpuInstall用于执行GPU代码生成环境检查

主题

元素行循环的内核

从创建包含标量化,逐元素的数学运算功能的MATLAB内核。

来自分散-聚集类型操作的内核

从包含约简操作的MATLAB函数中创建内核。

来自库调用的内核

目标GPU优化的数学库,如CUBLAS,cuSOLVER,CUFFT和推力。

万博1manbetx对GPU阵列的支持

使用GPU阵列生成CUDA代码。

遗留代码整合

集成定制的GPU代码用于代码生成的MATLAB代码。

设计模式

创建包含计算设计模式MATLAB功能的内核。

GPU内存分配和最小化

内存分配选项和优化GPU编码器。

特色的例子