内核创建

创建CUDA的算法结构和模式®GPU内核

CUDA内核是在GPU设备上执行的函数。这些内核由许多GPU线程并行执行。通过有效地将算法的计算密集型部分映射到内核,您可以利用GPU计算技术提供的性能改进。你可以触发GPU编码器™为特定的算法结构和模式创建CUDA内核在你的MATLAB®代码。

应用程序

GPU编码器 生成GPU代码MATLAB代码
检查显卡安装 验证并搭建GPU代码生成环境

功能

一半 构造半精度数值对象
coder.checkGpuInstall 验证GPU代码生成环境
coder.gpuConfig 配置参数CUDA代码生成的MATLAB代码通过使用GPU编码器
codegen 生成C/ c++代码MATLAB代码
gpucoder 开放GPU编码器应用程序
coder.gpu.kernel 编译指示映射-到GPU内核的循环
coder.gpu.kernelfun 映射函数到GPU内核的Pragma
coder.gpu.nokernel 用于禁用循环的内核创建的Pragma
coder.gpu.constantMemory 将一个变量映射到GPU上的常量内存的Pragma
gpucoder.stencilKernel 创建CUDA模板功能代码
gpucoder.matrixMatrixKernel 优化了包含矩阵-矩阵运算的函数的GPU实现
gpucoder.batchedMatrixMultiply 优化的批处理矩阵乘法运算的GPU实现
gpucoder.stridedMatrixMultiply 优化的GPU实现条带和成批矩阵乘法运算
gpucoder.batchedMatrixMultiplyAdd 优化了批量矩阵乘加运算的GPU实现
gpucoder.stridedMatrixMultiplyAdd 优化的图形处理器实现条带,成批矩阵乘与添加操作
gpucoder.sort 优化的GPU实现MATLAB排序函数
coder.gpu.iterations 为代码生成器在变量绑定循环上作出并行化决策提供信息的Pragma
gpucoder.transpose 优化的GPU实现MATLAB转置矩阵函数
gpucoder.reduce 优化的GPU实现减少操作
coder.ceval 调用外部C/ c++函数

对象

coder.gpuConfig 配置参数CUDA代码生成的MATLAB代码通过使用GPU编码器
coder.CodeConfig 用于生成C/ c++代码的配置参数MATLAB代码
coder.EmbeddedCodeConfig 用于生成C/ c++代码的配置参数MATLAB代码与嵌入式编码器
coder.gpuEnvConfig 创建包含传递到的参数的配置对象coder.checkGpuInstall用于执行GPU代码生成环境检查

主题

来自元素方向循环的内核

从MATLAB函数创建内核,这些函数包含扩展的、基于元素的数学运算。

来自分散-聚集类型操作的内核

从MATLAB函数中创建包含约简操作的内核。

来自库调用的内核

目标GPU优化的数学库,如cuBLAS, cuSOLVER, cuFFT,和推力。

万博1manbetx支持GPU阵列

使用GPU阵列生成CUDA代码。

遗留代码集成

集成定制的GPU代码与MATLAB代码,意在代码生成。

设计模式

为包含计算设计模式的MATLAB函数创建内核。

GPU内存分配和最小化

内存分配选项和GPU编码器优化。

特色的例子