CUDA内核是在GPU设备上执行的函数。这些内核由许多GPU线程并行执行。通过有效地将算法的计算密集型部分映射到内核,您可以利用GPU计算技术提供的性能改进。你可以触发GPU编码器™为特定的算法结构和模式创建CUDA内核在你的MATLAB®代码。
一半 |
构造半精度数值对象 |
coder.checkGpuInstall |
验证GPU代码生成环境 |
coder.gpuConfig |
配置参数CUDA代码生成的MATLAB代码通过使用GPU编码器 |
codegen |
生成C/ c++代码MATLAB代码 |
gpucoder |
开放GPU编码器应用程序 |
coder.gpu.kernel |
编译指示映射为 -到GPU内核的循环 |
coder.gpu.kernelfun |
映射函数到GPU内核的Pragma |
coder.gpu.nokernel |
用于禁用循环的内核创建的Pragma |
coder.gpu.constantMemory |
将一个变量映射到GPU上的常量内存的Pragma |
gpucoder.stencilKernel |
创建CUDA模板功能代码 |
gpucoder.matrixMatrixKernel |
优化了包含矩阵-矩阵运算的函数的GPU实现 |
gpucoder.batchedMatrixMultiply |
优化的批处理矩阵乘法运算的GPU实现 |
gpucoder.stridedMatrixMultiply |
优化的GPU实现条带和成批矩阵乘法运算 |
gpucoder.batchedMatrixMultiplyAdd |
优化了批量矩阵乘加运算的GPU实现 |
gpucoder.stridedMatrixMultiplyAdd |
优化的图形处理器实现条带,成批矩阵乘与添加操作 |
gpucoder.sort |
优化的GPU实现MATLAB排序函数 |
coder.gpu.iterations |
为代码生成器在变量绑定循环上作出并行化决策提供信息的Pragma |
gpucoder.transpose |
优化的GPU实现MATLAB转置矩阵函数 |
gpucoder.reduce |
优化的GPU实现减少操作 |
coder.ceval |
调用外部C/ c++函数 |
coder.gpuConfig |
配置参数CUDA代码生成的MATLAB代码通过使用GPU编码器 |
coder.CodeConfig |
用于生成C/ c++代码的配置参数MATLAB代码 |
coder.EmbeddedCodeConfig |
用于生成C/ c++代码的配置参数MATLAB代码与嵌入式编码器 |
coder.gpuEnvConfig |
创建包含传递到的参数的配置对象coder.checkGpuInstall 用于执行GPU代码生成环境检查 |
从MATLAB函数创建内核,这些函数包含扩展的、基于元素的数学运算。
从MATLAB函数中创建包含约简操作的内核。
目标GPU优化的数学库,如cuBLAS, cuSOLVER, cuFFT,和推力。
使用GPU阵列生成CUDA代码。
集成定制的GPU代码与MATLAB代码,意在代码生成。
为包含计算设计模式的MATLAB函数创建内核。
内存分配选项和GPU编码器优化。