从MATLAB代码创建内核

MATLAB代码创建CUDA的结构和模式^®GPU内核

GPU编码器™生成和执行优化CUDA内核为特定MATLAB算法结构和模式^®代码。生成的代码优化的NVIDIA的电话^®CUDA库,包括cuFFT cuSolver、cuBLAS cuDNN, TensorRT。生成的代码可以集成到你的项目源代码,静态库和动态库,并且可以被编译为台式机、服务器和NVIDIA gpu嵌入式杰森,开车,和其他平台。GPU编码器可以手写的CUDA代码合并到你的算法和生成的代码。

应用程序

全部展开

GPU编码器

GPU编码器	生成GPU代码从MATLAB代码
GPU环境检查	验证和设置GPU代码生成环境

功能

全部展开

代码生成

`codegen`	生成C / c++代码MATLAB代码
`gpucoder`	开放GPU编码器应用程序
`coder.checkGpuInstall`	验证GPU代码生成环境
`coder.gpuConfig`	配置参数CUDA代码生成的MATLAB代码通过使用GPU编码器

GPU核心语法

`coder.gpu.kernel`	编译指示映射`为`循环到GPU内核
`coder.gpu.kernelfun`	将功能映射到GPU内核的编译指示
`coder.gpu.nokernel`	编译指示禁用内核创建循环
`coder.ceval`	调用外部C / c++函数
`coder.gpu.iterations`	编译指示提供信息代码生成器为并行决策变量绑定循环

GPU记忆语法

`coder.gpu.constantMemory`	编译指示,一个变量映射到GPU不变的记忆
`coder.gpu.persistentMemory`	编译指示分配一个变量作为持久记忆在GPU上

GPU原子操作

`gpucoder.atomicAdd`	自动添加一个指定值到一个变量在全球或共享内存
`gpucoder.atomicAnd`	自动执行位操作和指定值和变量之间在全球或共享内存
`gpucoder.atomicCAS`	自动比较和交换一个变量的值在全球或共享内存
`gpucoder.atomicDec`	自动递减一个变量在全球或共享内存中指定的上限
`gpucoder.atomicExch`	自动交换一个变量在全球或共享内存与指定值
`gpucoder.atomicInc`	自动增加一个变量在全球或共享内存中指定的上限
`gpucoder.atomicMax`	自动发现的最大指定值和变量之间在全球或共享内存
`gpucoder.atomicMin`	自动找到最低指定值和变量之间在全球或共享内存
`gpucoder.atomicOr`	自动执行位操作或指定值和变量之间在全球或共享内存
`gpucoder.atomicSub`	自动减去指定的值从一个变量在全球或共享内存
`gpucoder.atomicXor`	自动执行位操作XOR指定值和变量之间在全球或共享内存

编程代码生成

`stencilfun`	生成CUDA代码模板功能
`gpucoder.matrixMatrixKernel`	GPU实现的功能包含矩阵与矩阵的操作进行了优化
`gpucoder.batchedMatrixMultiply`	优化GPU实现批处理矩阵的乘法操作
`gpucoder.stridedMatrixMultiply`	优化的GPU实现向和批处理矩阵乘运算
`gpucoder.batchedMatrixMultiplyAdd`	优化的GPU实现批处理矩阵乘法和加法运算
`gpucoder.stridedMatrixMultiplyAdd`	向的优化GPU实现,成批的矩阵乘法和加法运算
`gpucoder.sort`	优化的GPU实现MATLAB排序函数
`gpucoder.ctranspose`	优化的GPU实现MATLAB转置矩阵函数
`gpucoder.transpose`	优化的GPU实现MATLAB转置矩阵函数
`gpucoder.reduce`	优化GPU实现还原操作

对象

全部展开

代码的配置

`coder.gpuConfig`	配置参数CUDA代码生成的MATLAB代码通过使用GPU编码器
`coder.CodeConfig`	配置参数C / c++代码生成MATLAB代码
`coder.EmbeddedCodeConfig`	配置参数C / c++代码生成MATLAB代码与嵌入式编码器
`coder.gpuEnvConfig`	创建包含传入的参数配置对象`coder.checkGpuInstall`检查执行GPU代码生成环境

主题

内核从Element-Wise循环
从MATLAB函数创建内核包含scalarized element-wise数学操作。
内核从散集类型操作
从MATLAB函数创建内核包含还原操作。
从库调用内核
目标GPU优化数学库,如cuBLAS cuSOLVER, cuFFT和推力。
- cuBLAS例子
- cuSOLVER例子
- FFT的例子
- 推力的例子
万博1manbetx支持GPU数组
使用GPU数组生成CUDA代码。
使用动态分配的c++数组生成的函数接口
理解和使用动态分配的数组从生成的CUDA c++函数接口。
从生成的代码调用自定义CUDA内核
集成定制CUDA内核与MATLAB代码用于代码生成。
调用自定义CUDA设备函数生成的代码
定制集成GPU设备功能与MATLAB代码用于代码生成。
设计模式
为MATLAB函数创建内核包含计算设计模式。
GPU内存分配和最小化
内存分配GPU编码器的选择和优化。
一半精度是多少?
介绍了在MATLAB和Simulink half-precision数据类型万博1manbetx^®。
半精密代码生成的支持万博1manbetx
C / c++代码生成和GPU的支持功能,支持half-pr万博1manbetxecision输入。

特色的例子

建立一个地图使用踩GPU从激光雷达数据

执行3 d激光雷达同步定位和映射在Nvidia GPU(大满贯)。

打开生活的脚本

使用CUDA FFT模拟衍射模式库

使用GPU编码器™利用CUDA®快速傅里叶变换库(cuFFT)来计算二维FFT NVIDIA GPU®。使用二维傅里叶变换在光学计算远场衍射模式。当一个单色光源经过小光圈,如在杨氏双缝干涉实验中,你可以观察这些衍射模式。这个示例还显示了如何使用GPU指针时输入一个入口点函数生成CUDA墨西哥人,源代码,静态库,动态库和可执行文件。通过使用该功能,生成的代码的性能改进通过最小化cudaMemcpy调用的数量在生成的代码。

打开脚本