主要内容

从MATLAB代码创建内核

MATLAB代码创建CUDA的结构和模式®GPU内核

GPU编码器™生成和执行优化CUDA内核为特定MATLAB算法结构和模式®代码。生成的代码优化的NVIDIA的电话®CUDA库,包括cuFFT cuSolver、cuBLAS cuDNN, TensorRT。生成的代码可以集成到你的项目源代码,静态库和动态库,并且可以被编译为台式机、服务器和NVIDIA gpu嵌入式杰森,开车,和其他平台。GPU编码器可以手写的CUDA代码合并到你的算法和生成的代码。

应用程序

全部展开

GPU编码器 生成GPU代码从MATLAB代码
GPU环境检查 验证和设置GPU代码生成环境

功能

全部展开

codegen 生成C / c++代码MATLAB代码
gpucoder 开放GPU编码器应用程序
coder.checkGpuInstall 验证GPU代码生成环境
coder.gpuConfig 配置参数CUDA代码生成的MATLAB代码通过使用GPU编码器
coder.gpu.kernel 编译指示映射循环到GPU内核
coder.gpu.kernelfun 将功能映射到GPU内核的编译指示
coder.gpu.nokernel 编译指示禁用内核创建循环
coder.ceval 调用外部C / c++函数
coder.gpu.iterations 编译指示提供信息代码生成器为并行决策变量绑定循环
coder.gpu.constantMemory 编译指示,一个变量映射到GPU不变的记忆
coder.gpu.persistentMemory 编译指示分配一个变量作为持久记忆在GPU上
gpucoder.atomicAdd 自动添加一个指定值到一个变量在全球或共享内存
gpucoder.atomicAnd 自动执行位操作和指定值和变量之间在全球或共享内存
gpucoder.atomicCAS 自动比较和交换一个变量的值在全球或共享内存
gpucoder.atomicDec 自动递减一个变量在全球或共享内存中指定的上限
gpucoder.atomicExch 自动交换一个变量在全球或共享内存与指定值
gpucoder.atomicInc 自动增加一个变量在全球或共享内存中指定的上限
gpucoder.atomicMax 自动发现的最大指定值和变量之间在全球或共享内存
gpucoder.atomicMin 自动找到最低指定值和变量之间在全球或共享内存
gpucoder.atomicOr 自动执行位操作或指定值和变量之间在全球或共享内存
gpucoder.atomicSub 自动减去指定的值从一个变量在全球或共享内存
gpucoder.atomicXor 自动执行位操作XOR指定值和变量之间在全球或共享内存
stencilfun 生成CUDA代码模板功能
gpucoder.matrixMatrixKernel GPU实现的功能包含矩阵与矩阵的操作进行了优化
gpucoder.batchedMatrixMultiply 优化GPU实现批处理矩阵的乘法操作
gpucoder.stridedMatrixMultiply 优化的GPU实现向和批处理矩阵乘运算
gpucoder.batchedMatrixMultiplyAdd 优化的GPU实现批处理矩阵乘法和加法运算
gpucoder.stridedMatrixMultiplyAdd 向的优化GPU实现,成批的矩阵乘法和加法运算
gpucoder.sort 优化的GPU实现MATLAB排序函数
gpucoder.ctranspose 优化的GPU实现MATLAB转置矩阵函数
gpucoder.transpose 优化的GPU实现MATLAB转置矩阵函数
gpucoder.reduce 优化GPU实现还原操作

对象

全部展开

coder.gpuConfig 配置参数CUDA代码生成的MATLAB代码通过使用GPU编码器
coder.CodeConfig 配置参数C / c++代码生成MATLAB代码
coder.EmbeddedCodeConfig 配置参数C / c++代码生成MATLAB代码与嵌入式编码器
coder.gpuEnvConfig 创建包含传入的参数配置对象coder.checkGpuInstall检查执行GPU代码生成环境

主题