coder.gpuConfig

的配置参数CUDA代码生成的MATLAB使用GPU编码器

全部展开页面

描述

的编码器。GpuCodeConfig或coder.gpuConfig对象包含的配置参数codegen用于生成CUDA^®MEX，一个静态库，一个动态链接库，或一个带有GPU Coder™的可执行程序。将对象传递给codegen函数的配置选择。

创造

语法

cfg = coder.gpuConfig (build_type)

cfg = coder.gpuConfig (build_type,‘是’,假)

cfg=coder.gpuConfig（构建类型，'ecoder'，true）

描述

例子

cfg = coder.gpuConfig (build_type）为指定的生成类型创建代码生成配置对象，该对象可以是CUDA MEX、静态库、动态链接库或可执行程序。如果嵌入式编码器^®产品被安装，它创建一个coder.EmbeddedCodeConfig对象，用于静态库、动态库或可执行构建类型。

cfg = coder.gpuConfig (build_type“是”,假)创建代码生成配置对象以生成CUDA“自由”，“dll”,或“exe”即使安装了嵌入式编码器产品也会输出。

cfg = coder.gpuConfig (build_type“是”,真的)创建一个coder.EmbeddedCodeConfig配置对象，即使未安装Embedded Coder产品。但是，使用coder.EmbeddedCodeConfig对象需要嵌入式编码器许可证。

输入参数

全部展开

`build_type`- - - - - -从生成的CUDA代码生成的输出
`墨西哥人的`|`“自由”`|`“DLL”`|`“EXE”`

从生成的CUDA代码生成的输出，指定为该表中的一个值。

价值	描述
`墨西哥人的`	CUDA墨西哥人
`“自由”`	静态库
`“DLL”`	动态链接库
`“EXE”`	可执行程序

性质

全部展开

编码器。GpuConfig只包含代码配置对象的GPU特定配置参数。要查看代码配置对象的所有属性，请参见编码器。CodeConfig和coder.EmbeddedCodeConfig．

`启用`- - - - - -控制GPU代码生成
`真正的`（默认）|`假`

使用此表中的一个值控制CUDA（*.cu）文件的生成。

价值描述

价值	描述
`真正的`	此值为默认值。启用CUDA代码生成。
`假`	禁用CUDA代码生成。

真正的

此值为默认值。

启用CUDA代码生成。

假

禁用CUDA代码生成。

例子：cfg.GpuConfig.Enabled = true

`马洛基模式`- - - - - -GPU内存分配
`“离散”`（默认）|`“统一”`

内存分配(malloc)模式，在生成的CUDA代码中使用，指定为该表中的一个值。

价值描述

价值	描述
`“离散”`	此值为默认值。生成的代码使用`库达马洛克`用于在CPU和GPU之间传输数据的API。从程序员的角度来看，离散模式有一个传统的内存体系结构，具有独立的CPU和GPU全局内存地址空间。
`“统一”`	生成的代码使用`cudaMallocManaged`使用共享(统一)CPU和GPU全局内存地址空间的API。对于英伟达^®嵌入式目标。看到移除主机上的统一内存分配模式．

“离散”

此值为默认值。

生成的代码使用库达马洛克用于在CPU和GPU之间传输数据的API。从程序员的角度来看，离散模式有一个传统的内存体系结构，具有独立的CPU和GPU全局内存地址空间。

“统一”

生成的代码使用cudaMallocManaged使用共享(统一)CPU和GPU全局内存地址空间的API。

对于英伟达^®嵌入式目标。看到移除主机上的统一内存分配模式．

有关详细信息，请参阅离散模式和管理模式．

例子：cfg.GpuConfig.MallocMode =“离散”

`内存管理器`- - - - - -GPU内存管理器
`假`（默认）|`真正的`

选择GPU内存管理器可以有效地分配、管理和提高运行时性能。

价值描述

价值	描述
`真正的`	此值为默认值。 GPU内存管理器创建大型GPU内存池的集合，并管理这些池中内存块块的分配和释放。通过创建大型内存池，内存管理器减少了对CUDA内存API的调用次数，从而提高了运行时性能。您可以使用GPU内存管理器生成MEX和独立CUDA代码。
`假`	此值为默认值。关闭使用GPU内存管理器进行内存分配和管理。

真正的

此值为默认值。

GPU内存管理器创建大型GPU内存池的集合，并管理这些池中内存块块的分配和释放。通过创建大型内存池，内存管理器减少了对CUDA内存API的调用次数，从而提高了运行时性能。您可以使用GPU内存管理器生成MEX和独立CUDA代码。

假

此值为默认值。

关闭使用GPU内存管理器进行内存分配和管理。

例子：cfg.GpuConfig.MemoryManager = true

`KernelNamePrefix`- - - - - -自定义内核名称前缀
＇＇（默认）|特征向量

为生成的代码中的所有内核指定自定义名称前缀。例如，使用“CUDA_”创建具有名称的内核CUDA_kernel1，CUDA_kernel2，等等。如果没有提供名称，GPU编码器将在内核名称前加上入口点函数的名称。内核名可以包含大写字母、小写字母、数字0 ~ 9、下划线_。GPU编码器从内核名称中删除不支持的字符万博1manbetx并追加α不以字母开头的前缀。

例子：cfg.GpuConfig.KernelNamePrefix = ' myKernel '

`EnableCUBLAS`- - - - - -使用`cuBLAS`图书馆
`真正的`（默认）|`假`

用NVIDIA替换数学函数调用cuBLAS库调用，指定为该表中的值之一。

价值描述

价值	描述
`真正的`	此值为默认值。允许GPU编码器替换适当的数学函数调用调用`cuBLAS`图书馆对于CUDA中没有替代品的函数，GPU编码器使用便携式MATLAB^®函数，并尝试将它们映射到GPU。
`假`	禁止使用`cuBLAS`库。

真正的

此值为默认值。

允许GPU编码器替换适当的数学函数调用调用cuBLAS图书馆对于CUDA中没有替代品的函数，GPU编码器使用便携式MATLAB^®函数，并尝试将它们映射到GPU。

假

禁止使用cuBLAS库。

有关详细信息，请参阅库调用中的内核．

例子：cfg.GpuConfig.EnableCUBLAS=true

`使能器`- - - - - -使用`cuSOLVER`图书馆
`真正的`（默认）|`假`

用NVIDIA替换数学函数调用cuSOLVER库调用，指定为该表中的值之一。

价值描述

价值	描述
`真正的`	此值为默认值。允许GPU编码器替换适当的数学函数调用调用`cuSOLVER`图书馆对于CUDA中没有替代品的函数，GPU编码器使用便携式MATLAB函数，并尝试将它们映射到GPU。
`假`	禁止使用`cuSOLVER`库。

真正的

此值为默认值。

允许GPU编码器替换适当的数学函数调用调用cuSOLVER图书馆对于CUDA中没有替代品的函数，GPU编码器使用便携式MATLAB函数，并尝试将它们映射到GPU。

假

禁止使用cuSOLVER库。

有关详细信息，请参阅库调用中的内核．

例子：cfg.GpuConfig.EnableCUSOLVER = true

`使能袖套`- - - - - -使用`cuFFT`图书馆
`真正的`（默认）|`假`

更换快速傅里叶变换函数调用cuFFT库调用，指定为该表中的值之一。

价值描述

价值	描述
`真正的`	此值为默认值。允许GPU编码器替换适当`快速傅里叶变换`一个接一个的电话`cuFFT`图书馆。
`假`	禁止使用`cuFFT`库。使用此选项，GPU编码器使用C语言`FFTW`库中可用的或从可移植的MATLAB生成内核`快速傅里叶变换`代码。

真正的

此值为默认值。

允许GPU编码器替换适当快速傅里叶变换一个接一个的电话cuFFT图书馆。

假

禁止使用cuFFT库。使用此选项，GPU编码器使用C语言FFTW库中可用的或从可移植的MATLAB生成内核快速傅里叶变换代码。

有关详细信息，请参阅库调用中的内核．

例子：cfg.GpuConfig.EnableCUFFT = true

`基准测试`- - - - - -向生成的代码添加基准测试
`假`（默认）|`真正的`

通过使用此表中的一个值，控制基准代码添加到生成的CUDA代码中。

价值描述

价值	描述
`假`	此值为默认值。生成的CUDA代码不包含基准测试功能。
`真正的`	生成具有基准测试功能的CUDA代码。这个选项使用CUDA api，比如`cudaEvent`准确的时间`内核`，`memcpy`，以及其他活动。

假

此值为默认值。

生成的CUDA代码不包含基准测试功能。

真正的

生成具有基准测试功能的CUDA代码。这个选项使用CUDA api，比如cudaEvent准确的时间内核，memcpy，以及其他活动。

例子：cfg.GpuConfig.Benchmarking = true

`SafeBuild`- - - - - -检查生成的代码时出错
`假`（默认）|`真正的`

通过使用该表中的一个值，向生成的CUDA代码添加错误检查功能。

价值描述

价值	描述
`假`	此值为默认值。生成的CUDA代码不包含错误检查功能。
`真正的`	为CUDA API和内核调用生成带有错误检查的代码。

假

此值为默认值。

生成的CUDA代码不包含错误检查功能。

真正的

为CUDA API和内核调用生成带有错误检查的代码。

例子：cfg.GpuConfig.SafeBuild=true

`ComputeCapability`- - - - - -代码生成的最小计算能力
`“3.5”`（默认）|`“3.2”`|`“3.7”`|`“5.0”`|`“5.2”`|`“5.3”`|`“6.0”`|`“6.1”`|`“6.2”`|`“7.0”`|`“7.1”`|`“7.2”`

选择代码生成的最小计算能力。计算能力识别GPU硬件支持的功能。应用程序在运行时使用它来确定当前GPU上可用的硬件功能和指令。如果指定自定义计算能力，GPU编码器将忽略此设置。万博1manbetx

要查看代码生成的CUDA计算能力需求，请参阅下表。

目标	计算能力
CUDA墨西哥人	看到GPU版万博1manbetx本支持．
源代码、静态或动态库以及可执行文件	3.2或更高版本。
深度学习应用在8位整数精度	6.1、6.3或更高。
半精确(16位浮点)的深度学习应用	5.3、6.0、6.2或以上。

例子：cfg.GpuConfig.ComputeCapability = ' 6.1 '

`自定义计算能力`- - - - - -控制GPU代码生成
`＇＇`（默认）|特征向量

指定必须编译CUDA输入文件的NVIDIA虚拟GPU架构的名称。

例如，指定虚拟架构类型-arch=计算50. 您可以使用-arch=sm_50．有关更多信息，请参见转向GPU代码生成的选项CUDA工具包文档中的主题。

例子：cfg.GpuConfig.CustomComputeCapability = '拱= compute_50 '

`CompilerFlags`- - - - - -GPU编译器的附加标志
`＇＇`（默认）|`特征向量`

将附加标志传递给GPU编译器。例如,——fmad = false指示学校网站在一个浮点乘法-加法(FMAD)指令中禁用浮点乘法和加法的缩写。

有关类似的NVIDIA编译器选项，请参阅相关主题NVCC命令选项在CUDA工具包文档中。

例子：cfg.GpuConfig.CompilerFlags = '——fmad = false '

`StackLimitPerThread`- - - - - -每个GPU线程的堆栈限制
`1024`（默认）|`整数`

将每个GPU线程的最大堆栈限制指定为一个整数值。

例子：cfg.GpuConfig.StackLimitPerThread = 1024

`马洛克阈`- - - - - -Malloc阈值
`200`（默认）|`整数`

指定在堆上而不是堆栈上分配私有变量的大小，作为整数值。

例子：cfg.GpuConfig.MallocThreshold = 256

`MaximumBlocksPerKernel`- - - - - -在内核启动期间创建的最大块数
`0`（默认）|`整数`

指定在内核启动期间创建的最大块数。

由于GPU设备具有有限的流式多处理器（SM）资源，因此限制每个内核的块数可以避免因调度、加载和卸载块而导致的性能损失。

如果循环中的迭代次数大于每个内核的最大块数，代码生成器将创建带跨步的CUDA内核。

当您为每个内核指定最大块数时，代码生成器将创建1-D内核。要强制代码生成器创建2-D或3-D内核，请使用coder.gpu.kernel编译指示。的coder.gpu.kernelpragma优先于每个块的最大内核数。

例子：cfg.GpuConfig.MaximumBlocksPerKernel=1024

`SelectCudaDevice`- - - - - -CUDA设备选择
`－1`（默认）|`设备ID`

在多GPU环境下，如NVIDIA Drive平台，指定CUDA设备到目标。

例子：cfg.GpuConfig.SelectCudaDevice = <的DeviceID >

请注意

SelectCudaDevice可与gpuArray只有gpuDevice和SelectCudaDevice指向同一个GPU。如果gpuDevice指向不同的GPU，一个CUDA_ERROR_INVALID_VALUE抛出运行时错误。

例子

全部折叠

生成CUDA墨西哥人

利用MATLAB函数生成CUDA MEX函数，该函数适用于GPU代码生成。另外，启用代码生成报告。

编写MATLAB函数VecAdd，它执行输入的向量相加一个和B．

函数[C] = VecAdd (A, B)% # codegenC = coder.nullcopy(0(大小(A)));coder.gpu.kernelfun ();C = a + b;结束

要生成MEX函数，请创建代码生成配置对象。

cfg = coder.gpuConfig (墨西哥人的)；

启用代码生成报告。

cfg.GpuConfig.EnableCUBLAS = true;cfg。GenerateReport = true;

属性在当前文件夹中生成一个MEX函数，指定配置对象配置选择。

%生成MEX函数和代码生成报告codegen配置cfgarg游戏{0(512512年,“双”),0(512512年,“双”)}VecAdd

限制

GPU编码器总是设置PassStructByReference财产编码器。CodeConfig和coder.EmbeddedCodeConfig代码配置对象为true。
GPU编码器总是设置启用已签名的左移位和启用SignedRightShift财产coder.EmbeddedCodeConfig代码配置对象为true。
对于独立的目标，如静态库、动态链接库或Windows中的可执行程序^®环境中，生成的makefiles未设置每公吨或/ MD编译器标志。这些标志指示Visual Studio编译器使用多线程库。默认情况下，Visual Studio使用每公吨在编译过程中。要传递其他编译器特定的标志，请使用CompilerFlags选择。例如,
```
cfg.GpuConfig.CompilerFlags =“-Xcompiler / MD”；
```
的学校网站编译器对输入文件后缀有限制。例如，如果目标文件包含版本号，编译可能会失败。在这种情况下，创建符号链接或传递“-Xlinker”到CompilerFlags．

兼容性的考虑

全部展开

`统一的`移除主机上的内存分配模式

未来版本中的行为更改

在未来的版本中，统一内存分配(cudaMallocManaged)模式将被移除当目标是NVIDIA GPU设备在主机开发计算机上。针对NVIDIA嵌入式平台，您可以继续使用统一内存分配模式。

当从MATLAB生成主机CUDA代码时，设置马洛基模式财产coder.gpuConfig代码配置对象“离散”．

另请参阅

主题

介绍了R2017b

coder.gpuConfig

描述

创造

语法

描述

输入参数

`build_type`- - - - - -从生成的CUDA代码生成的输出
`墨西哥人的`|`“自由”`|`“DLL”`|`“EXE”`

性质

`启用`- - - - - -控制GPU代码生成
`真正的`（默认）|`假`

`马洛基模式`- - - - - -GPU内存分配
`“离散”`（默认）|`“统一”`

`内存管理器`- - - - - -GPU内存管理器
`假`（默认）|`真正的`

`KernelNamePrefix`- - - - - -自定义内核名称前缀
＇＇（默认）|特征向量

`EnableCUBLAS`- - - - - -使用`cuBLAS`图书馆
`真正的`（默认）|`假`

`使能器`- - - - - -使用`cuSOLVER`图书馆
`真正的`（默认）|`假`

`使能袖套`- - - - - -使用`cuFFT`图书馆
`真正的`（默认）|`假`

`基准测试`- - - - - -向生成的代码添加基准测试
`假`（默认）|`真正的`

`SafeBuild`- - - - - -检查生成的代码时出错
`假`（默认）|`真正的`

`ComputeCapability`- - - - - -代码生成的最小计算能力
`“3.5”`（默认）|`“3.2”`|`“3.7”`|`“5.0”`|`“5.2”`|`“5.3”`|`“6.0”`|`“6.1”`|`“6.2”`|`“7.0”`|`“7.1”`|`“7.2”`

`自定义计算能力`- - - - - -控制GPU代码生成
`＇＇`（默认）|特征向量

`CompilerFlags`- - - - - -GPU编译器的附加标志
`＇＇`（默认）|`特征向量`

`StackLimitPerThread`- - - - - -每个GPU线程的堆栈限制
`1024`（默认）|`整数`

`马洛克阈`- - - - - -Malloc阈值
`200`（默认）|`整数`

`MaximumBlocksPerKernel`- - - - - -在内核启动期间创建的最大块数
`0`（默认）|`整数`

`SelectCudaDevice`- - - - - -CUDA设备选择
`－1`（默认）|`设备ID`

例子

生成CUDA墨西哥人

限制

兼容性的考虑

`统一的`移除主机上的内存分配模式

另请参阅

应用程序

功能

对象

主题

GPU编码器文档

万博1manbetx

从MATLAB生成CUDA代码:gpu上加速嵌入式视觉和深度学习算法

coder.gpuConfig

描述

创造

语法

描述

输入参数

build_type- - - - - -从生成的CUDA代码生成的输出墨西哥人的|“自由”|“DLL”|“EXE”

性质

启用- - - - - -控制GPU代码生成真正的（默认）|假

马洛基模式- - - - - -GPU内存分配“离散”（默认）|“统一”

内存管理器- - - - - -GPU内存管理器假（默认）|真正的

KernelNamePrefix- - - - - -自定义内核名称前缀＇ ＇（默认）|特征向量

EnableCUBLAS- - - - - -使用cuBLAS图书馆真正的（默认）|假

使能器- - - - - -使用cuSOLVER图书馆真正的（默认）|假

使能袖套- - - - - -使用cuFFT图书馆真正的（默认）|假

基准测试- - - - - -向生成的代码添加基准测试假（默认）|真正的

SafeBuild- - - - - -检查生成的代码时出错假（默认）|真正的

ComputeCapability- - - - - -代码生成的最小计算能力“3.5”（默认）|“3.2”|“3.7”|“5.0”|“5.2”|“5.3”|“6.0”|“6.1”|“6.2”|“7.0”|“7.1”|“7.2”

自定义计算能力- - - - - -控制GPU代码生成＇＇（默认）|特征向量

CompilerFlags- - - - - -GPU编译器的附加标志＇＇（默认）|特征向量

StackLimitPerThread- - - - - -每个GPU线程的堆栈限制1024（默认）|整数

马洛克阈- - - - - -Malloc阈值200（默认）|整数

MaximumBlocksPerKernel- - - - - -在内核启动期间创建的最大块数0（默认）|整数

SelectCudaDevice- - - - - -CUDA设备选择－1（默认）|设备ID

例子

生成CUDA墨西哥人

限制

兼容性的考虑

统一的移除主机上的内存分配模式

另请参阅

应用程序

功能

对象

主题

GPU编码器文档

万博1manbetx

从MATLAB生成CUDA代码:gpu上加速嵌入式视觉和深度学习算法

`build_type`- - - - - -从生成的CUDA代码生成的输出
`墨西哥人的`|`“自由”`|`“DLL”`|`“EXE”`

`启用`- - - - - -控制GPU代码生成
`真正的`（默认）|`假`

`马洛基模式`- - - - - -GPU内存分配
`“离散”`（默认）|`“统一”`

`内存管理器`- - - - - -GPU内存管理器
`假`（默认）|`真正的`

`KernelNamePrefix`- - - - - -自定义内核名称前缀
＇＇（默认）|特征向量

`EnableCUBLAS`- - - - - -使用`cuBLAS`图书馆
`真正的`（默认）|`假`

`使能器`- - - - - -使用`cuSOLVER`图书馆
`真正的`（默认）|`假`

`使能袖套`- - - - - -使用`cuFFT`图书馆
`真正的`（默认）|`假`

`基准测试`- - - - - -向生成的代码添加基准测试
`假`（默认）|`真正的`

`SafeBuild`- - - - - -检查生成的代码时出错
`假`（默认）|`真正的`

`ComputeCapability`- - - - - -代码生成的最小计算能力
`“3.5”`（默认）|`“3.2”`|`“3.7”`|`“5.0”`|`“5.2”`|`“5.3”`|`“6.0”`|`“6.1”`|`“6.2”`|`“7.0”`|`“7.1”`|`“7.2”`

`自定义计算能力`- - - - - -控制GPU代码生成
`＇＇`（默认）|特征向量

`CompilerFlags`- - - - - -GPU编译器的附加标志
`＇＇`（默认）|`特征向量`

`StackLimitPerThread`- - - - - -每个GPU线程的堆栈限制
`1024`（默认）|`整数`

`马洛克阈`- - - - - -Malloc阈值
`200`（默认）|`整数`

`MaximumBlocksPerKernel`- - - - - -在内核启动期间创建的最大块数
`0`（默认）|`整数`

`SelectCudaDevice`- - - - - -CUDA设备选择
`－1`（默认）|`设备ID`

`统一的`移除主机上的内存分配模式