cnncodegen

生成用于深度学习网络的代码手臂马里GPU

折叠所有页面

语法

cnncodegen(网、“targetlib”、“arm-compute-mali”)

cnncodegen(净,‘targetlib’,‘arm-compute-mali’,targetparams)

描述

cnncodegen (网“targetlib”,“arm-compute-mali”)使用ARM为指定的网络对象生成c++代码^®马里图形处理器计算库。

需要GPU Coder™产品和用于深度学习库的GPU编码器接口．

例子

cnncodegen (网,‘targetlib’,‘arm-compute-mali’,targetparams）通过使用带有额外代码生成选项的Mali gpu的ARM计算库为指定的网络对象生成c++代码。

例子

全部折叠

生成在ARM处理器上运行的预训练网络的c++代码

使用cnncodegen为预先训练的网络生成c++代码，用于部署到ARM Mali图形处理器。

获取预训练的GoogLeNet模型googlenet(深度学习工具箱)函数。此函数需要深度学习工具箱™GoogLeNet网络模型．如果您没有安装此支持包，该功能提供了一个下载链接。万博1manbetx另外,看到//www.tianjin-qmedu.com/matlabcentral/fileexchange/64456-deep-learning-toolbox-model-for-googlenet-network．

Net = googlenet;

使用以下命令生成代码cnncodegen与“targetlib”设置为“arm-compute-mali”．默认情况下，代码生成器以版本为目标“19.05”ARM。若要针对不同版本的计算库，请使用“ArmComputeVersion”参数。

cnncodegen(净,“targetlib”，“arm-compute-mali”.．.，“targetparams”结构(“ArmComputeVersion”，“19.02”));

------------------------------------------------------------------------ 编译抑制:生成代码。------------------------------------------------------------------------ ### Codegen成功生成的手臂装置

代码生成器生成. cpp的头文件“/ pwd / codegen”文件夹中。DAG网络生成为一个c++类，名为CnnMain，包含87个层类的数组。代码生成器通过对卷积层和批处理归一化层的层间融合优化来减少层数。的设置()方法为每个层对象设置句柄并分配资源。的预测()方法调用对网络中87层中的每一层的预测。的清理()方法释放为每个层对象分配的所有内存和系统资源。所有的二进制权重(cnn_ * * _w)和偏见档案(cnn_ * * _b)，因为网络的卷积层存储在codegen文件夹中。

要构建库，将生成的代码移动到ARM目标平台并使用生成的makefilecnnbuild_rtw.mk．

输入参数

全部折叠

`网`- - - - - -预训练深度学习网络对象
特征向量|字符串标量

预先训练的SeriesNetwork或DAGNetwork对象。

请注意

cnncodegen不支持万博1manbetxdlnetwork对象。

`targetparams`- - - - - -特有的参数
结构

指定为ARM计算库的特定参数1——- - - - - -1结构，该结构包含这些表中描述的字段。

场	描述
`ArmComputeVersion`	目标硬件上ARM计算库的版本`“19.02”`或`“19.05”`．默认值为`“19.05”`．如果你设置`ArmComputeVersion`到以后的版本`“19.05”`，`ArmComputeVersion`设置为`“19.05”`．

兼容性的考虑

全部展开

目标库支持的更改万博1manbetx

R2021a开始警告

在将来的版本中，cnncodegen函数将生成c++代码和makefile来构建仅用于ARM Mali GPU处理器的静态库。您可以继续使用“arm-compute-mali”的值。“targetlib”参数，通过使用ARM计算库进行计算机视觉和机器学习来瞄准ARM Mali GPU。

对于所有其他目标，使用codegen命令。用MATLAB编写一个入口点函数^®它使用coder.loadDeepLearningNetwork函数加载深度学习模型并调用预测(深度学习工具箱)来预测反应。例如,

函数Out = googlenet_predict(in)% # codegen持续的mynet;如果mynet = code . loaddeeplearningnetwork (mynet)“googlenet”）;结束输入合格率Out = predict(mynet,in);

的一些典型用法cnncodegen以及如何更新您的代码以使用codegen代替。

目标工作流程不推荐推荐

目标工作流程	不推荐	推荐
ARM CPU处理器支持万博1manbetx`霓虹灯`指令	设置`“targetlib”`参数`“arm-compute”`．指定要为之生成代码的ARM计算库版本，以及目标硬件上的ARM架构`“targetparams”`参数。 cnncodegen(净,“targetlib”.．.，“arm-compute”，“targetparams”.．.结构(“ArmComputeVersion”.．.，“19.02”，“ArmArchitecture”.．.，“armv8”）) 其他支持的A万博1manbetxRM计算库版本有`“18.11”`，`“19.02”`，`“19.05”`,或`“20.02.1”`．默认值为`“20.02.1”`．如果你设置`ArmComputeVersion`到以后的版本`“20.02.1”`，`ArmComputeVersion`设置为`“20.02.1”` 您可以将ARM架构指定为`“v7`或`“armv8”`．指定的架构必须与目标硬件上ARM计算库的架构相同。	创建一个`coder.config`用于生成静态库的配置对象。 CFG = code .config(“自由”）;cfg。TargetLang =“c++”；创建一个`编码器。手臂霓虹灯Config`深度学习配置对象。指定深度学习配置对象的目标库特定属性。将其分配给`DeepLearningConfig`的属性`cfg`配置对象。 DLCFG =编码器。DeepLearningConfig.．.（“arm-compute”）;dlcfg。ArmArchitecture =“armv8”；dlcfg。ArmComputeVersion =“19.02”；cfg。DeepLearningConfig = dlcfg; 使用`配置`选项`codegen`函数指定`cfg`配置对象。的`codegen`函数必须确定MATLAB函数输入的大小、类和复杂度。使用`arg游戏`选项指定入口点函数的输入大小。 Arg = {ones(224,224,3，“单一”)};codegenarg游戏参数.．.配置cfggooglenet_predict 有关更多信息，请参见基于ARM计算库的深度学习网络代码生成．
英伟达^®通过CUDA实现gpu^®深度神经网络库(cuDNN)	设置`“targetlib”`参数`“cudnn”`．属性指定cuDNN库特定的属性`“targetparams”`参数。 cnncodegen(净,“targetlib”.．.，“cudnn”，“ComputeCapability”.．.，“7.0”，“targetparams”.．.结构(自动调谐的,真正的.．.，“数据类型”，“INT8”.．.，“CalibrationResultFile”.．.“myInt8Cal.mat”）) 自动调优功能允许cuDNN库找到最快的卷积算法。的`“数据类型”`参数指定支持层中推理计算的精度。万博1manbetx在32位浮点数中执行推理时，使用`“FP32”`．	创建一个`coder.gpuConfig`用于生成静态库的配置对象。 cfg = code . gpuconfig (“自由”）;cfg。TargetLang =“c++”；若要设置代码生成的最小计算能力，请使用`ComputeCapability`GPU代码配置对象的属性。 cfg.GpuConfig.ComputeCapability =“7.0”；创建一个`编码器。CuDNNConfig`深度学习配置对象。指定深度学习配置对象的目标库特定属性。将其分配给`DeepLearningConfig`的属性`cfg`配置对象。 DLCFG =编码器。DeepLearningConfig (“cudnn”）;dlcfg。自动调优= true;dlcfg。数据类型=“int8”；dlcfg。CalibrationResultFile =“myInt8Cal.mat”；cfg。DeepLearningConfig = dlcfg; 使用`配置`选项`codegen`函数指定`cfg`配置对象。的`codegen`函数必须确定MATLAB函数输入的大小、类和复杂度。使用`arg游戏`选项指定入口点函数的输入大小。 Arg = {ones(224,224,3，“单一”)};codegenarg游戏参数.．.配置cfggooglenet_predict 有关更多信息，请参见基于cuDNN的深度学习网络代码生成．
英特尔^®CPU处理器	要使用用于Intel cpu的深度神经网络的Intel数学内核库(MKL-DNN)，请设置`“targetlib”`参数`“mkldnn”`． cnncodegen(净,“targetlib”.．.，“mkldnn”）;	创建一个`coder.config`用于生成静态库的配置对象。 CFG = code .config(“自由”）;cfg。TargetLang =“c++”；创建一个`编码器。MklDNNConfig`深度学习配置对象。将其分配给`DeepLearningConfig`的属性`cfg`配置对象。 DLCFG =编码器。DeepLearningConfig.．.（“mkldnn”）;cfg。DeepLearningConfig = dlcfg; 使用`配置`选项`codegen`函数指定`cfg`配置对象。的`codegen`函数必须确定MATLAB函数输入的大小、类和复杂度。使用`arg游戏`选项指定入口点函数的输入大小。 Arg = {ones(224,224,3，“单一”)};codegenarg游戏参数.．.配置cfggooglenet_predict 有关更多信息，请参见基于mml - dnn的深度学习网络代码生成．
NVIDIA gpu使用NVIDIA TensorRT™，一个高性能的深度学习推理优化器和运行时库	设置`“targetlib”`参数`“tensorrt”`．属性指定TensorRT库特定的属性`“targetparams”`参数。 cnncodegen(净,“targetlib”.．.，“tensorrt”，“ComputeCapability”.．.，“7.0”，“targetparams”.．.结构(“数据类型”，“INT8”.．.DataPath公司的，“image_dataset”.．.，“NumCalibrationBatches”, 50))	创建一个`coder.gpuConfig`用于生成静态库的配置对象。 cfg = code . gpuconfig (“自由”）;cfg。TargetLang =“c++”；若要设置代码生成的最小计算能力，请使用`ComputeCapability`GPU代码配置对象的属性。 cfg.GpuConfig.ComputeCapability =“7.0”；创建一个`编码器。TensorRTConfig`深度学习配置对象。指定深度学习配置对象的目标库特定属性。将其分配给`DeepLearningConfig`的属性`cfg`配置对象。 DLCFG =编码器。DeepLearningConfig.．.（“cudnn”）;dlcfg。数据类型=“int8”；dlcfg。DataPath公司=“image_dataset”；dlcfg。numcalibrationbatch = 50;cfg。DeepLearningConfig = dlcfg; 使用`配置`选项`codegen`函数指定`cfg`配置对象。的`codegen`函数必须确定MATLAB函数输入的大小、类和复杂度。使用`arg游戏`选项指定入口点函数的输入大小。 Arg = {ones(224,224,3，“单一”)};codegenarg游戏参数.．.配置cfggooglenet_predict 有关更多信息，请参见基于NVIDIA TensorRT的深度学习预测．
一般选择	生成代码而不生成和构建makefile。例如, cnncodegen(净,“targetlib”.．.，“mkldnn”，“codegenonly”1);	若要在不调用make命令或构建目标代码的情况下生成源代码，请使用`GenCodeOnly`的属性`编码器。CodeConfig`或`编码器。GPUCodeConfig`对象。例如, cfg = code . codeconfig (“自由”）;cfg。GenCodeOnly = true;
指定要编译的NVIDIA GPU计算能力。参数的格式为`主要# .minor #`． cnncodegen(净,“targetlib”.．.，“cudnn”，“ComputeCapability”，“7.0”）;	若要设置代码生成的最小计算能力，请使用`ComputeCapability`GPU代码配置对象的属性。 cfg = code . gpuconfig (“自由”）;cfg.GpuConfig.ComputeCapability =“7.0”；

ARM CPU处理器支持万博1manbetx霓虹灯指令

设置“targetlib”参数“arm-compute”．指定要为之生成代码的ARM计算库版本，以及目标硬件上的ARM架构“targetparams”参数。

cnncodegen(净,“targetlib”.．.，“arm-compute”，“targetparams”.．.结构(“ArmComputeVersion”.．.，“19.02”，“ArmArchitecture”.．.，“armv8”）)

其他支持的A万博1manbetxRM计算库版本有“18.11”，“19.02”，“19.05”,或“20.02.1”．默认值为“20.02.1”．如果你设置ArmComputeVersion到以后的版本“20.02.1”，ArmComputeVersion设置为“20.02.1”

您可以将ARM架构指定为“v7或“armv8”．指定的架构必须与目标硬件上ARM计算库的架构相同。

创建一个coder.config用于生成静态库的配置对象。

CFG = code .config(“自由”）;cfg。TargetLang =“c++”；

创建一个编码器。手臂霓虹灯Config深度学习配置对象。指定深度学习配置对象的目标库特定属性。将其分配给DeepLearningConfig的属性cfg配置对象。

DLCFG =编码器。DeepLearningConfig.．.（“arm-compute”）;dlcfg。ArmArchitecture =“armv8”；dlcfg。ArmComputeVersion =“19.02”；cfg。DeepLearningConfig = dlcfg;

使用配置选项codegen函数指定cfg配置对象。的codegen函数必须确定MATLAB函数输入的大小、类和复杂度。使用arg游戏选项指定入口点函数的输入大小。

Arg = {ones(224,224,3，“单一”)};codegenarg游戏参数.．.配置cfggooglenet_predict

有关更多信息，请参见基于ARM计算库的深度学习网络代码生成．

英伟达^®通过CUDA实现gpu^®深度神经网络库(cuDNN)

设置“targetlib”参数“cudnn”．属性指定cuDNN库特定的属性“targetparams”参数。

cnncodegen(净,“targetlib”.．.，“cudnn”，“ComputeCapability”.．.，“7.0”，“targetparams”.．.结构(自动调谐的,真正的.．.，“数据类型”，“INT8”.．.，“CalibrationResultFile”.．.“myInt8Cal.mat”）)

自动调优功能允许cuDNN库找到最快的卷积算法。

的“数据类型”参数指定支持层中推理计算的精度。万博1manbetx在32位浮点数中执行推理时，使用“FP32”．

创建一个coder.gpuConfig用于生成静态库的配置对象。

cfg = code . gpuconfig (“自由”）;cfg。TargetLang =“c++”；

若要设置代码生成的最小计算能力，请使用ComputeCapabilityGPU代码配置对象的属性。

cfg.GpuConfig.ComputeCapability =“7.0”；

创建一个编码器。CuDNNConfig深度学习配置对象。指定深度学习配置对象的目标库特定属性。将其分配给DeepLearningConfig的属性cfg配置对象。

DLCFG =编码器。DeepLearningConfig (“cudnn”）;dlcfg。自动调优= true;dlcfg。数据类型=“int8”；dlcfg。CalibrationResultFile =“myInt8Cal.mat”；cfg。DeepLearningConfig = dlcfg;

使用配置选项codegen函数指定cfg配置对象。的codegen函数必须确定MATLAB函数输入的大小、类和复杂度。使用arg游戏选项指定入口点函数的输入大小。

Arg = {ones(224,224,3，“单一”)};codegenarg游戏参数.．.配置cfggooglenet_predict

有关更多信息，请参见基于cuDNN的深度学习网络代码生成．

英特尔^®CPU处理器

要使用用于Intel cpu的深度神经网络的Intel数学内核库(MKL-DNN)，请设置“targetlib”参数“mkldnn”．

cnncodegen(净,“targetlib”.．.，“mkldnn”）;

创建一个coder.config用于生成静态库的配置对象。

CFG = code .config(“自由”）;cfg。TargetLang =“c++”；

创建一个编码器。MklDNNConfig深度学习配置对象。将其分配给DeepLearningConfig的属性cfg配置对象。

DLCFG =编码器。DeepLearningConfig.．.（“mkldnn”）;cfg。DeepLearningConfig = dlcfg;

使用配置选项codegen函数指定cfg配置对象。的codegen函数必须确定MATLAB函数输入的大小、类和复杂度。使用arg游戏选项指定入口点函数的输入大小。

Arg = {ones(224,224,3，“单一”)};codegenarg游戏参数.．.配置cfggooglenet_predict

有关更多信息，请参见基于mml - dnn的深度学习网络代码生成．

NVIDIA gpu使用NVIDIA TensorRT™，一个高性能的深度学习推理优化器和运行时库

设置“targetlib”参数“tensorrt”．属性指定TensorRT库特定的属性“targetparams”参数。

cnncodegen(净,“targetlib”.．.，“tensorrt”，“ComputeCapability”.．.，“7.0”，“targetparams”.．.结构(“数据类型”，“INT8”.．.DataPath公司的，“image_dataset”.．.，“NumCalibrationBatches”, 50))

创建一个coder.gpuConfig用于生成静态库的配置对象。

cfg = code . gpuconfig (“自由”）;cfg。TargetLang =“c++”；

若要设置代码生成的最小计算能力，请使用ComputeCapabilityGPU代码配置对象的属性。

cfg.GpuConfig.ComputeCapability =“7.0”；

创建一个编码器。TensorRTConfig深度学习配置对象。指定深度学习配置对象的目标库特定属性。将其分配给DeepLearningConfig的属性cfg配置对象。

DLCFG =编码器。DeepLearningConfig.．.（“cudnn”）;dlcfg。数据类型=“int8”；dlcfg。DataPath公司=“image_dataset”；dlcfg。numcalibrationbatch = 50;cfg。DeepLearningConfig = dlcfg;

使用配置选项codegen函数指定cfg配置对象。的codegen函数必须确定MATLAB函数输入的大小、类和复杂度。使用arg游戏选项指定入口点函数的输入大小。

Arg = {ones(224,224,3，“单一”)};codegenarg游戏参数.．.配置cfggooglenet_predict

有关更多信息，请参见基于NVIDIA TensorRT的深度学习预测．

一般选择

生成代码而不生成和构建makefile。例如,

cnncodegen(净,“targetlib”.．.，“mkldnn”，“codegenonly”1);

若要在不调用make命令或构建目标代码的情况下生成源代码，请使用GenCodeOnly的属性编码器。CodeConfig或编码器。GPUCodeConfig对象。例如,

cfg = code . codeconfig (“自由”）;cfg。GenCodeOnly = true;

指定要编译的NVIDIA GPU计算能力。参数的格式为主要# .minor #．

cnncodegen(净,“targetlib”.．.，“cudnn”，“ComputeCapability”，“7.0”）;

若要设置代码生成的最小计算能力，请使用ComputeCapabilityGPU代码配置对象的属性。

cfg = code . gpuconfig (“自由”）;cfg.GpuConfig.ComputeCapability =“7.0”；

cnncodegen

语法

描述

例子

生成在ARM处理器上运行的预训练网络的c++代码

输入参数

`网`- - - - - -预训练深度学习网络对象
特征向量|字符串标量

`targetparams`- - - - - -特有的参数
结构

兼容性的考虑

目标库支持的更改万博1manbetx

另请参阅

功能

主题

GPU编码器文档

万博1manbetx

从MATLAB生成CUDA代码:加速gpu上的嵌入式视觉和深度学习算法

cnncodegen

语法

描述

例子

生成在ARM处理器上运行的预训练网络的c++代码

输入参数

网- - - - - -预训练深度学习网络对象特征向量|字符串标量

targetparams- - - - - -特有的参数结构

兼容性的考虑

目标库支持的更改万博1manbetx

另请参阅

功能

主题

GPU编码器文档

万博1manbetx

从MATLAB生成CUDA代码:加速gpu上的嵌入式视觉和深度学习算法

`网`- - - - - -预训练深度学习网络对象
特征向量|字符串标量

`targetparams`- - - - - -特有的参数
结构