在将来的版本中,cnncodegen
函数将生成c++代码和makefile来构建仅用于ARM Mali GPU处理器的静态库。您可以继续使用“arm-compute-mali”
的值。“targetlib”
参数,通过使用ARM计算库进行计算机视觉和机器学习来瞄准ARM Mali GPU。
对于所有其他目标,使用codegen
命令。用MATLAB编写一个入口点函数®它使用coder.loadDeepLearningNetwork
函数加载深度学习模型并调用预测
(深度学习工具箱)来预测反应。例如,
的一些典型用法cnncodegen
以及如何更新您的代码以使用codegen
代替。
目标工作流程 |
不推荐 |
推荐 |
ARM CPU处理器支持万博1manbetx霓虹灯 指令 |
设置“targetlib” 参数“arm-compute” .指定要为之生成代码的ARM计算库版本,以及目标硬件上的ARM架构“targetparams” 参数。
其他支持的A万博1manbetxRM计算库版本有“18.11” ,“19.02” ,“19.05” ,或“20.02.1” .默认值为“20.02.1” .如果你设置ArmComputeVersion 到以后的版本“20.02.1” ,ArmComputeVersion 设置为“20.02.1” 您可以将ARM架构指定为“v7 或“armv8” .指定的架构必须与目标硬件上ARM计算库的架构相同。 |
创建一个coder.config 用于生成静态库的配置对象。
创建一个编码器。手臂霓虹灯Config 深度学习配置对象。指定深度学习配置对象的目标库特定属性。将其分配给DeepLearningConfig 的属性cfg 配置对象。
使用配置 选项codegen 函数指定cfg 配置对象。的codegen 函数必须确定MATLAB函数输入的大小、类和复杂度。使用arg游戏 选项指定入口点函数的输入大小。
有关更多信息,请参见基于ARM计算库的深度学习网络代码生成. |
英伟达®通过CUDA实现gpu®深度神经网络库(cuDNN) |
设置“targetlib” 参数“cudnn” .属性指定cuDNN库特定的属性“targetparams” 参数。
自动调优功能允许cuDNN库找到最快的卷积算法。 的“数据类型” 参数指定支持层中推理计算的精度。万博1manbetx在32位浮点数中执行推理时,使用“FP32” . |
创建一个coder.gpuConfig 用于生成静态库的配置对象。
若要设置代码生成的最小计算能力,请使用ComputeCapability GPU代码配置对象的属性。
创建一个编码器。CuDNNConfig 深度学习配置对象。指定深度学习配置对象的目标库特定属性。将其分配给DeepLearningConfig 的属性cfg 配置对象。
使用配置 选项codegen 函数指定cfg 配置对象。的codegen 函数必须确定MATLAB函数输入的大小、类和复杂度。使用arg游戏 选项指定入口点函数的输入大小。
有关更多信息,请参见基于cuDNN的深度学习网络代码生成. |
英特尔®CPU处理器 |
要使用用于Intel cpu的深度神经网络的Intel数学内核库(MKL-DNN),请设置“targetlib” 参数“mkldnn” .
|
创建一个coder.config 用于生成静态库的配置对象。
创建一个编码器。MklDNNConfig 深度学习配置对象。将其分配给DeepLearningConfig 的属性cfg 配置对象。
使用配置 选项codegen 函数指定cfg 配置对象。的codegen 函数必须确定MATLAB函数输入的大小、类和复杂度。使用arg游戏 选项指定入口点函数的输入大小。
有关更多信息,请参见基于mml - dnn的深度学习网络代码生成. |
NVIDIA gpu使用NVIDIA TensorRT™,一个高性能的深度学习推理优化器和运行时库 |
设置“targetlib” 参数“tensorrt” .属性指定TensorRT库特定的属性“targetparams” 参数。
|
创建一个coder.gpuConfig 用于生成静态库的配置对象。
若要设置代码生成的最小计算能力,请使用ComputeCapability GPU代码配置对象的属性。
创建一个编码器。TensorRTConfig 深度学习配置对象。指定深度学习配置对象的目标库特定属性。将其分配给DeepLearningConfig 的属性cfg 配置对象。
使用配置 选项codegen 函数指定cfg 配置对象。的codegen 函数必须确定MATLAB函数输入的大小、类和复杂度。使用arg游戏 选项指定入口点函数的输入大小。
有关更多信息,请参见基于NVIDIA TensorRT的深度学习预测. |
一般选择 |
生成代码而不生成和构建makefile。例如,
|
若要在不调用make命令或构建目标代码的情况下生成源代码,请使用GenCodeOnly 的属性编码器。CodeConfig 或编码器。GPUCodeConfig 对象。例如,
|
指定要编译的NVIDIA GPU计算能力。参数的格式为主要# .minor # .
|
若要设置代码生成的最小计算能力,请使用ComputeCapability GPU代码配置对象的属性。
|