主要内容

coder.CuDNNConfig

参数配置深度学习的代码生成CUDA深层神经网络库

描述

coder.CuDNNConfig对象包含了英伟达®cuDNN具体参数codegen使用生成CUDA®为深层神经网络代码。

使用一个coder.CuDNNConfig对象代码生成、分配它DeepLearningConfig财产的coder.gpuConfig对象传递给codegen

创建

通过创建一个cuDNN配置对象coder.DeepLearningConfig函数库设置为目标“cudnn”

属性

全部展开

启用或禁用自动调谐特性。启用自动调优使cuDNN图书馆找到最快的卷积算法。这增加等大型网络的性能SegNetResNet

指定支持层的推理计算的精度。万博1manbetx在32位浮点数进行推理时,使用“fp32”。8位整数,使用“int8”。默认值是“fp32”

INT8精度需要CUDA GPU与最低6.1的计算能力。6.2不支持的计算能力万博1manbetxINT8精度。使用ComputeCapability财产的GpuConfig对象设置适当的计算能力值。

请注意

当执行推理在INT8NVIDIA精密使用cuDNN版本8.1.0、问题库可能会导致显著的性能退化。

的位置MAT-file包含校准数据。默认值是。这个选项只有当适用数据类型被设置为“int8”

当执行量子化的卷积神经网络校准(深度学习工具箱)功能锻炼的网络和收集动态范围重量和偏见的卷积和完全连接层的网络和动态范围激活所有层的网络。为优化网络生成代码,保存的结果校准函数MAT-file和指定的位置这MAT-file代码生成器使用这个属性。有关更多信息,请参见生成INT8代码深入学习网络

一个只读值指定目标库的名称。

例子

全部折叠

创建一个入口点函数resnet_predict使用coder.loadDeepLearningNetwork函数加载resnet50(深度学习工具箱)SeriesNetwork对象。

函数= resnet_predict(中)持续的mynet;如果isempty (mynet) mynet = coder.loadDeepLearningNetwork (“resnet50”,“myresnet”);结束=预测(mynet,);

创建一个coder.gpuConfig为墨西哥人代码生成配置对象。

cfg = coder.gpuConfig (墨西哥人的);

设置目标语言c++。

cfg。TargetLang =“c++”;

创建一个coder.CuDNNConfig深度学习配置对象,并将其分配给DeepLearningConfig财产的cfg配置对象。

cfg。DeepLearningConfig = coder.DeepLearningConfig (“cudnn”);

使用配置选择的codegen函数通过cfg配置对象。的codegen函数必须确定大小、阶级和MATLAB的复杂性®函数的输入。使用arg游戏选择指定的大小的入口点函数的输入。

codegenarg游戏{(224224 3,“单”)}配置cfgresnet_predict;

codegen命令所有生成的文件的地方codegen文件夹中。该文件夹包含CUDA入口点函数的代码resnet_predict.cu、头和c++源文件包含类定义的复杂神经网络(CNN),重量和偏见文件。

版本历史

介绍了R2018b