主要内容

Coder.TensorRTConfig

使用Deave学习代码生成的参数nvidia.统治库

描述

Coder.TensorRTConfig对象包含nvidia.®高性能深度学习推理优化器和运行时库(TensorRT)特定参数。Codegen.使用这些参数来生成CUDA®深度神经网络的代码。

使用A.Coder.TensorRTConfig代码生成的对象,将其分配给DeeplearningConfigA的财产coder.gpuconfig你通过的对象Codegen.

创建

通过使用使用TensorR配置对象编码器。DeeplearningConfig使用目标库设置为'tensorrt'

特性

展开全部

指定支持层推论计算的精度。万博1manbetx在32位浮点数中执行推断时,使用'fp32'。对于半精度,使用“fp16”。对于8位整数,使用“int8”。默认值为'fp32'

INT8.精度需要CUDA GPU,最小计算能力为6.1。计算能力为6.2不支持万博1manbetxINT8.精确。FP16.精度需要CUDA GPU,最小计算能力为7.0。使用computEcapity.财产的GpuConfig对象设置相应的计算能力值。

看到使用NVIDIA TensorRT进行深度学习预测使用Tensorrt为Logo分类网络的8位整数预测示例。

重新校准期间使用的图像数据集的位置。默认值为''。此选项仅适用于什么时候数据类型被设置为“int8”

当你选择'int8'选项,TensorRT™量化浮点数据INT8.。通过减少的校准数据进行重新校准。必须在指定的图像数据位置存在校准数据DataPath.

指定批次数量的数值INT8.校准。该软件使用产品Batchsize * NumCalizatches从图像数据集中挑选图像的随机子集以执行校准。这Batchsize * NumCalizatches值不得大于图像数据集中存在的图像的数量。此选项仅适用于什么时候数据类型被设置为“int8”

NVIDIA建议大约500个图像足以校准。有关更多信息,请参阅TensorRT文档。

指定目标库名称的只读值。

例子

全部收缩

创建一个入口点函数resnet_predict.这是用来的Coder.LoadDeePlearningnetwork.函数来加载resnet50(深度学习工具箱)系列网络对象。

函数= resnet_predict(中)执着的mynet;如果isempty(mynet) mynet = code . loaddeeplearningnetwork ('resnet50''myresnet');结尾出局=预测(Mynet,In);

创建一个coder.gpuconfigMEX代码生成的配置对象。

cfg = coder.gpuconfig('mex');

将目标语言设置为C ++。

cfg。TargetLang ='c ++';

创建一个Coder.TensorRTConfig深度学习配置对象。将它分配给DeeplearningConfig财产的CFG.配置对象。

cfg.deeplearningconfig = coder.deeplearningconfig('tensorrt');

使用-Config.选项Codegen.用来传递的功能CFG.配置对象。这Codegen.函数必须确定MATLAB的大小、类和复杂性®函数的输入。使用- args.选项指定输入点函数的输入大小。

Codegen.-  args.{ONE(224,224,3,'单')}-Config.CFG.resnet_predict.;

Codegen.命令将所有生成的文件放在其中Codegen.文件夹。该文件夹包含入门点函数的CUDA代码resnet_predict.cu.,头文件和源文件,其中包含用于卷积神经网络(CNN)的c++类定义,权重和偏差文件。

在R2018B中介绍