主要内容

编码器。TensorRTConfig

用于配置深度学习代码生成的参数英伟达TensorRT图书馆

描述

这个编码器。TensorRTConfig对象包含NVIDIA®高性能深度学习推理优化器和运行时库(TensorRT)特定参数。编码基因使用这些参数来生成CUDA®深层神经网络代码。

使用编码器。TensorRTConfig对象,将其指定给DeepLearningConfig财产coder.gpuConfig传递给的对象编码基因.

创造

使用创建TensorRT配置对象编码器。DeepLearningConfig函数,目标库设置为“tensorrt”.

性质

全部展开

指定支持层推论计算的精度。万博1manbetx在32位浮点数中执行推断时,使用“fp32”.对于半精度,请使用“fp16”.对于8位整数,使用“int8”。默认值为“fp32”.

INT8精度要求CUDA GPU的最小计算能力为6.1。6.2的计算能力不支持万博1manbetxINT8精确FP16精度要求CUDA GPU的最小计算能力为7.0。使用计算能力财产的GpuConfig对象设置相应的计算能力值。

看到使用NVIDIA TensorRT进行深度学习预测使用TensorRT对徽标分类网络进行8位整数预测的示例。

重新校准期间使用的图像数据集的位置。默认值为''. 此选项仅在以下情况下适用:数据类型被设置为“int8”.

当您选择“INT8”选项,TensorRT™ 将浮点数据量化为int8.使用减少的校准数据集执行重新校准。校准数据必须存在于数据通路.

一个数字值,用于指定的批数int8校准。软件使用batchsize*NumCalibrationBatchs从图像数据集中随机选取图像子集以执行校准batchsize*NumCalibrationBatchs值不得大于图像数据集中存在的图像数。此选项仅在以下情况下适用数据类型被设置为“int8”.

NVIDIA建议大约500张图像足以进行校准。有关更多信息,请参阅TensorRT文档。

指定目标库名称的只读值。

例子

全部崩溃

创建入口点函数预测使用coder.loadDeepLearningNetwork函数来加载resnet50(深度学习工具箱)系列网络对象。

函数= resnet_predict(中)持久的mynet;如果isempty(mynet) mynet = code . loaddeeplearningnetwork (“resnet50”,“myresnet”);终止out=预测(mynet,in);

创建一个coder.gpuConfig用于生成MEX代码的配置对象。

cfg=coder.gpuConfig(“墨西哥”);

将目标语言设置为C++。

cfg。TargetLang =“C++”;

创建一个编码器。TensorRTConfig深度学习配置对象。将其分配给DeepLearningConfig财产的cfg配置对象。

cfg.DeepLearningConfig=coder.DeepLearningConfig(“tensorrt”);

使用-配置选择权编码基因函数传递cfg配置对象。这个编码基因函数必须确定MATLAB的大小、类和复杂性®函数的输入。使用-args选项指定入口点函数输入的大小。

编码基因-args{one(224224,3,'single')}-配置cfg预测;

这个编码基因命令将所有生成的文件放置在编码基因文件夹。该文件夹包含入口点功能的CUDA代码resnet_predict.cu,头文件和源文件,其中包含用于卷积神经网络(CNN)的c++类定义,权重和偏差文件。

在R2018b中引入