主要内容

estimatePerformance

类:dlhdl.ProcessorConfig
包:dlhdl

通过使用检索层延迟和性能estimatePerformance方法

描述

estimatePerformance (processorConfigObject,网络)返回层延迟和网络性能指定的对象网络论点。

性能= estimatePerformance (processorConfigObject,网络)返回一个表,其中包含网络对象层,延迟和性能。

例子

性能= estimatePerformance (processorConfigObject,网络,名称,值)返回一个表,其中包含网络对象层,延迟和性能,与一个或多个参数指定可选的参数名称-值对。

输入参数

全部展开

处理器配置,指定为一个dlhdl.ProcessorConfig对象。

网络对象性能估计。

例子:estimatePerformance (snet)

名称-值参数

指定可选的双参数作为Name1 = Value1,…,以=家,在那里的名字参数名称和吗价值相应的价值。名称-值参数必须出现在其他参数,但对的顺序无关紧要。

R2021a之前,用逗号来分隔每一个名称和值,并附上的名字在报价。

的帧数的计算需要考虑性能评估,指定为正数整数。

例子:FrameCount, 10

输出参数

全部展开

网络对象的性能ProcessorConfig对象,作为一个表返回。

例子

全部展开

  1. 创建一个文件在你当前的工作目录getLogoNetwork.m。在文件中,输入:

    函数网= getLogoNetwork如果~ isfile (“LogoNet.mat”)url =“//www.tianjin-qmedu.com/万博1manbetxsupportfiles/gpucoder/cnn_models/logo_detection/LogoNet.mat”;websave (“LogoNet.mat”url);结束data =负载(“LogoNet.mat”);网= data.convnet;结束
  2. 创建一个dlhdl.ProcessorConfig对象。

    snet = getLogoNetwork;hPC = dlhdl.ProcessorConfig;
  3. 检索层LogoNet网络延迟和性能,调用estimatePerformance方法。

    hPC.estimatePerformance (snet)
    # # #注意:图层的imageinput类型“ImageInputLayer”分为图像输入层imageinput和附加层的imageinput_norm标准化硬件。# # #注意:层“softmax”型“nnet.cnn.layer.SoftmaxLayer”是在软件中实现。# # #注意:层“classoutput”型“nnet.cnn.layer.ClassificationOutputLayer”是在软件中实现。深度学习处理器估计性能结果LastFrameLatency(周期)LastFrameLatency总延迟(秒)FramesNum帧/ s - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - -网络38810151 0.19405 216472 0.00108 38810151 5.2 ____imageinput_norm ____conv_1 ____conv_2 0.01853 6829224 0.03415 ____maxpool_1 6829224 0.04682 10454501 0.05227 ____maxpool_2 10454501 0.00587 ____conv_3 10454501 ____maxpool_3 1229970 0.00615 ____conv_4 1229970 0.00692 24450年____maxpool_4 0.00012 ____fc_1 1229970 0.01322 ____fc_2 1692534 0.00846 89295年____fc_3 0.00045 * DL处理器的时钟频率:200 mhz

估计的性能ResNet-18网络通过使用多个帧dlhdl.ProcessorConfig对象。

加载ResNet-18网络并将其保存

网= resnet18;

创建一个dlhdl.ProcessorConfig对象并保存hPC

hPC = dlhdl.ProcessorConfig;

检索层帧每秒的延迟和性能水平(FPS)通过使用多个帧estimatePerformance方法FrameNumber作为一个可选的输入参数。

hPC.estimatePerformance(净,“FrameCount”10);
# # #优化网络:融合“nnet.cnn.layer.BatchNormalizationLayer”到“nnet.cnn.layer.Convolution2DLayer”# # #注意:图层的数据类型的ImageInputLayer分为图像输入层数据,添加一层“data_norm_add”,和一个乘法层的data_norm硬件标准化。# # #注意:层“概率”型“nnet.cnn.layer.SoftmaxLayer”是在软件中实现。# # #注意:层“ClassificationLayer_predictions”型“nnet.cnn.layer.ClassificationOutputLayer”是在软件中实现。深度学习处理器估计性能结果LastFrameLatency(周期)LastFrameLatency总延迟(秒)FramesNum帧/ s - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - -网络21328236 0.10664 210750 0.00105 210750 9.5 ____data_norm_add 211208850 ____data_norm 0.00105 ____conv1 0.00258 ____res2a_branch2a 966221 0.00483 515064 0.01082 ____pool1 2164124 ____res2a_branch2b 0.00483 966221 0.00483 ____res2a 210750 0.00105 966221年____res2b_branch2a ____res2b_branch2b 0.00270 966221 0.00483 ____res2b 210750 0.00105 540861年____res3a_branch1 ____res3a_branch2a 0.00053 540749 0.00270 ____res3a_branch2b 919117 0.00460 105404年____res3a ____res3b_branch2a 0.00053 919117 0.00460 ____res3b_branch2b 919117 0.00460 105404年____res3b ____res4a_branch1 503405 0.00252 ____res4a_branch2a 509261 0.00255 ____res4a_branch2b 905421 0.00453 ____res4a 52724 0.00026 905421年____res4b_branch2a 0.00453 ____res4b_branch2b 905421 0.00453 ____res4b 52724 0.00026 ____res5a_branch1 744525 0.00372 ____res5a_branch2b ____res5a_branch2a 751693 0.00376 1415373 0.00708 26368年____res5a 0.00013 ____res5b_branch2a 0.00708 ____res5b 26368 0.00013 1415373 0.00708 ____res5b_branch2b 1415373 ____pool5 54594 0.00027 ____fc1000 207351 0.00104 * DL处理器的时钟频率是:200 mhz

提示

获得的性能估算dlquantizer对象,设置dlhdl.ProcessorConfig对象ProcessorDataTypeint8

版本历史

介绍了R2021a