此示例显示如何检索ResNet-18网络的预测和探查器结果。查看预训练深度学习网络中各层、卷积模块和完全连接模块的网络预测和性能数据。
使用此映像运行此代码:
snet=resnet18;hT=dlhdl.Target(“Xilinx”,“界面”,“以太网”);hW = dlhdl。工作流(“净”snet,“比特流”,“zcu102_single”,“目标”,hT);硬件部署;图像=imread(“zebra.jpeg”); inputImg=imresize(图[224224]);imshow(inputImg);[预测,速度]=硬件预测(单个(输入),“个人资料”,“开”); [val,idx]=max(预测);snet.Layers(end).ClassNames{idx}
###已完成输入激活的编写。####运行单输入激活。深度学习处理器探查器性能结果LastFrameLatency(周期)LastFrameLatency(秒)FRAMESUM总延迟帧数/秒------------------------------网络23659630 0.10754 1 23659630 9.3 conv1 2224115 0.01011池1 572867 0.00260 res2a_branch2a 972699 0.00442 res2a_branch2b 972568 0.00442 res2a 209312 0.00095 res2b_branch2a 972733 0.00442 res2b_branch2b 973022 0.00442 res2b 209736 0.00095 res3a2a 747507 0.00340 res3a_branch2b 904291 0.00411 res3a_branch1 538763 0.00245 res3a 104750 0.00048 res3b_Branch2 A 904389 0.00411 res3b_Branch2 B 904367 0.00411 res3b 104886 0.00048 res4a_Branch2 A 485682 0.00221 res4a_Branch2 B 8800001 0.00400 Res4; branch1 486429 0.00221 res4a 52628 0.00024 res3b_Branch2 A 88005; Branch2 A 88005 r 8800es4b 52478 0.00024 res5a_branch2a 1056299 0.00480 res5a_branch2b 2056857 0.00935 res5a_branch1 1056510 0.00480 res5a 26170 0.00012 res5b_branch2a 205703 0.00935 res5b_branch2b 2057659 0.00935 res5b 26381 0.00012 pool5 71405 0.00032 fc1000 216155 0.00098*DL处理器的时钟频率为:220MHz
探查器数据返回以下参数及其值:
LastFrameLatency(周期)
-前一帧执行的时钟周期总数。
时钟频率-从用于将网络部署到目标板的位流中检索时钟频率信息。例如,分析器返回*DL处理器的时钟频率为:220MHz
。220 MHz的时钟频率是从zcu102_单
比特流。
LastFrameLatency(秒)
-前一帧执行的总秒数。总时间计算为LastFrameLatency(周期)/时钟频率
.例如转换模块
LastFrameLatency(秒)
计算为2224115/(220*10^6)
.
框架
-网络输入帧的总数。此值将用于计算帧/秒
.
总延迟
-执行所有网络层和模块的总时钟周期数框架
.
帧/秒
—网络每秒处理的帧数。总帧/秒
计算为(帧长*时钟频率)/总延迟
.例如帧/秒
在本例中,计算如下:(1 * 220 * 10 ^ 6) / 23659630
.