利用GoogLeNet对图像进行分类

此示例使用：

打开生活的脚本

这个例子展示了如何使用预训练的深卷积神经网络GoogLeNet对图像进行分类。

GoogLeNet已经训练了100多万张图片，可以将图片分成1000个对象类别(比如键盘、咖啡杯、铅笔和许多动物)。该网络已经为广泛的图像学习了丰富的特征表示。网络将图像作为输入，然后输出图像中对象的标签以及每个对象类别的概率。

负载Pretrained网络

加载经过预训练的谷歌网络。这一步需要深入学习工具箱™ 模型谷歌网络万博1manbetx支持包。如果未安装所需的支持软件包，则该软件提供下载链接。

您也可以选择加载不同的预训练网络进行图像分类。要尝试不同的预训练网络，请在MATLAB®中打开此示例并选择不同的网络。例如，您可以尝试挤压网，一个比古格伦。您可以使用其他预训练的网络运行此示例。有关所有可用网络的列表，请参见负载Pretrained网络。

净值=古格伦；

要分类的图像的大小必须与网络的输入大小相同。对于GoogLeNet来说层网络的属性是图像输入层。网络输入大小是InputSize图像输入层的属性。

inputSize=net.Layers（1）.inputSize

输入大小=1×3224 224 3个

最后一个元素层属性是分类输出层。这个类名此层的属性包含由网络学习的类的名称。查看1000个类名中的10个随机类名。

classNames=net.Layers（end.classNames；numClasses=numel（类名）；disp（类名（randperm（numClasses，10）））

“papillon”“eggnog”“jackfruit”“castle”“睡袋”“redshank”“Band Aid”“wok”“seat belt”“orange”

读取并调整图像大小

阅读并显示要分类的图像。

I=读('peppers.png')；图imshow（一）

显示图像的大小。图像为384 x 512像素，有三个颜色通道（RGB）。

尺寸（一）

答复=1×3384 512 3

通过使用调整大小. 调整大小会稍微改变图像的纵横比。

I=imresize（I，inputSize（1:2））；图imshow（I）

根据应用程序的不同，您可能需要以不同的方式调整图像的大小。例如，可以使用I（1:输入大小（1），1:输入大小（2），：）. 如果你有图像处理工具箱™，然后您可以使用作物功能。

分类图像

对图像进行分类并使用分类。该网络正确地将图像分类为灯笼椒。一个用于分类的网络被训练为为每个输入图像输出单个标签，即使图像包含多个对象。

[标签，分数]=分类（净，I）；标签

标签=绝对的甜椒

显示带有预测标签的图像和具有该标签的图像的预测概率。

图imshow(I) title(string(label) +", "+num2str（100*scores（classNames==label），3分）+"%");

显示顶部预测

将前五个预测标签及其相关概率显示为直方图。由于网络将图像分为许多对象类别，并且许多类别是相似的，所以在评估网络时通常会考虑前五个精度。该网络以很高的概率将图像分类为贝尔胡椒。

[~,idx] =排序(分数,“下降”);idx = idx (5: 1:1);classNamesTop = net.Layers(结束).ClassNames (idx);scoresTop =分数(idx);图barh(scoresTop) xlim([0 1])“5大预言”)包含('概率')yticklabels（类名称顶部）

参考文献

[1] 斯泽吉、克里斯蒂安、刘炜、贾扬庆、皮埃尔·塞尔马内特、斯科特·里德、德拉戈米尔·安圭洛夫、杜米特鲁·二罕、文森特·万霍克和安德鲁·拉比诺维奇。”随着卷积的加深IEEE计算机视觉和模式识别会议记录1 - 9页。2015.

[二]BVLC-GoogLeNet模型。https://github.com/BVLC/caffe/tree/master/models/BVLC_谷歌

另见

达格网络|alexnet|分类|古格伦|预测

利用GoogLeNet对图像进行分类

负载Pretrained网络

读取并调整图像大小

分类图像

显示顶部预测

参考文献

另见

相关的话题

深入学习工具箱文档

万博1manbetx

介绍用MATLAB进行深度学习