什么是卷积神经网络?

你需要知道三件事

卷积神经网络（CNN或ConvNet）是一种用于深度学习它直接从数据中学习，无需手动提取特征。

cnn在寻找图像模式以识别物体、面孔和场景方面特别有用。它们也可以非常有效地对非图像数据进行分类，如音频、时间序列和信号数据。

应用程序需要对象识别和计算机视觉——如无人驾驶车辆以及人脸识别应用——很大程度上依赖cnn。

为什么cnn物质

它们是如何工作的

基于MATLAB的CNNs

是什么让CNN如此有用？

使用cnn进行深度学习之所以流行，有三个重要因素:

CNN消除了人工提取特征的需要——特征直接由CNN学习。
cnn能产生高度精确的识别结果。
cnn可以接受重新培训，以完成新的识别任务，使您能够在已有的网络上进行构建。

CNN为发现和学习图像和时间序列数据中的关键特征提供了最佳体系结构。CNN是以下应用中的关键技术：

医学成像：CNN可以检查数千份病理报告，以直观地检测图像中是否存在癌细胞。
音频处理:任何带有麦克风的设备都可以使用关键字检测，以检测某个单词或短语何时被说出(“嗨，Siri!”)。cnn可以准确地学习和检测关键字，而不管环境如何，忽略所有其他短语。
停车标志检测:自动驾驶依靠cnn精确检测标识或其他物体的存在，并根据输出做出决定。
合成数据生成：使用生成性对抗网络（GAN）在美国，可以生成新的图像用于人脸识别和自动驾驶等深度学习应用程序。

了解更多

创建简单的深度学习网络分类

CNN如何工作

卷积神经网络可以有几十层或数百层，每层都可以学习检测图像的不同特征。滤波器以不同的分辨率应用于每个训练图像，每个卷积图像的输出用作下一层的输入。过滤器可以从非常简单的特征开始，例如亮度和边缘，并增加唯一定义对象的特征的复杂性。万博尤文图斯

特征学习、层和分类

像其他神经网络一样，CNN由一个输入层、一个输出层和许多隐藏层组成。

这些层执行改变数据的操作，目的是学习特定于数据的特性。最常见的三层是:卷积、激活(ReLU)和池化。

卷积将输入图像通过一组卷积滤波器，每个卷积滤波器激活图像中的某些特征。
校正线性单元（ReLU）通过将负值映射为零并保持正值，可以实现更快、更有效的训练。这有时被称为激活，因为只有激活的特征才会进入下一层。
池通过执行非线性下采样简化输出，减少网络需要学习的参数数量。

这些操作在数十层或数百层中重复，每一层学习识别不同的特征。

具有多个卷积层的网络示例。滤波器以不同的分辨率应用于每个训练图像，每个卷积图像的输出用作下一层的输入。万博尤文图斯

共同的权重和偏见

像传统的神经网络，CNN的神经元具有权重和偏差。模型在训练过程中学习这些值，并使用每个新的训练示例不断更新这些值。然而，在CNN的情况下，给定层中所有隐藏神经元的权重和偏差值是相同的。

这意味着所有隐藏的神经元都在检测图像不同区域的相同特征，比如边缘或斑点。这使得网络能够容忍图像中物体的平移。例如，一个经过训练的识别汽车的网络将能够识别图像中任何位置的汽车。

分类层

在多层学习特征后，CNN的架构转向分类。

倒数一层是一个完全连接的层，输出K维向量，其中K是网络能够预测的类的数量。这个向量包含任何图像被分类的每一类的概率。

CNN体系结构的最后一层使用诸如softmax之类的分类层来提供分类输出。

用MATLAB设计和训练cnn

使用MATLAB^®具有深度学习工具箱™使您可以设计、培训和部署CNN。

MATLAB提供了大量来自深度学习社区的预训练模型，可用于从新数据集学习和识别特征。这种方法被称为迁移学习，是一种不用从零开始就可以应用深度学习的便捷方法。像GoogLeNet、AlexNet和Inception这样的模型提供了一个探索深度学习的起点，利用专家构建的经过验证的架构。

设计和培训网络

使用Deep Network Designer，您可以导入预先训练的模型或从头构建新模型。

深度网络设计师应用程序，交互式构建，可视化，和编辑深度学习网络。

您还可以直接在应用程序中培训网络，并使用准确性、损失和验证指标图监控培训。

使用预先训练的模型进行迁移学习

对预先训练好的网络进行微调转移学习通常比从头开始训练更快更容易。它需要最少的数据量和计算资源。迁移学习用一种问题中的知识来解决类似的问题。你从一个预先训练过的网络开始，用它来学习一项新任务。迁移学习的一个优点是，预先训练的网络已经学习了一组丰富的特征。这些特性可以应用于其他类似的任务。例如，你可以在数百万张图像上训练一个网络，然后再使用数百张图像对它进行新的目标分类。