深度学习

什么是深度学习?

你需要知道三件事

深度学习是一种机器学习技术,它教会计算机做人类自然会做的事情:以身作则。深度学习是无人驾驶汽车背后的一项关键技术,使他们能够识别停车标志,或区分行人和路灯柱。它是手机、平板电脑、电视和免提扬声器等消费类设备中语音控制的关键。深度学习最近得到了很多关注,这是有原因的。它正在取得以前不可能取得的成果。

在深度学习中,计算机模型直接从图像、文本或声音中学习执行分类任务。深度学习模型可以达到最先进的精度,有时甚至超过人类水平的性能。模型通过使用大量的标记数据和包含许多层的神经网络体系结构来训练。

为什么深度学习很重要

深度学习是如何获得如此令人印象深刻的结果的?

一句话,准确。深度学习实现了比以往任何时候都更高的识别准确率。这有助于消费电子产品满足用户的期望,对于无人驾驶汽车等安全关键应用至关重要。深度学习的最新进展已经达到了这样一个程度:深度学习在一些任务(如图像中的对象分类)上优于人类。

尽管深度学习理论于上世纪80年代首次提出,但它直到最近才变得有用有两个主要原因:

  1. 深度学习需要大量的知识带安全标签的数据时.例如,无人驾驶汽车的开发需要数百万张图片和数千小时的视频。
  2. 深度学习需要大量的计算能力.高性能gpu有一个对深度学习非常有效的并行架构。当与集群或云计算相结合时,这使得开发团队能够将深度学习网络的培训时间从几周减少到几小时或更少。

深度学习在工作中的例子

深度学习应用在从自动驾驶到医疗设备的各个行业都有应用。

自动驾驶:汽车研究人员正在使用深度学习来自动检测诸如停车标志和交通信号灯等物体。此外,深度学习被用于检测行人,这有助于减少事故。

航空航天和国防:深度学习用于从卫星中识别目标,定位感兴趣的区域,并为部队识别安全或不安全区域。

医学研究:癌症研究人员正在利用深度学习自动检测癌细胞。加州大学洛杉矶分校的研究小组建造了一个先进的显微镜,该显微镜可以产生高维数据集,用于训练深度学习应用程序以准确识别癌细胞。

工业自动化:深度学习通过自动检测人或物体是否在机器的不安全距离内,帮助提高重型机械周围工人的安全。

电子学:深度学习被用于自动听力和语音翻译。例如,能够响应你的声音并知道你的偏好的家庭辅助设备是由深度学习应用程序驱动的。

深度学习是如何工作的

大多数深度学习方法使用神经网络架构,这就是为什么深度学习模型经常被称为深层神经网络

术语“深度”通常指的是神经网络中隐藏层的数量。传统的神经网络仅包含2-3个隐藏层,而深度网络可以有多达150个隐藏层。

深度学习模型是通过使用大量的标记数据和神经网络结构来训练的,这些神经网络结构直接从数据中学习特征,而不需要人工提取特征。

图1:神经网络,由一组相互连接的节点组成的层组织。网络可能有数十或数百个隐藏层。

最流行的深度神经网络类型之一是卷积神经网络(美国有线电视新闻网事先).CNN将学习到的特征与输入数据进行卷积,并使用2D卷积层,使这种架构非常适合处理2D数据,如图像。

cnn不再需要手动特征提取,这样就不需要识别用于分类图像的特征。CNN的工作原理是直接从图像中提取特征。相关特征没有预先训练;它们是在网络对图像集合进行训练时学习的。这种自动特征提取使得深度学习模型在物体分类等计算机视觉任务中具有很高的准确性。

图2:具有许多卷积层的网络示例。滤波器以不同的分辨率应用于每个训练图像,每个卷积图像的输出作为下一层的输入。万博 尤文图斯

CNN学习使用数十或数百个隐藏层检测图像的不同特征。每个隐藏层都增加了学习图像特征的复杂性。例如,第一个隐藏层可以学习如何检测边缘,最后一个隐藏层可以学习如何检测更复杂的形状,特别是针对我们试图识别的对象的形状。

机器学习和深度学习的区别是什么?

深度学习是机器学习的一种特殊形式。机器学习工作流从手动从图像中提取相关特征开始。然后使用这些特征创建一个模型,对图像中的对象进行分类。通过深入学习工作流,自动从图像中提取相关特征。此外,深度学习执行“端到端学习”——即向网络提供原始数据和要执行的任务,如分类,并学习如何自动执行。

另一个关键区别是深度学习算法随数据扩展,而浅层学习则收敛。浅层学习是指当您向网络中添加更多示例和训练数据时,机器学习方法的性能会稳定在一定水平。

深度学习网络的一个关键优势是,它们通常会随着数据规模的增加而不断改进。

图3。比较机器学习方法分类车辆(左)和深度学习(右)。

在机器学习中,你手动选择特征和分类器来对图像进行排序。通过深度学习,特征提取和建模步骤是自动的。

机器学习与深度学习之间的选择

机器学习提供了各种各样的技术和模型,您可以根据您的应用程序、您正在处理的数据大小以及您想要解决的问题类型来选择。一个成功的深度学习应用程序需要大量的数据(数以千计的图像)来训练模型,以及图形处理器或图形处理单元,以快速处理数据。

在选择机器学习和深度学习时,要考虑是否有高性能GPU和大量标记数据。如果你没有这些东西,那么使用机器学习而不是深度学习可能更有意义。深度学习通常更复杂,所以至少需要几千张图像才能得到可靠的结果。拥有高性能的GPU意味着模型将花费更少的时间来分析所有这些图像。

如何创建和训练深度学习模型

人们使用深度学习进行对象分类的三种最常见的方式是:

从头开始培训

要从头开始训练一个深度网络,您需要收集一个非常大的标记数据集,并设计一个网络体系结构来学习特征和模型。这对于新应用程序或具有大量输出类别的应用程序来说很好。这是一种不太常见的方法,因为有大量的数据和学习速度,这些网络通常需要几天或几周的时间来训练。

转移学习

大多数深度学习应用程序使用转移学习方法,这一过程包括对预先训练的模型进行微调。您从一个现有的网络(如AlexNet或GoogLeNet)开始,并提供包含以前未知类的新数据。在对网络做了一些调整后,你现在可以执行一个新的任务,比如只分类狗或猫,而不是1000个不同的对象。这样做的好处是需要更少的数据(处理数千张图像,而不是数百万张),因此计算时间减少到几分钟或几小时。

迁移学习需要一个与原有网络内部连接的接口,因此可以对其进行修改和增强,以适应新的任务。MATLAB®具有设计用于帮助您进行迁移学习的工具和功能。

特征提取

另一种不太常见但更专业的深度学习方法是将网络作为一个特征提取器.由于所有层的任务都是从图像中学习某些特征,所以在训练过程中,我们可以随时将这些特征从网络中提取出来。然后,这些特性可以用作机器学习模型万博1manbetx支持向量机

gpu加速深度学习模型

培养深度学习模式可能需要很长时间,从几天到几周不等。使用GPU加速可以显著加快进程。将MATLAB与GPU结合使用可减少训练网络所需的时间,并可将图像分类问题的训练时间从几天缩短到数小时。在培训深度学习模型时,MATLAB使用GPU(如果可用),而无需您了解如何显式编程GPU。

图4.深度学习工具箱命令,用于从头开始训练您自己的CNN或使用预训练模型进行迁移学习。

深度学习的应用

通过执行迁移学习或特征提取,预先训练的深度神经网络模型可以用于快速将深度学习应用于您的问题。对于MATLAB用户,一些可用的模型包括AlexNet、VGG-16和VGG-19,以及使用importcaffennetwork导入的Caffe模型(例如,来自Caffe Model Zoo)。

使用AlexNet通过网络摄像头识别对象

使用MATLAB,一个简单的网络摄像头和一个深度神经网络来识别你周围的物体。

示例:使用深度学习的对象检测

除了目标识别,它可以识别图像或视频中的特定对象,深度学习也可以用于对象检测对象检测像YOLO这样的算法可以识别和定位场景中的物体,也可以定位图像中的多个物体。

基于MATLAB的深度学习

MATLAB使深度学习变得容易。MATLAB还提供了用于管理大型数据集的工具和功能,用于机器学习、神经网络、计算机视觉和自动驾驶的专门工具箱。

只需几行代码,MATLAB就可以让您进行深度学习,而不必成为专家。快速入门,创建并可视化模型,并将模型部署到服务器和嵌入式设备。

团队成功使用MATLAB进行深度学习,因为它让您:

  1. 用几行代码创建和可视化模型。
  2. MATLAB让你用最少的代码构建深度学习模型。使用MATLAB,您可以快速导入预先训练的模型,并在调整训练参数时可视化和调试中间结果。

  3. 在没有专家的情况下进行深度学习。
  4. 您可以使用MATLAB学习并获得深度学习领域的专业知识。我们大多数人从来没有上过深度学习的课程。我们必须在工作中学习。MATLAB使这一领域的学习变得实用和容易。此外,MATLAB使领域专家能够进行深度学习,而不是将任务交给可能不了解你的行业或应用的数据科学家。

  5. 自动地面真相标签的图像和视频。
  6. MATLAB使用户能够交互式地在图像中标记对象,并可以自动地在视频中标记基础真理,用于训练和测试深度学习模型。这种交互式和自动化的方法可以在更短的时间内获得更好的结果。

  7. 将深度学习集成到单个工作流中。
  8. MATLAB可以在一个工作流中统一多个领域。有了MATLAB,你可以在一个环境中思考和编程。它为深度学习提供了工具和功能,也为深度学习算法提供了一系列领域,如信号处理、计算机视觉和数据分析。

使用MATLAB,您可以将结果集成到现有的应用程序中。MATLAB可以在企业系统、集群、云和嵌入式设备上自动部署深度学习模型。

查看更多深度学习功能,并得到示例代码

相关产品:s manbetx 845MATLAB计算机视觉工具箱™统计和机器学习工具箱™深度学习工具箱™,自动驾驶工具箱™

了解更多关于深度学习的信息

在这个MATLAB技术讲座中探索深度学习的基础。您将了解为什么深度学习变得如此受欢迎,并将通过3个概念:什么是深度学习,它如何在现实世界中使用,以及如何开始。
了解如何使用MATLAB、一个简单的网络摄像头和一个深度神经网络来识别你周围的物体。这个演示使用AlexNet,这是一个经过训练的深度卷积神经网络,已经在超过一百万张图像上训练过了。
本系列视频为工程师介绍了深度学习的主题,例如访问数据、训练网络、使用迁移学习以及将模型集成到更大的设计中。
了解如何使用深度学习工具箱块库以及MATLAB函数块在Simulink中模拟训练过的深度学习模型。万博1manbetx
学习三种训练深度学习神经网络的方法:从头开始训练,迁移学习和语义分割。

相关的话题