对象识别

你需要知道三件事

什么是物体识别?

目标识别是一种用于识别图像或视频中的目标的计算机视觉技术。目标识别是深度学习和机器学习算法的关键输出。当人们看一张照片或视频时,我们可以很容易地认出人、物体、场景和视觉细节。其目标是教会计算机做人类天生就会做的事:对图像所包含的内容有一定程度的理解。

图1所示。利用物体识别来识别不同类别的物体。

物体识别是无人驾驶汽车背后的一项关键技术,使它们能够识别停车标志或区分行人和灯柱。它在各种应用中也很有用,如生物成像中的疾病识别、工业检测和机器人视觉。

物体识别与物体检测

目标检测和目标识别是识别目标的类似技术,但它们的执行方式不同。对象检测是在图像中寻找物体实例的过程。在深度学习的情况下,目标检测是目标识别的子集,目标不仅被识别出来,而且被定位在图像中。这允许在同一图像中识别和定位多个对象。

图2。物体识别(左)和物体检测(右)。

物体识别原理

您可以使用多种方法进行对象识别。最近,技术机器学习深度学习已经成为物体识别问题的流行方法。这两种技术都是学习在图像中识别物体,但它们的执行方式不同。

图3:用于目标识别的机器学习和深度学习技术。

下面的部分解释了用于目标识别的机器学习和深度学习之间的区别,并展示了如何实现这两种技术。

目标识别技术

利用深度学习进行目标识别

深度学习技术已经成为一种流行的对象识别方法。深度学习模型比如卷积神经网络,或者美国有线电视新闻网用来自动学习物体的固有特征,以便识别该物体。例如,CNN可以通过分析数以千计的训练图像和学习使猫和狗不同的特征来识别猫和狗之间的区别。

使用深度学习进行物体识别有两种方法:

  • 从头开始训练一个模型要从头开始训练一个深度网络,您需要收集一个非常大的标记数据集,并设计一个网络架构,该架构将学习特征并构建模型。结果可能令人印象深刻,但这种方法需要大量的训练数据,您需要在CNN中设置层次和权重。
  • 使用预先训练的深度学习模型:大多数深度学习应用程序使用转移学习方法,这一过程包括对预先训练的模型进行微调。您从一个现有的网络(如AlexNet或GoogLeNet)开始,并提供包含以前未知类的新数据。由于模型已经在成千上万的图像上训练过,这种方法更省时,而且可以提供更快的结果。

深度学习提供了很高的准确性,但需要大量的数据才能做出准确的预测。

图4:深度学习应用显示餐厅食物的对象识别。

使用机器学习的目标识别

机器学习技术在物体识别方面也很受欢迎,它提供的方法与深度学习不同。机器学习技术的常见例子有:

机器学习工作流程

要使用标准的机器学习方法进行目标识别,首先要从一组图像(或视频)开始,然后在每个图像中选择相关的特征。例如,特征提取算法可能会提取可以用于区分数据中的类的边缘或角点特征。

这些特征被添加到机器学习模型中,该模型将这些特征划分为不同的类别,然后在分析和分类新对象时使用这些信息。

你可以使用各种机器学习算法和特征提取方法,它们提供了许多组合来创建精确的目标识别模型。

图5:对象识别的机器学习工作流。

使用机器学习进行目标识别提供了选择特征和分类器的最佳组合进行学习的灵活性。它可以用最少的数据得到精确的结果。

物体识别中的机器学习与深度学习

确定目标识别的最佳方法取决于您的应用程序和您试图解决的问题。在许多情况下,机器学习可能是一种有效的技术,特别是当你知道图像的哪些特征或特征是用来区分物体类别的最佳特征时。

在选择机器学习和深度学习时,要记住的主要考虑因素是你是否有强大的GPU和大量标记好的训练图像。如果有一个问题的答案是否定的,那么机器学习方法可能是最好的选择。深度学习技术在处理更多图像时效果更好,GPU有助于减少训练模型所需的时间。

图6:选择深度学习和机器学习的关键因素。

了解更多

其他物体识别方法

根据应用程序的不同,其他更基本的对象识别方法可能就足够了。

  • 模板匹配-使用小图像或模板在大图像中寻找匹配区域
  • 图像分割和斑点分析-使用简单的对象属性,如大小、颜色或形状

通常,如果一个对象可以通过像图像分割这样的简单方法来识别,那么最好先使用更简单的方法。这可以提供一个健壮的解决方案,不需要数百或数千个训练图像,也不需要过于复杂的解决方案。

基于MATLAB的目标识别

深度学习和机器学习

只有几行MATLAB®代码,你可以构建对象识别的机器学习和深度学习模型,而不必是专家。

使用MATLAB进行对象识别,使您能够在更短的时间内成功,因为它让您:

  1. 使用您的领域专业知识和学习数据科学与MATLAB:

    您可以使用MATLAB学习并获得机器学习和深度学习领域的专业知识。MATLAB使这些领域的学习变得实用和容易。此外,MATLAB使领域专家能够创建对象识别模型,而不是将任务交给可能不了解您的行业或应用的数据科学家。

  2. 使用应用程序标签数据和构建模型:

    MATLAB让你用最少的代码构建机器学习和深度学习模型。

    分类学习者应用,您可以快速构建机器学习模型和比较不同的机器学习算法,而无需编写代码。

    使用图片标志应用程序,您可以交互式地在图像中标记对象,并在视频中自动地标记基础真理,用于训练和测试深度学习模型。这种交互式和自动化的方法可以在更短的时间内获得更好的结果。

  3. 将对象识别集成到单个工作流中:

    MATLAB可以在一个工作流中统一多个领域。有了MATLAB,你可以在一个环境中思考和编程。它为深度学习和机器学习提供了工具和功能,也为一系列的领域提供了这些算法,例如机器人、计算机视觉和数据分析。

MATLAB可以在企业系统、集群、云和嵌入式设备上自动部署模型。

30天的免费试用

开始