愿景。CascadeObjectDetector

使用Viola-Jones算法检测目标

全部展开页面

描述

级联对象检测器使用Viola-Jones算法来检测人脸、鼻子、眼睛、嘴巴或上半身。你也可以用the图片标志训练一个自定义分类器来使用这个System对象。有关函数如何工作的详细信息，请参见训练一个级联对象检测器．

在图像中检测面部特征或上半身:

创建愿景。CascadeObjectDetector对象，并设置其属性。
使用参数调用对象，就像调用函数一样。

要了解更多关于System对象如何工作的信息，请参见什么是系统对象?(MATLAB)。

创建

语法

探测器=愿景。CascadeObjectDetector

探测器= Vision.cascadeObjectDetector（型号）

探测器= vision.CascadeObjectDetector (XMLFILE)

探测器= Vision.cascadeObjectDetector（名称，价值）

描述

例子

探测器=愿景。CascadeObjectDetector使用Viola-Jones算法创建一个检测器来检测对象。

探测器=愿景。CascadeObjectDetector (模型）创建一个被配置为检测由输入字符向量定义的对象的探测器，模型．

探测器=愿景。CascadeObjectDetector (XMLFILE）属性指定的自定义分类模型创建检测器并将其配置为使用XMLFILE输入。

探测器=愿景。CascadeObjectDetector (名称,值）使用一个或多个名称-值对设置属性。将每个属性名用引号括起来。例如,探测器= vision.CascadeObjectDetector(“ClassificationModel”、“UpperBody”)

属性

全部展开

除非另有说明，属性是不宜，这意味着在调用对象后无法更改其值。当您调用它们时，对象锁定，以及释放函数打开它们。

如果一个属性是可调，您可以随时更改它的值。

有关更改属性值的更多信息，请参见在MATLAB中使用系统对象进行系统设计(MATLAB)。

`ClassificationModel`- - - - - -训练级联分类模型
`“FrontalFaceCART”`(默认)|`字符串`

训练的级联分类模型，指定为字符向量。的ClassificationModel属性控制要检测的对象类型。缺省情况下，该检测器用于检测人脸。

您可以将这个字符向量设置为包含自定义分类模型的XML文件，或者设置为下面列出的有效模型字符向量之一。控件可以训练自定义分类模型trainCascadeObjectDetector函数。该函数可以使用haar类特征、定向梯度直方图(HOG)或局部二值模式(LBP)来训练模型。该功能的使用方法请参见训练一个级联对象检测器．

分类模型	用于训练模型的图像大小	模型描述
`“FrontalFaceCART”`(默认)	20 [20]	检测垂直和向前的脸。该模型由弱分类器组成，基于分类和回归树分析（推车）。这些分类器使用HAAR功能来编码面部特征。基于购物车的分类器提供了在面部特征之间建模高阶依赖性的能力。[1]
`“FrontalFaceLBP”`	24 (24)	检测垂直和向前的脸。该模型基于一个决策残桩，由弱分类器组成。这些分类器使用局部二值模式(LBP)对面部特征进行编码。LBP特征对光照变化具有鲁棒性。［2］
`“UpperBody”`	(18 22)	检测上体区域，其被定义为头部和肩部区域。该模型使用HAAR功能来编码头部和肩部区域的细节。因为它在头周围使用更多特征，因此这种模型对姿势变化更加强大，例如，更强大。头部旋转/倾斜。［3］
`“EyePairBig”` `“EyePairSmall”`	45 [11] 22 [5]	侦测一双眼睛。的`“EyePairSmall”`模型使用较小的图像进行训练。这使得模型能够检测到比`“EyePairBig”`模型可以检测。［4］
`“LeftEye”` `“RightEye”`	18 [12]	分别检测左右眼。这些模型由基于决策树桩的弱分类器组成。这些分类器使用HAAR功能来编码细节。［4］
`“LeftEyeCART”` `“RightEyeCART”`	20 [20]	分别检测左右眼。构成这些模型的弱分类器是cart树。与决策树桩相比，基于cart树的分类器能够更好地建模高阶依赖关系。［5］
`“ProfileFace”`	20 [20]	检测直立的面部轮廓。该模型基于一个决策残桩，由弱分类器组成。这些分类器使用Haar特征对脸部细节进行编码。
`'嘴'`	25 [15]	检测到嘴。该模型由基于决策残桩的弱分类器组成，利用哈尔特征对嘴巴细节进行编码。［4］
`“鼻子”`	[15 18]	该模型由基于决策残基的弱分类器组成，利用Haar特征对鼻子细节进行编码。［4］

`迷西化`- - - - - -最小可检测物体的大小
`[]`(默认)|双元素向量

最小可探测物体的大小，指定为二元矢量[高度宽度］．为包含对象的最小大小区域设置此属性。该值必须大于或等于用于训练模型的图像大小。使用此属性可以在处理图像之前知道最小对象大小时减少计算时间。未指定此属性的值，检测器将其设置为用于培训分类模型的图像的大小。

详细解释了设置可探测物体的大小与ScaleFactor财产,看到算法部分。

可调:是的

`最大尺寸`- - - - - -最大可检测物体的大小
`[]`(默认)|双元素向量

最大可检测物体的大小，指定为两个元素矢量[高度宽度］．指定要检测的最大对象的像素大小。当您在处理图像之前知道最大对象大小时，使用此属性可减少计算时间。当您没有为该属性指定值时，检测器将其设置为大小（我)．

详细解释了设置可探测物体的大小与ScaleFactor财产,看到算法部分。

`ScaleFactor`- - - - - -用于多尺度目标检测的缩放
`1．1`(默认)|标量

用于多尺度对象检测的缩放，指定为大于的值1.0001．比例因子递增地缩放检测分辨率之间迷西化和最大尺寸．你可以使用以下方法将比例系数设置为一个理想值:

大小（我/（大小（我）-0．5）

检测器以中间的增量缩放搜索区域迷西化和最大尺寸使用以下关系:

搜索区域＝圆形的（（培训规模) * (ScaleFactor^N））

N当前增量是大于零的整数吗培训规模为训练分类模型所用的图像大小。

可调:是的

`MergeThreshold`- - - - - -检测阈值
`4`(默认)|整数

检测阈值，整数形式。阈值定义了在一个对象周围有多个检测的区域中声明最终检测所需的标准。满足阈值的一组并置检测被合并，在目标物体周围产生一个边界框。增加这个阈值可以通过要求目标对象在多尺度检测阶段被多次检测来帮助抑制错误检测。当您将此属性设置为0，返回所有检测，不执行阈值设置或合并操作。此属性是可调的。

`UseROI`- - - - - -使用范围
`假`(默认)|`假`

使用感兴趣的区域，指定为假或假．将此属性设置为真正的检测输入图像中感兴趣的矩形区域内的目标。

使用

语法

bbox =探测器(我)

Bbox =探测器（I，ROI）

描述

bbox=探测器(我）返回A.米-By-4矩阵，bbox,定义了米包含检测到的对象的边界框。探测器对输入图像执行多尺度对象检测，我．

bbox=探测器(我，roi）在指定的矩形搜索区域内检测对象roi．设置“UseROI”财产真正的使用此语法。

输入参数

全部展开

`我`- - - - - -输入图像
灰度|真彩(RGB)

输入图像，指定为灰度或真彩色(RGB)。

`模型`- - - - - -分类模型
`“FrontalFaceCART”`(默认)|`字符串`

分类模型，指定为字符向量。的模型输入描述要检测的对象的类型。有几个有效的模型字符向量，如'FrontalFaceCART'，'UpperBody”和“ProfileFace＇.看到ClassificationModel所有可用型号列表的财产描述。

`XMLFILE`- - - - - -自定义分类模型
XML文件

自定义分类模型，指定为XML文件。的XMLFILE可以使用trainCascadeObjectDetector功能或OpenCV（开源计算机视觉）培训功能。您必须指定完整或相对路径XMLFILE，如果不是在MATLAB中^®路径。

`roi`- - - - - -感兴趣矩形区
研制出向量(默认)

图像内感兴趣的矩形区域我，指定为四元素向量，[xy宽度高度］．

输出参数

全部展开

`bbox`——检测
米4矩阵(默认)

检测，返回为米-By-4元素矩阵。输出矩阵的每一行包含四元素向量，[xy宽度高度，它以像素、左上角和边界框的大小指定。

对象的功能

要使用对象函数，请将System Object™指定为第一个输入参数。例如，要发布命名的系统对象的系统资源obj，使用此语法：

发行版(obj)

全部展开

所有系统对象都是通用的

`一步`	运行系统对象算法
`释放`	释放资源并允许更改系统对象属性值和输入特征
`重置`	重置内部状态系统对象

例子

全部折叠

使用正面脸部分类模型检测图像中的面部

打开生活的脚本

创建一个人脸检测器对象。

faceDetector = vision.CascadeObjectDetector;

读取输入图像。

我= imread (“visionteam.jpg”）;

检测的面孔。

bboxes = faceDetector(我);

注释发现脸。

ifac = insertObjectAnnotation(我“矩形”bboxes,“脸”）;图imshow (ifac)标题(检测到人脸的）;

利用上体分类模型检测图像中的上体

打开生活的脚本

创建身体检测器对象并设置属性。

bodyDetector =愿景。CascadeObjectDetector (“UpperBody”）;bodyDetector。迷西化＝[60 60]; bodyDetector.MergeThreshold = 10;

读取输入图像并检测上半身。

I2 = imread (“visionteam.jpg”）;bboxBody = bodyDetector (I2);

标注检测到的上体。

ibody = InsertObjectAnnotation（I2，“矩形”bboxBody,“上身”）;图imshow (IBody)标题(检测到上半身的）;

算法

全部展开

分类模型的训练

每个模型都经过训练，以检测特定类型的对象。分类模型是通过从一组已知图像中提取特征来训练的。然后将这些提取的特征输入到学习算法中来训练分类模型。计算机视觉工具箱™软件使用Viola-Jones级联对象检测器。这个探测器使用HOG［7］,枸杞多糖［8］, Haar-like［6］特征和使用增强训练的分类器级联。

用于训练分类器的图像大小定义了包含该对象的最小区域。训练图像大小根据应用程序，目标对象类型和可用的正图像而变化。你必须设置迷西化属性设置为大于或等于用于训练模型的图像大小的值。

级联分类器的

该对象使用级联分类器有效地处理图像区域的存在的目标对象。级联中的每个阶段都应用越来越复杂的二值分类器，这使得算法能够快速剔除不包含目标的区域。如果在级联的任何阶段都没有找到所需的对象，探测器立即拒绝该区域并终止处理。通过终止，对象避免了进一步调用级联中计算密集型的分类器。

多尺度对象检测

检测器对输入图像进行增量缩放以定位目标物体。在每次缩放时，一个大小与训练图像大小相同的滑动窗口扫描缩放后的图像来定位目标。的ScaleFactor属性确定连续增量之间的伸缩量。

搜索区域大小与之相关ScaleFactor以下列方式:

搜索区域＝圆形的（（ObjectTrainingSize) * (ScaleFactor^N））

N当前增量是大于零的整数吗ObjectTrainingSize为训练分类模型所用的图像大小。

搜索窗口遍历图像的每个缩放增量。

MinSize、MaxSize和ScaleFactor之间的关系

了解要检测的对象的大小和比例因子之间的关系将帮助您相应地设置属性。的迷西化和最大尺寸属性限制了要检测的对象的大小范围。理想情况下，当您在处理图像之前知道近似的对象大小时，可以修改这些属性以减少计算时间。它们不是设计来基于对象大小提供结果的精确过滤的。这些属性的行为受ScaleFactor的影响。比例因子决定了搜索窗口大小的量化。

搜索区域＝圆形的（（培训规模) * (ScaleFactor^N））

返回的对象大小的实际范围可能与您为迷西化和最大尺寸属性。例如,

对于一个ScaleFactor的价值1．1使用24x24训练尺寸，用于5增量时，搜索区域计算为:

>>搜索区域= round(24*1.1.^(1:5))

>>26 29 32 35 39

如果你要最大尺寸来34，由于搜索区域量化，算法实际使用的最大对象大小为32．

合并检测阈值

对于尺度上的每一个增量，搜索窗口遍历图像，在目标对象周围产生多个检测。多个检测被合并到每个目标对象的一个边界框中。你可以使用MergeThreshold属性来控制在合并或拒绝检测之前所需的检测次数。最终边界框的大小是每个检测的边界框的大小的平均值迷西化和最大尺寸．

参考

Lienhart R.， Kuranov A.， and V. Pisarevsky《用于快速目标检测的增强分类器检测级联的经验分析》第25届DAGM模式识别学术研讨会论文集。德国马格德堡,2003年。

[2] Ojala Timo, Pietikäinen Matti, Mäenpää Topi，“基于局部二值模式的多分辨率灰度和旋转不变纹理分类”。在机械工程学报，2002．第24卷第7期971-987页。

Kruppa H.， Castrillon-Santana M.，和B. Schiele。“基于局部上下文的快速和健壮的人脸查找”。视觉监视与跟踪与监视性能评估联合IEEE国际研讨会论文集， 2003，页157-164。

[4] Castrillón Marco, Déniz Oscar, Guerra Cayetano, Hernández Mario，“ENCARA2:视频流中不同分辨率的多个面孔实时检测”。万博尤文图斯在视觉传达与图像再现学报， 2007(18) 2: 130-140页。

[5]余世奇“眼睛检测”。石岐宇的主页。http://yushiqi.cn/research/eyedetection。

Viola, Paul和Michael J. Jones，“使用简单特征的增强级联快速目标检测”，2001 IEEE计算机学会计算机视觉与模式识别会议论文集, 2001年。数量:1、pp.511 - 518。

[7] Dalal, N.，和B. Triggs，“面向人类检测的梯度直方图”。计算机视觉与模式识别学术会议．第1卷，(2005)，886-893页。

[8] Ojala, T.， M. Pietikainen，和T. Maenpaa，“基于局部二值模式的多分辨率灰度和旋转不变纹理分类”。模式分析与机器智能学报．第24卷，第7期，2002年7月，971-987页。

扩展功能

C / c++代码生成
使用MATLAB®Coder™生成C和c++代码。

使用注意事项及限制:

使用链接到OpenCV(版本3.4.0)库的c++编译器生成可移植的C代码。看到用于使用OpenCV库的函数的便携式C代码．
看到系统对象在MATLAB代码生成(MATLAB编码器)。
XMLFILE必须是编译时常量。

另请参阅

图片标志|insertShape|integralImage|trainCascadeObjectDetector|愿景。PeopleDetector

主题

外部网站

在实时视频流中检测和跟踪多个面

愿景。CascadeObjectDetector

描述

创建

语法

描述

属性

ClassificationModel- - - - - -训练级联分类模型“FrontalFaceCART”(默认)|字符串

迷西化- - - - - -最小可检测物体的大小[](默认)|双元素向量

最大尺寸- - - - - -最大可检测物体的大小[](默认)|双元素向量

ScaleFactor- - - - - -用于多尺度目标检测的缩放1．1(默认)|标量

MergeThreshold- - - - - -检测阈值4(默认)|整数

UseROI- - - - - -使用范围假(默认)|假

使用

语法

描述

输入参数

我- - - - - -输入图像灰度|真彩(RGB)

模型- - - - - -分类模型“FrontalFaceCART”(默认)|字符串

XMLFILE- - - - - -自定义分类模型XML文件

roi- - - - - -感兴趣矩形区研制出向量(默认)

输出参数

bbox——检测米4矩阵(默认)

对象的功能

所有系统对象都是通用的

例子

使用正面脸部分类模型检测图像中的面部

利用上体分类模型检测图像中的上体

算法

分类模型的训练

级联分类器的

多尺度对象检测

MinSize、MaxSize和ScaleFactor之间的关系

合并检测阈值

参考

扩展功能

C / c++代码生成使用MATLAB®Coder™生成C和c++代码。

另请参阅

主题

外部网站

介绍了R2012a

计算机视觉工具箱文档

万博1manbetx

与Matlab引入深度学习

`ClassificationModel`- - - - - -训练级联分类模型
`“FrontalFaceCART”`(默认)|`字符串`

`迷西化`- - - - - -最小可检测物体的大小
`[]`(默认)|双元素向量

`最大尺寸`- - - - - -最大可检测物体的大小
`[]`(默认)|双元素向量

`ScaleFactor`- - - - - -用于多尺度目标检测的缩放
`1．1`(默认)|标量

`MergeThreshold`- - - - - -检测阈值
`4`(默认)|整数

`UseROI`- - - - - -使用范围
`假`(默认)|`假`

`我`- - - - - -输入图像
灰度|真彩(RGB)

`模型`- - - - - -分类模型
`“FrontalFaceCART”`(默认)|`字符串`

`XMLFILE`- - - - - -自定义分类模型
XML文件

`roi`- - - - - -感兴趣矩形区
研制出向量(默认)

`bbox`——检测
米4矩阵(默认)

C / c++代码生成
使用MATLAB®Coder™生成C和c++代码。