主要内容

对象检测

使用卷积神经网络(CNNs,或ConvNets)进行分类、目标检测、迁移学习,创建定制的检测器

目标检测是一种用于定位图像或视频中物体实例的计算机视觉技术。对象检测算法通常利用机器学习深度学习产生有意义的结果。当观看图像或视频时,人类可以在瞬间识别和定位感兴趣的对象。目标检测的目标是使用计算机复制这种智能。目标检测的最佳方法取决于您的应用程序和您试图解决的问题。

深度学习技术需要大量的标记训练图像,因此建议使用GPU来减少训练模型所需的时间。基于深度学习的目标检测方法使用卷积神经网络(cnn或ConvNets),如R-CNN和YOLO v2,或使用单镜头检测(SSD)。您可以训练自定义的对象检测器,或利用预先训练的对象检测器迁移学习,这种方法使您能够从预先训练好的网络开始,然后针对您的应用程序对其进行微调。卷积神经网络需要深度学习工具箱™。CUDA支持训练和预测万博1manbetx®-有能力的GPU。建议使用GPU,并且需要并行计算工具箱™. 有关详细信息,请参阅计算机视觉工具箱首选项MathWorks产品中的并行计算支持万博1manbetxs manbetx 845(并行计算工具箱)

用于目标检测的机器学习技术包括聚合通道特征(ACF)、使用方向梯度直方图(HOG)特征的支持向量机(SVM)分类以及用于人脸或上身检测的Viola-Jones算法。您可以选择从预训练万博1manbetx对象检测器开始,或创建自定义对象检测器以适合您的应用程序。

目标检测,神经网络

应用程序

图片标志 计算机视觉应用中的标签图像
贴标签机视频 计算机视觉应用中的标签视频

功能

全部展开

深度学习探测器

rcnnObjectDetector 使用R-CNN深度学习检测器检测对象
fastRCNNObjectDetector 使用快速R-CNN深度学习检测器检测对象
fasterRCNNObjectDetector 使用更快的R-CNN深度学习检测器检测对象
ssdObjectDetector 使用SSD深度学习检测器检测对象
yolov2ObjectDetector 使用YOLO v2对象检测器检测对象
yolov3ObjectDetector 创建YOLO v3对象检测器

基于功能的探测器

光学字符识别 使用光学字符识别识别文本
readAprilTag 检测和估计AprilTag在图像中的姿态
readBarcode 检测和解码图像中的1-D或2-D条形码
acfObjectDetector 使用聚合通道特性检测对象
peopleDetectorACF 使用聚合通道特性检测人员
愿景。CascadeObjectDetector 使用Viola-Jones算法检测目标
愿景。ForegroundDetector 使用高斯混合模型的前景检测
愿景。PeopleDetector 使用HOG特征检测直立的人
愿景。BlobAnalysis 连通区域的性质

使用点特征检测对象

检测风险特征 检测快速特征并返回BRISKPoints对象
detectFASTFeatures 使用FAST算法检测角点并返回拐点对象
detectHarrisFeatures 使用Harris-Stephens算法检测角点并返回拐点对象
检测特征 检测KAZE特征并返回卡泽波因茨对象
detectMinEigenFeatures 使用最小特征值算法和返回检测角点拐点对象
detectMSERFeatures 检测MSER特征并返回MSERRegions对象
detectORBFeatures 检测ORB关键点并返回ORBPoints对象
detectSURFFeatures 检测冲浪功能并返回冲浪点对象
提取特征 提取兴趣点描述符
匹配特征 查找匹配的特征

选择检测对象

selectStrongestBbox 从重叠的簇中选择最强的包围框
选择StrongESTBoxMultiClass 从重叠的簇中选择最强的多类包围框

负荷训练数据

boxLabelDatastore 用于边界框标签数据的数据存储
事实真相 地面真值标记数据
图像数据存储 用于图像数据的数据存储
objectDetectorTrainingData 为目标检测器创建训练数据
结合 合并来自多个数据存储的数据

基于训练特征的目标检测器

trainACFObjectDetector 训练ACF物体检测器
trainCascadeObjectDetector 训练级联对象检测器模型
trainImageCategoryClassifier 训练图像分类分类器

训练基于深度学习的目标检测器

trainRCNNObjectDetector 训练R-CNN深度学习目标检测器
列车快速目标检测器 训练一个快速的R-CNN深度学习对象检测器
列车快速故障检测器 训练一个更快的R-CNN深度学习对象检测器
trainSSDObjectDetector 训练SSD深度学习对象检测器
Trainyolov2oObject检测器 火车YOLO v2物体探测器

为深度学习增加和预处理训练数据

balanceBoxLabels 用于对象检测的平衡边界框标签
bboxcrop 作物边界框
消除边界框
bboxresize 调整边界框
bboxwarp 对边界框应用几何变换
bbox2points 将矩形转换为角点列表
imwarp 对图像应用几何变换
imcrop 作物图像
调整大小 调整图像
随机仿射E2D 创建随机的二维仿射变换
centerCropWindow2d 创建矩形中心裁剪窗口
randomWindow2d 随机选择图像中的矩形区域
整体图像 计算二维积分图像

R-CNN(带卷积神经网络的区域)

回归层 盒回归层快速和更快的R-CNN
fasterRCNNLayers 创建一个更快的R-CNN对象检测网络
rpnSoftmaxLayer 区域提议网(RPN)软max层
rpnClassificationLayer 区域提议网络分类层
区域提议者 区域提议层更快的R-CNN
roiAlignLayer 用于掩模CNN的非量化ROI池层
roiInputLayer 快速R-CNN的ROI输入层
roiMaxPooling2dLayer 用于矩形roi输出固定尺寸特征图的神经网络层

你只看一次

yolov2Layers 创建YOLO v2对象检测网络
卵黄转移膜 为YOLO v2对象检测网络创建变换层
yolov2OutputLayer 为YOLO v2对象检测网络创建输出层
yolov2ReorgLayer (不推荐)为YOLO v2对象检测网络创建重组层
spaceToDepthLayer 空深层

焦层损失

focalLossLayer 使用焦丢失函数创建焦丢失层
聚焦交叉熵 计算焦点交叉熵损失

SSD(单针探测器)

ssdMergeLayer 创建SSD合并层用于对象检测
ssdLayers SSD多盒对象检测网络

锚箱

锚定层 创建锚框层用于对象检测
estimateAnchorBoxes 评估深度学习对象检测器的锚盒
插入对象注释 注释真彩色或灰度图像或视频流
插入对象掩码 在图像或视频流中插入掩码
insertShape 在图像或视频中插入形状
展示 在图像、视频或点云上显示形状
评估检测AOS 评估目标检测的平均方向相似度度量
评估检测错误率 评估目标检测的缺失率度量
评估检测精度 评估目标检测的精度度量
BBOX重叠率 计算边界框重叠率
bboxPrecisionRecall 根据地面真实值计算包围盒精度和召回率

主题

开始

开始使用深度学习的对象检测

利用深度学习神经网络进行目标检测。

点特征类型

为几种类型的特性选择返回和接受点对象的函数

坐标系统

指定像素索引、空间坐标和三维坐标系

局部特征检测与提取

学习局部特征检测和提取的好处和应用

基于视觉词袋的图像分类

使用计算机视觉工具箱™功能,通过创建一个视觉词汇袋来进行图像类别分类。

开始使用级联对象检测器

训练自定义分类器

选择“功能”以可视化检测到的对象

比较可视化功能。

目标检测和语义分割的训练数据

开始使用图像标签

交互式标记矩形roi用于目标检测,像素用于语义分割,多边形用于实例分割,场景用于图像分类。

开始使用视频贴标机

以交互方式标记用于对象检测的矩形ROI、用于语义分割的像素、用于实例分割的多边形以及用于视频或图像序列中图像分类的场景。

用于深度学习的数据存储(深度学习工具箱)

学习如何在深度学习应用程序中使用数据存储。

开始使用掩码R-CNN进行实例分割

使用Mask R-CNN和深度学习执行多类实例分割。

目标检测和语义分割的训练数据

使用创建用于对象检测或语义分割的训练数据图片标志贴标签机视频

开始深度学习

深度网络设计器(深度学习工具箱)

深度学习层列表(深度学习工具箱)

发现MATLAB中所有的深度学习层®

MATLAB中的深度学习(深度学习工具箱)

使用卷积神经网络进行分类和回归,包括预训练网络和转移学习,以及GPU、CPU、群集和云上的培训,在MATLAB中发现深度学习能力。

预先训练的深度神经网络(深度学习工具箱)

了解如何下载并使用预训练卷积神经网络进行分类、转移学习和特征提取。

特色的例子