特征提取机器学习和深入学习

特征提取是将原始数据转化为可以处理的数字特征,同时保留原始数据集中的信息,比直接对原始数据进行机器学习效果更好

特征提取可以手动或自动完成:

  • 手动特征提取需要识别和描述与给定问题相关的特征,并实现提取这些特征的方法。在许多情况下,对背景或领域有良好的理解可以帮助做出明智的决定,确定哪些特性是有用的。经过几十年的研究,工程师和科学家已经开发出了图像、信号和文本的特征提取方法。一个简单特征的例子是信号中窗口的平均值。
  • 自动特征提取使用专门的算法或深度网络自动从信号或图像中提取特征,而不需要人工干预。当您想要快速地从原始数据转移到开发机器学习算法时,这项技术非常有用。小波散射是自动特征提取的一个例子。

随着深度学习的发展,特征提取在很大程度上已被深度网络的第一层所取代——但主要用于图像数据。对于信号和时间序列应用,特征提取仍然是第一个挑战,需要大量专业知识才能建立有效的预测模型。

特征提取信号和时间序列数据

特征提取在识别信号中的最鉴别特征,其中一台机器学习或深学习算法可以更容易地消耗。对机器学习或深度学习直接与原始信号往往产生,因为高数据速率和信息冗余的效果差。

用于施加特征提取到的信号和时序数据进行机器学习分类概略工序。

信号特性和时频转换

在分析信号和传感器数据时,信号处理工具箱™小波工具箱™提供让您测量在时间,频率和时间 - 频率域的信号的共同显着特征的功能。可以应用脉冲和过渡度量,测量信噪比(SNR),估计频谱熵和峰度,和计算功率谱。

时频变换,如短时傅里叶变换(STFT),可用于机器学习和深度学习模型中的训练数据的信号表示。例如,卷积神经网络(CNNs)通常用于图像数据,它可以成功地从时频变换返回的二维信号表示中学习。

使用短时傅里叶变换的一个信号的光谱图。谱图显示了频率内容随时间的变化。

还可以使用其他时频转换,具体取决于具体应用程序或特性。例如,常量q变换(CQT)提供了对数间隔的频率分布;连续小波变换是识别非平稳信号短瞬态的有效方法。

特点为音频应用和预测性维护

音频工具箱™提供时间 - 频率变换,包括梅尔频谱,八度和伽马通滤波器组,和离散余弦变换(DCT),即通常用于音频,语音,和声学的集合。对于这些类型的信号的其它流行特征提取方法包括梅尔频率倒谱系数(MFCC),伽马通倒频谱系数(GTCC),俯仰,谐,和不同类型的音频的频谱描述符。该音频特征提取器工具可帮助选择并同时重用任何中间计算效率从相同的源信号中提取不同的音频功能。

对于开发状态监测和预测维护应用程序的工程师,该系统诊断功能设计app预测性维护工具箱™您可以提取,可视化和等级特点,设计条件指标来监测机器健康。

诊断功能设计应用程序可以让你设计和比较功能,以名义和系统故障区分。

自动特征提取方法

自动从信号中提取特征的高级方法已经出现。自动编码器、小波散射和深度神经网络是常用的特征提取和降维数据。

小波散射网络自动化低方差的提取从实值的时间序列的图像数据的功能。这种方法产生的数据表示,一个类中的差异最小化,同时跨类保护辨别。小波散射效果很好,当你没有大量的数据的开始。

图像数据的特征提取

用于图像数据的特征提取表示图像的作为紧凑特征矢量的感兴趣的部分。在过去,这是用专门的特征检测,特征提取和特征匹配算法来完成。今天,深学习是在图像和视频分析普遍,并且已经成为以其取原始图像数据作为输入的能力,跳过特征提取步骤。无论哪个接近你服用,计算机视觉应用,例如图像配准,对象检测和分类,以及基于内容的图像检索中,所有需要的图像特征有效地代表 - 或隐通过深网络的第一层,或明确地施加一些的长期图像特征提取技术。

使用特征检测、特征提取和匹配相结合的方法在一个杂乱的场景(右)中检测一个物体(左)。示例见细节。

所提供的特征提取技术计算机视觉工具箱™图像处理工具箱™包括:

  • 定向梯度直方图(HOG)
  • 加速健壮特性(SURF)
  • 本地二进制模式(LBP)特征

梯度方向(HOG)的图像(顶部)的特征提取的直方图。创建不同尺寸的特征矢量通过改变小区大小(底部)来表示图像。示例见细节。

也可以看看:特征匹配对象检测防抖图像处理和计算机视觉人脸识别图像识别对象检测物体识别数字图像处理光流RANSAC模式识别点云深度学习特征选择

机器学习培训课程

在本课程中,你将决定如何使用无监督学习技术来发现大数据集的特征和监督学习技术来建立预测模型。