特征提取

面向机器学习和深度学习的特征提取

特征提取是指将原始数据转换为数字特征的过程,这些特征可以在保留原始数据集中信息的同时进行处理。它比直接对原始数据应用机器学习产生更好的结果.

特征提取可以手动或自动完成:

  • 手动特征提取需要识别和描述与给定问题相关的特征,并实现提取这些特征的方法。在许多情况下,充分了解背景或领域有助于做出明智的决定,哪些功能可能有用。经过几十年的研究,工程师和科学家已经开发出图像、信号和文本的特征提取方法。一个简单特征的例子是信号中窗口的平均值。
  • 自动特征提取使用专门的算法或深度网络从信号或图像中自动提取特征,无需人工干预。当您想要快速地从原始数据转移到开发机器学习算法时,这种技术非常有用。小波散射是自动特征提取的一个例子。

随着深度学习的兴起,特征提取在很大程度上已被第一层深度网络所取代,但主要用于图像数据。对于信号和时间序列应用,特征提取仍然是第一个挑战,在建立有效的预测模型之前,需要大量的专业知识。

信号和时间序列数据的特征提取

特征提取识别信号中最具辨别力的特征,机器学习或深度学习算法更容易使用这些特征。由于高数据率和信息冗余,直接使用原始信号进行机器学习或深度学习的训练结果往往很差。

用于将特征提取应用于机器学习分类器的信号和时间序列数据的示意图过程。

信号特征与时频变换

在分析信号和传感器数据时,讯号处理工具箱™小波工具箱™提供的功能允许您在时间、频率和时频域中测量信号的常见特征。您可以应用脉冲和跃迁度量,测量信噪比(SNR),估计谱熵和峰度,并计算功率谱。

短时傅里叶变换(STFT)等时频变换可以用作机器学习和深度学习模型中训练数据的信号表示。例如,卷积神经网络(CNN)通常用于图像数据,可以成功地从时频变换返回的2D信号表示中学习。

使用短时傅里叶变换的信号频谱图。频谱图显示了频率含量随时间的变化。

根据具体应用或特性,还可以使用其他时频变换。例如,常数q变换(CQT)提供了对数间隔频率分布;连续小波变换通常能有效地识别非平稳信号中的短暂瞬态。

用于音频应用和预测性维护的功能

音频工具箱™ 提供一组时频变换,包括Mel频谱图、倍频程和gammatone滤波器组以及离散余弦变换(DCT),这些变换通常用于音频、语音和声学。这些类型信号的其他流行特征提取方法包括Mel频率倒谱系数(MFCC)、gammatone倒谱系数(GTCC)、基音、和谐度和不同类型的音频频谱描述符。这个音频特征提取程序该工具可以帮助从同一源信号中选择和提取不同的音频特征,同时重用任何中间计算以提高效率。

对于开发状态监测和预测性维护应用程序的工程师诊断功能设计器应用程序在里面预测性维护工具箱™允许您提取、可视化和排列功能,以设计用于监视机器运行状况的条件指示器。

诊断功能设计器应用程序允许您设计和比较功能,以区分正常系统和故障系统。

自动特征提取方法

新的高级方法已经出现,可以自动从信号中提取特征。自动编码器、小波散射和深度神经网络通常用于提取特征和降低数据的维数。

小波散射网络自动从实值时间序列和图像数据中提取低方差特征。这种方法生成的数据表示可以最小化类内的差异,同时保持类间的可区分性。小波散射在没有大量数据的情况下工作良好。

图像数据的特征提取

图像数据的特征提取将图像中感兴趣的部分表示为一个紧凑的特征向量。在过去,这是通过专门的特征检测、特征提取和特征匹配算法实现的。如今,深度学习在图像和视频分析中非常流行,它能够将原始图像数据作为输入,跳过特征提取步骤。无论采用哪种方法,计算机视觉应用(如图像注册、对象检测和分类以及基于内容的图像检索)都需要有效地表示图像特征——或者通过深层网络的第一层隐式表示,或者明确应用一些长期存在的图像特征提取技术。

使用特征检测、特征提取和匹配的组合在杂乱场景(右侧)中检测对象(左侧)。有关详细信息,请参见示例。

特征提取技术由计算机视觉工具箱™图像处理工具箱™包括:

  • 定向梯度直方图(HOG)
  • 加速功能强大(SURF)
  • 本地二进制模式(LBP)特征

图像的方向梯度直方图(HOG)特征提取(顶部)。创建不同大小的特征向量,通过改变单元大小(底部)来表示图像。有关详细信息,请参见示例。

另见:特征匹配,目标检测,图像稳定,图像处理与计算机视觉,图像识别,目标检测,目标识别,数字图像处理,光流,兰萨克,模式识别,点云,深度学习,特征选择

机器学习培训课程

在本课程中,您将确定如何使用无监督学习技术来发现大数据集中的特征,以及如何使用监督学习技术来构建预测模型。