自动构建优化的机器学习模型的过程

自动化机器学习(AutoML)自动化并消除了从数据集到预测模型所需的手工步骤。AutoML还降低了构建精确模型所需的专业知识水平,因此无论您是专家还是具有有限的机器学习经验,都可以使用它。通过自动化重复的任务,AutoML简化了机器学习工作流中的复杂阶段,比如:

  • 数据探索和预处理:确定与低的预测能力,并应当消除高度相关的变量,变量。
  • 特征提取与选择:自动提取特征,在一个大的特征集中,识别那些具有高预测能力的特征。
  • 模型选择和调优:自动调节模式超参数和识别表现最好的模型。
  • 准备部署:代码生成,可以改造高级别机器学习代码转换成低级语言如C / C ++对具有有限的存储器和低功耗的嵌入式设备部署。

图1:AutoML简化了机器学习的工作流程。AutoML应用的步骤显示为浅灰色。

您可以使用MATLAB与AutoML支持许多工作流程,如特征提取和选万博1manbetx择和模型的选择和调整。

特征提取与选择

特征提取减少了原始数据,并且识别变量捕获的显着和输入信号的独特份的高维数和变异存在。特征工程的过程典型地从产生从原始数据初始特征于选择的最适合的特征的小的子集进行。但功能设计是一个反复的过程,和其他方法,如特征变换和降维能起到一定的作用。

根据数据的类型,很多方法可用来从原始数据的特点:

  • 小波散射适用预先定义小波和缩放滤波器,以获得低方差从信号和图像数据的功能。
  • 无监督学习方法,如重建ICA稀疏过滤,通过揭露独立的组件,并在特征分布稀疏优化学习效率表示。
  • 其他功能图片和音频信号可以在计算机视觉工具箱™和音频工具箱™被发现。

特征选择识别功能仍提供预测能力,但功能较少和较小的模型的一个子集。各个用于自动特征选择方法可供选择,包括通过他们的预测能力分级特征,并与模型参数一起学习功能的重要性。其他特征选择方法反复确定一组功能,优化模型的性能。

模型选择和调优

在制定一个全面的机器学习模型识别其手头上的许多可用的模型进行最适合的任务中,然后调整其超参数来优化性能的核心。AutoML可以在单一步骤中同时优化模型和相关联的超参数。的一个步骤模型优化高效的实现使用元学习缩小了良好的模型基础上的功能特性候选模型的一个子集搜索,并优化超参数为每个候选模型的有效运用贝叶斯优化,而不是计算的更密集的网格和随机搜索。

如果希望的模型使用其他手段(例如,试验和错误)确定,其超参数可以单独通过方法如网格或随机搜索,或贝叶斯优化如前所述优化。

一旦您确定了一个性能模型,您就可以部署您的优化模型,而不需要额外的编码。要完成此任务,请应用自动代码生成或将其集成到仿真环境(如Simulink)中万博1manbetx®

也可以看看:统计和机器学习工具箱机器学习监督学习特征提取特征选择数据拟合小波变换小波工具箱