自动化构建优化机器学习模型的过程

自动机器学习(AutoML)自动化并消除了从数据集到预测模型所需的手动步骤。AutoML还降低了构建精确模型所需的专业技能水平,因此无论您是专家还是机器学习经验有限,都可以使用它。通过自动化重复性任务,AutoML简化了机器学习中的复杂阶段工作流,例如:

  • 数据探索与预处理:识别预测能力低的变量和应消除的高度相关变量。
  • 特征提取与选择:自动提取功能,并在大型功能集中识别具有高预测能力的功能。
  • 型号选择和调整:自动调整模型超参数并确定性能最佳的模型。
  • 部署准备:通过代码生成,您可以将高级机器学习代码转换为低级语言(如C/C++),以便在内存有限、功耗低的嵌入式设备上部署。

图1:AutoML简化了机器学习工作流。AutoML应用的步骤以浅灰色显示。

您可以使用MATLAB和AutoML来支持许多工作流,例如特征提取和万博1manbetx选择以及模型选择和调整。

特征提取与选择

特征提取降低了原始数据中存在的高维性和可变性,并识别了捕获输入信号显著和独特部分的变量。特征工程的过程通常从从原始数据生成初始特征到选择最合适特征的一小部分。但特征工程是一个迭代过程,其他方法,如特征变换和降维也可以发挥作用。

根据数据的类型,可以使用多种方法从原始数据生成要素:

  • 小波散射应用预定义的小波和缩放滤波器从信号和图像数据中获取低方差特征。
  • 无监督学习方法,如重建ICA稀疏滤波,通过发现独立组件和优化特征分布中的稀疏性来学习有效表示。
  • 其他功能图像和音频信号可以在计算机视觉工具箱中找到™ 音频工具箱™.

特征选择确定了仍具有预测能力的特征子集,但特征较少,模型较小。各种各样的自动特征选择方法包括根据预测能力和学习特征重要性以及模型参数对特征进行排序。其他特征选择方法迭代确定一组优化模型性能的特征。

型号选择和调整

开发综合机器学习模型的核心是确定许多可用模型中哪一个最适合手头的任务,然后调整其超参数以优化性能。AutoML可以一步优化模型和相关超参数。一步模型优化的高效实现应用元学习,根据特征的特征将对好模型的搜索缩小到候选模型的子集,并通过应用贝叶斯优化,而不是计算更密集的网格和随机搜索,有效地优化每个候选模型的超参数。

如果使用其他方法(例如,试错法)确定有希望的模型,则可以通过网格或随机搜索或前面提到的贝叶斯优化等方法单独优化其超参数。

一旦确定了性能模型,就可以部署优化模型而无需额外编码。要完成此任务,请应用自动代码生成或将其集成到Simulink之类的模拟环境中万博1manbetx®.

另见:统计和机器学习工具箱,机器学习,监督学习,特征提取,特征选择,数据拟合,小波变换,小波工具箱