主要内容

训练核近似模型使用回归学习应用程序

这个示例展示了如何使用regression Learner应用程序创建和比较各种内核近似回归模型,并将训练过的模型导出到工作空间,以对新数据进行预测。核近似模型通常用于执行具有许多观测值的非线性回归。对于内存中的大型数据,核近似模型往往比使用高斯核的SVM模型更快地训练和预测。

  1. 在MATLAB中®命令窗口,加载carbig数据集,并创建一个包含不同变量的表。

    负载carbigcartable = table(加速度,气缸,位移,...马力,Model_Year、重量、起源、MPG);
  2. 单击应用程序选项卡,然后单击显示更多右边的箭头打开应用程序库。在机器学习和深度学习组中,单击回归的学习者

  3. 回归的学习者选项卡,在文件部分中,点击新会话并选择从工作空间

  4. 在“从工作区新建会话”对话框中,选择表cartable数据集变量列表。

    如图对话框所示,应用程序选择英里/加仑作为响应,其他变量作为预测。对于本例,不要更改选择。

    “从工作区新建会话”对话框

  5. 若要接受默认验证方案并继续,请单击开始会议.默认的验证选项是5倍交叉验证,以防止过拟合。

    “回归学习器”创建响应图,并在图上记录数字x设在。

  6. 使用响应图来研究哪些变量对预测响应有用。为了可视化不同预测因子与响应之间的关系,在X列表下在地块的右边。观察哪些变量与反应的相关性最明显。

  7. 创建核近似模型的选择。在回归的学习者选项卡,在模型部分,单击箭头打开图库。在核近似回归模型组中,单击所有的内核

  8. 火车部分中,点击火车都并选择火车都

    请注意

    • 如果您有并行计算工具箱™,那么应用程序有使用并行按钮默认开启。点击之后火车都并选择火车都选择火车,该应用程序会打开一个并行的员工池。在此期间,您无法与该软件进行交互。泳池开放后,你可以继续与应用程序互动,而模型则并行训练。

    • 如果你没有并行计算工具箱,那么应用程序有使用背景培训中的复选框。火车都默认选择的菜单。在你选择一个训练模型的选项后,应用程序会打开一个背景池。泳池开放后,当模特在后台训练时,你可以继续与应用程序互动。

    回归学习器训练库中每个核近似选项中的一个,以及默认的精细树模型。在模型窗格,应用程序概述RMSE(验证)(均方根误差)的最佳模型。

  9. 中选择模型模型窗格查看结果。在回归的学习者选项卡,在情节和解释部分,单击箭头打开图库,然后单击响应验证结果组。检查训练模型的响应图。真实的反应是蓝色的,预测的反应是黄色的。

    基于核近似模型的汽车数据响应图

    请注意

    验证在结果中引入了一些随机性。您的模型验证结果可能与本示例中显示的结果不同。

  10. 中,选择马力检查一下反应图。真实反应和预测反应现在都被绘制出来了。显示预测误差,以预测响应和真实响应之间的垂直线绘制,方法是选择错误下面的复选框情节在地块的右边。

  11. 有关当前所选模型的详细信息,请参阅总结选项卡。检查并比较其他模型特征,如r平方(决定系数)、MAE(平均绝对误差)和预测速度。要了解更多信息,请参见在摘要选项卡和模型窗格中查看模型统计信息.在总结选项卡,您还可以找到当前所选模型类型的详细信息,例如用于训练模型的选项。

  12. 把预测反应和真实反应画出来。在回归的学习者选项卡,在情节和解释部分,单击箭头打开图库,然后单击预测与实际(验证)验证结果组。使用此图来确定回归模型对不同响应值的预测效果如何。

    核近似模型的预测响应与真实响应的图

    一个完美的回归模型预测的响应等于真实的响应,所以所有的点都在一条对角线上。直线到任意一点的垂直距离就是对该点的预测误差。一个好的模型误差很小,所以预测结果分散在直线附近。一般来说,一个好的模型的点大致对称地分布在对角线周围。如果您可以在图中看到任何清晰的模式,您很可能可以改进您的模型。

  13. 对于每个剩余的模型,在模型窗格,打开预测图与实际图,然后比较各个模型的结果。有关更多信息,请参见通过改变布局来比较模型图

  14. 为了改进模型,需要包含不同的特性。在模型画廊,选择所有的内核一次。看看是否可以通过去除低预测能力的特征来改进模型。在总结选项卡上,单击特征选择展开该部分。

    特征选择节,清除的复选框加速度而且气缸将它们从预测因子中排除。响应图显示,这些变量与响应变量不是高度相关的。

    火车部分中,点击火车都并选择火车都选择火车用新的特征集训练核近似模型。

  15. 观察的新模型模型窗格。这些模型与之前的核近似模型相同,但只使用七个预测因子中的五个进行训练。对于每个模型,应用程序会显示使用了多少预测器。控件中的模型,单击模型窗格和咨询特征选择部份总结选项卡。

    除去这两个特征的模型与所有预测因子的模型表现相当。使用所有预测因子与只使用其中一个子集相比,模型的预测效果并不好。如果数据收集是昂贵的或困难的,您可能更喜欢一个没有一些预测器就能令人满意地执行的模型。

  16. 中选择模型模型窗格与最低验证RSME(最佳模型),并查看残差图。在回归的学习者选项卡,在情节和解释部分,单击箭头打开图库,然后单击残差(验证)验证结果组。残差图显示了预测响应和真实响应之间的差异。要将残差显示为折线图,请选择风格

    ,选择要在上绘图的变量x设在。选择真实反应、预测反应、记录数或其中一个预测因子。

    核近似模型的残差图

    通常,一个好的模型的残差大致对称地分布在0附近。如果你能在残差中看到任何清晰的模式,你很可能可以改进你的模型。

  17. 你可以尝试进一步改进最好的模型模型窗格,通过更改其超参数。首先,复制模型。在回归的学习者选项卡,在模型部分中,点击重复的

    然后,在总结,尝试更改一些超参数设置,如核尺度参数或正则化强度。通过单击来训练新模型火车都并选择选择火车

    要了解有关核近似模型设置的更多信息,请参见核逼近模型

  18. 您可以将经过训练的模型的紧凑版本导出到工作区。在回归的学习者选项卡,在出口部分中,点击出口模式选择其中之一出口模式出口紧凑型.请注意,任何一种选择都导出训练模型的紧凑版本,因为核近似模型不存储训练数据。看到导出回归模型预测新数据

  19. 要查看用于训练此模型的代码,请单击生成函数出口部分。

提示

使用相同的工作流来评估和比较您可以在回归学习器中训练的其他回归模型类型。

要训练所有可用于您的数据集的不可优化回归模型预置:

  1. 回归的学习者选项卡,在模型部分,单击箭头打开回归模型库。

  2. 开始组中,单击所有

    选择用于训练所有可用模型类型的选项

  3. 火车部分中,点击火车都并选择火车都

要了解其他回归模型类型,请参见在回归学习应用程序中训练回归模型

另请参阅

|

相关的话题