回归学习应用中的超参数优化
在选择要训练的特定类型的模型(例如决策树或支持向量机)之后,可以通过选择不同的高级选项来优化模型。万博1manbetx例如,您可以更改决策树的最小叶大小或支持向量机的框约束。其中一些选项是模型的内部参数,或超参数,它们会强烈影响模型的性能。您可以在Regression Learner应用程序中使用超参数优化来自动选择超参数值,而不是手动选择这些选项。对于给定的模型类型,应用程序通过使用一种寻求最小化模型均方误差(MSE)的优化方案尝试不同的超参数值组合,并返回具有优化超参数的模型。您可以像使用任何其他训练过的模型一样使用得到的模型。
请注意
因为超参数优化可能导致模型过度拟合,推荐的方法是在将数据导入Regression Learner应用程序之前创建一个单独的测试集。在训练可优化模型之后,可以看到它在测试集上的表现。示例请参见在回归学习软件中使用超参数优化训练回归模型.
要在Regression Learner中执行超参数优化,请遵循以下步骤:
选择要优化的超参数
在回归学习者应用中,在模型部份回归的学习者选项卡,单击箭头打开图库。该库包括可优化的模型,您可以使用超参数优化训练。
选择可优化模型之后,可以选择要优化的超参数。在模型中总结选项卡,在模型Hyperparameters部分中,选择优化选中要优化的超参数的复选框。下值,为不希望优化或不可优化的超参数指定固定值。
该表描述了可针对每种类型的模型优化的超参数以及每个超参数的搜索范围。它还包括可以为其指定固定值的附加超参数。
模型 | Optimizable Hyperparameters | 额外Hyperparameters | 笔记 |
---|---|---|---|
Optimizable树 |
|
|
有关更多信息,请参见回归树模型超参数选项. |
Optimizable支持向量机 |
|
有关更多信息,请参见支持向量机模型超参数选项. |
|
Optimizable探地雷达 |
|
|
有关更多信息,请参见高斯过程回归模型超参数选项. |
Optimizable合奏 |
|
有关更多信息,请参见集合模型超参数选项. |
|
可优化神经网络 |
|
|
有关更多信息,请参见神经网络模型超参数选项. |
优化选项
默认情况下,回归学习者应用程序使用贝叶斯优化执行超参数调优。贝叶斯优化的目标,以及一般的优化,是找到一个最小化目标函数的点。在应用程序的超参数调优上下文中,点是一组超参数值,目标函数是损失函数,或均方误差(MSE)。有关贝叶斯优化基础知识的更多信息,请参见贝叶斯优化工作流.
您可以指定如何执行超参数调优。例如,您可以将优化方法更改为网格搜索或限制训练时间。在回归的学习者选项卡,在选项部分中,点击优化器.该应用程序打开一个对话框,你可以在其中选择优化选项。
做出选择后,单击保存并应用.中的所有草稿可优化模型模型窗格,并将应用于使用图库创建的新的可优化模型模型部份回归的学习者选项卡。
要为单个可优化模型指定优化选项,请在训练模型之前打开并编辑模型摘要。中单击模型模型窗格。该模型总结TAB包含一个可编辑项优化器部分。
该表描述了可用的优化选项及其默认值。
选项 | 描述 |
---|---|
优化器 | 优化器的值是:
|
获取函数 | 当应用程序对超参数调优执行贝叶斯优化时,它使用采集函数来确定下一组要尝试的超参数值。 采集函数值为:
有关这些获取函数如何在贝叶斯优化上下文中工作的详细信息,请参见采集功能类型. |
迭代 | 每次迭代都对应于应用程序尝试的超参数值的组合。当您使用贝叶斯优化或随机搜索时,请指定一个设置迭代次数的正整数。默认值为 当你使用网格搜索时,应用程序会忽略迭代值并计算整个网格中每一点的损失。您可以设置一个训练时间限制,以过早地停止优化过程。 |
培训时间限制 | 若要设置培训时间限制,请选择此选项并设置以秒为单位的最大训练时间选择。默认情况下,该应用程序没有训练时间限制。 |
以秒为单位的最大训练时间 | 将训练时间限制设置为正实数,单位为秒。默认值为300 .运行时间可以超过训练时间限制,因为这个限制不会中断迭代评估。 |
网格划分数 | 当你使用网格搜索时,设置一个正整数作为应用程序尝试为每个数字超参数的值的数量。应用程序忽略了分类超参数的这个值。默认值为10 . |
最小MSE图
在指定要优化的模型超参数并设置任何其他优化选项(可选)之后,训练可优化模型。在回归的学习者选项卡,在火车部分中,点击火车都并选择选择火车.该应用程序创建一个最小MSE图它会随着优化的运行而更新。
最小均方误差(MSE)图显示以下信息:
估计最小MSE-每个浅蓝色点对应优化过程在考虑到目前为止尝试的所有超参数值集(包括当前迭代)时计算出的最小MSE的估计。
该估计基于当前MSE目标模型的上置信区间,如中所述Bestpoint hyperparameters描述。
如果你使用网格搜索或随机搜索来执行超参数优化,应用程序不会显示这些浅蓝色的点。
观测到的最小均方误差-每个深蓝色点对应优化过程计算到目前为止观察到的最小MSE。例如,在第三次迭代中,蓝色的点对应于在第一次、第二次和第三次迭代中观察到的MSE的最小值。
Bestpoint hyperparameters—红色方格表示优化后的超参数对应的迭代。您可以在下面的图的右上角找到已优化的超参数的值优化结果.
优化后的超参数并不总是提供观测到的最小均方误差。当应用程序使用贝叶斯优化执行超参数调优(参见优化选项简单介绍一下),它选择最小化MSE目标模型的上置信区间的超参数值集,而不是最小化MSE的超参数值集。有关更多信息,请参见
“标准”、“min-visited-upper-confidence-interval”
的名值参数bestPoint
.最小误差超参数-黄点表示对应于产生观测到的最小MSE的超参数的迭代。
有关更多信息,请参见
“标准”、“min-observed”
的名值参数bestPoint
.如果使用网格搜索执行超参数优化,则Bestpoint hyperparameters和最小误差超参数都是一样的。
情节中缺失的点对应于南
最小MSE值。
优化结果
当应用程序完成模型超参数的调优时,它返回一个用优化的超参数值训练的模型(Bestpoint hyperparameters).模型指标、显示图和导出模型对应于这个训练过的具有固定超参数值的模型。
中选择模型以检查经过训练的可优化模型的优化结果模型窗格并查看模型总结选项卡。
的总结TAB包含以下部分:
培训结果—显示可优化模型的性能。看到在“摘要”选项卡和“模型”窗格中查看模型统计信息.
模型Hyperparameters-显示可优化模型的类型,并列出任何固定的超参数值
优化Hyperparameters—列出优化后的超参数值
超参数搜索范围—显示优化后的超参数的搜索范围
优化器—显示所选优化器选项
当您使用贝叶斯优化执行超参数调优并将经过训练的可优化模型作为结构导出到工作空间时,该结构包含一个BayesianOptimization
对象中的HyperParameterOptimizationResult
字段。该对象包含在应用程序中执行的优化结果。
当你生成MATLAB时®代码来自一个经过训练的可优化模型,生成的代码使用模型的固定和优化的超参数值在新数据上进行训练。生成的代码不包括优化过程。有关如何在使用拟合函数时执行贝叶斯优化的信息,请参见利用拟合函数的贝叶斯优化.