Desarrollo y evaluación de modelos
Al desarrollar un model de clasificación预测的高质量,重要的选择的las características (o predictores)正确的y ajustar los hiperparámetros (parámetros del modelo que no se han estimado)。
La selección de características y el ajuste delos hiperparámetros pueden arrojar变异模型。Puede比较las tasas de errors de clasificación dek迭代,曲线ROC, por sus siglas en inglés) o las matrices de confusión entre los modelos。También puede realizar una prueba estadística para detectar si un modelo de clasificación超级重要的外星人。
Para extrer nuevas características antes de entrenar un modelo de clasificación,效用gencfeatures
.
Para desarrollar y评估模型clasificación形式上的交互,应用程序分类学习者.
Para seleccionar automáticamente un modelo con hiperparámetros ajustados, utilicefitcauto
.Esta función prueba una selección de tipos de modelos de clasificación con valores en los hiperparámetros y deuelve un modelo final que se prevé que funcione bien con los nuevos datos。Utilicefitcauto
在SUS数据中没有sepa con seguridad和tipo的分类。
Para ajustar los hiperparámetros de un modelo concrete, seleccione los valores hiperparámetros y realice una validación cruzada del modelo con dichos valores。Por ejemplo, para ajustar un modelo SVM, elija un conjunto de restricciones de cajas y escalas de kernel y, después, realice una validación cruzada de modelo para cada par de valores。Determinadas funciones de clasificación de Statistics and Machine Learning Toolbox™ofrecen un ajuste automático de los hiperparámetros mediante optimización bayesiana, búsqueda por cuadrículas o búsqueda aleatoria。bayesopt
, la función主要para implementar la optimización bayesiana, es también灵活的para muchas otras aplicaciones。Consulte贝叶斯优化流程.
Para interpretar un modelo de clasificación, puede utilzar石灰
,沙普利
yplotPartialDependence
.
应用程序
分类学习者 | 机器学习管理的先验模型和分类数据 |
一些必要
Objetos
Propiedades
ConfusionMatrixChart属性 | 混淆矩阵图表外观和行为 |
ROCCurve属性 | 受试者工作特征(ROC)曲线的外观和行为 |
特马
应用分类学习器
- 在分类学习App中训练分类模型
用于训练、比较和改进分类模型的工作流,包括自动、手动和并行训练。 - 分类学习中分类器性能的可视化和评估
比较模型精度分数,通过绘制类预测来可视化结果,并在混淆矩阵中检查每个类的性能。 - 使用分类学习App进行特征选择和特征转换
使用图或特征排序算法识别有用的预测因子,选择要包含的特征,并使用分类学习器中的PCA转换特征。
Selección de características
- 特征选择简介
了解特征选择算法,并探索可用于特征选择的功能。 - 顺序特征选择
本主题介绍了顺序特征选择,并提供了使用自定义标准和顺序选择特征的示例sequentialfs
函数。 - 邻域成分分析(NCA)特征选择
邻域成分分析(NCA)是一种以最大化回归和分类算法预测精度为目标的特征选择的非参数方法。 - 调整正则化参数,使用NCA进行分类
这个例子展示了如何调优正则化参数fscnca
使用交叉验证。 - 正则化判别分析分类器
在不影响模型预测能力的情况下,通过删除预测器来创建更健壮、更简单的模型。 - 选择分类高维数据的特征
这个例子展示了如何选择特征来分类高维数据。
Ingeniería de características
- 分类自动化特征工程
使用gencfeatures
在训练分类模型之前设计新特征。在对新数据进行预测之前,对新数据集应用相同的特征转换。
Selección自动模型
- 自动分类器选择贝叶斯和ASHA优化
使用fitcauto
给出训练预测器和响应数据,自动尝试选择具有不同超参数值的分类模型类型。
Optimización de hiperparámetros
- 贝叶斯优化流程
使用拟合函数或调用来执行贝叶斯优化bayesopt
直接。 - 贝叶斯优化的变量
为贝叶斯优化创建变量。 - 贝叶斯优化目标函数
创建贝叶斯优化的目标函数。 - 贝叶斯优化中的约束
为贝叶斯优化设置不同类型的约束。 - 使用bayesopt优化交叉验证分类器
使用贝叶斯优化最小化交叉验证损失。 - 使用贝叶斯优化优化分类器拟合
使交叉验证损失最小化OptimizeParameters
拟合函数中的名称-值参数。 - 贝叶斯优化图函数
可视化地监视贝叶斯优化。 - 贝叶斯优化输出函数
监视贝叶斯优化。 - 贝叶斯优化算法
理解贝叶斯优化的底层算法。 - 并行贝叶斯优化
贝叶斯优化如何并行工作。
Interpretación de modelos
- 解释机器学习模型
解释模型预测石灰
而且沙普利
对象和plotPartialDependence
函数。 - 机器学习模型的Shapley值
使用两种算法计算机器学习模型的Shapley值:kernelSHAP和kernelSHAP的扩展。
Validacion cruzada
- 使用并行计算实现交叉验证
使用并行计算加速交叉验证。
Evaluación de la capacidad de la clasificación
- ROC曲线与绩效指标
使用rocmetrics
在测试数据集上检验分类算法的性能。 - perfcurve的性能曲线
了解如何perfcurve
函数计算受试者工作特征(ROC)曲线。