主要内容

La traducción de esta página aún没有se ha actualizado a La versión más reciente。Haga clic aquí para ver la última versión en inglés。

Desarrollo y evaluación de modelos

Seleccion de caracteristicas ingenieria de caracteristicas Seleccion de莫德罗optimizacion de hiperparametros validacion cruzada, evaluacion de la capacidad predictiva y de las clasificaciones功能de comparacion de la精度

Al desarrollar un model de clasificación预测的高质量,重要的选择的las características (o predictores)正确的y ajustar los hiperparámetros (parámetros del modelo que no se han estimado)。

La selección de características y el ajuste delos hiperparámetros pueden arrojar变异模型。Puede比较las tasas de errors de clasificación dek迭代,曲线ROC, por sus siglas en inglés) o las matrices de confusión entre los modelos。También puede realizar una prueba estadística para detectar si un modelo de clasificación超级重要的外星人。

Para extrer nuevas características antes de entrenar un modelo de clasificación,效用gencfeatures

Para desarrollar y评估模型clasificación形式上的交互,应用程序分类学习者

Para seleccionar automáticamente un modelo con hiperparámetros ajustados, utilicefitcauto.Esta función prueba una selección de tipos de modelos de clasificación con valores en los hiperparámetros y deuelve un modelo final que se prevé que funcione bien con los nuevos datos。Utilicefitcauto在SUS数据中没有sepa con seguridad和tipo的分类。

Para ajustar los hiperparámetros de un modelo concrete, seleccione los valores hiperparámetros y realice una validación cruzada del modelo con dichos valores。Por ejemplo, para ajustar un modelo SVM, elija un conjunto de restricciones de cajas y escalas de kernel y, después, realice una validación cruzada de modelo para cada par de valores。Determinadas funciones de clasificación de Statistics and Machine Learning Toolbox™ofrecen un ajuste automático de los hiperparámetros mediante optimización bayesiana, búsqueda por cuadrículas o búsqueda aleatoria。bayesopt, la función主要para implementar la optimización bayesiana, es también灵活的para muchas otras aplicaciones。Consulte贝叶斯优化流程

Para interpretar un modelo de clasificación, puede utilzar石灰沙普利yplotPartialDependence

应用程序

分类学习者 机器学习管理的先验模型和分类数据

一些必要

expandir待办事项

fscchi2 使用卡方检验进行单变量特征排序分类
fscmrmr 采用最小冗余最大相关性(MRMR)算法对特征进行分类排序
fscnca 使用邻域成分分析进行特征选择分类
oobPermutedPredictorImportance 通过对随机森林分类树的袋外预测器观测的排列估计预测器重要性
predictorImportance 分类树预测因子重要性的估计
predictorImportance 决策树分类集合中预测因子重要性的估计
sequentialfs 使用自定义标准的顺序特征选择
relieff 使用ReliefF或RReliefF算法对预测因子的重要性进行排序
gencfeatures 执行自动特征工程进行分类
描述 描述生成的特性
变换 使用生成的特征转换新数据
fitcauto 利用优化的超参数自动选择分类模型
bayesopt 使用贝叶斯优化选择最优的机器学习超参数
hyperparameters 优化拟合函数的变量描述
optimizableVariable 变量描述bayesopt或其他优化器
crossval 使用交叉验证估计损失
cvpartition 为交叉验证划分数据
重新分区 重新划分数据以进行交叉验证
测验 交叉验证的测试指标
培训 交叉验证的训练指标

本地可解释的模型独立解释(LIME, por sus siglas en inglés)

石灰 局部可解释模型不可知解释(LIME)
适合 局部可解释模型不可知解释(LIME)拟合简单模型
情节 局部可解释模型不可知解释(LIME)的图结果

Valores de Shapley

沙普利 沙普利值
适合 计算查询点的Shapley值
情节 Plot Shapley价值观

Dependencia parcial

partialDependence 计算部分依赖关系
plotPartialDependence 创建部分依赖图(PDP)和个别条件期望图(ICE)

Matriz de confusión

confusionchart 为分类问题创建混淆矩阵图
confusionmat 计算分类问题的混淆矩阵

曲线característica操作受体(ROC)

rocmetrics 二元和多类分类器的接收者工作特征(ROC)曲线和性能指标
addMetrics 计算额外的分类性能指标
平均 计算多类问题中平均受试者工作特征(ROC)曲线的性能指标
情节 绘制受试者工作特征(ROC)曲线和其他性能曲线
perfcurve 接收者工作特征(ROC)曲线或分类器输出的其他性能曲线
testcholdout 比较两种分类模型的预测精度
testckfold 通过重复交叉验证比较两种分类模型的准确性

Objetos

expandir待办事项

FeatureSelectionNCAClassification 基于邻域成分分析(NCA)的分类特征选择
FeatureTransformer 生成的特征转换
BayesianOptimization 贝叶斯优化结果

Propiedades

ConfusionMatrixChart属性 混淆矩阵图表外观和行为
ROCCurve属性 受试者工作特征(ROC)曲线的外观和行为

特马

应用分类学习器

Selección de características

Ingeniería de características

  • 分类自动化特征工程
    使用gencfeatures在训练分类模型之前设计新特征。在对新数据进行预测之前,对新数据集应用相同的特征转换。

Selección自动模型

Optimización de hiperparámetros

Interpretación de modelos

Validacion cruzada

Evaluación de la capacidad de la clasificación