主要内容

CompactClassificationEnsemble

包:classreg.learning.classif

紧分类系综类

描述

分类集合(类的)的紧凑版本ClassificationEnsemble).精简版本不包括用于训练分类集成的数据。因此,您不能使用紧凑的分类集成执行某些任务,例如交叉验证。使用紧凑的分类集合对新数据进行预测(分类)。

建设

实体=紧凑(fullEns从一个完整的决策集成构造一个紧凑的决策集成。

输入参数

fullEns

由。创建的分类集合fitcensemble

属性

CategoricalPredictors

分类预测指标,指定为一个正整数向量。CategoricalPredictors包含与包含分类预测器的预测器数据列对应的索引值。如果没有任何预测器是绝对的,则此属性为空([]).

一会

中的元素列表Y删除了重复项。一会可以是数字向量、类别变量的向量、逻辑向量、字符数组或字符向量的单元格数组。一会是否与参数中的数据具有相同的数据类型Y(该软件将字符串数组视为字符向量的单元格数组。)

CombineWeights

描述如何实体结合弱学习权重,也可以结合“WeightedSum”“WeightedAverage”

成本

方阵,成本(i, j)将一个点分类的成本是多少j如果它真正的阶级是(行对应真实的类,列对应预测的类)。的行和列的顺序成本中类的顺序一会.中的行数和列数成本是响应中唯一类的数量。此属性是只读的。

ExpandedPredictorNames

扩展的预测器名称,存储为字符向量的单元格数组。

如果模型对分类变量使用编码,那么ExpandedPredictorNames包括描述扩展变量的名称。否则,ExpandedPredictorNames是一样的PredictorNames

NumTrained

受过训练的弱学习者的数量实体一个标量。

PredictorNames

预测器变量名称的单元格数组,按它们出现的顺序排列X

之前

每个类的先验概率的数字向量。元素的顺序之前中类的顺序一会.元素的数量之前是响应中唯一类的数量。此属性是只读的。

ResponseName

带有响应变量名称的字符向量Y

ScoreTransform

用于转换分数的函数句柄,或表示内置转换函数的字符向量。“没有”意味着没有转换;同样,“没有”意味着@ x (x).有关内置转换函数的列表和自定义转换函数的语法,请参见fitctree

添加或更改ScoreTransform函数使用点表示法:

ens.ScoreTransform = '函数

ens.ScoreTransform = @函数

训练有素的

训练的分类模型的细胞向量。

  • 如果方法“LogitBoost”“GentleBoost”,然后CompactClassificationEnsemble商店训练学习者jCompactRegressionLearner属性中存储的对象训练有素的{j.也就是说,接触训练有素的学习者j,使用ens.Trained {j}。CompactRegressionLearner

  • 否则,细胞向量的细胞包含相应的紧凑分类模型。

TrainedWeights

中弱学习者训练权值的数值向量实体TrainedWeightsT元素,T弱学习者的人数在多少学习者

UsePredForLearner

逻辑大小矩阵P——- - - - - -NumTrained,在那里P训练数据中预测器(列)的数量XUsePredForLearner (i, j)真正的当学习者j使用预测,是否则。对于每个学习者,预测器的顺序与训练数据中的列相同X

如果集合不是类型子空间,所有输入UsePredForLearner真正的

对象的功能

compareHoldout 使用新数据比较两个分类模型的准确性
边缘 分类的优势
石灰 局部可解释的模型不可知解释(LIME)
损失 分类错误
保证金 分类的利润率
partialDependence 计算部分依赖
plotPartialDependence 创建部分依赖图(PDP)和个人条件期望图(ICE)
预测 使用分类模型的集合对观测结果进行分类
predictorImportance 决策树分类集成中预测器重要性的估计
removeLearners 删除紧凑分类集合的成员
沙普利 沙普利值

复制语义

价值。要了解值类如何影响复制操作,请参见复制对象

例子

全部折叠

创建一个紧凑的分类集合,有效地对新数据进行预测。

加载电离层数据集。

负载电离层

使用所有的测量值和AdaBoostM1方法。

Mdl = fitcensemble (X, Y,“方法”“AdaBoostM1”
Mdl = ClassificationEnsemble ResponseName: 'Y' CategoricalPredictors: [] ClassNames: {'b' ' 'g'} ScoreTransform: 'none' NumObservations: 351 NumTrained: 100 Method: 'AdaBoostM1' LearnerNames: {'Tree'} ReasonForTermination: '在完成请求的训练周期数后正常终止。'FitInfo描述:{2x1 cell}属性,方法

Mdl是一个ClassificationEnsemble模型对象,其中包含训练数据。

创建一个紧凑的版本Mdl

CMdl =紧凑(Mdl)
CMdl = CompactClassificationEnsemble ResponseName: 'Y' CategoricalPredictors: [] ClassNames: {'b' ' 'g'} ScoreTransform: 'none' NumTrained: 100属性,方法

CMdl是一个CompactClassificationEnsemble模型对象。CMdl几乎一样吗Mdl.一个例外是CMdl不存储训练数据。

比较所消耗的空间量MdlCMdl

mdlInfo =谁(“Mdl”);cMdlInfo =谁(“CMdl”);[mdlInfo。字节cMdlInfo.bytes]
ans =1×2878146 631686

MdlCMdl

CMdl。Trained储存经过训练的分类树(CompactClassificationTree模型对象)Mdl

显示紧凑型集成中的第一棵树的图。

视图(CMdl。训练有素的{1},“模式”“图”);

图分类树查看器包含一个轴和其他类型的uimenu, uicontrol对象。轴包含36个类型为line, text的对象。

默认情况下,fitcensemble种植浅的树木,以增强树木的整体效果。

预测的平均值的标签X使用紧凑的集成。

predMeanX =预测(CMdl,意味着(X))
predmeanx =1 x1单元阵列{' g '}

提示

对于分类树的集合训练有素的的属性实体存储一个ens.NumTrained紧凑分类模型的-by-1细胞向量。用于树的文本或图形显示t在细胞向量中,输入:

  • 视图(实体。训练有素的{t} .CompactRegressionLearner)用于使用LogitBoost或GentleBoost聚合的集成。

  • 视图(实体。训练有素的{t})用于所有其他聚合方法。

扩展功能

介绍了R2011a