主要内容

CompactTreeBagger类

由自举聚合生长的决策树的紧凑集成

描述

CompactTreeBagger类是一个轻量级类,它包含使用TreeBaggerCompactTreeBagger没有保存任何关于如何TreeBagger种植决策树。它不包含用于树木生长的输入数据,也不包含训练参数,如最小叶子大小或为每个随机决策分裂所采样的变量数量。你只能使用CompactTreeBagger用于预测给定新数据的训练集合的响应X,及其他相关功能。

CompactTreeBagger允许您将训练过的集成保存到磁盘,或以任何其他方式使用它,同时丢弃与预测完全成熟的集成的响应无关的训练数据和训练配置的各种参数。这减少了存储和内存需求,特别是对于在大型数据集上训练的集成。

建设

CompactTreeBagger 创建CompactTreeBagger对象

CMdl=紧凑(Mdl的紧凑版本Mdl,一个TreeBagger模型对象。你可以用CMdl就像你可以用的那样Mdl.然而,由于CMdl如果不包含训练数据,则无法执行某些操作,例如使用oobPredict

对象的功能

结合 结合两个乐团
错误 误差(误分类概率或MSE)
保证金 分类保证金
mdsprox 接近矩阵的多维尺度
meanMargin 意思是分类保证金
outlierMeasure 数据的离群值测量
partialDependence 计算部分依赖
plotPartialDependence 创建部分依赖图(PDP)和个人条件期望图(ICE)
预测 使用袋装决策树预测响应
接近 数据邻近矩阵
setDefaultYfit 设置默认值预测

属性

一会

一会属性是包含响应变量的类名的单元格数组Y提供给TreeBagger.对于回归树,此属性为空。

DefaultYfit

DefaultYfit属性控制预测值CompactTreeBagger当无法进行预测时返回,例如预测方法需要对通过提供的矩阵中只有假值的观测进行预测“useifort”论点。

对于分类,可以将此属性设置为''“MostPopular”.如果你选择“MostPopular”(默认),属性值将成为训练数据中最可能的类的名称。

对于回归,可以将此属性设置为任何数值标量。默认值是训练数据响应的平均值。

DeltaCriterionDecisionSplit

DeltaCriterionDecisionSplit属性是大小为1 × -的数字数组据nvar将分割标准的变化通过每个变量的分割进行求和,并在整个已长成的树木集合中取平均值。

方法

方法属性是“分类”用于分类集合和“回归”回归集合体。

NumPredictorSplit

NumPredictorSplit属性是大小为1 × -的数字数组据nvar,其中每个元素给出了这个预测器上所有树的分割数。

NumTrees

NumTrees属性是等于集合中决策树数量的标量。

PredictorNames

PredictorNames属性是包含预测变量(特性)名称的单元格数组。这些名字取自可选的“名字”提供给TreeBagger.默认名称为x1的“x2”等。

SurrogateAssociation

SurrogateAssociation属性是一个大小矩阵据nvar——- - - - - -据nvar通过变量关联的预测措施,对整个成年树木进行平均。如果你增加了布景“代孕”“上”,每个树的这个矩阵都填充了代理分割上平均的关联预测度量。如果你增加了布景“代孕”“关闭”(默认),SurrogateAssociation是斜的。

属性是具有大小的单元格数组NumTrees-by-1包含集合中的树。

例子

全部折叠

创建一个紧凑的树袋,有效地对新数据进行预测。

加载电离层数据集。

负载电离层

训练一袋100棵分类树使用所有的测量和AdaBoostM1方法。

Mdl = TreeBagger (100 X, Y,“方法”“分类”
Mdl = TreeBagger合奏与100袋装决策树:训练X: [351 x34]培训Y: [351 x1)方法:分类NumPredictors: 34 NumPredictorsToSample: 6 MinLeafSize: 1 InBagFraction: 1 SampleWithReplacement: 1 ComputeOOBPrediction: 0 ComputeOOBPredictorImportance: 0距离:[]一会:“b”“g”属性,方法

Mdl是一个TreeBagger模型对象,其中包含训练数据。

创建一个紧凑的版本Mdl

CMdl =紧凑(Mdl)
CMdl = CompactTreeBagger集合与100袋决策树:方法:分类NumPredictors: 34 ClassNames: 'b' ' 'g'属性,方法

CMdl是一个CompactTreeBagger模型对象。CMdl几乎一样吗Mdl.一个例外是它不存储训练数据。

比较所消耗的空间量MdlCMdl

mdlInfo =谁(“Mdl”);cMdlInfo =谁(“CMdl”);[mdlInfo。字节cMdlInfo.bytes]
ans =1×21115742 976936

MdlCMdl

CMdl。树储存经过训练的分类树(CompactClassificationTree模型对象)Mdl

在紧凑模型中显示第一棵树的图。

视图(CMdl。{1},“模式”“图”);

图分类树查看器包含一个轴和其他类型的uimenu, uicontrol对象。轴包含60个类型为line, text的对象。

默认情况下,TreeBagger深树生长。

预测的平均值的标签X使用紧凑的集成。

predMeanX =预测(CMdl,意味着(X))
predMeanX =1 x1单元阵列{' g '}

复制语义

价值。要了解这如何影响您对类的使用,请参见比较句柄类和值类在MATLAB®面向对象编程的文档。

提示

的属性CMdl存储的细胞载体CMdl。NumTreesCompactClassificationTreeCompactRegressionTree模型对象。用于树的文本或图形显示t在细胞载体中,输入

视图(CMdl。树木{t})