决策树包
TreeBagger
将决策树集合用于分类或回归。Bagging代表引导聚合。集合中的每棵树都是在输入数据的独立绘制的引导副本上生长的。不包括在这个副本中的观察结果对于这个树来说是“out of bag”。
TreeBagger
依赖于ClassificationTree
和RegressionTree
生长单独的树的功能。特别是,ClassificationTree
和RegressionTree
接受为每个决策分割随机选择的特性数量作为可选输入参数。也就是说,TreeBagger
实现随机森林算法[1].
对于回归问题,TreeBagger
万博1manbetx支持均值和分位数回归(即分位数回归森林)[2]).
为了预测平均响应或估计给定数据的均方误差,通过TreeBagger
模型和数据预测
或错误
,分别。要对袋外观察执行类似的操作,请使用oobPredict
或oobError
.
为了估计响应分布的分位数或给定数据的分位数误差,通过aTreeBagger
模型和数据quantilePredict
或quantileError
,分别。要对袋外观察执行类似的操作,请使用oobQuantilePredict
或oobQuantileError
.
TreeBagger | 创建决策树包 |
附加 |
添加新树到集合 |
紧凑的 |
决策树的紧凑集成 |
错误 |
误差(误分类概率或MSE) |
fillprox |
训练数据的接近矩阵 |
growTrees |
训练额外的树,并添加到整体 |
保证金 |
分类保证金 |
mdsprox |
接近矩阵的多维尺度 |
meanMargin |
意思是分类保证金 |
oobError |
Out-of-bag错误 |
oobMargin |
Out-of-bag利润率 |
oobMeanMargin |
Out-of-bag意味着利润 |
oobPredict |
包外观测的集合预测 |
oobQuantileError |
回归树袋外分位数损失 |
oobQuantilePredict |
从回归树的袋外观察的分位数预测 |
partialDependence |
计算部分依赖 |
plotPartialDependence |
创建部分依赖图(PDP)和个人条件期望图(ICE) |
预测 |
使用袋装决策树预测响应 |
quantileError |
使用回归树的袋的分位数损失 |
quantilePredict |
预测响应分位数使用袋回归树 |
|
包含响应变量的类名的单元格数组 |
|
一个逻辑标志,指定是否应该计算训练观察的包外预测。默认值是 如果这面旗是
如果这面旗是
|
|
一个逻辑标志,指定是否应该计算变量重要性的包外估计。默认值是 如果这面旗是
|
|
方阵, 这个属性是:
|
|
返回的默认值
|
|
大小为1 × -的数字数组据nvar将分割标准的变化通过每个变量的分割进行求和,并在整个已长成的树木集合中取平均值。 |
|
随机选择的观察结果的一部分,并替换每个引导副本。每个副本的大小为脑袋× |
|
对于不降低总风险的拆分,是否合并具有相同父类的决策树叶子的逻辑标志。默认值为 |
|
树木使用的方法。可能的值是 |
|
每片树叶的最低观察次数。默认情况下, |
|
集合中等于决策树数目的标量值。 |
|
大小为1 × -的数字数组据nvar,其中每个元素给出了这个预测器上所有树的分割数。 |
|
为每个决策分裂随机选择的预测器或特征变量的数目。默认情况下, |
|
逻辑阵列大小脑袋——- - - - - -NumTrees,在那里脑袋训练数据中的观察数和NumTrees为集合中树的数量。一个 |
|
大小数字数组脑袋-by-1包含用于计算每次观测的袋外响应的树的数量。脑袋为用于创建集合的训练数据中的观测数。 |
|
大小为1 × -的数字数组据nvar包含对每个预测变量(特征)的变量重要性的度量。对于任何一个变量,如果该变量的值在包外观察值中排列,则度量值是提高保证金的数量和降低保证金的数量之间的差异。对每棵树计算这个度量,然后在整个集合上取平均值,再除以整个集合上的标准差。对于回归树,此属性为空。 |
|
大小为1 × -的数字数组据nvar包含每个预测变量(特征)的重要性度量。对于任何一个变量,如果该变量的值是在袋子外的观察值中排列的,则度量是预测误差的增加。对每棵树计算这个度量,然后在整个集合上取平均值,再除以整个集合上的标准差。 |
|
大小为1 × -的数字数组据nvar包含每个预测变量(特征)的重要性度量。对于任何变量,如果该变量的值在包外观察值中排列,则度量是分类边际的减少。对每棵树计算这个度量,然后在整个集合上取平均值,再除以整个集合上的标准差。对于回归树,此属性为空。 |
|
有大小的数字数组脑袋1,脑袋为训练数据中的观测数,包含每个观测值的离群值。 |
|
每个类的先验概率的数字向量。元素的顺序 这个属性是:
|
|
有大小的数字矩阵脑袋——- - - - - -脑袋,在那里脑袋为训练数据中的观测数,包含观测值之间的接近度度量值。对于任意两个观测值,它们的接近度定义为这些观测值落在同一片叶子上的树木的比例。这是一个对称矩阵,对角线和非对角线上的元素从0到1都有1s。 |
|
的 |
|
一个逻辑标志,指定是否对每个具有替换的决策树进行数据采样。此属性 |
|
|
|
大小相同的单元格数组NumTrees-by-1包含集合中的树。 |
|
大小矩阵据nvar——- - - - - -据nvar通过变量关联的预测措施,对整个成年树木进行平均。如果你增加了布景 |
|
包含预测变量(特性)名称的单元格数组。 |
|
长度权值的数值向量脑袋,在那里脑袋为训练数据中的观察数(行)。 |
|
有大小的表格或数字矩阵脑袋——- - - - - -据nvar,在那里脑袋观察数(行数)和据nvar为训练数据中变量(列)的个数。如果你用一个预测值表来训练集合,那么 |
|
一个大小脑袋响应数据数组。的元素 |
价值。要了解这如何影响您对类的使用,请参见比较句柄类和值类在MATLAB®面向对象编程的文档。
对于一个TreeBagger
模型对象B
,树
属性存储的单元格向量B.NumTrees
CompactClassificationTree
或CompactRegressionTree
模型对象。用于树的文本或图形显示t
在细胞载体中,输入
视图(B。树木{t})
Statistics and Machine Learning Toolbox™提供了三种对象用于套袋和随机森林:
详细了解两者的区别TreeBagger
以及袋装套装(ClassificationBaggedEnsemble
和RegressionBaggedEnsemble
),看套袋式和套袋式的比较.
[1] Breiman, L。随机森林。机器学习45,pp. 5-32, 2001。
[2] Meinshausen, N.“分位数回归森林”机器学习研究杂志,第7卷,2006年,第983-999页。