决策树包
TreeBagger
袋子为分类或回归的决策树的集合。装袋代表引导聚合。合奏中的每棵树都在独立绘制的输入数据的自主绘制复制品上生长。此副本中未包含的观察是“从包中的”这棵树。
TreeBagger
依赖于ClassificationTree
和RegressionTree
种植个体树木的功能。特别是,ClassificationTree
和RegressionTree
接受为每个决策分割随机选择的特性数量作为可选输入参数。也就是说,TreeBagger
实现随机森林算法[1].
对于回归问题,TreeBagger
万博1manbetx支持均值和分位数回归(即分位数回归森林)[2])。
为了预测平均响应或估计给定数据的均方误差,通过TreeBagger
模型和数据到预测
要么错误
,分别。要对袋外观察执行类似的操作,请使用oobPredict
要么ooberror.
.
估计响应分布的定量或给定数据的定量误差,通过aTreeBagger
模型和数据到quantilePredict
要么quantileError
,分别。要对袋外观察执行类似的操作,请使用OOBQUANTILEPREDICT
要么oobQuantileError
.
TreeBagger | 创建决策树包 |
附加 |
添加新树到集合 |
紧凑的 |
决策树的紧凑型集合 |
错误 |
错误(错误分类概率或MSE) |
fillprox |
训练数据的接近矩阵 |
Growtees. |
训练额外的树,并添加到整体 |
保证金 |
分类保证金 |
mdsprox |
接近矩阵的多维尺度 |
meanMargin |
意思是分类保证金 |
ooberror. |
Out-of-bag错误 |
oobMargin |
Out-of-bag利润率 |
oobMeanMargin |
Out-of-bag意味着利润 |
oobPredict |
包外观测的集合预测 |
oobQuantileError |
袋子袋数丢失的袋子 |
OOBQUANTILEPREDICT |
从回归树的袋外观察的分位数预测 |
部分竞争 |
计算部分依赖 |
plotPartialDependence |
创建部分依赖图(PDP)和个人条件期望图(ICE) |
预测 |
使用袋装决策树的集合来预测响应 |
quantileError |
使用回归树的袋的分位数损失 |
quantilePredict |
使用袋子回归树预测响应量子 |
|
包含响应变量的类名的单元格数组 |
|
应计算指定是否应该计算用于训练观察的袋子预测的逻辑标志。默认值是 如果这面旗是
如果这面旗是
|
|
一个逻辑标志,指定是否应该计算变量重要性的包外估计。默认值是 如果这面旗是
|
|
方阵, 这个属性是:
|
|
返回的默认值
|
|
大小为1 × -的数字数组据nvar将分割标准的变化通过每个变量的分割进行求和,并在整个已长成的树木集合中取平均值。 |
|
随机选择的观察分数,用于替换每个引导副本。每个副本的大小是谈判× |
|
一个逻辑标志,指定与同一父级的决策树是否留下的拆分是不降低总风险的拆分。默认值是 |
|
树木使用的方法。可能的值是 |
|
每片树叶的最低观察次数。默认情况下, |
|
集合中等于决策树数目的标量值。 |
|
大小为1 × -的数字数组据nvar,其中每个元素给出了这个预测器上所有树的分割数。 |
|
为每个决策分裂随机选择的预测器或特征变量的数目。默认情况下, |
|
逻辑阵列大小谈判——- - - - - -NumTrees,在那里谈判训练数据中的观察数和NumTrees是集合中的树木数量。一种 |
|
大小数字数组谈判-1包含用于计算每次观察的禁止袋响应的树木数量。谈判为用于创建集合的训练数据中的观测数。 |
|
大小为1 × -的数字数组据nvar包含对每个预测变量(特征)的变量重要性的度量。对于任何一个变量,如果该变量的值在包外观察值中排列,则度量值是提高保证金的数量和降低保证金的数量之间的差异。对每棵树计算这个度量,然后在整个集合上取平均值,再除以整个集合上的标准差。对于回归树,此属性为空。 |
|
大小为1 × -的数字数组据nvar包含每个预测变量(特征)的重要性度量。对于任何一个变量,如果该变量的值是在袋子外的观察值中排列的,则度量是预测误差的增加。对每棵树计算这个度量,然后在整个集合上取平均值,再除以整个集合上的标准差。 |
|
大小为1 × -的数字数组据nvar包含每个预测变量(特征)的重要性度量。对于任何变量,如果该变量的值在包外观察值中排列,则度量是分类边际的减少。对每棵树计算这个度量,然后在整个集合上取平均值,再除以整个集合上的标准差。对于回归树,此属性为空。 |
|
有大小的数字数组谈判1,谈判为训练数据中的观测数,包含每个观测值的离群值。 |
|
每个类的先验概率的数字向量。元素的顺序 这个属性是:
|
|
有大小的数字矩阵谈判——- - - - - -谈判,在那里谈判为训练数据中的观测数,包含观测值之间的接近度度量值。对于任意两个观测值,它们的接近度定义为这些观测值落在同一片叶子上的树木的比例。这是一个对称矩阵,对角线和非对角线上的元素从0到1都有1s。 |
|
的 |
|
一个逻辑标志,指定是否对每个具有替换的决策树进行数据采样。此属性 |
|
|
|
大小相同的单元格数组NumTrees-by-1包含集合中的树。 |
|
大小矩阵据nvar——- - - - - -据nvar通过变量关联的预测措施,对整个成年树木进行平均。如果你增加了布景 |
|
包含预测器变量的名称(特征)的单元格数组。 |
|
长度权值的数值向量谈判,在那里谈判为训练数据中的观察数(行)。 |
|
有大小的表格或数字矩阵谈判——- - - - - -据nvar,在那里谈判观察数(行数)和据nvar是培训数据中的变量(列)的数量。如果您使用预测值的表培训集合,那么 |
|
一个大小谈判响应数据数组。的元素 |
价值。要了解这会如何影响您对类的使用,请参阅比较句柄类和值类在MATLAB®面向对象编程的文档。
对于一个TreeBagger
模型对象B
,树
属性存储的单元格向量B.numtrees.
CompactClassificationTree.
要么Compactregressiontree.
模型对象。用于树的文本或图形显示t
在细胞载体中,输入
视图(B.Trees {t})
Statistics and Machine Learning Toolbox™提供了三种对象用于套袋和随机森林:
回归释迦缩短
由...制作fitrensemble.
为回归
TreeBagger
由...制作TreeBagger
用于分类和回归
详细了解两者的区别TreeBagger
和袋装合奏(ClassificationBaggedEnsemble
和回归释迦缩短
),看套袋式和套袋式的比较.
[1] Breiman, L。“随机森林。”机器学习45,pp。5-32,2001。
[2] Meinshausen, N.“分位数回归森林”机器学习研究杂志,第7卷,2006年,第983-999页。