TreeBagger类
决策树的袋子
描述
TreeBagger
打包用于分类或回归的决策树集合。Bagging代表自举聚合。集成中的每棵树都是在输入数据的独立自举副本上生长的。没有包含在这个副本中的观察结果是“out of bag”。
TreeBagger
依赖于ClassificationTree
而且RegressionTree
用于生长单个树的功能。特别是,ClassificationTree
而且RegressionTree
接受为每个决策分割随机选择的特征数量作为可选输入参数。也就是说,TreeBagger
实现随机森林算法[1].
对于回归问题,TreeBagger
万博1manbetx支持均值和分位数回归(即分位数回归森林)[2]).
为了预测平均响应或估计给定数据的均方误差,传递a
TreeBagger
模型和数据预测
或错误
,分别。若要对袋外观察执行类似操作,请使用oobPredict
或oobError
.为了估计响应分布的分位数或给定数据的分位数误差,传递a
TreeBagger
模型和数据quantilePredict
或quantileError
,分别。若要对袋外观察执行类似操作,请使用oobQuantilePredict
或oobQuantileError
.
建设
TreeBagger | 创建决策树包 |
对象的功能
附加 |
添加新树到集合 |
紧凑的 |
决策树的紧凑集合 |
错误 |
错误(错误分类概率或MSE) |
fillprox |
训练数据的接近矩阵 |
growTrees |
训练额外的树,并添加到集合 |
保证金 |
分类保证金 |
mdsprox |
接近矩阵的多维尺度 |
meanMargin |
平均分类裕度 |
oobError |
Out-of-bag错误 |
oobMargin |
Out-of-bag利润率 |
oobMeanMargin |
袋外平均边际 |
oobPredict |
袋外观测的集合预测 |
oobQuantileError |
回归树的袋外分位数损失 |
oobQuantilePredict |
从袋回归树的袋外观测的分位数预测 |
partialDependence |
计算部分依赖关系 |
plotPartialDependence |
创建部分依赖图(PDP)和个别条件期望图(ICE) |
预测 |
使用袋装决策树的集合预测响应 |
quantileError |
分位数损失使用袋回归树 |
quantilePredict |
使用回归树袋预测响应分位数 |
属性
|
包含响应变量类名的单元格数组 |
|
一个逻辑标志,指定是否应计算训练观察结果的袋外预测。默认为 如果这个标志是
如果这个标志是
|
|
一个逻辑标志,指定是否应计算可变重要性的袋外估计。默认为 如果这个标志是
|
|
方阵,其中 这个属性是:
|
|
返回的默认值
|
|
大小为1 × -的数值数组据nvar对每个变量的分割条件的变化求和,在整个已生长的树的整体上平均。 |
|
对每个自举副本进行替换后随机选择的观察值的百分比。每个复制品的大小是脑袋× |
|
一个逻辑标志,指定是否合并具有相同父结点的决策树叶子,以用于不能降低总风险的分割。默认值为 |
|
树木使用的方法。可能的值为 |
|
每片树叶的最小观测次数。默认情况下, |
|
等于集合中决策树数量的标量值。 |
|
大小为1 × -的数值数组据nvar,其中每个元素在这个预测器上给出对所有树求和的分割数。 |
|
为每个决策分割随机选择的预测变量或特征变量的数量。默认情况下, |
|
大小的逻辑数组脑袋——- - - - - -NumTrees,在那里脑袋训练数据中的观察次数和NumTrees是集合中树的数量。一个 |
|
大小的数值数组脑袋-by-1,包含用于计算每个观测结果的out-of-bag响应的树的数量。脑袋是用于创建集合的训练数据中的观测数。 |
|
大小为1 × -的数值数组据nvar包含每个预测变量(特征)的变量重要性的度量。对于任何变量,如果该变量的值在袋外观测值中排列,则度量值是提高边际数与降低边际数之间的差值。对每棵树进行测量,然后对整个集合进行平均,并除以整个集合的标准偏差。对于回归树,此属性为空。 |
|
大小为1 × -的数值数组据nvar包含每个预测变量(特征)的重要性度量。对于任何变量,度量的是预测误差的增加,如果该变量的值在袋外观测中被打乱。对每棵树进行测量,然后对整个集合进行平均,并除以整个集合的标准偏差。 |
|
大小为1 × -的数值数组据nvar包含每个预测变量(特征)的重要性度量。对于任何变量,如果该变量的值在袋外观测值中被打乱,则度量方法是分类边际的减少。对每棵树进行测量,然后对整个集合进行平均,并除以整个集合的标准偏差。对于回归树,此属性为空。 |
|
大小的数字数组脑袋1,脑袋是训练数据中观测值的数量,包含每个观测值的离群值。 |
|
每个类的先验概率的数字向量。元素的顺序 这个属性是:
|
|
大小的数字矩阵脑袋——- - - - - -脑袋,在那里脑袋训练数据中观测值的数量,包含观测值之间的接近度度量。对于任意两个观测值,它们的接近度被定义为这些观测值落在同一片树叶上的树木比例。这是一个对角线上有1的对称矩阵,对角线外的元素范围从0到1。 |
|
的 |
|
一个逻辑标志,指定是否对每个具有替换的决策树进行数据采样。这个性质是 |
|
|
|
大小的单元格数组NumTrees-by-1包含集合中的树。 |
|
大小矩阵据nvar——- - - - - -据nvar通过变量关联的预测措施,在整个生长树木的整体上平均。如果你增加了整体环境 |
|
包含预测变量(特征)名称的单元格数组。 |
|
长度权重的数字向量脑袋,在那里脑袋是训练数据中的观察数(行)。 |
|
大小的表格或数字矩阵脑袋——- - - - - -据nvar,在那里脑袋观察数(行)和据nvar是训练数据中变量(列)的数量。如果你用一个预测值表来训练集合,那么 |
|
一个大小脑袋响应数据数组。的元素 |
例子
复制语义
价值。要了解这如何影响您对类的使用,请参见比较句柄类和值类在MATLAB中®面向对象编程文档。
提示
对于一个TreeBagger
模型对象B
,树
属性存储的单元格向量B.NumTrees
CompactClassificationTree
或CompactRegressionTree
模型对象。用于树的文本或图形显示t
在单元格向量中,输入
视图(B.Trees {t})
选择功能
统计和机器学习工具箱™为装袋和随机森林提供了三个对象:
之间的详细区别TreeBagger
以及袋装套装(ClassificationBaggedEnsemble
而且RegressionBaggedEnsemble
),看树木装袋和装袋套装的比较.
参考文献
[1]布莱曼,L。“随机森林。”机器学习45,页5-32,2001。
[2] Meinshausen, N.“分位数回归森林。”机器学习研究杂志, Vol. 7, 2006, pp. 983-999。