主要内容

oobQuantileError

类:TreeBagger

回归树袋外分位数损失

描述

例子

犯错= oobQuantileError (Mdl返回out-of-bag中比较真实响应的平均绝对偏差(MAD)Mdl。Y到预测的,超出预期的中位数Mdl。X,预测数据,并使用袋回归树MdlMdl必须是一个TreeBagger模型对象。

例子

犯错= oobQuantileError (Mdl名称,值使用一个或多个指定的附加选项名称,值对参数。例如,指定分位数概率、错误类型,或者在分位数回归错误估计中包括哪些树。

输入参数

全部展开

袋子的回归树,指定为TreeBagger模型对象由TreeBagger

  • 的价值Mdl。方法必须回归

  • 当你训练Mdl使用TreeBagger,则必须指定名称-值对“OOBPrediction”,“上”.因此,TreeBagger保存所需的袋外观察指标矩阵Mdl。OOBIndices

名称-值对的观点

指定可选的逗号分隔的对名称,值参数。的名字参数名和价值为对应值。的名字必须出现在引号内。可以以任意顺序指定多个名称和值对参数Name1, Value1,…,的家

集合错误类型,指定为逗号分隔对,由“模式”和这个表中的值。假设τ的价值分位数

价值 描述
“累积”

犯错是一个Mdl。NumTrees——- - - - - -元素个数(τ累积分位数回归误差的数值矩阵。错(jkτk中使用学习者的分位数回归误差Mdl。Trees(1:j只有。

“合奏”

犯错是1 -元素个数(τ整个集成的累积分位数回归误差的数值向量。错(kτk集成分位数回归错误。

“个人”

犯错是一个Mdl。NumTrees——- - - - - -元素个数(τ来自个体学习者的分位数回归误差的数值矩阵。错(jkτk分位数回归误差使用的学习者Mdl。Trees(j只有。

“累积”“个人”,如果您选择使用更少的树进行分位数估计,则此操作将影响进入的行数犯错以及相应的行索引。

例子:“模式”、“累积”

分位数概率,指定为逗号分隔对分位数的和包含区间[0,1]值的数字向量。为每个观察(行)Mdl。XoobQuantileError中所有概率的对应分位数估计分位数

例子:'分位数',[0 0.25 0.5 0.75 1]

数据类型:|

在响应估计中使用的树的索引,指定为逗号分隔的对,包括“树”“所有”或者一个正整数的数字向量。指数对应的单元格Mdl。Trees;其中的每个细胞都包含集合中的一棵树。的最大值必须小于或等于集合中的树的数目(Mdl。NumTrees).

“所有”oobQuantileError使用集合中的所有树(即索引)1: Mdl。NumTrees).

默认值以外的值可能会影响中的行数犯错

例子:“树”,[1 10 Mdl。NumTrees]

数据类型:字符|字符串||

来自各个树的响应的权重,指定为逗号分隔的对,由“TreeWeights”和一个数值向量元素个数(负的值。的价值

如果您指定“模式”,“个人”,然后oobQuantileError忽略了TreeWeights

数据类型:|

输出参数

全部展开

袋子里的一半分位数回归误差,作为数字标量或返回T——- - - - - -元素个数(τ矩阵。τ的价值分位数

T取决于值模式,分位数.假设你指定分位数,τ“树”,

  • “模式”、“累积”犯错是一个元素个数(——- - - - - -元素个数(τ数字矩阵。错(jkτk累积的,包外分位数回归误差使用的学习者Mdl。Trees((1:j))

  • “模式”、“合奏”犯错是一个1——- - - - - -元素个数(τ数值向量。错(kτk累积的,包外分位数回归误差使用的学习者Mdl。Trees(

  • “模式”,“个人”犯错是一个元素个数(——- - - - - -元素个数(τ数字矩阵。错(jkτkout- bag分位数回归误差Mdl。Trees(j))

例子

全部展开

加载carsmall数据集。考虑一个模型,该模型可以预测给定发动机排量、重量和汽缸数量的汽车的燃油经济性。考虑气缸一个分类变量。

负载carsmall气缸=分类(缸);X =表(位移、重量、汽缸、MPG);

使用整个数据集训练一组袋装回归树。指定100个弱学习者并保存out- bag索引。

rng (1);%的再现性Mdl = TreeBagger (100 X,“英里”“方法”“回归”“OOBPrediction”“上”);

Mdl是一个TreeBagger合奏。

执行分位数回归,并使用预测的条件中位数估计整个集合的MAD。

oobErr = oobQuantileError (Mdl)
oobErr = 1.5349

oobErr是对整个集合的分位数回归误差的无偏估计。

加载carsmall数据集。考虑一个模型,该模型可以预测给定发动机排量、重量和汽缸数量的汽车的燃油经济性。

负载carsmallX =表(位移、重量、汽缸、MPG);

使用整个数据集训练一组袋装回归树。指定250个弱学习者并保存out- bag索引。

rng (“默认”);%的再现性Mdl = TreeBagger (250 X,“英里”“方法”“回归”...“OOBPrediction”“上”);

估计累积;out-of-bag;0.25、0.5和0.75分位数回归错误。

呃= oobQuantileError (Mdl分位数的(0.25 0.5 0.75),“模式”“累积”);

犯错是一个250 × 3的累积,包外,分位数回归错误矩阵。列对应分位数概率,行对应集合中的树。这些错误是累积的,所以它们合并了以前树的聚合预测。

在同一图上绘制累积的、包外的分位数错误。

图;情节(错);传奇(“0.25分位数错误”“0.5分位数错误”“0.75分位数错误”);ylabel (“Out-of-bag分位数错误”);包含(“树指数”);标题(“累积的,包外的,分位数回归错误”

图中包含一个坐标轴。标题为Cumulative, out - bag, Quantile Regression Error的轴包含3个line类型的对象。这些对象表示0.25分位数错误,0.5分位数错误,0.75分位数错误。

在训练了大约50棵树后,所有分位数误差曲线都趋于平稳。因此,训练50棵树似乎足以实现三个分位数概率的最小分位数误差。

更多关于

全部展开

提示

包外集成误差估计器对于真集成误差是无偏的。因此,为了调整随机森林的参数,估计包外集成误差,而不是实现交叉验证。

参考文献

[1] Breiman, L。“随机森林。”机器学习45,页5-32,2001。

[2] Meinshausen, N.“分位数回归森林”机器学习研究杂志,第7卷,2006年,第983-999页。

介绍了R2016b