对于树木,分数叶节点的分类是该节点上分类的后验概率。节点分类的后验概率是通过分类导致该节点的训练序列的数量,除以导致该节点的训练序列的数量。
例如,考虑对预测器进行分类X
作为真正的
当X
<0.15
或X
>0.95
,X
是假的。
生成100个随机点并对它们进行分类:
修剪树:
修剪后的树正确地将小于0.15的观测结果分类为真正的
.它还正确地将观测值从。15到。94分类为错误的
.然而,它错误地将大于。94的观测结果归类为错误的
.因此,观察的分数大于.15的分数应为约0.05 /.85 = .06真正的
,约为.8/.85=。94年错误的
.
的前10行计算预测得分X
:
ans =.10×3.0.9059 0.0941 0.8147 0.9059 0.0941 0.9058 0 1.0000 0.1270 0.9059 0.0941 0.9134 0.9059 0.0941 0.6324 0 1.0000 0.0975 0.9059 0.0941 0.2785 0.9059 0.0941 0.5469 0.9059 0.0941 0.9575 0.9059 0.0941 0.9649
的确,每一种价值X
(最右边的列)小于0.15的关联得分(左边和中间的列)0.
和1
,而另一个值X
有相关的分数0.91
和0.09
.(得分的区别0.09
而不是预期的06
)是由于统计上的波动:有8.
观察X
范围内(.95,1)
而不是预期的5.
观察。