对于绿树成荫,得分叶节点的分类的是在该节点分类的后验概率。在节点分类的后验概率是训练序列的数目铅与分类该节点,通过训练序列的铅的数量,以该节点划分。
例如,考虑分类的预测X
如真正
什么时候X
<0.15
要么X
>0.95
和X
是假的,否则。
生成100个随机点,它们归类:
修剪树:
该修剪树正确分类是小于0.15的意见真正
。它还正确分类,从0.15到0.94的意见假
。但是,它错误地归类是大于0.94的意见假
。因此,该分数是大于0.15应为约0.05 / 0.85 = 0.06的观测真正
和约0.8 / 0.85 = 0.94对假
。
计算预测得分前10行的X
:
ANS =10×30.9059 0.0941 0.8147 0.9059 0.0941 0.9058 1.0000 0 0.1270 0.9059 0.0941 0.9134 0.9059 0.0941 0.6324 1.0000 0 0.0975 0.9059 0.0941 0.2785 0.9059 0.0941 0.5469 0.9059 0.0941 0.9575 0.9059 0.0941 0.9649
事实上,每一个值X
(最右列),其小于0.15具有相关联的得分(左边和中间列)0
和1
,而其它值X
有相关的分数0.91
和0.09
。所不同的(得分0.09
而不是预期的0.06
)是由于统计波动:有8
在观察X
在范围内(.95,1)
而不是预期的五
观察结果。