predictorImportance
计算预测器重要性的估计树
通过将每个预测器上的分割造成的均方误差(MSE)的变化加起来,然后将其总和除以分支节点的数量。如果树是在没有代理分支的情况下生长的,那么这个总和将取代在每个分支节点上找到的最佳分支。如果树是由代理分割生长的,那么这个总和将接管每个分支节点上的所有分割,包括代理分割。小鬼
具有用于在用于训练该树中的数据的每个输入预测器的一个元素。在每个节点,MSE被估计为通过该节点概率加权节点错误。与此相关联的分割变量重要性被计算为MSE之间的父节点和总MSE的两个孩子的差异。
如果使用代理分割,则预测器重要性的估计不依赖于预测器的顺序,但如果不使用代理分割,则依赖于顺序。
如果使用替代拆分,predictorImportance
在通过修剪或合并叶子来减少树之前计算估计数。如果你不使用代理分割,predictorImportance
树后,估计单位计算,通过修剪或合并叶子减少。因此,通过减少修剪树会影响没有替代分裂生长的树预测的重要性,并不会影响与替代分裂生长的树预测的重要性。