predictorImportance
计算树中预测器的重要性度量,方法是将每个预测器分裂后的节点风险变化相加,然后除以分支节点的总数。节点风险的变化是父节点的风险与两个子节点的总风险之间的差异。例如,如果一棵树将父节点(例如节点1)分解为两个子节点(例如节点2和3),则predictorImportance
增加分裂预测器的重要性
(R1- - - - - -R2- - - - - -R3.)/N分支,
在哪里R我节点是否存在节点风险我,N分支分支节点总数。一个节点的风险定义为以节点概率加权的节点误差或节点杂质:
在哪里P我是节点的概率吗我,E我是节点的节点错误(对于通过最小化二乘标准生长的树)还是节点不纯(对于通过最小化不纯标准生长的树,比如基尼指数或偏差)我.
预测器重要性的估计取决于您是否在训练中使用代理分割。