分类树随机森林的预测值重要性估计
返回的向量out- bag,通过排列估计预测器的重要性使用分类树的随机森林接口信息处理器
=oobPermited预测重要性(Mdl
)Mdl
.Mdl
必须是一个分类BaggedAssemble
模型对象。
在使用菲特森布尔
:
标准CART倾向于选择包含许多不同值(如连续变量)的分离预测因子,而不是包含很少不同值(如分类变量)的分离预测因子[3]. 如果预测器数据集是异构的,或者如果预测变量具有比其他变量相对较少的不同值,那么考虑指定曲率或交互测试。
使用标准CART生长的树木对预测变量相互作用不敏感。此外,与交互测试的应用相比,在存在许多无关的预测因子时,这种树不太可能识别出重要的变量。因此,为了解释预测变量之间的交互作用,并在存在许多不相关变量的情况下识别重要变量,指定交互作用检验[2].
如果训练数据包含多个预测值,并且要分析预测值的重要性,请指定“NumVariablesToSample”
的模板树
充当“所有”
对于集合中的树学习者。否则,软件可能不会选择一些预测因子,低估了它们的重要性。
有关详细信息,请参阅模板树
和选择分割预测器选择技术.
[1] 布莱曼,L.,J.弗里德曼,R.奥尔森和C.斯通。分类与回归树.佛罗里达州博卡拉顿:CRC出版社,1984。
[2] 具有无偏变量选择和交互检测的回归树中国统计局, 2002年第12卷,第361-386页。
Loh w.y y and Y.S. Shih分类树的分裂选择方法中国统计局,第7卷,1997年,第815-840页。