回归树随机林的预测值重要性估计
在使用fitrensemble.
:
标准推车倾向于选择包含许多不同值的分割预测器,例如连续变量,在包含几个不同值的那些中,例如分类变量[3]。如果预测器数据集是异构的,或者如果存在与其他变量相对较少的不同值的预测器,则考虑指定曲率或交互测试。
使用标准推车生长的树木对预测变量相互作用不敏感。而且,这种树木在许多不相关的预测因子的存在中的可能性不太可能识别重要的变量,而不是应用相互作用测试。因此,要考虑预测器相互作用并在存在许多无关变量的情况下识别重要变量,请指定交互测试[2]。
如果训练数据包含多个预测值,并且要分析预测值的重要性,请指定“NumVariablesToSample”
的模板树
充当'全部'
为合奏的树学习者。否则,软件可能不会选择一些预测因子,低估了它们的重要性。
有关详细信息,请参阅模板树
和选择分割预测器选择技术。
[1] 布莱曼,L.,J。弗里德曼,R。奥尔申和C。石分类和回归树。Boca Raton,FL:CRC Press,1984。
[2] 具有无偏变量选择和交互检测的回归树STATISTICA SINICA.,卷。12,2002,第361-386页。
[3] LOH,W.Y.和Y.S.Shih。“分类树的分离选择方法。”STATISTICA SINICA.,第7卷,1997年,第815-840页。