predictorImportance

估计回归树的预测器重要性

句法

小鬼= predictorImportance(树)

描述

小鬼= predictorImportance (计算预测器重要性的估计通过对每一个预测总结的均方误差因拆分变动和分支节点的数目除以总和。

输入参数

通过创建一个回归树fitrtree或者通过紧凑的方法。

输出参数

小鬼

中元素数量与预测器(列)数量相同的行向量以下方式。这些条目的预测重要性的估计,以0代表最小可能的重要性。

例子

展开全部

在数据的所有预测变量的估计预测的重要性。

加载carsmall数据集。

加载carsmall

增长回归树MPG运用加速度气瓶移位马力Model_Year,重量作为预测。

X = [加速油缸位移马力Model_Year重量];树= fitrtree(X,MPG);

估计所有预测变量的预测器重要性。

小鬼= predictorImportance(树)
小鬼=1×60.0647 0.1068 0.1155 0.1411 0.3348 2.6565

重量,最后的预测,对里程的影响最大。与做预测的影响最小的预测是第一个变量,它是加速度

在数据和有关回归树包含替代拆分所有变量估算预测的重要性。

加载carsmall数据集。

加载carsmall

增长回归树MPG运用加速度气瓶移位马力Model_Year,重量作为预测。指定要找出替代分裂。

X = [加速油缸位移马力Model_Year重量];树= fitrtree(X,MPG,“代孕”'上');

估计所有预测变量的预测器重要性。

小鬼= predictorImportance(树)
小鬼=1×61.0449 2.4560 2.5570 2.5788 2.0832 2.8938

比较小鬼在结果估计预测变量重要性重量仍然有里程的影响最大,但气瓶是第四个最重要的预测。

加载carsmall考虑一个模型,根据加速、气缸数量、发动机排量、马力、制造商、型号年份和重量来预测一辆汽车的平均燃油经济性。考虑气瓶制造行业,Model_Year作为分类变量。

加载carsmall气缸=分类(缸);MFG =分类(cellstr(MFG));Model_Year =分类(Model_Year);X =表(加速度,缸,排气量,马力,厂家批号,...Model_Year,重量,MPG);

显示类别变量中表示的类别数目。

numCylinders = numel(类别(缸))
numCylinders = 3
numMfg =元素个数(类别(有限公司))
numMfg = 28
numModelYear = numel(类别(Model_Year))
numModelYear = 3

因为有3个类别只在气瓶Model_Year,标准的CART预测器分割算法倾向于分割连续预测器而不是这两个变量。

使用整个数据集训练回归树。要生长无偏倚的树,指定使用曲率测试来分裂预测器。由于数据中缺少值,请指定代理分割的用法。

MDL = fitrtree(X,'MPG''PredictorSelection'“曲率”“代孕”'上');

通过由于对每一个预测分裂总结在风险变化和分支节点的数量除以总数估计预测的重要性值。比较用柱状图的估计。

小鬼= predictorImportance(MDL);数字;栏(IMP);标题(的预测估计的重要性);ylabel(“估计”);xlabel(“预测”);甘氨胆酸h =;h。XTickLabel = Mdl.PredictorNames;h。XTickLabelRotation = 45;h。TickLabelInterpreter ='没有';

在这种情况下,移位是最重要的预测指标,其次是马力

更多关于

展开全部