主要内容

绘图竞争依赖性

创建部分依赖图(PDP)和个人条件期望图(ICE)

描述

例子

plotPartialDependence(Regersionmdl.vars.计算并绘制列出的预测变量之间的部分依赖性vars.并且使用回归模型预测的响应Regersionmdl.,其中包含预测数据。

  • 如果指定一个变量vars.,该函数创建对变量的部分依赖的线曲线。

  • 如果你指定两个变量vars.,该函数创建针对两个变量的部分依赖的表面图。

例子

plotPartialDependence(classificationmdl.vars.标签计算并绘制列出的预测变量之间的部分依赖性vars.以及在标签通过使用分类模型classificationmdl.,其中包含预测数据。

  • 如果指定一个变量vars.和一个课程标签,该函数创建针对指定类的变量的部分依赖的线图。

  • 如果指定一个变量vars.和多个班级标签,该函数为一个数字为每个类创建一个线绘图。

  • 如果你指定两个变量vars.和一个课程标签,该函数创建针对两个变量的部分依赖的表面图。

例子

plotPartialDependence(___数据使用新的预测器数据数据.您可以指定数据除了以前的语法中的任何输入参数组合。

例子

plotPartialDependence(___名称,价值使用一个或多个名称值对参数指定的其他选项。例如,如果您指定'条件','绝对', 这绘图竞争依赖性功能创建一个图,包括PDP,所选预测变量的散点图和预测的响应或分数,以及每个观察的冰图。

例子

斧头= plotPartialDependence(___返回情节的轴线。

例子

全部折叠

使用的方法训练回归树Carsmall.数据集,并创建一个PDP,显示特征和经过训练的回归树中的预测响应之间的关系。

加载Carsmall.数据集。

负载Carsmall.

指定重量气瓶,马力为预测变量(X), 和MPG.为响应变量(y).

X =(重量、气缸、马力);Y = MPG;

使用回归树使用Xy

Mdl = fitrtree (X, Y);

查看经过训练的回归树的图形显示。

查看(MDL,'模式''图形'

Figure回归树查看器包含UIMEnu,UIControl类型的轴和其他对象。轴包含60个类型的类型线,文本。

创建第一个预测变量的PDP,重量

plotPartialDependence (Mdl, 1)

图中包含一个坐标轴。具有标题部分依赖图的轴包含类型线的对象。

绘制的线表示平均部分关系重量(标记为X1) 和MPG.(标记为y)在训练的回归树中Mdl.这X-axis次要刻度表示唯一的值X1

回归树查看器显示第一个决定是是否X1小于3085.5。PDP还显示了附近的大变化X1= 3085.5。树查看器根据预测器变量在每个节点处可视化每个节点的每个决定。您可以找到基于值的几个节点X1,但确定依赖yX1不简单。然而绘图竞争依赖性绘图平均预测反应X1,所以你可以清楚地看到部分依赖yX1

标签X1y是预测器名称和响应名称的默认值。您可以通过指定名称值对参数来修改这些名称'predictornames''responsebame'当你训练Mdl使用fitrtree..您还可以使用轴标签来修改轴标签XLabel.ylabel.职能。

培训一个天真的贝母分类模型渔民数据集,并创建一个PDP,显示多个类别的预测变量和预测得分(后验概率)之间的关系。

加载渔民数据集,包括物种(物种)及尺寸(测定)萼片长度,萼片宽度,花瓣长度和花瓣宽度为150鸢尾标本。数据集包含来自三种种类中的每一个的50个标本:Setosa,Versicolor和Virginica。

负载渔民

培训一个天真的贝叶斯分类模型物种作为响应测定为预测因子。

MDL = FITCNB(MEAS,物种);

创建一个预期的分数的PDPMdl对于所有三个课程物种对阵第三预测变量X3.属性指定类标签Classnames.的属性Mdl

plotPartialDependence(MDL,3,MDL.Classnames);

图中包含一个坐标轴。具有标题部分依赖图的轴包含3个类型的线。这些对象代表Setosa,Versicolor,Virginica。

根据该模型,概率virginica增加X3.的概率setosa从哪里约0.33X3是0到2.5左右,然后概率几乎降到0。

使用生成的样本数据列出高斯过程回归模型,其中响应变量包括预测器变量之间的交互。然后,创建冰块,显示特征与每个观察的预测响应之间的关系。

生成样本预测器数据X1X2

RNG('默认'重复性的%n = 200;x1 = rand(n,1)* 2-1;x2 = rand(n,1)* 2-1;

生成包含与之间的交互的响应值X1X2

Y = x1-2 * x1。* (x2 > 0) + 0.1 *兰德(n, 1);

使用Gaussian进程回归模型[x1 x2]y

mdl = fitrgp([x1 x2],y);

为第一个预测器创建一个包括PDP(红线)的图X1的散点图(圆标记)X1并预测响应,并通过指定进行一组冰块(灰线)'条件'作为'中心'

plotPartialDependence (Mdl 1'条件''中心'

图中包含一个坐标轴。具有标题个体条件期望绘图的轴包含202个类型的类型,分散。

'条件''中心'绘图竞争依赖性偏移绘图,使所有绘图从零开始,这有助于检查所选功能的累积效果。

PDP找到平均的关系,因此它不会透露隐藏的依赖项,特别是当响应包括特征之间的交互时。然而,冰块清楚地表明了两个不同的回应依赖性X1

培训分类模型的集合并创建两个PDP,使用培训数据集,另一个使用新的数据集。

加载人口普查1994.数据集,其中包含美国年薪数据,分类为<= 50K.或者> 50K.,以及一些人口统计学变量。

负载人口普查1994.

从表中提取要分析的变量子集AdultData.成人

x = AdultData(:,{'年龄''工作组'“education_num”“marital_status”'种族'......“性”'资本收益''capital_loss'“hours_per_week”'薪水'});xnew = Adulttest(:,{'年龄''工作组'“education_num”“marital_status”'种族'......“性”'资本收益''capital_loss'“hours_per_week”'薪水'});

用。训练分类器集合薪水作为响应,其余变量使用函数作为预测器fitcensemble..对于二进制分类,fitcensemble.聚合100个分类树Logitboost.方法。

mdl = fitcensemble(x,'薪水');

检查类名Mdl

mdl.classnames.
ans =.2x1分类<= 50k> 50k

创建所预测的分数的部分依赖关系图Mdl第二节课薪水> 50K.)反对预测指标年龄使用培训数据。

plotPartialDependence(MDL,'年龄',mdl.classnames(2))

图中包含一个坐标轴。具有标题部分依赖图的轴包含类型线的对象。

为类创建一个分数的PDP> 50K.反对年龄使用来自表的新预测仪数据XNew.

plotPartialDependence(MDL,'年龄'Xnew Mdl.ClassNames (2))

图中包含一个坐标轴。具有标题部分依赖图的轴包含类型线的对象。

这两张图显示了预测高分的部分依赖性的相似形状薪水> 50K.) 在年龄.这两个图都表明,对高薪的预测得分在30岁之前增长很快,然后在60岁之前几乎持平,然后快速下降。然而,基于新数据的图表显示,年龄在65岁以上的人得分略高。

使用培训回归的集合Carsmall.数据集,并使用新数据集为每个预测变量创建PDP绘图和冰块,CARBIG..然后,比较数字来分析预测器变量的重要性。此外,将结果与预测因素重要性的估计进行比较预测的重要性功能。

加载Carsmall.数据集。

负载Carsmall.

指定重量气瓶马力,model_year.为预测变量(X), 和MPG.为响应变量(y).

X =[重量、气缸、马力,Model_Year];Y = MPG;

使用训练回归集成Xy

mdl = fitrensemble(x,y,......'predictornames',{“重量”'气瓶''马力''模型年'},......'responsebame''mpg');

通过使用使用来创建预测变量的重要性绘图竞争依赖性预测的重要性职能。这绘图竞争依赖性函数将选定的预测器和预测的响应之间的关系可视化。预测的重要性总结预测器具有单个值的重要性。

为每个预测器创建一个包括PDP图(红线)和ICE图(灰线)的图绘图竞争依赖性并指定'条件','绝对'.每个图还包括所选预测器的散点图(圆标记)和预测的响应。另外,加载CARBIG.数据集并将其用作新的预测器数据,XNew..当你提供XNew., 这绘图竞争依赖性功能使用XNew.而不是预测数据Mdl

负载CARBIG.Xnew =[重量、气缸、马力,Model_Year];图t = tiledlayout(2,2,“TileSpacing”'袖珍的');标题(t,“个人有条件期望地块”i = 1:4 nextdile plotpartialdendence(mdl,i,xnew,'条件'“绝对”) 标题(''结尾

图包含4个轴。轴1包含408型型线,分散。轴2包含408个类型的线,散射。轴3包含408型型线,散射。轴4包含408型型线,散射。

计算通过使用计算预测的预测值估计预测的重要性.该函数对每个预测器的分裂导致的均方误差(MSE)的变化进行求和,然后除以分支节点的数量。

Imp = predictorimportance(mdl);图酒吧(IMP)标题(的预测估计的重要性)ylabel(“估计”)Xlabel('预测器'斧头= GCA;ax.xticklabel = mdl.predictornames;

图中包含一个坐标轴。具有标题预测值重要性估计的轴包含类型栏的对象。

变量重量对最有影响力MPG.根据预测的重要性。PDP的重量也表明,MPG.有高度的部分依赖性重量.变量气瓶影响最小MPG.根据预测的重要性。PDP的气瓶也表明,MPG.取决于气瓶

训练一个具有线性和交互项的广义可加性模型(GAM)用于预测。然后,创建一个既有线性项又有交互项的PDP和一个只有线性项的PDP。指定在创建pdp时是否包含交互术语。

加载电离层数据集。此数据集具有34个预测器和351个雷达返回的二进制响应,无论是坏的吗('B')或好(‘g’).

负载电离层

使用预测器训练游戏X和班级标签y.推荐的做法是指定类名。指定包含10个最重要的交互项。

mdl = fitcgam(x,y,'classnames',{'B'‘g’},'互动',10);

Mdl是一个Classificationgam.模型对象。

列出中的交互项Mdl

mdl.interaction.
ans =.10×21 5 7 8 6 7 5 6 5 7 5 8 3 5 4 7 1 7 4 5

每一排互动表示一个交互项,并包含该交互项的预测变量的列索引。

在交互术语中找到最常见的预测器。

模式(mdl.interactions,“所有”
ans = 5.

交互项中最常见的预测因子是第5个预测因子(X5).为第5个预测器创建PDP。要从计算中排除交互术语,请指定'internalidantaction',false第二个PDP。

PlotPartialDependence(MDL,5,MDL.Classnames(1))保持PlotPartialDependence(MDL,5,MDL.Classnames(1),'internalideraction'假)网格传奇('线性和互动条款''仅线性条款') 标题(第五预测器的后验概率的“PDP”) 抓住

图中包含一个坐标轴。第5 Predictor的后验概率pdp轴包含2个类型为line的对象。这些对象表示线性和交互项,仅表示线性项。

该图显示了分数(后验概率)的部分依赖性X5根据模型是否包括交互术语而变化,尤其是在哪里X5在0.2和0.45之间。

使用培训支持向量万博1manbetx机(SVM)回归模型Carsmall.数据集,并为两个预测变量创建PDP。然后,从输出中提取部分依赖估计值绘图竞争依赖性.或者,您可以通过使用来获得部分依赖值部分竞争功能。

加载Carsmall.数据集。

负载Carsmall.

指定重量气瓶位移,马力为预测变量(资源描述).

台=表(重量、汽缸、排量、马力);

使用SVM回归模型使用资源描述和响应变量MPG..使用具有自动内核刻度的高斯内核功能。

mdl = fitrsvm(tbl,mpg,'responsebame''mpg'......'pationoricalpricictors''气瓶''标准化',真的,......'骨箱''高斯''kernelscale''汽车');

创建一个PDP,可视化预测响应的部分依赖(MPG.)在预测器变量上重量气瓶.指定要计算其部分依赖性的查询点重量通过使用'querypoints'名称-值对的论点。您不能指定'querypoints'价值气瓶因为它是一个分类变量。绘图竞争依赖性使用所有分类值。

Pt = Linspace(min(重量),最大(重量),50)';AX = PlotPartialDependence(MDL,{“重量”'气瓶'},'querypoints',{pt,[]});查看(140,30)%修改视角

图中包含一个坐标轴。具有标题部分依赖性图的轴包含类型表面的对象。

PDP显示了相互作用效果重量气瓶.部分依赖MPG.重量根据价值而变化气瓶

提取估计的部分依赖MPG.重量气瓶.这XDataydata.,Zdata.价值AX.Children.分别为x轴值(第一个选定的预测值)、y轴值(第二个选定的预测值)和z轴值(对应的部分相关性值)。

xval = ax.chillren.xdata;yval = ax.children.ydata;zval = ax.children.zdata;

或者,您可以通过使用来获得部分依赖值部分竞争功能。

[PD,X,Y] = PartialDependence(MDL,{“重量”'气瓶'},'querypoints',{pt,[]});

PD.包含查询点的部分依赖值Xy

如果您指定'条件'作为“绝对”绘图竞争依赖性创建包括PDP,散点图和一组冰块的图。AX.CHILDREN(1)AX.CHILDREN(2)分别对应于PDP和散点图。其余的元素AX.Children.对应于冰块。这XDataydata.价值AX.CHILDREN(I)分别为x轴值(所选预测值)和y轴值(相应的偏相关值)。

输入参数

全部折叠

回归模型,指定为完整或紧凑的回归模型对象,如下表所支持的模型中给出。万博1manbetx

模型 完整或紧凑的模型对象
广义线性模型 GeneralizedLinearModelCompactGeneralizedLinearModel
广义线性混合效应模型 GeneralizeLmixedModel.
线性回归 linearmodel.CompactLinearModel.
线性混合效应模型 linearmixedmodel.
非线性回归 非线性模型
回归模型集合 回归回归释迦缩短compactregressionensemble
广义添加剂模型(GAM) 回归CompactRegressionGAM
高斯过程回归 RegressionGPCompactregressionGP.
高斯内核回归模型使用随机特征扩展 回归科内尔
线性回归用于高维数据 回归线性
神经网络回归模型 回归翁网络网络compactregressionneuralnetwork
万博1manbetx支持向量机(SVM)回归 回归vm.CompactRegressionSVM
回归树 RegressionTreeCompactregressiontree.
决策树集合的引导集合 TreeBaggerCompactTreeBagger.

如果Regersionmdl.是一个不包含预测数据(例如,紧凑型)的模型对象,您必须提供输入参数数据

绘图竞争依赖性不支持具有稀疏矩阵万博1manbetx训练的模型对象。当您培训模型时,使用完整的数字矩阵或表格,用于预测数据,其中行对应各个观察。

分类模型,指定为完整或紧凑型分类模型对象,如下表所支持的模型中给出。万博1manbetx

模型 完整或紧凑的模型对象
判别分析分类器 分类Discriminant.CompactClassificationDiscriminant.
支持向量机或其他分类器的多类模型万博1manbetx ClassificationECOCCompactClassificationECOC
学习者的集体融合 ClassificationEnsembleCompactClassificationEnsembleClassificationBaggedEnsemble
广义添加剂模型(GAM) Classificationgam.CompactClassificationgam.
高斯核分类模型使用随机特征展开 ClassificationKernel.
K.最近的邻居分类器 ClassificationKnn.
线性分类模型 分类线性
Multiclass Naive Bayes模型 ClassificationniveBayes.CompactClassificationNaiveBayes
神经网络分类器 ClassificationNeuralNetworkCompactClassificationneAuralKetwork.
万博1manbetx支持向量机(SVM)分类器,用于单级和二进制分类 分类VM.CompactClassificationSVM
用于多类分类的二叉决策树 ClassificationTreeCompactClassificationTree.
袋装决策树的合奏 TreeBaggerCompactTreeBagger.

如果classificationmdl.是一个不包含预测数据(例如,紧凑型)的模型对象,您必须提供输入参数数据

绘图竞争依赖性不支持具有稀疏矩阵万博1manbetx训练的模型对象。当您培训模型时,使用完整的数字矩阵或表格,用于预测数据,其中行对应各个观察。

预测变量,指定为正整数的向量,字符向量,字符串标量,字符串数组或字符向量的单元数组。您可以指定一个或两个预测器变量,如下表所示。

一个预测变量

价值 描述
正整数 对应于预测器数据列的索引值。
字符矢量或字符串标量

预测变量的名称。名称必须与输入的条目匹配RegressionMdl。PredictorNames或者classificationmdl.predictornames.

两个预测变量

价值 描述
两个正整数矢量 对应于预测器数据列的索引值。
字符串阵列或字符向量的单元数组

预测变量的名称。数组中的每个元素是预测器变量的名称。名称必须与条目匹配RegressionMdl。PredictorNames或者classificationmdl.predictornames.

例子:{'x1','x3'}

数据类型:单身的|双倍的|char|细绳|细胞

类标签,指定为类别或字符数组、逻辑或数字向量或字符向量的单元格数组。中的值和数据类型标签必须匹配类名中的类名Classnames.的属性classificationmdl.ClassificationMdl。Classnames.).

  • 只有在指定一个变量时,才能指定多个类标签vars.并指定'条件'作为'没有任何'(默认)。

  • 使用部分竞争如果要在一个函数调用中计算多个变量和多个类标签的部分依赖项。

此参数仅在指定分类模型对象时有效classificationmdl.

例子:{'红蓝'}

例子:ClassificationMdl。3类名([1])指定标签作为第一和第三类classificationmdl.

数据类型:单身的|双倍的|逻辑|char|细胞|分类

预测数据,指定为数字矩阵或表。每一排数据对应于一个观察,并且每列对应于一个变量。

数据必须与培训模型的预测数据一致(Regersionmdl.或者classificationmdl.),存储在其中X或者变量财产。

  • 如果您使用数字矩阵训练模型,那么数据必须是数字矩阵。构成列的变量数据必须具有与培训模型的预测变量相同。

  • 如果您使用表培训模型(例如,资源描述), 然后数据必须是一张桌子。所有预测因子变量数据必须具有与名称和类型相同的变量名称和数据类型资源描述.但是,的列顺序数据不需要对应于列顺序资源描述

  • 绘图竞争依赖性不支持稀疏矩阵。万博1manbetx

如果Regersionmdl.或者classificationmdl.您是否必须提供不包含预测器数据的模型对象数据.如果模型是包含预测器数据的完整模型对象,并指定此参数,则绘图竞争依赖性不使用模型中的预测器数据并使用数据只要。

数据类型:单身的|双倍的|表格

名称值对参数

指定可选的逗号分离对名称,价值参数。姓名参数名和价值是相应的价值。姓名必须出现在引号内。可以以任意顺序指定多个名称和值对参数Name1, Value1,…,的家

例子:plotPartialDependence(MDL,Var,数据,'numobservationstosample',100,'使用指惯',true)通过使用100个采样的观察来创建PDP数据和执行- 并行迭代。

绘图类型,指定为'没有任何'“绝对”, 或者'中心'

价值 描述
'没有任何'

绘图竞争依赖性创建一个PDP。绘图类型取决于指定的预测变量的数量vars.以及指定的类标签数标签(用于分类模型)。

  • 一个预测变量和一个类标签 -绘图竞争依赖性计算查询点上的部分依赖关系,并创建部分依赖关系的二维线图。

  • 一个预测变量和多级标签 -绘图竞争依赖性为选定的类创建一个包含多个2-D线图的图形。

  • 两个预测变量和一个类标签 -绘图竞争依赖性创建对两个变量的部分依赖的表面曲线。

“绝对”

绘图竞争依赖性创建一个图,包括以下三种类型的绘图:

  • 有红线的PDP

  • 将所选预测器变量的散点图和预测的响应或分数与圆标记

  • 用灰色线绘制每个观测值的ICE图

当您只选择一个预测器变量时,此值有效vars.还有一个类标签标签(用于分类模型)。

'中心'

绘图竞争依赖性创建一个图形,包括相同的三种类型的情节“绝对”.函数对绘图进行偏移,使所有绘图都从零开始。

当您只选择一个预测器变量时,此值有效vars.还有一个类标签标签(用于分类模型)。

例子:'条件','绝对'

标志包括在部分依赖计算中的广义添加剂模型(GAM)的交互条款,指定为真正的或者.此参数仅对GAM有效。也就是说,您只能指定此参数Regersionmdl.回归或者CompactRegressionGAM, 或者classificationmdl.Classificationgam.或者CompactClassificationgam.

默认值'internalideraction'价值是真正的如果模型包含交互项。该值必须为如果模型不包含交互术语。

例子:'internalidantaction',false

数据类型:逻辑

标志包括在部分依赖计算中的广义添加剂模型(GAM)的截取期限,指定为真正的或者.此参数仅对GAM有效。也就是说,您只能指定此参数Regersionmdl.回归或者CompactRegressionGAM, 或者classificationmdl.Classificationgam.或者CompactClassificationgam.

例子:“IncludeIntercept”,假的

数据类型:逻辑

样本的观察次数,指定为正整数。默认值是总观察的数量数据或模型(Regersionmdl.或者classificationmdl.).如果指定的值大于观测总数,则绘图竞争依赖性使用所有的观察。

绘图竞争依赖性样品观察不替代使用datasample.功能并使用采样的观察来计算部分依赖。

绘图竞争依赖性在采样观测的唯一值下显示次要刻度标记。

如果您指定'条件'作为“绝对”或者'中心'绘图竞争依赖性创建一个图,包括每个采样观察的冰绘图。

例子:“NumObservationsToSample”,100年

数据类型:单身的|双倍的

作为绘图的轴,指定为轴对象。如果您没有指定轴,那么当前轴是笛卡尔,那么绘图竞争依赖性使用当前坐标轴(gca).如果轴不存在,绘图竞争依赖性在一个新图中的情节。

例子:'父母',斧头

指定为数字列向量,数字两列矩阵或两个数字列向量的单元阵列的数字依赖性指定的部分依赖。

  • 如果你选择一个预测变量vars.,使用数字列向量。

  • 如果你选择两个预测变量vars.

    • 使用数字两列矩阵指定每个预测变量的相同数量的点。

    • 使用两个数字列向量的单元格数组来指定每个预测变量的不同数量的点。

默认值是数字列向量或数字两列矩阵,具体取决于所选预测器变量的数量。每个列包含在对应预测器变量的采样观测的最小值和最大值之间的100个均匀间隔点。

如果'条件'“绝对”或者'中心',然后软件添加预测器数据值(数据或预测数据Regersionmdl.或者classificationmdl.)所选预测器到查询点。

你不能修改'querypoints'对于一个分类变量。这绘图竞争依赖性函数使用所选变量中的所有分类值。

如果选择一个数字变量和一个分类变量,则可以指定'querypoints'通过使用由数字列向量和空数组组成的单元格数组来获取数值变量。

例子:QueryPoints, {pt, []}

数据类型:单身的|双倍的|细胞

标志以并行运行,指定为真正的或者.如果您指定'使用反应',真实, 这绘图竞争依赖性函数执行使用议案当预测每个观察结果并平均它们时的响应或分数。此选项需要并行计算工具箱™。

例子:'使用反应',真实

数据类型:逻辑

输出参数

全部折叠

绘图的轴,作为轴对象返回。有关如何修改轴的外观并从图中提取数据的详细信息,请参阅轴的外观从图中提取部分依赖估计

更多关于

全部折叠

对回归模型的部分依赖

部分依赖[1]表示预测变量与训练回归模型中的预测响应之间的关系。绘图竞争依赖性通过边缘化通过其他变量来计算预测响应对预测变量子集的部分依赖性。

考虑对子集的部分依赖XS.整个预测变量集X= {X1X2、……Xm}.一个子集XS.包括一个变量或两个变量:XS.= {XS1}或者XS.= {XS1XS2}.让XC是互补的XS.X.预测的响应FX)取决于所有变量X

FX)=FXS.XC).

预测反应的部分依赖于XS.由对预测反应的期望来定义XC

F S. X S. = E. C [ F X S. X C ] = F X S. X C P. C X C D. X C

在哪里P.CXC)是边缘概率XC,也就是说, P. C X C P. X S. X C D. X S. .假设每个观察都同样可能,并且之间的依赖XS.XC以及相互作用XS.XC在反应不强烈时,绘图竞争依赖性通过使用观察到的预测器数据估计部分依赖性,如下所示:

F S. X S. 1 N σ. 一世 = 1 N F X S. X 一世 C (1)

在哪里N是观察人数和X一世=(X一世S.X一世C是个一世观察。

当你呼叫绘图竞争依赖性功能,您可以指定培训的模型(F(·))和选择变量(XS.)通过使用输入参数Regersionmdl.vars., 分别。绘图竞争依赖性计算在100个等间距点处的部分相关XS.或者使用它使用的点'querypoints'名称-值对的论点。你可以指定号码(N)的观察样本,从给定的预测数据使用“NumObservationsToSample”名称-值对的论点。

回归模型的个体条件期望

个人有条件的期望(冰)[2],作为部分依赖的延伸,表示预测变量和每个观测的预测响应之间的关系。部分依赖性显示了预测变量和预测响应之间的平均关系,而一组ICE图分解了平均信息,并显示了每个观测的独立依赖性。

绘图竞争依赖性为每个观察创建冰块。一组冰块可用于研究源自不同观察的部分依赖性的异质性。绘图竞争依赖性还可以使用通过输入参数提供的任何预测数据来创建冰块数据.您可以使用此功能来探索预测的响应空间。

考虑选择预测器变量的冰绘图XS.具有给定观察X一世C, 在哪里XS.= {XS.}XC的互补集XS.在整个变量集中X,X一世=(X一世S.X一世C是个一世观察。冰块对应于求和的汇总方程1

F S. 一世 X S. = F X S. X 一世 C

绘图竞争依赖性绘图 F S. 一世 X S. 对于每次观察一世当你指定'条件'作为“绝对”.如果您指定'条件'作为'中心'绘图竞争依赖性在删除由于不同观察结果的级别效应后绘制所有绘图:

F S. 一世 以中心为中心 X S. = F X S. X 一世 C - F X S. X 一世 C

这个减法确保每个情节从零开始,以便您可以检查累积的效果XS.和之间的相互作用XS.XC

分类模型的部分依赖和冰

在分类模型的情况下,绘图竞争依赖性以与回归模型的方式相同的方式计算部分依赖和各个条件期望,其中一个例外:而不是使用来自模型的预测响应,而是使用所指定的类的预测分数来计算标签

加权遍历算法

加权遍历算法[1]是一种估算基于树的模型的部分依赖的方法。估计的部分依赖性是与树遍历期间访问的叶节点对应的响应或刻痕值的加权平均值。

XS.是整个变量集的子集XXC是互补的XS.X.对于每一个人XS.计算部分依赖的值,算法将树从根(开头)节点从根(开始)节点遍历到叶(终端)节点,并找到叶节点的权重。通过在根节点处分配一个权重值来开始遍历开始。如果节点拆分XS.,该算法遍历适当的子节点XS.价值。子节点的权重变为与其父节点相同的值。如果节点拆分XC,该算法遍历两个子节点。每个子节点的权重变为其父节点的值乘以与每个子节点对应的观察的分数。在完成树遍历之后,算法通过使用指定的权重来计算加权平均值。

对于袋装树的集合,估计的部分依赖性是各种树木的加权平均值的平均值。

算法

绘图竞争依赖性用A.预测功能预测响应或分数。绘图竞争依赖性选择适当的预测根据模型的功能(Regersionmdl.或者classificationmdl.)和跑步预测有其默认设置。有关每个人的详细信息预测函数,见预测以下两个表中的功能。如果指定的模型是基于树的模型(不包括树木的增强集合)和'条件''没有任何',然后绘图竞争依赖性使用加权遍历算法而不是预测功能。有关详细信息,请参阅加权遍历算法

回归模型对象

模型类型 完整或紧凑的回归模型对象 预测响应的功能
决策树集合的引导集合 CompactTreeBagger. 预测
决策树集合的引导集合 TreeBagger 预测
回归模型集合 回归回归释迦缩短compactregressionensemble 预测
高斯内核回归模型使用随机特征扩展 回归科内尔 预测
高斯过程回归 RegressionGPCompactregressionGP. 预测
广义加性模型 回归CompactRegressionGAM 预测
广义线性混合效应模型 GeneralizeLmixedModel. 预测
广义线性模型 GeneralizedLinearModelCompactGeneralizedLinearModel 预测
线性混合效应模型 linearmixedmodel. 预测
线性回归 linearmodel.CompactLinearModel. 预测
线性回归用于高维数据 回归线性 预测
神经网络回归模型 回归翁网络网络compactregressionneuralnetwork 预测
非线性回归 非线性模型 预测
回归树 RegressionTreeCompactregressiontree. 预测
万博1manbetx支持向量机 回归vm.CompactRegressionSVM 预测

分类模型对象

模型类型 完整或紧凑的分类模型对象 预测标签和分数的功能
判别分析分类器 分类Discriminant.CompactClassificationDiscriminant. 预测
支持向量机或其他分类器的多类模型万博1manbetx ClassificationECOCCompactClassificationECOC 预测
学习者的集体融合 ClassificationEnsembleCompactClassificationEnsembleClassificationBaggedEnsemble 预测
高斯核分类模型使用随机特征展开 ClassificationKernel. 预测
广义加性模型 Classificationgam.CompactClassificationgam. 预测
K.- 最邻居模型 ClassificationKnn. 预测
线性分类模型 分类线性 预测
天真的贝叶斯模型 ClassificationniveBayes.CompactClassificationNaiveBayes 预测
神经网络分类器 ClassificationNeuralNetworkCompactClassificationneAuralKetwork. 预测
万博1manbetx支持向量机的一类和二值分类 分类VM.CompactClassificationSVM 预测
用于多类分类的二叉决策树 ClassificationTreeCompactClassificationTree. 预测
袋装决策树的合奏 TreeBaggerCompactTreeBagger. 预测

替代功能

  • 部分竞争在没有可视化的情况下计算部分依赖。该函数可以在一个函数调用中计算两个变量和多个类的部分依赖。

参考

[1]弗里德曼,杰罗姆。H.“贪婪函数近似:梯度升压机。”统计史29,不。5(2001):1189-1232。

[2] Goldstein,Alex,Adam Kapelner,Justin Bleich和Emil Pitkin。“偷看黑匣子里面:用个人有条件期望的情节可视化统计学习。”中国计算与图形统计学报24日,没有。1(2015年1月2日):44-65。

[3] Hastie,Trevor,Robert Tibshirani和Jerome Friedman。统计学习的要素。纽约,纽约:春天的纽约,2001年。

扩展能力

在R2017B中介绍