主要内容

plotPartialDependence

创建部分依赖图(PDP)和个人条件期望(ICE)情节

描述

例子

plotPartialDependence (RegressionMdl,var)计算和情节部分中列出的预测变量之间的依赖var并使用回归模型预测的反应RegressionMdl,其中包含预测数据。

  • 如果您指定一个变量var的函数创建一条线情节部分依赖变量。

  • 如果指定两个变量var的函数创建一个曲面图部分依赖两个变量。

例子

plotPartialDependence (ClassificationMdl,var,标签)计算和情节部分中列出的预测变量之间的依赖var和分数中指定的类标签通过使用分类模型ClassificationMdl,其中包含预测数据。

  • 如果您指定一个变量var的函数创建一条线情节部分依赖对每个类的变量标签

  • 如果指定两个变量var的函数创建一个曲面图部分依赖两个变量。您必须指定一个类标签

例子

plotPartialDependence (___,数据)使用新的预测数据数据。您可以指定数据除了任何输入参数组合在前面的语法。

例子

plotPartialDependence (有趣的,var,数据)计算和情节部分中列出的预测变量之间的依赖var和返回的输出自定义模型有趣的使用预测数据数据

  • 如果您指定一个变量var的函数创建一条线情节部分依赖的变量为每个列返回的输出有趣的

  • 如果指定两个变量var的函数创建一个曲面图部分依赖两个变量。当你指定两个变量,有趣的必须返回一个列向量或者你必须指定使用哪个输出列通过设置OutputColumns名称-值参数。

例子

plotPartialDependence (___,名称,值)使用附加选项指定一个或多个名称参数。例如,如果您指定“有条件”、“绝对”,plotPartialDependence函数创建一个图包括PDP中,选择预测变量的散点图和预测反应或分数,每个观测和冰的阴谋。

例子

斧头= plotPartialDependence (___)返回轴的阴谋。

例子

全部折叠

回归树使用训练carsmall数据集,并创建一个PDP显示之间的关系特性,预测反应训练回归树。

加载carsmall数据集。

负载carsmall

指定重量,气缸,马力作为预测变量(X),英里/加仑作为响应变量(Y)。

X =(重量、气缸、马力);Y = MPG;

火车回归树使用XY

Mdl = fitrtree (X, Y);

查看训练回归树的图形化显示。

视图(Mdl,“模式”,“图”)

图回归树查看器包含一个坐标轴对象和其他对象类型的uimenu, uicontrol。坐标轴对象包含60线类型的对象,文本。一个或多个行显示的值只使用标记

创建一个PDP的第一个预测变量,重量

plotPartialDependence (Mdl, 1)

图包含一个坐标轴对象。坐标轴对象与标题部分依赖图,包含x1, ylabel Y包含一个类型的对象。

绘制线代表平均部分之间的关系重量(标记为x1),英里/加仑(标记为Y)训练回归树Mdl。的x设在小蜱虫代表的惟一值x1

回归树查看器显示第一个决定是否x1小于3085.5。PDP显示附近的一个大变化x1= 3085.5。每个节点的树查看器可视化每个决策基于预测变量。你可以找到几个节点分裂值的基础上x1,但确定的依赖Yx1是不容易的。然而,plotPartialDependence土地平均预测反应x1,所以你可以清楚地看到的部分依赖Yx1

标签x1Y的默认值预测的名字和响应的名字。您可以修改这些名称通过指定名称参数PredictorNamesResponseName当你训练Mdl使用fitrtree。您还可以通过修改轴标签包含ylabel功能。

朴素贝叶斯分类模型的训练fisheriris数据集,并创建一个PDP显示预测变量之间的关系和预测的分数为多个类(后验概率)。

加载fisheriris数据集,其中包含物种(物种)和测量(花萼长度,萼片宽,花瓣长度和花瓣宽度150虹膜样本。数据集包含50个标本每个三个物种:setosa,杂色的,virginica。

负载fisheriris

训练朴素贝叶斯分类模型物种的反应,为预测因子。

Mdl = fitcnb(量、种类);

创建一个PDP的评分预测Mdl所有的三个类物种针对第三个预测变量x3。通过使用指定的类标签一会的属性Mdl

plotPartialDependence (Mdl 3 Mdl.ClassNames);

图包含一个坐标轴对象。坐标轴对象与标题部分依赖图,包含x3, ylabel分数包含3线类型的对象。杂色的,这些对象代表setosa virginica。

根据这个模型,的概率virginica增加而x3。的概率setosa约为0.33,从哪里x3的概率是0到2.5左右,然后降到几乎为0。

火车一个高斯过程回归模型使用生成的样本数据,响应变量包括预测变量之间的相互作用。然后,创建冰情节显示特性之间的关系为每个观测和预测的反应。

生成样本预测数据x1x2

rng (“默认”)%的再现性n = 200;x1 =兰德(n - 1) * 2 - 1;x2 =兰德(n - 1) * 2 - 1;

生成响应值,包括之间的相互作用x1x2

Y = x1-2 * x1。* (x2 > 0) + 0.1 *兰德(n, 1);

创建一个高斯过程回归模型使用(x1, x2))Y

Mdl = fitrgp (x1, x2), Y);

创建一个图包括一个PDP(红线)第一个预测x1散点图(圆圈标记)x1并预测反应,和一组冰情节(灰色行)通过指定有条件的为“为中心”

plotPartialDependence (Mdl 1“条件”,“中心”)

图包含一个坐标轴对象。坐标轴对象与标题个人条件期望的情节,包含x1, ylabel Y包含202行,类型的对象分散。

有条件的是“为中心”,plotPartialDependence补偿情节,使所有情节从0开始,这有助于检查所选特征的累积效应。

PDP发现平均关系,所以没有发现隐藏的依赖关系特别是反应包括特性之间的相互作用。然而,冰情节清楚显示两种不同的依赖关系的反应x1

训练分类模型和创建两个pdp的合奏,一个使用训练数据集,另一个使用新的数据集。

加载census1994数据集,其中包含我们年薪数据,分类< = 50 k> 50 k,一些人口统计学变量。

负载census1994

从表中提取变量分析的一个子集adultdata成人

X = adultdata (:,“年龄”,“workClass”,“education_num”,“marital_status”,“种族”,“性”,“capital_gain”,“capital_loss”,“hours_per_week”,“工资”]);Xnew =成人(:,“年龄”,“workClass”,“education_num”,“marital_status”,“种族”,“性”,“capital_gain”,“capital_loss”,“hours_per_week”,“工资”]);

训练一个分类器工资作为反应,其余变量预测使用的功能fitcensemble。对于二进制分类,fitcensemble总量100分类树使用LogitBoost方法。

Mdl = fitcensemble (X,“工资”);

检查的类名Mdl

Mdl.ClassNames
ans =2 x1分类< = 50 k > 50 k

创建一个部分依赖成绩预测的情节Mdl的第二课堂工资(> 50 k对预测)年龄使用训练数据。

plotPartialDependence (Mdl“年龄”Mdl.ClassNames (2))

图包含一个坐标轴对象。坐标轴对象与标题部分依赖图,包含年龄,ylabel分数类> 50 k的包含一个类型的对象。

创建一个分数的PDP类> 50 k年龄从表中使用新的预测数据Xnew

plotPartialDependence (Mdl“年龄”Xnew Mdl.ClassNames (2))

图包含一个坐标轴对象。坐标轴对象与标题部分依赖图,包含年龄,ylabel分数类> 50 k的包含一个类型的对象。

两个情节显示类似形状的部分依赖预测分数高工资(> 50 k)年龄。两个图表明,预测分数高的工资快速上涨,直到30岁,然后保持几乎不变直到60岁,然后迅速下降。然而,情节基于新的数据产生较高分数超过65岁。

创建一个PDP分析预测和异常分数之间的关系isolationForest对象。你不能通过isolationForest直接对象plotPartialDependence函数。相反,定义一个自定义函数,返回异常分数为对象,然后通过函数plotPartialDependence

1994年的人口普查数据加载存储census1994.mat。数据集由美国人口普查局的人口数据。

负载census1994

census1994包含两个数据集adultdata成人

火车一个隔离森林模型成人。这个函数iforest返回一个IsolationForest对象。

rng (“默认”)%的再现性Mdl = iforest(成人);

定义自定义函数myAnomalyScores,它返回的异常分数的计算isanomaly的函数IsolationForest;自定义函数定义出现在这个例子的结束

创建一个PDP的异常分数对变量年龄成人数据集。plotPartialDependence接受一个定制的模型函数形式的处理。所表示的函数函数处理必须接受预测数据并返回一个列向量或矩阵的每一行的观察。指定自定义模型@(台)myAnomalyScores (Mdl(资源)自定义函数使用训练模型Mdl和接受预测数据。

plotPartialDependence(@(台)myAnomalyScores (Mdl(资源),“年龄”、成人)包含(“年龄”)ylabel (“异常分数”)

图包含一个坐标轴对象。坐标轴对象与标题部分依赖图,包含年龄,ylabel异常分数包含一个类型的对象。

自定义函数myAnomalyScores

函数成绩= myAnomalyScores (Mdl(资源)[~,分数]= isanomaly (Mdl(资源);结束

火车回归整体使用carsmall数据集,并创建一个PDP情节和冰情节为每个预测变量使用一个新的数据集,carbig。然后,比较数据分析预测变量的重要性。另外,比较预测的结果与估计返回的重要性predictorImportance函数。

加载carsmall数据集。

负载carsmall

指定重量,气缸,马力,Model_Year作为预测变量(X),英里/加仑作为响应变量(Y)。

X =[重量、气缸、马力,Model_Year];Y = MPG;

火车回归整体使用XY

Mdl = fitrensemble (X, Y,“PredictorNames”,(“重量”,“气缸”,“马力”,“模型”),“ResponseName”,“英里”);

创建通过使用预测变量的重要性plotPartialDependencepredictorImportance功能。的plotPartialDependence函数可视化选择预测和预测反应之间的关系。predictorImportance总结了与一个值预测的重要性。

创建一个图包括一个PDP情节(红色线)和冰情节为每个预测使用(灰色行)plotPartialDependence并指定”条件”、“绝对”。每个图还包括一个散点图(圆圈标记)选择的预测和预测反应。同时,加载carbig数据集和使用它作为新的预测数据,Xnew。当你提供Xnew,plotPartialDependence函数使用Xnew而不是预测数据Mdl

负载carbigXnew =[重量、气缸、马力,Model_Year];图t = tiledlayout (2, 2,“TileSpacing”,“紧凑”);标题(t)“个人条件期望的阴谋”)i = 1: 4 nexttile plotPartialDependence (Xnew Mdl,我,“条件”,“绝对”)标题(”“)结束

图包含4轴对象。坐标轴对象1包含重量,ylabel MPG包含408行类型的对象,散射。坐标轴对象和包含2缸,ylabel MPG包含408行类型的对象,散射。坐标轴对象和包含3马力,ylabel MPG包含408行类型的对象,散射。轴与包含模型对象4年,ylabel MPG包含408行类型的对象,散射。

计算估计预测重要的用predictorImportance。这个函数和均方误差(MSE)的变化将在每一个预测,分裂,然后把和分支节点的数量。

小鬼= predictorImportance (Mdl);图酒吧(imp)标题(“预测重要性估计”)ylabel (“估计”)包含(“预测”甘氨胆酸)ax =;斧子。XTickLabel = Mdl.PredictorNames;

图包含一个坐标轴对象。坐标轴对象与标题预测重要性估计,包含预测,ylabel估计包含一个对象类型的酒吧。

的变量重量最影响吗英里/加仑根据预测的重要性。PDP的重量也表明,英里/加仑具有较高的部分依赖重量。的变量气缸至少影响了吗英里/加仑根据预测的重要性。PDP的气缸也表明,英里/加仑不会改变取决于多少气缸

火车一个广义相加模型(GAM)与线性预测和交互方面。然后,创建一个PDP线性和交互条款和PDP只有线性的条件。指定是否要包括交互创建pdp时。

加载电离层数据集。这个数据集有34个预测因子和351二进制响应雷达回报,要么坏(“b”)或好(‘g’)。

负载电离层

使用预测训练GAMX和类标签Y。推荐的做法是指定类名。指定包含10个最重要的互动。

Mdl = fitcgam (X, Y,“类名”,{“b”,‘g’},“互动”10);

Mdl是一个ClassificationGAM模型对象。

交互术语列表Mdl

Mdl.Interactions
ans =10×21 5 6 7 8 6 7 5 5 7 5 8 3 5 4 7 1 7 4 5

每一行的的相互作用代表一个交互术语和包含的列索引的预测变量的交互项。

在交互方面找到最常见的预测。

模式(Mdl.Interactions,“所有”)
ans = 5

最常见的预测在交互方面是5日预测(x5)。为第五预测创建pdp。排除交互方面的计算,指定“IncludeInteractions”,假对于第二个PDP。

plotPartialDependence (Mdl 5 Mdl.ClassNames (1))plotPartialDependence (Mdl 5 Mdl.ClassNames (1),“IncludeInteractions”假)网格传奇(“线性和交互条款”,只“线性”)标题(“第五预测pdp的后验概率”)举行

图包含一个坐标轴对象。坐标轴对象与标题pdp 5日预测的后验概率,包含x5, ylabel得分的b类包含2线类型的对象。这些对象是线性和互动方面,线性条件。

情节表明,部分依赖的分数(后验概率)x5不同取决于模型包括交互方面,尤其是在哪里x5在0.2和0.45之间。

训练支持向量机(万博1manbetxSVM)回归模型使用carsmall数据集,并创建两个预测变量的PDP。然后,提取局部估计的输出的依赖plotPartialDependence。另外,您可以通过使用部分依赖值partialDependence函数。

加载carsmall数据集。

负载carsmall

指定重量,气缸,位移,马力作为预测变量(资源描述)。

台=表(重量、汽缸、排量、马力);

构建一个支持向量机回归模型使用资源描述和响应变量英里/加仑。使用高斯核函数与一个自动内核规模。

Mdl = fitrsvm (MPG(资源,“ResponseName”,“英里”,“CategoricalPredictors”,“气缸”,“标准化”,真的,“KernelFunction”,“高斯”,“KernelScale”,“汽车”);

创建一个可视化的PDP部分依赖预测响应(英里/加仑在预测变量)重量气缸。指定查询点计算部分依赖重量通过使用QueryPoints名称-值参数。你不能指定QueryPoints气缸因为它是一个分类变量。plotPartialDependence使用所有分类值。

pt = linspace (min(重量),max(重量),50)';ax = plotPartialDependence (Mdl, (“重量”,“气缸”),“QueryPoints”,{pt, []});视图(140,30)%修改视角

图包含一个坐标轴对象。坐标轴对象与标题部分依赖图,包含重量,ylabel圆柱体表面包含一个类型的对象。

PDP显示之间的相互影响重量气缸。的部分依赖英里/加仑重量根据价值的变化气缸

提取估计部分依赖英里/加仑重量气缸。的XData,YData,ZData的值ax.Children轴值(第一个选择的预测值),轴值(第二选择的预测值),和z轴的值(值)对应的部分依赖,分别。

xval = ax.Children.XData;yval = ax.Children.YData;zval = ax.Children.ZData;

另外,您可以通过使用部分依赖值partialDependence函数。

(pd, x, y) = partialDependence (Mdl, (“重量”,“气缸”),“QueryPoints”,{pt, []});

pd包含部分依赖查询点的值xy

如果您指定有条件的为“绝对的“,plotPartialDependence创建一个图包括PDP,散点图,和一组冰情节。ax.Children (1)ax.Children (2)分别对应于PDP和散点图。其余的元素ax.Children对应冰情节。的XDataYData的值ax.Children(我)轴值(选择的预测值)和轴的值(值)对应的部分依赖,分别。

输入参数

全部折叠

回归模型,指定为一个完整的或紧凑的回归模型对象,如下表中给出支持的模型。万博1manbetx

模型 全部或紧凑的模型对象
广义线性模型 GeneralizedLinearModel,CompactGeneralizedLinearModel
广义线性混合效应模型 GeneralizedLinearMixedModel
线性回归 LinearModel,CompactLinearModel
线性混合效应模型 LinearMixedModel
非线性回归 NonLinearModel
整体的回归模型 RegressionEnsemble,RegressionBaggedEnsemble,CompactRegressionEnsemble
广义可加模型(GAM) RegressionGAM,CompactRegressionGAM
高斯过程回归 RegressionGP,CompactRegressionGP
高斯核函数回归模型使用随机特性的扩张 RegressionKernel
对高维数据线性回归 RegressionLinear
神经网络回归模型 RegressionNeuralNetwork,CompactRegressionNeuralNetwork
万博1manbetx支持向量机(SVM)回归 RegressionSVM,CompactRegressionSVM
回归树 RegressionTree,CompactRegressionTree
引导聚合合奏的决策树 TreeBagger,CompactTreeBagger

如果RegressionMdl是一个模型对象,不包含预测数据(例如,一个紧凑的模型),你必须提供输入参数了吗数据

plotPartialDependence不支持一个模型对象万博1manbetx训练的稀疏矩阵。当你训练模型,对预测数据使用一个完整的数字矩阵或表行对应于观测的地方。

分类模型,指定为一个完整的或紧凑的分类模型对象,按照下表支持的模型。万博1manbetx

模型 全部或紧凑的模型对象
判别分析分类器 ClassificationDiscriminant,CompactClassificationDiscriminant
多类支持向量机模型或其他分类器万博1manbetx ClassificationECOC,CompactClassificationECOC
系综分类的学习者 ClassificationEnsemble,CompactClassificationEnsemble,ClassificationBaggedEnsemble
广义可加模型(GAM) ClassificationGAM,CompactClassificationGAM
高斯核函数分类模型使用随机特性的扩张 ClassificationKernel
k最近的邻居分类器 ClassificationKNN
线性分类模型 ClassificationLinear
多级朴素贝叶斯模型 ClassificationNaiveBayes,CompactClassificationNaiveBayes
神经网络分类器 ClassificationNeuralNetwork,CompactClassificationNeuralNetwork
万博1manbetx支持向量机(SVM)分类器看到下面成了和二进制分类 ClassificationSVM,CompactClassificationSVM
二叉决策树的多类分类 ClassificationTree,CompactClassificationTree
袋装的决策树 TreeBagger,CompactTreeBagger
多项式回归模型 MultinomialRegression

如果ClassificationMdl是一个模型对象,不包含预测数据(例如,一个紧凑的模型),你必须提供输入参数了吗数据

plotPartialDependence不支持一个模型对象万博1manbetx训练的稀疏矩阵。当你训练模型,对预测数据使用一个完整的数字矩阵或表行对应于观测的地方。

自定义模型,指定为一个函数处理。函数处理有趣的必须代表一个函数,它接受了预测数据数据并返回一个输出一个列向量或矩阵的形式。每一行的输出必须对应于每个观察(行)的预测数据。

默认情况下,plotPartialDependence使用的所有输出列有趣的的部分依赖计算。您可以指定使用哪个输出列通过设置OutputColumns名称-值参数。

如果预测数据(数据)是在一个表中,plotPartialDependence假设变量是直言如果它是一个逻辑向量,分类向量,字符数组,字符串数组或单元阵列特征向量。如果预测数据是一个矩阵,plotPartialDependence假设所有的预测都是连续的。识别任何其他预测分类预测,通过使用指定它们CategoricalPredictors名称-值参数。

数据类型:function_handle

预测变量指定为一个向量的正整数,特征向量,字符串标量字符串数组或单元阵列特征向量。您可以指定一个或两个预测变量,如下表所示。

一个预测变量

价值 描述
正整数 索引值对应的列预测数据。
特征向量或字符串标量

预测变量的名称。的名称必须匹配条目PredictorNames财产RegressionMdlClassificationMdl或变量名数据表中为一个自定义模型有趣的

两个预测变量

价值 描述
向量的两个正整数 索引值对应的列预测数据。
字符串数组或单元阵列的特征向量

预测变量的名称。数组中的每个元素是一个预测变量的名字。名称必须匹配的条目PredictorNames财产RegressionMdlClassificationMdl或变量的名字数据表中为一个自定义模型有趣的

如果你指定两个预测变量,你必须指定一个类标签ClassificationMdl或者指定一个输出列OutputColumns为一个自定义模型有趣的

例子:[" x1”、“x3”)

数据类型:||字符|字符串|细胞

类标签,分类或字符数组,指定逻辑或者数值向量、数组或单元的特征向量。和数据类型的值标签必须匹配的类名的一会的属性ClassificationMdl(ClassificationMdl.ClassNames)。

  • 您可以指定多个类标签只有当你指定一个变量var并指定有条件的作为“没有”(默认)。

  • 使用partialDependence如果你想计算部分依赖两个变量和多个类标签在一个函数调用。

这个论点是有效的只有当你指定一个分类模型对象ClassificationMdl

例子:(“红”、“蓝色”)

例子:ClassificationMdl.ClassNames((13])指定标签第一和第三类ClassificationMdl

数据类型:||逻辑|字符|细胞|分类

预测数据,指定为一个数字矩阵或表。每一行的数据对应于一个观察,每一列对应一个变量。

对回归模型(RegressionMdl)和一个分类模型(ClassificationMdl),数据必须符合训练模型的预测数据,存储在的吗X变量财产。

  • 如果你训练模型使用一个数字矩阵,数据必须是一个数字矩阵。的变量的列数据必须有相同的号码和订单预测变量,训练模型。

  • 如果你训练模型使用一个表(例如,资源描述),然后数据必须是一个表。所有的预测变量数据必须有相同的变量名和数据类型的名称和类型资源描述。然而,列的顺序数据不需要对应的列顺序资源描述

  • 数据一定不能少。

如果你指定一个回归或分类模型,该模型不包含预测数据,您必须提供数据。如果模型是一个完整的模型对象,其中包含预测数据和指定数据参数,然后plotPartialDependence忽略了预测模型中的数据,并使用数据只有。

如果您指定一个自定义模型有趣的,你必须提供数据

数据类型:||

名称-值参数

指定可选的双参数作为Name1 = Value1,…,以=家,在那里的名字参数名称和吗价值相应的价值。名称-值参数必须出现在其他参数,但对的顺序无关紧要。

R2021a之前,用逗号来分隔每一个名称和值,并附上的名字在报价。

例子:plotPartialDependence (Mdl、var、数据“NumObservationsToSample”, 100年,“UseParallel”,真的)创建一个PDP用100采样观测数据和执行循环迭代并行。

情节类型,指定为“没有”,“绝对”,或“中心”

价值 描述
“没有”

plotPartialDependence创建一个PDP。情节类型取决于预测变量中指定的数量var

  • 一个预测变量,plotPartialDependence创建一个二维线的情节部分依赖。如果您提供一个分类模型(ClassificationMdl),该函数为每个类创建一个线情节标签中指定标签。如果您提供一个定制的模型(有趣的),每一列的函数创建一个线路图返回的输出有趣的。您可以指定使用哪个输出列通过设置OutputColumns名称-值参数。

  • 两个预测变量,plotPartialDependence创建一个表面的情节部分依赖两个变量。对于一个分类模型,您必须指定一个类标签标签。为一个自定义的模型时,您必须提供一个模型,它返回一个列向量或指定使用哪个输出列通过设置OutputColumns名称-值参数。

“绝对”

plotPartialDependence创建一个图,包括三种类型的情节:

  • PDP红线

  • 散点图的选择预测变量和预测反应或得分圈标记

  • 冰情节为每个观察灰线

使用“绝对”选项,您必须指定一个预测变量var。此外,对于一个分类模型,您必须指定一个类标签标签。为一个自定义的模型时,您必须提供一个模型,它返回一个列向量或指定使用哪个输出列通过设置OutputColumns名称-值参数。

“中心”

plotPartialDependence创建一个图,其中包括三种类型的情节一样“绝对”。函数补偿情节,使所有情节从0开始。

使用“中心”选项,您必须指定一个预测变量var。此外,对于一个分类模型,您必须指定一个类标签标签。为一个自定义的模型时,您必须提供一个模型,它返回一个列向量或指定使用哪个输出列通过设置OutputColumns名称-值参数。

例子:“有条件”、“绝对”

标志包括交互的广义相加模型(GAM)部分依赖计算,指定为真正的。这个论点是有效的只有GAM。也就是说,您可以指定这个论点只有当RegressionMdlRegressionGAMCompactRegressionGAM,或ClassificationMdlClassificationGAMCompactClassificationGAM

默认的IncludeInteractions值是真正的如果模型包含交互方面。的值必须如果模型不包含交互方面。

例子:“IncludeInteractions”,假的

数据类型:逻辑

标记包含一个截距项的广义相加模型(GAM)部分依赖计算,指定为真正的。这个论点是有效的只有GAM。也就是说,您可以指定这个论点只有当RegressionMdlRegressionGAMCompactRegressionGAM,或ClassificationMdlClassificationGAMCompactClassificationGAM

例子:“IncludeIntercept”,假的

数据类型:逻辑

数量的观测样本,指定为一个正整数。默认值是总数量的观察数据或模型(RegressionMdlClassificationMdl)。如果你指定一个值大于总数量的观察,然后plotPartialDependence使用所有的观察。

plotPartialDependence样本观测不重复使用datasample功能和使用采样观测计算部分依赖。

plotPartialDependence显示小刻度线的惟一值采样观测。

如果您指定有条件的作为“绝对”“中心”,plotPartialDependence创建一个为每个采样观测图包括一个冰的阴谋。

例子:“NumObservationsToSample”, 100

数据类型:|

轴的情节,指定为一个坐标轴对象。如果你不指定轴和如果当前轴是笛卡尔,plotPartialDependence使用当前轴(gca)。如果轴不存在,plotPartialDependence情节在一个新的数字。

例子:“父”,斧头

点为数值计算部分依赖预测,指定为一个数字列向量,一个数字两列矩阵,或一个单元阵列的两个数值列向量。

  • 如果你选择一个预测变量var,使用一个数字列向量。

  • 如果你选择两个预测变量var:

    • 使用一个数字两列矩阵指定为每个预测变量相同数量的点。

    • 使用单元阵列的两个数值列向量指定为每个预测变量不同数量的点。

默认值是一个数字列向量或一个数字两列矩阵,根据选择的预测变量的数量。每一列包含100个等间距的最小值和最大值之间的点的采样观察相应的预测变量。

如果有条件的“绝对”“中心”,然后软件增加了预测的数据值(数据或预测数据RegressionMdlClassificationMdl)选择预测的查询点。

您不能修改QueryPoints类别变量。的plotPartialDependence函数使用所有分类值在选定的变量中。

如果您选择一个数值型变量和一个分类变量,您可以指定QueryPoints数值变量用一个单元阵列组成的数字列向量和一个空数组。

例子:“QueryPoints”{pt, []}

数据类型:||细胞

国旗并行运行,指定为真正的。如果您指定“UseParallel”,真的,plotPartialDependence函数执行通过循环迭代parfor当预测反应或为每个观察和平均成绩。并行循环运行时并行计算工具箱™。

例子:“UseParallel”,真的

数据类型:逻辑

自定义模型的分类预测列表有趣的,指定为这个表中的值之一。

价值 描述
向量的正整数

向量中的每个条目是一个索引值表明相应的预测分类。索引值介于1和p,在那里p变量的数量吗数据

逻辑向量

一个真正的意味着相应的预测分类条目。向量的长度p

字符矩阵 矩阵的每一行是一个预测变量的名字。名称必须匹配的变量名预测数据数据在一个表中。垫的名字与额外的空格字符矩阵的每一行有相同的长度。
字符串数组或单元阵列的特征向量 数组中的每个元素是一个预测变量的名字。名称必须匹配的变量名预测数据数据在一个表中。
“所有” 所有预测都直言。

默认情况下,如果预测数据数据在一个表,plotPartialDependence假设变量是直言如果它是一个逻辑向量,分类向量,字符数组,字符串数组或单元阵列特征向量。如果预测数据是一个矩阵,plotPartialDependence假设所有的预测都是连续的。识别任何其他预测分类预测,通过使用指定它们CategoricalPredictors名称-值参数。

这个论点是有效的只有当你指定一个自定义模型通过使用有趣的

例子:“CategoricalPredictors”、“所有”

数据类型:||逻辑|字符|字符串|细胞

自定义模型的输出列有趣的对部分依赖计算,使用指定的值在这个表。

价值 描述
向量的正整数

中的每个条目表示向量索引值plotPartialDependence使用相应的输出列部分依赖计算。索引值介于1和,在那里是输出矩阵的列数返回的自定义模型有趣的

逻辑向量

一个真正的条目意味着plotPartialDependence使用相应的输出列部分依赖计算。向量的长度

“所有” plotPartialDependence使用所有输出列的部分依赖计算。

  • 您可以指定多个输出列只有当你指定一个变量var并指定有条件的作为“没有”(默认)。

  • 使用partialDependence如果你想计算部分依赖两个变量和多个输出列在一个函数调用。

这个论点是有效的只有当你指定一个自定义模型通过使用有趣的

例子:“OutputColumns”, [1 - 2]

数据类型:||逻辑|字符|字符串

输出参数

全部折叠

轴的情节,作为一个坐标轴对象返回。有关如何修改轴的外观和提取数据从情节,看到的轴的外观从图中提取部分依赖估计

更多关于

全部折叠

回归模型的部分依赖

部分依赖[1]代表之间的关系预测变量和预测反应在一个训练有素的回归模型。plotPartialDependence计算预测反应的部分依赖于预测变量的子集在其他变量被边缘化。

考虑部分的一个子集的依赖X年代整个预测变量的集合X= {x1,x2、…x}。一个子集X年代包括一个变量或两个变量:X年代= {xS1}X年代= {xS1,xS2}。让XC是互补的X年代X。预测的响应f(X)取决于所有变量X:

f(X)=f(X年代,XC)。

预测反应的部分依赖X年代被定义为预期的期望响应对吗XC:

f 年代 ( X 年代 ) = E C ( f ( X 年代 , X C ) ] = f ( X 年代 , X C ) p C ( X C ) d X C ,

在哪里pC(XC)的边际概率XC,也就是说, p C ( X C ) p ( X 年代 , X C ) d X 年代 。假设每个观察是等可能的,和之间的依赖X年代XC的相互作用X年代XC在反应不强,plotPartialDependence估计部分依赖通过观察预测数据如下:

f 年代 ( X 年代 ) 1 N = 1 N f ( X 年代 , X C ) , (1)

在哪里N是观察和的数量吗X= (X年代,XC)观察。

当你打电话给plotPartialDependence功能,您可以指定一个训练有素的模型(f (·)),并选择变量(X年代通过使用输入参数)RegressionMdlvar,分别。plotPartialDependence计算部分依赖于100的均匀间隔的点X年代或您指定的点使用QueryPoints名称-值参数。您可以指定号码(N)的观测样本给定预测数据使用NumObservationsToSample名称-值参数。

个人条件期望的回归模型

一个单独的条件期望(ICE)[2]作为一个扩展部分依赖,代表一个预测变量之间的关系对每个观察和预测的反应。虽然部分依赖关系显示了平均预测变量和预测反应,一套冰情节分解的平均信息,显示了每个个体依赖观察。

plotPartialDependence创建一个为每个观察冰情节。一套冰情节是有用的调查部分依赖来自异构性问题不同的观察结果。plotPartialDependence还可以创建冰情节与任何预测数据通过输入参数提供数据。您可以使用此功能来探索预测反应空间。

考虑一个冰情节选择的预测变量x年代与给定的观察XC,在那里X年代= {x年代},XC补充的吗X年代在整个变量集X,X= (X年代,XC)观察。冰图对应的被加数求和方程1:

f 年代 ( X 年代 ) = f ( X 年代 , X C )

plotPartialDependence情节 f 年代 ( X 年代 ) 对于每一个观察当你指定有条件的作为“绝对”。如果您指定有条件的作为“中心”,plotPartialDependence吸引所有的阴谋后去除水平影响由于不同的观察:

f 年代 , 为中心的 ( X 年代 ) = f ( X 年代 , X C ) f ( 最小值 ( X 年代 ) , X C )

这种减法可以确保每个情节从0开始,这样你就可以检查的累积效应X年代和之间的交互X年代XC

部分依赖和冰分类模型

的分类模型,plotPartialDependence计算部分依赖和个人条件期望的回归模型一样,但有一个例外:而不是使用的预测响应模型,预测分数的函数使用中指定的类标签

加权算法遍历

加权算法遍历[1]是一个方法来估计部分依赖基于树模型。估计部分依赖响应或分数值的加权平均叶节点对应在树遍历访问。

X年代是整个变量集的一个子集XXC是互补的X年代X。为每一个X年代值计算部分依赖,该算法遍历树的根(开始)节点到叶节点(终端),发现叶节点的权重。遍历首先分配一个权重值的一个根节点。如果一个节点分裂X年代,该算法遍历到适当的子节点根据X年代价值。子节点的重量是相同的值作为它的父节点。如果一个节点分裂XC,该算法遍历子节点。每个子节点的重量成为它的父节点的价值乘以对应的分数的观察每个孩子节点。在完成遍历树,该算法通过使用分配的权重计算加权平均。

袋装的合奏树木,估计部分依赖平均单个树的加权平均。

算法

对回归模型(RegressionMdl)和一个分类模型(ClassificationMdl),plotPartialDependence使用一个预测函数来预测反应或分数。plotPartialDependence选择适当的预测根据模型和运行时功能预测默认设置。对每个细节预测功能,请参见预测在接下来的两个表的功能。如果指定的模型是一个基于树模型(不包括提高合奏的树)有条件的“没有”,然后plotPartialDependence使用加权算法遍历而不是预测函数。有关详细信息,请参见加权算法遍历

回归模型对象

模型类型 全部或紧凑的回归模型对象 函数来预测反应
引导聚合合奏的决策树 CompactTreeBagger 预测
引导聚合合奏的决策树 TreeBagger 预测
整体的回归模型 RegressionEnsemble,RegressionBaggedEnsemble,CompactRegressionEnsemble 预测
高斯核函数回归模型使用随机特性的扩张 RegressionKernel 预测
高斯过程回归 RegressionGP,CompactRegressionGP 预测
广义加性模型 RegressionGAM,CompactRegressionGAM 预测
广义线性混合效应模型 GeneralizedLinearMixedModel 预测
广义线性模型 GeneralizedLinearModel,CompactGeneralizedLinearModel 预测
线性混合效应模型 LinearMixedModel 预测
线性回归 LinearModel,CompactLinearModel 预测
对高维数据线性回归 RegressionLinear 预测
神经网络回归模型 RegressionNeuralNetwork,CompactRegressionNeuralNetwork 预测
非线性回归 NonLinearModel 预测
回归树 RegressionTree,CompactRegressionTree 预测
万博1manbetx支持向量机 RegressionSVM,CompactRegressionSVM 预测

分类模型对象

模型类型 全部或紧凑的分类模型对象 函数来预测标签和分数
判别分析分类器 ClassificationDiscriminant,CompactClassificationDiscriminant 预测
多类支持向量机模型或其他分类器万博1manbetx ClassificationECOC,CompactClassificationECOC 预测
系综分类的学习者 ClassificationEnsemble,CompactClassificationEnsemble,ClassificationBaggedEnsemble 预测
高斯核函数分类模型使用随机特性的扩张 ClassificationKernel 预测
广义加性模型 ClassificationGAM,CompactClassificationGAM 预测
k最近的邻居模型 ClassificationKNN 预测
线性分类模型 ClassificationLinear 预测
朴素贝叶斯模型 ClassificationNaiveBayes,CompactClassificationNaiveBayes 预测
神经网络分类器 ClassificationNeuralNetwork,CompactClassificationNeuralNetwork 预测
万博1manbetx看到下面成了一和二分类支持向量机 ClassificationSVM,CompactClassificationSVM 预测
二叉决策树的多类分类 ClassificationTree,CompactClassificationTree 预测
袋装的决策树 TreeBagger,CompactTreeBagger 预测

选择功能

  • partialDependence没有可视化计算部分依赖。函数可以计算部分依赖两个变量和一个函数调用多个类。

引用

[1]弗里德曼,杰罗姆。h .“贪婪的近似函数:一个梯度增加机器”。统计年报29日,没有。5 (2001):1189 - 1232。

[2]戈尔茨坦,亚历克斯,亚当Kapelner,贾斯汀布莱西,埃米尔皮特金。“偷看里面的黑盒:可视化统计学习与个人条件期望的情节。”计算和图形统计杂志》上24日,没有。1(2015年1月2日):44 - 65。

[3]Hastie,特雷弗,罗伯特•Tibshirani和杰罗姆·弗里德曼。统计学习的元素。纽约纽约,纽约州:施普林格,2001年。

扩展功能

版本历史

介绍了R2017b

全部展开