适合
描述
指定的查询计算夏普利值点(newExplainer
=健康(讲解员
,queryPoint
)queryPoint
)和存储计算夏普利值ShapleyValues
的属性newExplainer
。的沙普利
对象讲解员
包含一个机器学习模型和选择计算夏普利值。
适合
利用夏普利值计算选项创建时指定讲解员
。您可以更改的选项使用名称-值参数适合
函数。函数返回一个沙普利
对象newExplainer
包含新计算夏普利值。
使用一个或多个名称参数指定附加选项。例如,指定newExplainer
=健康(讲解员
,queryPoint
,名称,值
)“UseParallel”,真的
并行计算夏普利值。
例子
创建沙普利
使用对象和计算夏普利值适合
训练一个回归模型,并创建一个沙普利
对象。当您创建一个沙普利
查询对象,如果你不指定一个点,然后软件不计算夏普利值。使用目标函数适合
指定的查询计算夏普利值点。然后创建一个条形图的夏普利值通过使用对象的功能情节
。
加载carbig
的数据集,其中包含测量汽车在1970年代末和1980年代初。
负载carbig
创建一个表包含预测变量加速度
,气缸
等等,以及响应变量英里/加仑
。
台=表(加速度、汽缸、排量、马力、Model_Year重量,MPG);
删除缺失值在一个训练集可以帮助减少内存消耗,加速训练fitrkernel
函数。删除缺失值资源描述
。
台= rmmissing(台);
火车的黑箱模型英里/加仑
通过使用fitrkernel
函数
rng (“默认”)%的再现性mdl = fitrkernel(资源描述,“英里”,“CategoricalPredictors”[2 - 5]);
创建一个沙普利
对象。指定的数据集资源描述
,因为mdl
不包含训练数据。
讲解员=沙普利(mdl(资源)
讲解员=沙普利与属性:BlackboxModel: [1 x1 RegressionKernel] QueryPoint: [] BlackboxFitted: [] ShapleyValues: [] NumSubsets: 64 X: [392 x7表]CategoricalPredictors:[2 5]方法:“interventional-kernel”拦截:22.6202
讲解员
存储训练数据资源描述
在X
财产。
计算所有预测变量的夏普利值第一观察资源描述
。
:queryPoint =(资源(1)
queryPoint =表1×7加速汽缸位移马力Model_Year重量MPG _______ _____ _______ __________ __________ ______ ___ 12 8 307 130 70 3504
讲解员=适合(讲解员,queryPoint);
回归模型,沙普利
使用预测响应计算夏普利值,并将它们存储在ShapleyValues
财产。显示的值ShapleyValues
财产。
explainer.ShapleyValues
ans =6×2表预测_______ ShapleyValue * * *“加速度”-0.1561“气缸”-0.18306“位移”-0.34203“马力”-0.27291“Model_Year”-0.2926“重量”-0.32402
情节的夏普利值查询使用情节
函数。
情节(讲解员)
水平条形图显示了所有变量的夏普利值,按他们的绝对值。每个夏普利值解释查询的预测点的偏差从平均,由于相应的变量。
计算多个查询点的夏普利值
训练一个分类模型,并创建一个沙普利
对象。然后计算多个查询点的夏普利值。
加载CreditRating_Historical
数据集,数据集包含客户id和他们的财务比率,行业标签,信用评级。
台= readtable (“CreditRating_Historical.dat”);
火车的黑箱模型使用的信用评级fitcecoc
函数。使用变量通过第七列第二资源描述
作为预测变量。
黑箱= fitcecoc(资源描述,“评级”,…“PredictorNames”tbl.Properties.VariableNames (7),…“CategoricalPredictors”,“行业”);
创建一个沙普利
对象的黑箱
模型。为更快的计算,子样品的观察的25%资源描述
与分层和使用样本来计算夏普利值。指定使用扩展内核世鹏科技电子算法。
rng (“默认”)%的再现性c = cvpartition (tbl.Rating“坚持”,0.25);:tbl_ =台(测试(c):);:tbl_讲解员=沙普利(黑盒,“方法”,“条件”);
找到两个查询点的真实等级值AAA
和B
,分别。
queryPoint (1) =: tbl_ (find (strcmp (tbl_s.Rating,“AAA”),1):);queryPoint (2) =: tbl_ (find (strcmp (tbl_s.Rating,“B”),1),:)
queryPoint =2×8表ID WC_TA RE_TA EBIT_TA MVE_BVTD S_TA行业评级_____持续累积________ _____ ________ 58258 0.511 0.869 0.106 8.538 0.732 - 2 {' AAA '} 82367 -0.078 -0.042 0.011 0.262 0.167 7 {B}
第一个查询计算和绘制夏普利值点。
explainer1 =适合(讲解员,queryPoint (1:));情节(explainer1)
第二个查询计算和绘制夏普利值点。
explainer2 =适合(讲解员,queryPoint (2:));情节(explainer2)
第二个查询点的真实评价B
,但预测评级BB
。情节展示了夏普利值预测评级。
explainer1
和explainer2
包括第一个查询的夏普利值点和第二个查询点,分别。
输入参数
讲解员
- - - - - -对象解释黑箱模型
沙普利
对象
对象解释黑箱模型,指定为一个沙普利
对象。
queryPoint
- - - - - -查询点
行向量的数值|单列表
查询点适合
解释了一个预测,指定为一个行向量的数值或单列表。
一个行向量的数值:
单列表:
如果预测数据
explainer.X
是一个表,那么所有预测变量queryPoint
必须有相同的变量名和数据类型的吗explainer.X
。然而,列的顺序queryPoint
不需要对应的列顺序explainer.X
。如果预测数据
explainer.X
是一个数字矩阵,然后预测名称explainer.BlackboxModel.PredictorNames
和相应的预测变量名称queryPoint
必须相同。使用指定预测名称在训练“PredictorNames”
名称-值参数。所有的预测变量queryPoint
必须是数值向量。queryPoint
可以包含额外的变量(响应变量,观察体重、等等),但适合
忽略了它们。适合
不支持多列变量或细万博1manbetx胞数组以外的细胞阵列的特征向量。
如果queryPoint
包含南
年代连续预测“方法”
是“条件”
,然后夏普利值(ShapleyValues
在返回的对象南
年代。否则,适合
处理南
值一样explainer.BlackboxModel
(预测
对象的函数explainer.BlackboxModel
或一个函数处理规定黑箱
)。
例子::explainer.X (1)
指定查询点作为第一个观察的预测数据X
在讲解员
。
数据类型:单
|双
|表
名称-值参数
指定可选的双参数作为Name1 = Value1,…,以=家
,在那里的名字
参数名称和吗价值
相应的价值。名称-值参数必须出现在其他参数,但对的顺序无关紧要。
R2021a之前,用逗号来分隔每一个名称和值,并附上的名字
在报价。
例子:fit(讲解员,问,‘法’,‘条件’,‘UseParallel’,真的)
计算查询的夏普利值点问
使用扩展内核世鹏科技电子算法,并行执行计算。
方法
- - - - - -沙普利值计算算法
“介入”
|“条件”
自从R2023a
沙普利值计算算法,指定为“介入”
或“条件”
。
的方法
的属性newExplainer
商店的名称选择算法。有关更多信息,请参见算法。
默认情况下,适合
函数中指定使用的算法方法
的属性讲解员
。
之前R2023a:您可以指定这个论点“interventional-kernel”
或“conditional-kernel”
。适合
万博1manbetx支持内核世鹏科技电子内核世鹏科技电子算法的算法和扩展。
例子:“方法”,“条件”
数据类型:字符
|字符串
UseParallel
- - - - - -国旗并行运行
假
(默认)|真正的
国旗并行运行,指定为真正的
或假
。如果您指定“UseParallel”,真的
,适合
函数执行为
通过循环迭代parfor
。并行循环运行时并行计算工具箱™。
这个论点时是有效的适合
函数使用树世鹏科技电子一树的算法,算法内核世鹏科技电子,或扩展内核世鹏科技电子算法。
例子:“UseParallel”,真的
数据类型:逻辑
输出参数
newExplainer
——对象解释黑箱模型
沙普利
对象
更多关于
沙普利值
在博弈论中,一个球员的夏普利值是平均边际贡献的球员合作游戏。上下文中的机器学习预测的夏普利值功能查询点解释特性预测的贡献(响应回归或得分的每个类分类)在指定的查询。
的夏普利值功能查询点的贡献平均预测偏差特性。查询点,沙普利值之和所有功能对应的总偏差预测的平均水平。也就是说,平均预测和沙普利值的总和为所有特性对应查询的预测点。
更多细节,请参阅沙普利值机器学习模型。
引用
[1]Lundberg,斯科特·M。李,美国。“一个统一的方法来解释模型的预测”。先进的神经信息处理系统30 (2017):4765 - 774。
[2]Lundberg,斯科特·M。,G. Erion, H. Chen, et al. "From Local Explanations to Global Understanding with Explainable AI for Trees."自然机器智能2(2020年1月):56 - 67。
[3]Aas、Kjersti马丁Jullum,安德斯Løland。“解释个人预测当依赖特性:更精确的近似夏普利值。”人工智能298(2021年9月)。
扩展功能
自动并行支持万博1manbetx
加速代码通过自动运行并行计算使用并行计算工具箱™。
并行运行,设置UseParallel
名称-值参数真正的
在调用这个函数。
关于并行计算的更一般的信息,请参阅MATLAB函数自动并行支持运行万博1manbetx(并行计算工具箱)。
版本历史
介绍了R2021aMATLAB命令
你点击一个链接对应MATLAB命令:
运行该命令通过输入MATLAB命令窗口。Web浏览器不支持MATLAB命令。万博1manbetx
你也可以从下面的列表中选择一个网站:
表现最好的网站怎么走吗
选择中国网站(中文或英文)最佳站点的性能。其他MathWorks国家网站不优化的访问你的位置。