主要内容

酸橙

局部可解释的模型不可知解释(LIME)

    描述

    酸橙通过寻找重要的预测器并拟合一个简单的可解释模型,解释一个查询点的机器学习模型(分类或回归)的预测。

    您可以创建酸橙具有指定查询点的机器学习模型的对象(queryPoint)和指定数量的重要预测(numImportantPredictors).该软件生成一个合成数据集,并适合一个重要预测器的简单可解释模型,该模型有效地解释了对查询点周围的合成数据的预测。简单模型可以是线性模型(默认)或决策树模型。

    使用拟合的简单模型在指定的查询点处本地解释本地机器学习模型的预测。使用情节功能可视化石灰结果。根据本地解释,您可以决定是否相信机器学习模型。

    将新的简单模型用于另一个查询点合身功能。

    创建

    描述

    例子

    结果=石灰(黑盒子创建酸橙使用机器学习模型对象的对象黑盒子包含预测数据。这酸橙函数生成一个合成预测数据集的样本,并计算样本的预测。要适合一个简单的模型,使用合身与功能结果

    例子

    结果=石灰(黑盒子X创建酸橙使用预测器数据的对象X

    结果=石灰(黑盒子'CustomSyntheticData',customsyntheticdata.创建酸橙对象,使用预生成的自定义合成预测器数据集customsyntheticdata..这酸橙功能计算样本中的预测customsyntheticdata.

    例子

    结果=石灰(___,'querypoint',queryPoint“NumImportantPredictors”,numImportantPredictors还查找指定的重要预测器数量,并适合查询点的线性简单模型queryPoint.您可以指定queryPointnumImportantPredictors除了以前的语法中的任何输入参数组合。

    结果=石灰(___名称,价值使用一个或多个名称-值对参数指定其他选项。例如,'simplemodeltype','树'指定作为决策树模型的简单模型的类型。

    输入参数

    全部展开

    要解释的机器学习模型,指定为函数句柄或完整或紧凑的回归或分类模型对象。

    预测数据,指定为数字矩阵或表。每一排X对应于一个观察,并且每列对应于一个变量。

    X必须与培训的预测数据一致黑盒子,存储在一个blackbox.X或者黑箱。变量.指定的值不能包含响应变量。

    • X必须具有与预测变量相同的数据类型(例如,trainX)训练有素黑盒子.构成列的变量X必须具有相同的数字和订单trainX

      • 如果你训练黑盒子然后使用数字矩阵X必须是一个数值矩阵。

      • 如果你训练黑盒子那就用表格吧X必须是一张桌子。所有预测因子变量X的变量名和数据类型必须与trainX

    • 酸橙不支持稀疏矩阵。万博1manbetx

    如果黑盒子是一个紧凑的机器学习模型对象或功能手柄,您必须提供X或者customsyntheticdata..如果黑盒子是一个完整的机器学习模型对象,并指定此参数,然后指定此参数酸橙不使用预测器数据黑盒子.它只使用指定的预测器数据。

    数据类型:|双倍的

    Pregenerated,自定义合成预测仪数据集,指定为数字矩阵或表。

    如果您提供预生成的数据集,那么酸橙使用提供的数据集而不是生成新的合成预测器数据集。

    customsyntheticdata.必须与培训的预测数据一致黑盒子,存储在一个blackbox.X或者黑箱。变量.指定的值不能包含响应变量。

    • customsyntheticdata.必须具有与预测变量相同的数据类型(例如,trainX)训练有素黑盒子.构成列的变量customsyntheticdata.必须具有相同的数字和订单trainX

      • 如果你训练黑盒子然后使用数字矩阵customsyntheticdata.必须是一个数值矩阵。

      • 如果你训练黑盒子那就用表格吧customsyntheticdata.必须是一张桌子。所有预测因子变量customsyntheticdata.的变量名和数据类型必须与trainX

    • 酸橙不支持稀疏矩阵。万博1manbetx

    如果黑盒子是一个紧凑的机器学习模型对象或功能手柄,您必须提供X或者customsyntheticdata..如果黑盒子是一个完整的机器学习模型对象,并指定此参数,然后指定此参数酸橙不使用预测器数据黑盒子;它只使用指定的预测器数据。

    数据类型:|双倍的|表格

    查询点酸橙解释了预测,指定为数字值的行向量或单行表中。queryPoint必须具有相同的数据类型和列数Xcustomsyntheticdata.或者预测器数据黑盒子

    如果您指定numImportantPredictorsqueryPoint,那么酸橙函数适合一个简单的模型时创建酸橙目的。

    例子:blackbox.x(1,:)指定查询点作为完整机器学习模型中的预测器数据的第一次观察黑盒子

    数据类型:|双倍的|表格

    在简单模型中使用的重要预测因子的数量指定为正整数标量值。

    • 如果'simplemodeltype''线性'然后,软件选择指定的重要预测器数量并适合所选预测器的线性模型。

    • 如果'simplemodeltype''树'然后,该软件指定作为重要预测器的数量的判定删除(或分支节点)的最大判定数量,使得拟合决策树在大多数指定的预测器中使用。

    如果您指定numImportantPredictorsqueryPoint,那么酸橙函数适合一个简单的模型时创建酸橙目的。

    数据类型:|双倍的

    名称值对参数

    指定可选的逗号分离对名称,价值论点。的名字参数名和价值是相应的价值。的名字必须出现在引号内。可以以任意顺序指定多个名称和值对参数name1,value1,...,namen,valuen

    例子:酸橙黑盒子'QueryPoint',Q,'numimportantpredictors',n,'simpleModeltype','树')指定查询点作为问:,用于简单模型的重要预测因子的数量N和简单的模型决策树模型的类型。酸橙生成合成预测器数据集的样本,计算样本的预测,并使用大多数指定的预测器数量来赋予查询点的决策树模型。
    合成预测数据的选项

    全部展开

    数据生成的合成数据的局部性,指定为逗号分隔对'datalocality'“全球”或者'当地的'

    • “全球”-该软件使用整个预测数据集(X或者是预测数据黑盒子).该软件利用估计的参数生成一个综合预测数据集,并使用该数据集对任何查询点进行简单的模型拟合。

    • '当地的'- 软件估计使用分布参数K.-查询点的最近邻居,其中K.是个'numneighbors'价值。该软件在每次适合指定查询点时都会生成新的合成预测器数据集。

    有关更多详细信息,请参阅酸橙

    例子:'Datalocality','当地'

    数据类型:char|细绳

    查询点的邻居数量,指定为逗号分隔的对组成'numneighbors'和一个正整数标量值。此参数仅在何时有效'datalocality''当地的'

    如果指定的值大于预测器数据集中的观测数(X或者是预测数据黑盒子), 然后酸橙使用所有的观察。

    例子:“NumNeighbors”,2000年

    数据类型:|双倍的

    要为合成数据集生成的样本数量,指定为由逗号分隔的对组成'NumSyntheticData'和一个正整数标量值。此参数仅在何时有效'datalocality''当地的'

    例子:'numsyntheticdata',2500

    数据类型:|双倍的

    对于简单模型选项

    全部展开

    平方指数(或高斯)内核函数的内核宽度指定为逗号分隔对组成'kernelwidth'和一个数值标量值。

    酸橙功能计算综合预测器数据集中查询点和样本之间的距离,然后通过使用平方指数内核功能将距离转换为权重。如果你降低了'kernelwidth'那么酸橙使用更重大关注查询点附近的样本的权重。有关详细信息,请参阅酸橙

    例子:'kernelwidth',0.5

    数据类型:|双倍的

    简单模型的类型,指定为逗号分隔的对组成'simplemodeltype''线性'或者'树'

    例子:'simplemodeltype','树'

    数据类型:char|细绳

    机器学习模型的选项

    全部展开

    分类预测器列表,指定为逗号分隔的配对组成'pationoricalpricictors'和这个表中的一个值。

    价值 描述
    正整数的向量 向量中的每个条目是与包含分类变量的预测数据列对应的索引值。
    逻辑矢量 一种真的条目意味着预测器数据的相应列是分类变量。
    字符矩阵 矩阵的每一行是预测器变量的名称。名称必须匹配表格中的预测器数据的变量名称。使用额外的空白填充名称,因此字符矩阵的每行具有相同的长度。
    字符串阵列或字符向量的单元数组 数组中的每个元素是预测器变量的名称。名称必须匹配表格中的预测器数据的变量名称。
    “所有” 所有预测因素都是分类的。

    • 如果您指定黑盒子作为函数手柄,然后酸橙从预测数据中确定分类预测X或者customsyntheticdata..如果预测器数据位于表中,酸橙假定一个变量是分类,如果它是一个逻辑向量,无序的分类矢量,字符数组,字符串数组,或字符向量的单元阵列。如果预测数据是矩阵,酸橙假设所有预测因子都是连续的。要将任何其他预测因子识别为分类预测器,请通过使用来指定它们'pationoricalpricictors'名称值对参数。

    • 如果您指定黑盒子作为回归或分类模型对象,然后酸橙属性标识分类预测器分类预测器模型对象的属性。

    酸橙不支持有序分类预测万博1manbetx。

    例子:'patericalpricictors','全部'

    数据类型:|双倍的|逻辑|char|细绳|细胞

    机器学习模型的类型,指定为逗号分隔对组成“类型”'回归或者'分类'

    指定时必须指定此参数黑盒子作为函数句柄。如果您指定黑盒子作为回归或分类模型对象,然后酸橙确定“类型”值取决于模型类型。

    例子:“类型”、“分类”

    数据类型:char|细绳

    用于计算距离的选项

    全部展开

    距离度量,指定为逗号分隔对组成'距离'以及字符向量、字符串标量或函数句柄。

    • 如果预测器数据仅包括连续变量,则酸橙万博1manbetx支持这些距离指标。

      价值 描述
      “欧几里得”

      欧几里德距离。

      'seuclidean'

      标准化的欧氏距离。观测值之间的每个坐标差是由标准偏差的对应元件除以缩放,S = STD(PD, 'omitnan'), 在哪里PD是预测数据或合成预测数据。要指定不同的缩放,请使用'规模'名称值对参数。

      “马氏

      使用样本协方差的Mahalanobis距离PDC = COV(PD, 'omitrows').要更改协方差矩阵的值,请使用“冠状病毒”名称值对参数。

      '城市街区'

      城市街区的距离。

      闵可夫斯基的

      Minkowski距离。默认指数为2.要指定其他指数,请使用'P'名称值对参数。

      “chebychev”

      Chebychev距离(最大坐标差异)。

      '余弦'

      一个减去点之间的晶的角度(视为载体)之间的余弦。

      '相关性'

      一个减去点之间的样本相关性(作为值序列)之间的样本相关性。

      “斯皮尔曼

      一个减去样本Spearman的观察之间的秩相关性(视为值序列)。

      @DISTFUN

      自定义距离功能手柄。距离函数有这样的形式

      功能d2 = distfun(zi,zj)距离计算%......
      在哪里

      • ZI是一个1-经过-T.载体含有单个观察。

      • ZJ.是一个S.-经过-T.矩阵包含多个观察。DISTFUN必须接受矩阵ZJ.具有任意数量的观察。

      • D2是一个S.-经过-1距离矢量,和D2(k)是观察之间的距离ZIZJ (k,:)

      如果您的数据不稀疏,则通常可以使用内置距离度量而不是函数手柄来更快地计算距离。

    • 如果预测数据包括连续变量和分类变量,然后酸橙万博1manbetx支持这些距离指标。

      价值 描述
      'Goodall3'

      改性古德尔距离

      海底钻井的

      发生频率距离

    定义,请参阅距离指标

    默认值是“欧几里得”如果预测器数据仅包括连续变量,或者'Goodall3'如果预测器数据包括连续和分类变量。

    例子:'距离','OFD'

    数据类型:char|细绳|function_handle.

    用于Mahalanobis距离度量的协方差矩阵,指定为逗号分隔对组成“冠状病毒”A.K.-经过-K.正定矩阵,其中K.是预测器的数量。

    此参数仅在此处有效'距离'“马氏

    默认值“冠状病毒”价值是COV(PD,'omitrows'), 在哪里PD是预测数据或合成预测数据。如果您没有指定“冠状病毒”值,然后该软件在计算预测器数据和合成预测器数据的距离时使用不同的协方差矩阵。

    例子:'Cov',Eye(3)

    数据类型:|双倍的

    用于Minkowski距离度量的指数,指定为逗号分隔对组成'P'和正标量。

    此参数仅在此处有效'距离'闵可夫斯基的

    例子:'P',3

    数据类型:|双倍的

    对于标准化欧几里德距离度量,指定为逗号分隔的一对组成的比例参数值'规模'和一个长度的非负数字矢量K., 在哪里K.是预测器的数量。

    此参数仅在此处有效'距离''seuclidean'

    默认值'规模'价值是STD(PD,'omitnan'), 在哪里PD是预测数据或合成预测数据。如果您没有指定'规模'值,然后软件在计算预测器数据和合成预测器数据的距离时使用不同的比例参数。

    例子:'Scale',Smianile(x,0.75) - smartile(x,0.25)

    数据类型:|双倍的

    属性

    全部展开

    指定属性

    可以在创建时指定以下属性酸橙目的。

    此属性是只读的。

    要解释的机器学习模型,指定为回归或分类模型对象或函数句柄。

    黑盒子参数设置此属性。

    此属性是只读的。

    分类预测索引指定为正整数的向量。分类预测器包含与包含分类预测器的预测器数据列对应的索引值。如果没有预测器都是分类的,则此属性是空的([]).

    • 如果您指定黑盒子然后使用函数句柄酸橙从预测数据中确定分类预测X或者customsyntheticdata..如果您指定了'pationoricalpricictors'名称值对参数,然后参数设置此属性。

    • 如果您指定黑盒子作为回归或分类模型对象,然后酸橙属性来确定此属性分类预测器模型对象的属性。

    酸橙不支持有序分类预测万博1manbetx。

    如果'simplemodeltype''线性'(默认),然后酸橙创建针对每个识别分类预测虚拟变量。酸橙将指定查询点的类别视为参考组,并创建比类别数量少一个的虚拟变量。有关更多详细信息,请参阅带参考组的虚拟变量

    数据类型:|双倍的

    此属性是只读的。

    数据生成的合成数据的局部性,指定为“全球”或者'当地的'

    'datalocality'名称 - 值对参数设置此属性。

    此属性是只读的。

    简单模型中使用的重要预测因子数量(simpleemodel.),指定为正整数标量值。

    numImportantPredictors的观点酸橙或者numImportantPredictors的观点合身设置此属性。

    数据类型:|双倍的

    此属性是只读的。

    合成数据集中的样本数指定为正整数标量值。

    数据类型:|双倍的

    此属性是只读的。

    查询点酸橙解释使用简单模型的预测(simpleemodel.),指定为数字值或单行表的行向量。

    queryPoint的观点酸橙或者queryPoint的观点合身设置此属性。

    数据类型:|双倍的|表格

    此属性是只读的。

    机器学习模型的类型(BlackBoxModel.),指定为'回归或者'分类'

    • 如果您指定黑盒子作为回归或分类模型对象,然后酸橙根据模型类型确定此属性。

    • 如果您指定黑盒子使用函数手柄,然后使用函数“类型”名称 - 值对参数设置此属性。

    此属性是只读的。

    预测数据,指定为数字矩阵或表。

    每一排X对应于一个观察,并且每列对应于一个变量。

    • 如果您指定了X参数,然后参数设置此属性。

    • 如果您指定了customsyntheticdata.参数,则此属性为空。

    • 如果您指定黑盒子作为完整机器学习模型对象,并未指定X或者customsyntheticdata.,然后该属性值是用于训练的预测数据黑盒子

    数据类型:|双倍的|表格

    计算属性

    该软件计算以下属性。

    此属性是只读的。

    预测查询点计算通过机器学习模型(BlackBoxModel.),指定为标量。

    数据类型:|双倍的|分类|逻辑|char|细绳|细胞

    此属性是只读的。

    由机器学习模型计算的合成预测数据的预测(BlackBoxModel.),指定为矢量。

    数据类型:|双倍的|分类|逻辑|char|细绳|细胞

    此属性是只读的。

    重要的预测索引指定,指定为正整数的向量。ImportantPredictors包含对应于在简单的模型中使用的预测值的列中的指标值(simpleemodel.).

    数据类型:|双倍的

    此属性是只读的。

    简单的模型,指定为aRegressionLinearRegressionTree分类线性, 或者ClassificationTree.模型对象。酸橙根据机器学习模型的类型确定简单模型对象的类型(类型)和简单模型的类型('simplemodeltype').

    此属性是只读的。

    简单模型计算的查询点的预测(simpleemodel.),指定为标量。

    如果simpleemodel.分类线性,那么SimpleModelFitted值为1或-1。

    • SimpleModelFitted如果简单模型的预测结果与BlackboxFitted(从机器学习模型预测)。

    • SimpleModelFitted如果简单模型的预测不同,则值为-1BlackboxFitted.如果是BlackboxFitted价值是一种,那么情节功能显示SimpleModelFitted不是一个

    数据类型:|双倍的|分类|逻辑|char|细绳|细胞

    此属性是只读的。

    合成预测器数据,指定为数字矩阵或表。

    • 如果您指定了customsyntheticdata.输入参数,然后参数设置此属性。

    • 除此以外,酸橙来自预测数据估计分布参数X并生成合成预测器数据集。

    数据类型:|双倍的|表格

    对象的功能

    合身 适合局部可解释模型 - 不可知的解释(石灰)的简单模型
    情节 绘制局部可解释模型 - 不可知解释的结果(石灰)

    例子

    全部折叠

    训练分类模型并创建酸橙使用决策树简单模型的对象。当你创造一个酸橙对象,指定查询点和重要预测器的数量,以便软件生成合成数据集的样本,并为具有重要预测器的查询点拟合一个简单的模型。然后,通过使用对象函数在简单模型中显示估计的预测值重要性情节

    加载Creditrating_Historical.数据集。该数据集包含客户id及其财务比率、行业标签和信用评级。

    tbl =可读取的('CreditRating_Historical.dat');

    显示表的前三行。

    头(TBL,3)
    ANS =3×8表ID WC_TA RE_TA EBIT_TA MVE_BVTD S_TA行业评级  _____ _____ _____ _______ ________ _____ ________ ______ 62394 0.013 0.104 0.036 0.447 0.142 3{“BB”}48608 0.232 0.335 0.062 1.969 0.281 8 {A} 42444 0.311 0.367 0.074 1.935 0.366 1 {A}

    通过删除客户id和评级列来创建一个预测器变量表TBL.

    tblx = removevars(tbl,[“ID”“评分”]);

    通过使用培训Blackbox模型的信用评级模型Fitcecoc.功能。

    黑箱= fitcecoc (tblX,资源描述。评级,'pationoricalpricictors''行业');

    创建一个酸橙对象,该对象使用决策树简单模型解释最后一次观测的预测。指定'numimportantpredictors'至于最多6个重要预测因子。如果您指定了'QueryPoint''numimportantpredictors'的值酸橙对象,然后软件生成一个合成数据集的样本,并将一个简单的可解释模型适合于该合成数据集。由于随机性,您的结果可能因这些结果而异酸橙.你可以通过使用来设置随机种子RNG.为重现。

    querypoint = tblx(结束,:)
    queryPoint =1×6表WC_TA RE_TA EBIT_TA MVE_BVTD S_TA行业_____ _____ _______ ________ ____ ________ 0.239 0.463 0.065 2.924 0.34 2
    结果=石灰(黑盒,'QueryPoint',querypoint,'numimportantpredictors',6,......'pationoricalpricictors''行业''simplemodeltype''树'
    结果=具有属性的石灰:BlackBoxModel:[1×1分类] Datalocality:'Global'类分类预备主因:6类型:'分类'X:[3932×6表] QueryPoint:[1×6表] NumimportPredictors:6 NumSyntheticData:5000合成数据[5000×6表]安装:{5000×1个单元格} SimpleModel:[1×1分类触发]重要的预计:[2 4] Blackboxfited:{'AA'} SimpleModelfited:{'AA'}

    绘图酸橙目的结果通过使用对象函数情节.要在任何预测器名称中显示现有的下划线,请更改ticklabelinterpreter.轴的值'没有任何'

    f =情节(结果);f.CurrentAxes.TickLabelInterpreter ='没有任何'

    该曲线显示对应于的查询点的两个预测BlackboxFitted财产和零件SimpleModelFitted的属性结果

    水平条形图显示排序的预测器重要值。酸橙找到财务比率变量EBIT_TAwc_ta.作为查询点的重要预测因子。

    您可以通过使用数据提示或酒吧属性.例如,您可以找到酒吧通过使用的对象findobj.使用函数并通过使用该标签将标签添加到条形的末端文本功能。

    B = findobj(F,“类型”'酒吧');文本(b.yendpointss + 0.001,b.xendpoints,string(b.ydata))

    或者,您可以使用预测器变量名在表中显示系数值。

    小鬼= b.YData;flipud (array2table(小鬼”,......“RowNames”f.CurrentAxes.YTickLabel,'VariableNames',{'预测重要性'}))
    ANS =2×1表预测性重要____________________ MVE_BVTD 0.088695 RE_TA 0.0018228

    训练一个回归模型并创建一个酸橙使用线性简单模型的对象。当你创造一个酸橙对象,如果不指定查询点和重要的预测数,则该软件生成的合成数据集的样本,但是不符合一个简单的模型。使用目标函数合身适合查询点的简单模型。然后通过使用对象功能显示拟合线性简单模型的系数情节

    加载carbig数据集,其中包含在上世纪70年代和80年代初制造的汽车的测量..

    负载carbig

    创建一个包含预测变量的表加速气瓶等等,以及响应变量MPG

    TBL =表(加速度,缸,排气量,马力,Model_Year,体重,MPG);

    在训练组中删除丢失的值可以帮助减少内存消耗和加快培训Fitrkernel.功能。删除缺失的值TBL.

    tbl = rmmissing(tbl);

    通过删除响应变量来创建预测变量表TBL.

    tblX = removevars(资源描述,'mpg');

    训练黑盒模型MPG通过使用Fitrkernel.功能,并创建一个酸橙目的。指定预测数据集,因为MDL.不包含预测数据。由于随机性,您的结果可能因这些结果而异Fitrkernel.酸橙.你可以通过使用来设置随机种子RNG.为重现。

    mdl = fitrkernel (tblX,资源描述。英里/加仑,'pationoricalpricictors'[2 - 5]);结果=石灰(mdl tblX,'pationoricalpricictors',[2 5])
    结果=具有属性的石灰:BlackBoxModel:[1×1 regressionkernel] Datalocality:'Global'类分类预备主因:[2 5]类型:'回归'x:[392×6表] QueryPoint:[] NumimportantPredictors:[] NumSyntheticData:5000 SyntheticData:5000:[5000×6表]安装:[5000×1双] SimpleModel:[]重要的预分信息:[] BlackBoxFitted:[] SimpleModelfited:[]

    结果包含生成的合成数据集。这simpleemodel.属性是空的([]).

    适用于第一次观察的线性简单模型tblx..指定要查找的重要预测器的数量为3。

    querypoint = tblx(1,:)
    queryPoint =1×6表加速度油缸位移马力Model_Year重量____________ _________ ____________ __________ __________ ______ 12 8 307 130 70 3504
    结果=适合(结果,Querypoint,3);

    绘图酸橙目的结果通过使用对象函数情节.要在任何预测器名称中显示现有的下划线,请更改ticklabelinterpreter.轴的值'没有任何'

    f =情节(结果);f.CurrentAxes.TickLabelInterpreter ='没有任何'

    该曲线显示对应于的查询点的两个预测BlackboxFitted财产和零件SimpleModelFitted的属性结果

    横条形图显示了简单模型的系数值,按其绝对值排序。石灰发现马力model_year., 和气瓶作为查询点的重要预测因子。

    训练分类模型并创建酸橙使用决策树简单模型的对象。适合多个查询点的多种型号。

    加载Creditrating_Historical.数据集。该数据集包含客户id及其财务比率、行业标签和信用评级。

    tbl =可读取的('CreditRating_Historical.dat');

    通过删除客户id和评级列来创建一个预测器变量表TBL.

    tblx = removevars(tbl,[“ID”“评分”]);

    通过使用培训Blackbox模型的信用评级模型Fitcecoc.功能。

    黑箱= fitcecoc (tblX,资源描述。评级,'pationoricalpricictors''行业'
    BlackBox = ClassificationCoc Predictornames:{'wc_ta''re_ta'''ebit_ta''mve_bvtd''s_ta'行业'} resportename:'y'pationoricalpricictors:6 classnames:{'a'''''''''''b'''bb''bbb''ccc'} scoreTransform:'无'BinaryLearners:{21×1 Cell} CodingName:'OneVSONE'属性,方法

    创建一个酸橙对象与之黑盒子模型。由于随机性,您的结果可能因这些结果而异酸橙.你可以通过使用来设置随机种子RNG.为重现。

    结果=石灰(黑盒,'pationoricalpricictors''行业');

    发现两个查询点,其真实的评价值AAA.B., 分别。

    querypoint(1,:) = tblx(find(strcmp(tbl.rating,“AAA”), 1):);queryPoint (2) = tblX(找到(strcmp(资源描述。评级,'B'), 1),:)
    queryPoint =2×6表WC_TA RE_TA EBIT_TA MVE_BVTD S_TA行业_____ _____ _______ ________ _____ ________ 0.121 0.413 0.057 3.647 0.466 0.019 12 0.009 0.042 0.257 0.119 1

    适合第一个查询点的线性简单模型。将重要预测因子的数量设置为4。

    newresults1 = fit(结果,querypoint(1,:),4);

    绘制LIME结果图newresults1.对于第一个查询点。要在任何预测器名称中显示现有的下划线,请更改ticklabelinterpreter.轴的值'没有任何'

    f1 = plot(newresults1);f1.currentaxes.ticklabelinterpreter =.'没有任何'

    适用于第一个查询点的线性决策树模型。

    newresults2 = fit(结果,querypoint(1,:),6,'simplemodeltype''树');f2 =情节(newresults2);f2.CurrentAxes。TickLabelInterpreter ='没有任何'

    简单的模型newresults1.newresults2.既找到MVE_BVTDRE_TA作为重要的预测因子。

    适用于第二个查询点的线性简单模型,并对第二个查询点绘制石灰结果。

    newresults3 = fit(结果,querypoint(2,:),4);f3 = plot(newresults3);f3.currentaxes.ticklabelinterpreter =.'没有任何'

    预测来自黑盒子模型是B.,但简单模型的预测则不然B..当两种预测不一样时,您可以指定更小的'kernelwidth'价值。该软件使用更重要的权重拟合在查询点附近的样本上的权重。如果查询点是异常值或位于决策边界附近,那么即使指定小型,两个预测值也可以不同'kernelwidth'价值。在这种情况下,您可以更改其他名称 - 值对的参数。例如,您可以生成本地合成数据集(指定'datalocality'酸橙作为'当地的')对于查询点并增加样本的数量('NumSyntheticData'酸橙或者合身)在合成数据集中。您还可以使用不同的距离度量('距离'酸橙或者合身).

    适合线性简单模型,小'kernelwidth'价值。

    newresults4 =适合(结果,queryPoint (2:), 4,'kernelwidth',0.01);f4 = plot(newresults4);f4.currentaxes.ticklabelinterpreter =.'没有任何'

    第一个和第二个查询点的信用评级是AAA.B., 分别。简单的模型newresults1.newresults4.既找到MVE_BVTDRE_TA, 和wc_ta.作为重要的预测因子。然而,它们的系数值是不同的。该地图表明,这些预测因子根据信用评级而不同地行动。

    更多关于

    全部展开

    算法

    全部展开

    参考

    [1] Ribeiro,Marco Tulio,S. Singh和C.宾馆。“”我为什么要相信你?':解释任何分类器的预测。“在22届ACM锡贡德克德克德克德国际知识发现和数据挖掘会议上1135-44。旧金山加利福尼亚州美国:ACM,2016。

    [2]świrszcz,grzegorz,naoki abe和auréliec. lozano。“分组正交匹配追求变量选择和预测。”神经信息处理系统研究进展(2009年):1150-58。

    [3] Lozano,AurélieC.,GrzegorzśWirszcz,以及Naoki Abe。“小组正交匹配追求逻辑回归。”第十四届国际会议人工智能和统计程序(2011):452-60。

    也可以看看

    介绍了R2020b