主要内容

酸橙

局部可解释的模型不可知解释(LIME)

    描述

    酸橙通过寻找重要的预测器并拟合一个简单的可解释模型,解释一个查询点的机器学习模型(分类或回归)的预测。

    您可以创建酸橙对象,用于具有指定查询点的机器学习模型(queryPoint)及指定数目的重要预测因子(numImportantPredictors).该软件生成一个合成数据集,并适合一个重要预测器的简单可解释模型,该模型有效地解释了对查询点周围的合成数据的预测。简单模型可以是线性模型(默认)或决策树模型。

    使用拟合的简单模型在指定的查询点处本地解释本地机器学习模型的预测。使用情节函数可视化LIME结果。根据局部的解释,你可以决定是否相信机器学习模型。

    将新的简单模型用于另一个查询点合身函数。

    创建

    描述

    结果=石灰(黑箱创建一个酸橙对象使用机器学习模型对象黑箱它包含预测数据。这酸橙函数生成一个合成预测数据集的样本,并计算样本的预测。要适合一个简单的模型,使用合身函数与结果

    例子

    结果=石灰(黑箱X创建一个酸橙使用预测器数据的对象X

    结果=石灰(黑箱“CustomSyntheticData”,customsyntheticdata.创建一个酸橙对象,使用预生成的自定义合成预测器数据集customsyntheticdata..这酸橙功能计算样本中的预测customsyntheticdata.

    例子

    结果=石灰(___,'querypoint',queryPoint“NumImportantPredictors”,numImportantPredictors还可以查找指定数量的重要预测器,并为查询点拟合一个简单的线性模型queryPoint.您可以指定queryPointnumImportantPredictors除了以前的语法中的任何输入参数组合。

    例子

    结果=石灰(___名称,值使用一个或多个名称-值参数指定其他选项。例如,'simplemodeltype','树'指定简单模型的类型为决策树模型。

    输入参数

    展开全部

    要解释的机器学习模型,指定为完整或紧凑的回归或分类模型对象或函数句柄。

    预测器数据,指定为数字矩阵或表。每一行的X对应于一个观察,并且每列对应于一个变量。

    X必须与训练的预测数据一致吗黑箱,存储在黑箱。X.指定的值不能包含响应变量。

    • X必须具有与预测变量相同的数据类型(例如,trainX)训练有素黑箱.构成列的变量X必须具有相同的数字和订单trainX

      • 如果你训练黑箱然后使用数字矩阵X必须是数字矩阵。

      • 如果你训练黑箱然后使用表格X一定是一张桌子。所有的预测变量X的变量名和数据类型必须与trainX

    • 酸橙不支持稀疏矩阵。万博1manbetx

    如果黑箱是否必须提供不包含预测数据或函数句柄的模型对象X要么customsyntheticdata..如果黑箱是一个完整的机器学习模型对象,然后指定这个参数酸橙不使用预测器数据黑箱.它只使用指定的预测器数据。

    数据类型:||桌子

    Pregenerated,自定义合成预测仪数据集,指定为数字矩阵或表。

    如果您提供预生成的数据集,那么酸橙使用提供的数据集而不是生成新的合成预测器数据集。

    customsyntheticdata.必须与训练的预测数据一致吗黑箱,存储在黑箱。X.指定的值不能包含响应变量。

    • customsyntheticdata.必须具有与预测变量相同的数据类型(例如,trainX)训练有素黑箱.构成列的变量customsyntheticdata.必须具有相同的数字和订单trainX

      • 如果你训练黑箱然后使用数字矩阵customsyntheticdata.必须是数字矩阵。

      • 如果你训练黑箱然后使用表格customsyntheticdata.一定是一张桌子。所有的预测变量customsyntheticdata.的变量名和数据类型必须与trainX

    • 酸橙不支持稀疏矩阵。万博1manbetx

    如果黑箱是否必须提供不包含预测数据或函数句柄的模型对象X要么customsyntheticdata..如果黑箱是一个完整的机器学习模型对象,然后指定这个参数酸橙不使用预测器数据黑箱;它仅使用指定的预测值数据。

    数据类型:||桌子

    查询点酸橙解释以数字值或单行表的行向量指定的预测。queryPoint必须具有相同的数据类型和列数Xcustomsyntheticdata.或者预测器数据黑箱

    如果您指定numImportantPredictorsqueryPoint,那么酸橙函数适合一个简单的模型时创建酸橙对象。

    queryPoint不得包含缺失的值。

    例子:blackbox.x(1,:)指定查询点作为完整机器学习模型中预测器数据的第一个观察点黑箱

    数据类型:||桌子

    在简单模型中使用的重要预测因子的数量指定为正整数标量值。

    • 如果“SimpleModelType”'线性',然后软件选择指定数量的重要预测因子,并拟合所选预测因子的线性模型。

    • 如果“SimpleModelType”“树”然后,该软件指定作为重要预测器的数量的判定删除(或分支节点)的最大判定数量,使得拟合决策树在大多数指定的预测器中使用。

    如果您指定numImportantPredictorsqueryPoint,那么酸橙函数适合一个简单的模型时创建酸橙对象。

    数据类型:|

    名称-值对的观点

    指定可选的逗号分离对名称,值论点。的名字参数名和价值是相应的价值。的名字必须出现在引号内。您可以以任何顺序指定多个名称和值对参数name1,value1,...,namen,valuen

    例子:酸橙黑箱“QueryPoint”问,'numimportantpredictors',n,'simplemodeltype','树')指定查询点作为问:,重要预测因子的数量用于简单模型为N,简单模型的类型为决策树模型。酸橙生成合成预测器数据集的样本,计算样本的预测,并使用最多指定数量的预测器为查询点拟合决策树模型。
    合成预测数据的选项

    展开全部

    数据生成的合成数据的局部性,指定为逗号分隔对'datalocality'“全球”要么'当地的'

    • “全球”-该软件使用整个预测数据集(X或预测的数据黑箱).该软件利用估计的参数生成一个综合预测数据集,并使用该数据集对任何查询点进行简单的模型拟合。

    • '当地的'-该软件估计分布参数使用K.-查询点的最近邻居,其中K.是个'numneighbors'价值。该软件在每次适合指定查询点时都会生成新的合成预测器数据集。

    有关详细信息,请参见酸橙

    例子:'Datalocality','本地'

    数据类型:char|字符串

    查询点的邻居数量,指定为逗号分隔的对组成'numneighbors'和一个正整数标量值。此参数仅在何时有效'datalocality''当地的'

    如果指定的值大于预测器数据集中的观测数(X或预测的数据黑箱),然后酸橙使用所有的观察。

    例子:'numneighbors',2000

    数据类型:|

    要为合成数据集生成的样本数量,指定为由逗号分隔的对组成“NumSyntheticData”和一个正整数标量值。此参数仅在何时有效'datalocality''当地的'

    例子:“NumSyntheticData”,2500年

    数据类型:|

    简单模型的选择

    展开全部

    平方指数(或高斯)核函数的核宽度,指定为逗号分隔对组成“KernelWidth”和一个数值标量值。

    酸橙功能计算综合预测器数据集中查询点和样本之间的距离,然后通过使用平方指数内核功能将距离转换为权重。如果你降低了“KernelWidth”值,然后酸橙使用更侧重于查询点附近的示例的权重。有关详细信息,请参见酸橙

    例子:“KernelWidth”,0.5

    数据类型:|

    简单模型的类型,指定为逗号分隔的对组成“SimpleModelType”'线性'要么“树”

    • '线性'-软件采用线性模型拟合fitrlinear回归或者fitclinear进行分类。

    • “树”- 软件通过使用拟合决策树模型fitrtree回归或者fitctree进行分类。

    例子:'simplemodeltype','树'

    数据类型:char|字符串

    机器学习模型的选项

    展开全部

    分类预测器列表,指定为逗号分隔的配对组成'pationoricalpricictors'和这个表中的一个值。

    价值 描述
    正整数向量

    向量中的每个条目都是对应于包含分类变量的预测器数据列的索引值。索引值在1到之间P.,在那里P.是用于训练模型的预测器数量。

    如果黑箱使用输入变量的子集作为预测器,然后软件仅使用该子集对预测器进行索引。这'pationoricalpricictors'值不计算响应变量,观察权重变量和功能不使用的任何其他变量。

    逻辑矢量

    一种真的Entry表示预测数据对应的列是一个分类变量。向量的长度是P.

    字符矩阵 矩阵的每一行是预测器变量的名称。名称必须匹配表格中的预测器数据的变量名称。使用额外的空白填充名称,因此字符矩阵的每行具有相同的长度。
    字符向量的字符串数组或单元格数组 数组中的每个元素是预测器变量的名称。名称必须匹配表格中的预测器数据的变量名称。
    “所有” 所有预测因素都是分类的。

    • 如果您指定黑箱作为函数手柄,然后酸橙从预测器数据识别分类预测器X要么customsyntheticdata..如果预测器数据位于表中,酸橙如果一个变量是逻辑向量、无序分类向量、字符数组、字符串数组或字符向量的单元格数组,则假设它是类别变量。如果预测数据是一个矩阵,酸橙假设所有预测器都是连续的。

    • 如果您指定黑箱作为回归或分类模型对象,然后酸橙属性标识分类预测器分类预测器模型对象的属性。

    酸橙不支持有序分类预测万博1manbetx器。

    例子:'patericalpricictors','全部'

    数据类型:||逻辑|char|字符串|细胞

    机器学习模型的类型,指定为逗号分隔对,由'类型''回归要么“分类”

    指定时必须指定此参数黑箱作为函数句柄。如果您指定黑箱作为回归或分类模型对象,然后酸橙决定了'类型'值取决于模型类型。

    例子:'类型','分类'

    数据类型:char|字符串

    计算距离的选项

    展开全部

    距离度量,指定为逗号分隔对,由'距离'以及字符向量、字符串标量或函数句柄。

    • 如果预测器数据仅包括连续变量,则酸橙万博1manbetx支持这些距离指标。

      价值 描述
      'euclidean'

      欧氏距离。

      'seuclidean'

      标准化的欧氏距离。观测值之间的每个坐标差除以相应的标准差,S =性病(PD omitnan),在那里PD是预测数据或合成预测数据。要指定不同的缩放,请使用“规模”名称-值参数。

      “mahalanobis”

      使用样本协方差的Mahalanobis距离PDC = x (PD omitrows).要改变协方差矩阵的值,请使用“浸”名称-值参数。

      “cityblock”

      城市街区的距离。

      'minkowski'

      Minkowski距离。默认指数为2.要指定其他指数,请使用“P”名称-值参数。

      “chebychev”

      Chebychev距离(最大坐标差异)。

      '余弦'

      一个减去点之间的晶的角度(视为载体)之间的余弦。

      '相关性'

      一个减去点之间的样本相关性(作为值序列)之间的样本相关性。

      “枪兵”

      1减去观察值之间的样本斯皮尔曼等级相关性(作为值的序列处理)。

      @DISTFUN

      自定义距离功能句柄。距离功能具有表单

      函数ZJ D2 = distfun(子)距离计算%...
      在哪里

      • 是一个1-经过-T.载体含有单个观察。

      • ZJ是一个S.-经过-T.包含多个观测值的矩阵。DISTFUN必须接受矩阵ZJ具有任意数量的观察。

      • D2是一个S.-经过-1距离矢量,和D2(k)观察距离是多少ZJ (k,:)

      如果您的数据不稀疏,则通常可以使用内置距离度量而不是函数手柄来更快地计算距离。

    • 如果预测数据同时包含连续变量和分类变量,那么酸橙万博1manbetx支持这些距离指标。

      价值 描述
      'Goodall3'

      修改古德距离

      'OFD'

      发生频率的距离

    定义,请参阅距离指标

    默认值为'euclidean'如果预测器数据仅包括连续变量,或者'Goodall3'如果预测数据包括连续变量和分类变量。

    例子:“距离”、“海底钻井的

    数据类型:char|字符串|function_handle.

    马氏距离度量的协方差矩阵,指定为逗号分隔对,由“浸”和一个K.-经过-K.正定矩阵,其中K.是预测器的数量。

    此参数仅在此处有效'距离'“mahalanobis”

    默认的“浸”值是COV(PD,'omitrows'),在那里PD是预测数据或合成预测数据。如果不指定“浸”值,然后该软件在计算预测器数据和合成预测器数据的距离时使用不同的协方差矩阵。

    例子:'Cov',Eye(3)

    数据类型:|

    闵可夫斯基距离度量的指数,指定为逗号分隔对,由“P”一个正标量。

    此参数仅在此处有效'距离''minkowski'

    例子:'P',3

    数据类型:|

    尺度参数值为标准化的欧几里得距离度量,指定为逗号分隔对组成“规模”和一个长度为非负的数值向量K.,在那里K.是预测器的数量。

    此参数仅在此处有效'距离''seuclidean'

    默认的“规模”值是性病(PD omitnan),在那里PD是预测数据或合成预测数据。如果不指定“规模”值,然后软件在计算预测器数据和合成预测器数据的距离时使用不同的比例参数。

    例子:'Scale',Smianile(x,0.75) - smartile(x,0.25)

    数据类型:|

    属性

    展开全部

    指定的属性

    可以在创建时指定以下属性酸橙对象。

    此属性是只读的。

    要解释的机器学习模型,指定为回归或分类模型对象或函数句柄。

    黑箱参数设置此属性。

    此属性是只读的。

    分类预测索引指定为正整数的向量。分类预测器包含与包含分类预测器的预测器数据列对应的索引值。如果没有预测器都是分类的,则此属性是空的([]).

    • 如果您指定黑箱然后使用函数句柄酸橙从预测器数据识别分类预测器X要么customsyntheticdata..如果您指定了'pationoricalpricictors'名称值参数,然后参数设置此属性。

    • 如果您指定黑箱作为回归或分类模型对象,然后酸橙属性来确定此属性分类预测器模型对象的属性。

    酸橙不支持有序分类预测万博1manbetx器。

    如果“SimpleModelType”'线性'(默认),然后酸橙为每个确定的分类预测器创建虚拟变量。酸橙将指定查询点的类别视为引用组,并将创建比类别数量更少的虚拟变量。有关详细信息,请参见参考组虚拟变量

    数据类型:|

    此属性是只读的。

    数据生成的合成数据的局部性,指定为“全球”要么'当地的'

    'datalocality'名称值参数设置此属性。

    此属性是只读的。

    简单模型中使用的重要预测因子数量(simpleemodel.),指定为正整数标量值。

    numImportantPredictors争论酸橙或者numImportantPredictors争论合身设置此属性。

    数据类型:|

    此属性是只读的。

    合成数据集中的样本数指定为正整数标量值。

    数据类型:|

    此属性是只读的。

    查询点酸橙解释使用简单模型的预测(simpleemodel.),指定为数字值或单行表的行向量。

    queryPoint争论酸橙或者queryPoint争论合身设置此属性。

    数据类型:||桌子

    此属性是只读的。

    机器学习模型的类型(BlackboxModel),指定为'回归要么“分类”

    • 如果您指定黑箱作为回归或分类模型对象,然后酸橙根据模型类型确定此属性。

    • 如果您指定黑箱使用函数手柄,然后使用函数'类型'名称值参数设置此属性。

    此属性是只读的。

    预测器数据,指定为数字矩阵或表。

    每一行的X对应于一个观察,并且每列对应于一个变量。

    • 如果您指定了X参数,则参数设置此属性。

    • 如果您指定了customsyntheticdata.参数,然后这个属性是空的。

    • 如果您指定黑箱作为一个完整的机器学习模型对象而不指定X要么customsyntheticdata.,然后该属性值是用于训练的预测数据黑箱

    酸橙不使用包含缺失值的行,且不将行存储在X

    数据类型:||桌子

    计算属性

    该软件计算以下属性。

    此属性是只读的。

    通过机器学习模型(BlackboxModel),指定为标量。预测是对回归的预测反应或分类的分类标签。

    数据类型:||分类|逻辑|char|字符串|细胞

    此属性是只读的。

    由机器学习模型计算的合成预测数据的预测(BlackboxModel),指定为向量。

    数据类型:||分类|逻辑|char|字符串|细胞

    此属性是只读的。

    重要的预测索引指定,指定为正整数的向量。ImportantPredictors包含与简单模型中使用的预测器列对应的索引值(simpleemodel.).

    数据类型:|

    此属性是只读的。

    简单的模型,指定为aRegressionLinear回归植物ClassificationLinear, 要么ClassificationTree.模型对象。酸橙根据机器学习模型的类型确定简单模型对象的类型(类型)和简单模型的类型(“SimpleModelType”).

    此属性是只读的。

    简单模型计算的查询点的预测(simpleemodel.),指定为标量。

    如果simpleemodel.ClassificationLinear,那么SimpleModelFitted取值为1或-1。

    • SimpleModelFitted如果简单模型的预测是相同的,则值为1BlackboxFitted(从机器学习模型预测)。

    • SimpleModelFitted如果简单模型的预测不同,则值为-1BlackboxFitted.如果是BlackboxFitted值是一种,那么情节功能显示SimpleModelFitted值作为不是一个

    数据类型:||分类|逻辑|char|字符串|细胞

    此属性是只读的。

    合成预测器数据,指定为数字矩阵或表。

    • 如果您指定了customsyntheticdata.输入参数,然后参数设置此属性。

    • 否则,酸橙从预测器数据估计分布参数X并生成一个综合预测数据集。

    数据类型:||桌子

    对象的功能

    合身 拟合局部可解释模型不可知论解释(LIME)的简单模型
    情节 局部可解释模型不可知解释(LIME)的图结果

    例子

    全部折叠

    训练分类模型并创建酸橙使用决策树简单模型的对象。当你创建一个酸橙对象,指定查询点和重要预测器的数量,以便软件生成合成数据集的样本,并为具有重要预测器的查询点拟合一个简单的模型。然后,通过使用对象函数在简单模型中显示估计的预测值重要性情节

    加载CreditRating_Historical数据集。该数据集包含客户id及其财务比率、行业标签和信用评级。

    tbl =可读取的(“CreditRating_Historical.dat”);

    显示表的前三行。

    头(TBL,3)
    ans =3×8表ID WC_TA RE_TA EBIT_TA MVE_BVTD S_TA行业评级  _____ _____ _____ _______ ________ _____ ________ ______ 62394 0.013 0.104 0.036 0.447 0.142 3{“BB”}48608 0.232 0.335 0.062 1.969 0.281 8 {A} 42444 0.311 0.367 0.074 1.935 0.366 1 {A}

    通过删除客户id和评级列来创建一个预测器变量表TBL.

    tblx = removevars(tbl,[“ID”“评级”]);

    使用的方法训练信用评级的黑箱模型fitcecoc函数。

    黑箱= fitcecoc (tblX,资源描述。评级,'pationoricalpricictors''行业');

    创建一个酸橙对象,该对象使用决策树简单模型解释最后一次观测的预测。指定'numimportantpredictors'至于最多6个重要预测因子。如果您指定了“QueryPoint”'numimportantpredictors'的值酸橙对象,然后软件生成一个合成数据集的样本,并将一个简单的可解释模型适合于该合成数据集。

    querypoint = tblx(结束,:)
    queryPoint =1×6表WC_TA RE_TA EBIT_TA MVE_BVTD S_TA行业_____ _____ _______ ________ ____ ________ 0.239 0.463 0.065 2.924 0.34 2
    RNG('默认'重复性的%结果=石灰(黑盒,“QueryPoint”,querypoint,'numimportantpredictors',6,...“SimpleModelType”“树”
    结果=具有属性的石灰:BlackBoxModel:[1x1 ClassificationCoc] Datalocality:'Global'类分类预示因素:6类型:'分类'x:[3932x6表]查询点:[1x6表] NumimportantPredictors:6 NumSyntheticData:5000 InclueCata:[5000x6表]安装:{5000x1 Cell} SimpleModel:[1x1 ClassificationTree]重要的预计:[2x1双] BlackBoxFited:{'AA'} SimpleModelfited:{'AA'}

    绘图酸橙目的结果通过使用对象函数情节.要在任何预测器名称中显示现有的下划线,请更改TickLabelInterpreter坐标轴的值“没有”

    f =情节(结果);f.currentaxes.TicklabelInterpreter =.“没有”;

    图中包含一个坐标轴。标题为“LIME with Decision Tree Model”的轴包含一个bar类型的对象。

    该曲线显示对应于的查询点的两个预测BlackboxFitted财产和SimpleModelFitted的属性结果

    水平条形图显示排序的预测器重要值。酸橙找到财务比率变量EBIT_TA.wc_ta.作为查询点的重要预测因子。

    您可以通过使用数据提示或酒吧属性.例如,您可以找到酒吧对象,使用findobj.使用函数并通过使用该标签将标签添加到条形的末端文本函数。

    b = findobj (f,'类型'“酒吧”);文本(b.YEndPoints + 0.001, b.XEndPoints字符串(b.YData))

    图中包含一个坐标轴。标题为LIME with Decision Tree Model的轴包含3个类型为bar, text的对象。

    或者,您可以使用预测器变量名在表中显示系数值。

    小鬼= b.YData;flipud (array2table(小鬼”,...“RowNames”f.CurrentAxes.YTickLabel,“VariableNames”,{'预测重要性'}))
    ans =2×1表预测性重要____________________ MVE_BVTD 0.088412 RE_TA 0.0018061

    训练一个回归模型并创建一个酸橙使用线性简单模型的对象。当你创建一个酸橙对象,如果不指定查询点和重要预测器的数量,则软件生成合成数据集的样本,但不适合简单模型。使用对象函数合身适合查询点的简单模型。然后用目标函数显示拟合的线性简单模型的系数情节

    加载carbig数据集,其中包含在20世纪70年代和20世纪80年代初进行的汽车测量。

    负载carbig

    创建包含预测器变量的表加速度气缸等等,以及响应变量英里/加仑

    台=表(加速度、汽缸、排量、马力、Model_Year重量,MPG);

    删除训练集中缺失的值可以帮助减少内存消耗并加速训练Fitrkernel.函数。删除TBL.

    tbl = rmmissing(tbl);

    通过删除响应变量来创建预测变量表TBL.

    tblx = removevars(tbl,'mpg');

    训练一个黑匣子模型英里/加仑通过使用Fitrkernel.函数。

    RNG('默认'重复性的%mdl = fitrkernel(tblx,tbl.mpg,'pationoricalpricictors',[2 5]);

    创建一个酸橙对象。指定预测数据集,因为MDL.不包含预测数据。

    结果=石灰(MDL,TBLX)
    结果=具有属性的石灰:BlackBoxModel:[1x1 regressionkernel] Datalocality:'Global'类别预防icon:[2 5]类型:'回归'x:[392x6表] QueryPoint:[] NumImportAntPredictors:[] NumSyntheticData:5000 SyntheticData:[5000x6表]安装了:[5000x1双] SimpleModel:[]重要的预分标识:[] BlackBoxFitted:[] SimpleModelfited:[]

    结果包含生成的合成数据集。这simpleemodel.属性为空([]).

    适用于第一次观察的线性简单模型tblx..指定要查找的重要预测器的数量为3。

    : queryPoint = tblX (1)
    queryPoint =1×6表加速气缸位移马力Model_Year重量  ____________ _________ ____________ __________ __________ ______ 12 8 307 130 70 3504
    结果=适合(结果,queryPoint, 3);

    绘图酸橙目的结果通过使用对象函数情节.要在任何预测器名称中显示现有的下划线,请更改TickLabelInterpreter坐标轴的值“没有”

    f =情节(结果);f.currentaxes.TicklabelInterpreter =.“没有”;

    图中包含一个坐标轴。带有线性模型的标题式石灰的轴包含类型栏的物体。

    该曲线显示对应于的查询点的两个预测BlackboxFitted财产和SimpleModelFitted的属性结果

    水平条图显示了简单模型的系数值,由其绝对值排序。石灰发现马力model_year., 和气缸作为查询点的重要预测因子。

    model_year.气缸是具有多个类别的分类预测器。对于线性简单模型,该软件创建比每个分类预测器的类别更少的虚拟变量。条形图仅显示最重要的虚拟变量。您可以使用该检查其他虚拟变量的系数simpleemodel.的属性结果.显示排序系数值,包括所有分类虚拟变量。

    [~,我]=排序(abs (results.SimpleModel.Beta),“下”);表(结果.simplemodel.eppandedpredictornames(i)',结果.simplemodel.beta(i),...“VariableNames”,{'extedied predictor名称'“系数”})
    ans =17×2表Exeded预测值名称系数____________________________________________________3.4485e-05 {'model_year(74 vs.70)'} -6.1279e-07 {'model_year(80 vs.70)'} -4.015e-07 {'model_year(81 vs. 70)'} 3.4176e-07 {'model_year(82 vs. 70)'} -2.2483e-07 {'圆柱(6 vs. 8)'} -1.9024e-07 {'model_year(76vs. 70)'} 1.8136E-07 {'圆柱(5 vs. 8)'} 1.7461E-07 {'model_year(71 vs.70)'} 1.558E-07 {'model_year(75 vs. 70)'}1。5456e-07 {'Model_Year (77 vs. 70)'} 1.521e-07 {'Model_Year (78 vs. 70)'} 1.4272e-07 {'Model_Year (72 vs. 70)'} 6.7001e-08 {'Model_Year (73 vs. 70)'} 4.7214e-08 {'Cylinders (4 vs. 8)' } 4.5118e-08 {'Model_Year (79 vs. 70)'} -2.2598e-08 ⋮

    训练一个回归模型并创建一个酸橙对象使用函数句柄到预测模型的功能。使用对象函数合身使简单模型适合于指定的查询点。然后用目标函数显示拟合的线性简单模型的系数情节

    加载carbig数据集,其中包含在20世纪70年代和20世纪80年代初进行的汽车测量。

    负载carbig

    创建包含预测器变量的表加速度气缸,等等。

    TBL =桌子(加速,气瓶,位移,马力,型号,重量);

    训练一个黑匣子模型英里/加仑通过使用TreeBagger函数。

    RNG('默认'重复性的%mdl = treebagger(100,tbl,mpg,'方法''回归''pationoricalpricictors',[2 5]);

    酸橙不支持万博1manbetxTreeBagger直接对象,因此您无法指定第一个输入参数(Blackbox模型)酸橙作为一个TreeBagger对象。的函数句柄预测函数。您还可以指定选项预测使用函数的名称值参数函数。

    创建功能句柄预测功能的功能TreeBagger目的MDL..指定要使用的树指数数组1:50

    mypredict = @(tbl)预测(mdl,tbl,“树”,1:50);

    创建一个酸橙使用功能句柄的对象MyPredict..当您指定黑箱模型作为函数句柄时,您必须提供预测器数据并指定'类型'名称-值参数。TBL.包括分类预测器(油缸model_year.)与之数据类型。默认情况下,酸橙不治疗变量作为分类预测器的数据类型。指定第二个(油缸)及第五(model_year.)变量作为分类预测因子。

    结果=石灰(MyPredict,TBL,'类型''回归''pationoricalpricictors',[2 5]);

    适用于第一次观察的线性简单模型TBL..要在任何预测器名称中显示现有的下划线,请更改TickLabelInterpreter坐标轴的值“没有”

    结果= FIT(结果,TBL(1,:),4);f =情节(结果);f.currentaxes.TicklabelInterpreter =.“没有”;

    图中包含一个坐标轴。带有线性模型的标题式石灰的轴包含类型栏的物体。

    酸橙发现马力位移气缸, 和model_year.作为重要的预测因子。

    更多关于

    展开全部

    算法

    展开全部

    参考

    [1] Ribeiro,Marco Tulio,S. Singh和C.宾馆。“”我为什么要相信你?':解释任何分类器的预测。“在22届ACM锡贡德克德克德克德国际知识发现和数据挖掘会议上1135-44。旧金山,加利福尼亚州:ACM,2016。

    [2]świrszcz,grzegorz,naoki abe和auréliec. lozano。“分组正交匹配追求变量选择和预测。”神经信息处理系统研究进展(2009): 1150 - 58。

    [3] Lozano,AurélieC.,GrzegorzśWirszcz,以及Naoki Abe。“小组正交匹配追求逻辑回归。”第十四届国际人工智能和统计会议论文集(2011):452-60。

    介绍了R2020b