错误

类:TreeBagger

误分类概率或MSE

语法

呃=错误(B TBLnew Ynew)
ERR =错误(B,Xnew,Ynew)
ERR =错误(B,TBLnew,Ynew, '的param1',VAL1, '参数2',val2次,...)
都会犯错误= (B Xnew Ynew param1, val1, param2, val2,…)

描述

呃=错误(B TBLnew Ynew)计算对于分类树或均方误差(MSE)的回归树每棵树的误判概率,包含在表中的预测TBLnew给出真实反应Ynew。你可以省略Ynew如果TBLnew包含响应变量。如果你训练B如果使用包含在表中的示例数据,那么此方法的输入数据也必须在表中。

ERR =错误(B,Xnew,Ynew)计算用于分类树或回归树每个树均方误差(MSE)的误分类概率,所述用于预测包含在基质Xnew给出真实反应Ynew。如果你训练B如果使用包含在矩阵中的样本数据,则此方法的输入数据也必须在矩阵中。

对于分类,Ynew可以是数字向量、字符矩阵、字符串数组、字符向量的单元数组、分类向量或逻辑向量。对于回归,Y必须是数值向量。是与一个误差测量的向量为每个NTrees在合奏树B

ERR =错误(B,TBLnew,Ynew, '的param1',VAL1, '参数2',val2次,...)要么都会犯错误= (B Xnew Ynew param1, val1, param2, val2,…)指定可选的参数名称-值对:

“模式” 指示方法如何计算错误的字符向量或字符串标量。如果设置为“累积”(默认),错误计算累积错误和是长度的向量吗NTrees,其中第一个元素给出错误树(1),第二个元素给出错误树(1:2)等,直到树(1:NTrees)。如果设置为“个人”,是长度的向量吗NTrees,其中每个元素是集合中每棵树的一个错误。如果设置为“合奏”,是示出用于整个合奏的累积误差的标量。
“重量” 用于误差平均的观测权值向量。默认情况下,每个观测值的权重为1。这个向量的长度必须等于它的行数X
“大树” 指示在此计算中包括哪些树的索引向量。默认情况下,此参数设置为“所有”并且该方法使用的所有树木。如果“大树”是数值向量,该方法返回长度的矢量NTrees“累积”“个人”模式,NTrees在输入矢量元素的数量,以及用于标量“合奏”模式。例如,在“累积”模式时,第一元件从给误差树(1),第二个元素给出来自的错误树(1:2)等。
'TreeWeights' 树权值的向量。这个向量必须和“大树”向量。该方法使用这些权重来通过取加权平均,而不是简单的非加权多数表决输出从指定的树结合。不能使用在这个论点“个人”模式。
'UseInstanceForTree' 逻辑大小矩阵NOBS-通过-NTrees指示哪些树木应该用来为每个观察预测。默认情况下,该方法使用的所有观测值的所有树木。

算法

当估计误差合奏:

  • 使用“模式”名称 - 值对的参数,你可以指定返回错误的任何以下三种方式:

    • 在集合中单个树的错误

    • 所有树的累积误差

    • 整个乐团的错误

  • 使用“大树”名称 - 值对的参数,你可以指定在整体误差计算要使用的树木。

  • 使用'UseInstanceForTree'名称-值对参数,您可以指定输入数据(XY)用于每棵选定树的集成误差计算。

  • 使用“重量”名称-值对参数,可以为每个参数设置属性意见重量。对于下面的公式,wj观察的权重是多少j

  • 使用'TreeWeights'名称-值对参数,可以为每个参数设置属性重量。

对于回归问题,错误估计袋回归树集合的加权MSE用于预测Y鉴于X使用选定的树木和观察结果。

  1. 错误预测对所选观察结果的反应X利用在合奏所选回归树。

  2. MSE的估计取决于的值“模式”

    • 如果您指定“模式”,“个人”,然后加权MSE的树t

      MSE t = 1 j = 1 n w j j = 1 n w j ( y j y ^ t j ) 2

      y ^ t j 预测的观测反应是什么j从选定的回归树t错误将所选树中未选择的观察值设置为观察到的训练数据响应的加权样本平均值。

    • 如果您指定“模式”、“累积”,则加权MSE是大小的矢量T*含有超过累积,加权的MSET*T选择树。错误按照以下步骤来估计MSEt*,采用累积的加权平均方差t选择树。

      1. 选择观测j,j= 1,…,n,错误估计 y ^ , t j 中,第一间的加权平均的预测的t选定的树(有关详细信息,请参见预测)。对于这个计算,错误使用树权重。

      2. 错误估计通过植树累计,加权MSEt

        MSE t = 1 j = 1 n w j j = 1 n w j ( y j y ^ , t j ) 2

      错误将未被选中的所有树的观测数据集合为观察到的加权样本平均值,训练数据响应。

    • 如果您指定“模式”、“合奏”,则加权MSE为累积加权MSE向量的最后一个元素。

对于分类问题,错误估计袋装分类树集合的加权误分类率,用于预测Y鉴于X使用选定的树木和观察结果。

  • 如果您指定“模式”,“个人”,然后加权错误率的树t

    e t = 1 j = 1 n w j j = 1 n w j ( y j y ^ t j )

    y ^ t j 所选观察的预测类别是什么j使用从选定的分类树t错误设置在所有训练响应选定树预测,加权,最流行的类中的任何未选择的意见。如果有多个最流行的类别,错误认为在第一中列出的一个一会财产TreeBagger型号是最受欢迎的。

  • 如果您指定“模式”、“累积”然后,加权误分类率是一个大小向量T*中包含累积的加权误分类率T*T选择树。错误按照以下步骤进行估算et*使用所述第一累积,加权错误率t选择树。

    1. 选择观测j,j= 1,…,n,错误估计 y ^ , t j ,权重最大,最受欢迎的类中第一t选定的树(有关详细信息,请参见预测)。对于这个计算,错误使用树权重。

    2. 错误估计通过植树累计,加权错误率t

      e t = 1 j = 1 n w j j = 1 n w j ( y j y ^ , t j )

      错误设置一个未被选择超过所有训练响应所有选定的树预测,加权,最流行的类中的任何意见。如果有多个最流行的类别,错误认为在第一中列出的一个一会财产TreeBagger型号是最受欢迎的。

  • 如果您指定“模式”、“合奏”,则加权错误率是累积的,加权的错误分类率向量的最后一个元素。