主要内容

错误

错误(错误分类概率或MSE)

语法

呃=错误(B TBLnew Ynew)
呃=错误(B Xnew Ynew)
都会犯错误= (B TBLnew Ynew param1, val1, param2, val2,…)
都会犯错误= (B Xnew Ynew param1, val1, param2, val2,…)

描述

呃=错误(B TBLnew Ynew)计算错误分类概率分类树和均方误差(MSE)回归树,每棵树,为预测包含在表中TBLnew给真实的反应Ynew。你可以省略Ynew如果TBLnew包含变量的响应。如果你训练B使用样本数据包含在一个表中,然后输入数据的方法也必须在一个表中。

呃=错误(B Xnew Ynew)计算错误分类概率分类树和均方误差(MSE)回归树,每棵树,为预测包含在矩阵Xnew给真实的反应Ynew。如果你训练B使用样本数据包含在一个矩阵,然后输入数据的方法也必须在一个矩阵。

的分类,Ynew可以是一个数值向量,字符矩阵,字符串数组,单元阵列的特征向量,分类向量或逻辑向量。对于回归,Y必须是一个数字向量。犯错是一个向量和一个误差测量的NTrees树木的合奏B

都会犯错误= (B TBLnew Ynew param1, val1, param2, val2,…)都会犯错误= (B Xnew Ynew param1, val1, param2, val2,…)指定可选参数名称-值对:

“模式” 特征向量或字符串标量表示方法计算错误。如果设置为“累积”(默认),错误计算累积错误和犯错是一个向量的长度NTrees,其中第一个元素为错误树(1),第二个元素为错误树(1:2)等,树(1:NTrees)。如果设置为“个人”,犯错是一个向量的长度NTrees,其中每个元素是一个错误的每棵树。如果设置为“合奏”,犯错是一个标量显示整个合奏的累积误差。
“重量” 的观察向量权重平均用于错误。默认情况下每个观测的重量是1。这个向量的长度必须相等的行数X
“树” 向量指标指示要包括哪些树的计算。默认情况下,这个参数被设置为“所有”方法使用所有的树木。如果“树”是一个数值向量,该方法返回一个向量的长度NTrees“累积”“个人”模式,NTrees在输入向量元素的数量,和一个标量吗“合奏”模式。例如,在“累积”模式,给了错误的第一个元素树(1),第二个元素为错误树(1:2)等。
“TreeWeights” 权重向量的树。这个向量必须具有相同的长度“树”向量。该方法使用这些指定权重组合输出树通过加权平均,而不是简单的非加权多数投票。你不能使用这个论点“个人”模式。
“UseInstanceForTree” 逻辑矩阵的大小脑袋——- - - - - -NTrees表示应该使用哪个树为每个观测进行预测。默认情况下,所有观测方法使用了所有的树木。

算法

当评估整体错误:

  • 使用“模式”名称-值对参数,您可以指定返回错误的三种方式:

    • 个别树木的错误

    • 累积误差除以所有的树木

    • 整个合奏的错误

  • 使用“树”名称-值对参数,您可以指定使用哪个树的整体误差计算。

  • 使用“UseInstanceForTree”名称-值对参数,您可以指定观察输入数据(XY)用于合奏错误计算为每个选定的树。

  • 使用“重量”名称-值对的观点,你可以每个属性观察重量。的公式,wj观察的重量吗j

  • 使用“TreeWeights”名称-值对的观点,你可以每个属性重量。

对于回归问题,错误估计的加权均方误差的袋装回归树来预测Y鉴于X使用选定的树木和观察。

  1. 错误预测选择观察的反应X使用选定的回归树的合奏。

  2. 均方误差估计的值取决于“模式”

    • 如果您指定“模式”,“个人”,然后树的加权均方误差t

      均方误差 t = 1 j = 1 n w j j = 1 n w j ( y j y ^ t j ) 2

      y ^ t j 预测反应的观察吗j从选择回归树t错误内设置任何未经选择的观察选择树的加权样本平均观察,训练数据的响应。

    • 如果您指定“模式”、“累积”,然后加权均方误差是一个向量的大小T*包含累积,加权家中小企业T*T选择树。错误遵循这些步骤来估计均方误差t*使用第一个,累计加权均方误差t选择树。

      1. 选择观测j,j= 1,…,n,错误估计 y ^ , t j 的加权平均预测第一批t选择树(详情,请参阅预测)。对于这个计算,错误使用树的重量。

      2. 错误估计累积,通过树的加权均方误差t

        均方误差 t = 1 j = 1 n w j j = 1 n w j ( y j y ^ , t j ) 2

      错误集,对于所有选定观察,没有树木的加权样本平均观察,训练数据的响应。

    • 如果您指定“模式”、“合奏”,然后加权均方误差累积的最后一个元素,加权均方误差向量。

对于分类问题,错误估计的加权误分类率整体预测的袋装分类树Y鉴于X使用选定的树木和观察。

  • 如果您指定“模式”,“个人”,然后加权树误分类率t

    e t = 1 j = 1 n w j j = 1 n w j ( y j y ^ t j )

    y ^ t j 是选择观察的预测类j使用从选定的分类树t错误内设置任何未经选择的观察选择树预测,所有训练反应的加权,最受欢迎的课。如果有多个最受欢迎的课程,错误认为首先列出之一一会财产的TreeBagger最受欢迎的模型。

  • 如果您指定“模式”、“累积”然后加权误分类率是一个向量的大小T*包含累积,加权误分类率T*T选择树。错误遵循这些步骤来估计et*累积,使用第一个加权误分类率t选择树。

    1. 选择观测j,j= 1,…,n,错误估计 y ^ , t j 、加权类第一批最受欢迎t选择树(详情,请参阅预测)。对于这个计算,错误使用树的重量。

    2. 错误通过树估计累积,加权误分类率t

      e t = 1 j = 1 n w j j = 1 n w j ( y j y ^ , t j )

      错误集的任何观察都没有选择树预测,所有训练反应的加权,最受欢迎的课。如果有多个最受欢迎的课程,错误认为首先列出之一一会财产的TreeBagger最受欢迎的模型。

  • 如果您指定“模式”、“合奏”,然后加权累积的误分类率是最后一个元素,加权向量错误分类。