主要内容

错误

类:树人

误差(误分类概率或MSE)

语法

err=错误(B,TBLnew,Ynew)
呃=错误(B Xnew Ynew)
都会犯错误= (B TBLnew Ynew param1, val1, param2, val2,…)
err=错误(B,Xnew,Ynew,'param1',val1,'param2',val2,…)

描述

err=错误(B,TBLnew,Ynew)对于表中包含的预测器,计算分类树的误分类概率或每棵树的回归树的均方误差(MSE)TBLnew给真实的反应Ynew. 你可以省略Ynew如果TBLnew包含响应变量。如果你受过训练B使用表中包含的示例数据,则此方法的输入数据也必须在表中。

呃=错误(B Xnew Ynew)计算分类树的误分类概率或每棵树的回归树的均方误差(MSE),矩阵中包含的预测因子Xnew给真实的反应Ynew.如果你训练B使用矩阵中包含的样本数据,则此方法的输入数据也必须在矩阵中。

的分类,Ynew可以是数字向量、字符矩阵、字符串数组、字符向量的单元格数组、分类向量或逻辑向量。对于回归,Y必须是数字向量。犯错是否每个向量都有一个误差入侵者树木合奏B

都会犯错误= (B TBLnew Ynew param1, val1, param2, val2,…)err=错误(B,Xnew,Ynew,'param1',val1,'param2',val2,…)指定可选的参数名称-值对:

“模式” 指示方法如何计算错误的字符向量或字符串标量。如果设置为“累积”(违约),错误计算累积错误和犯错向量的长度是多少入侵者,其中第一个元素从树木(1),第二个元素从树木(1:2)等,树木(1:1).如果设置为“个人”,犯错向量的长度是多少入侵者,其中每个元素都是集合中每个树的错误。如果设置为“合奏”,犯错是表示整个系统累积误差的标量。
“重量” 用于误差平均的观测权重向量。默认情况下,每个观察值的权重为1。此向量的长度必须等于中的行数X
“树” 指示此计算中包含哪些树的索引向量。默认情况下,此参数设置为“全部”这个方法使用了所有的树。如果“树”是数值向量,该方法返回长度的向量入侵者对于“累积”“个人”模式,在哪里入侵者输入向量中的元素数,和标量是多少“合奏”模式。例如,在“累积”Mode,第一个元素给出了误差树木(1),第二个元素给出了树木(1:2)等。
“TreeWeights” 树权重向量。此向量的长度必须与“树”向量。该方法使用这些权重来组合指定树的输出,方法是采用加权平均而不是简单的非加权多数投票。中不能使用这个参数“个人”模式。
“UseInstanceForTree” 大小逻辑矩阵脑袋——- - - - - -入侵者指出应该使用哪些树对每次观测进行预测。默认情况下,该方法对所有观测使用所有树。

算法

在估计集成误差时:

  • 使用“模式”名称-值对参数,您可以指定以下三种方法中的任何一种返回错误:

    • 集合中单个树的错误

    • 所有树上的累积误差

    • 整个系统的误差

  • 使用“树”参数,您可以指定在集成错误计算中使用的树。

  • 使用“UseInstanceForTree”名称-值对参数,可以指定输入数据中的观察值(XY)在每个选定树的集合误差计算中使用。

  • 使用“重量”名称-值对参数,可以为每个观察有重量。对于下面的公式,WJ观察的重量是多少J

  • 使用“TreeWeights”名称-值对参数,可以为每个有重量。

对于回归问题,错误估计套袋回归树集合的加权均方误差,用于预测Y鉴于X使用选定的树和观察。

  1. 错误预测中选定观察结果的响应X使用集合中选择的回归树。

  2. MSE估计值取决于“模式”

    • 如果您指定“模式”,“个人”,则树的加权MSET

      均方误差 T = 1. J = 1. N W J J = 1. N W J ( Y J Y ^ T J ) 2.

      Y ^ T J 是观察的预期反应J从选定的回归树T错误将选定树中任何未选定的观察值设置为观察到的训练数据响应的加权样本平均值。

    • 如果您指定“模式”,“累积”,则加权MSE为尺寸向量T*包含累积的,加权的mseT*T选定的树。错误按照以下步骤估算MSET*,使用第一个T选定的树。

      1. 用于选定的观察J,J= 1,...,N,错误估计 Y ^ 纸袋 , T J ,即对第一批预测的加权平均T选定的树(有关详细信息,请参见预测).对于此计算,错误使用树的重量。

      2. 错误通过树估计累积的,加权的MSET

        均方误差 T = 1. J = 1. N W J J = 1. N W J ( Y J Y ^ 纸袋 , T J ) 2.

      错误将所有选定树的未选择观察值设置为观察到的训练数据响应的加权样本平均值。

    • 如果您指定“模式”,“合奏”,则加权MSE是累积加权MSE向量的最后一个元素。

对于分类问题,错误估计套袋分类树集合的加权误分类率,以进行预测Y鉴于X使用选定的树和观察。

  • 如果您指定“模式”,“个人”,求得树的加权误分类率T

    E T = 1. J = 1. N W J J = 1. N W J ( Y J Y ^ T J )

    Y ^ T J 是选定观测的预测类别J使用所选分类树中的T错误将选定树中任何未选择的观察结果设置为所有训练响应中预测的、加权的、最流行的类。如果有多个最受欢迎的课程,错误考虑第一个列在类名财产的树人模特最受欢迎。

  • 如果您指定“模式”,“累积”然后,加权误分类率是一个大小向量T*包含过去一段时间内的累计加权误分类率T*T选定的树。错误按照以下步骤进行估算ET*的累积加权误分类率T选定的树。

    1. 用于选定的观察J,J= 1,...,N,错误估计 Y ^ 纸袋 , T J ,是第一流中最受欢迎的加权类T选定的树(有关详细信息,请参见预测).对于此计算,错误使用树的重量。

    2. 错误通过树估计累积的、加权的误分类率T

      E T = 1. J = 1. N W J J = 1. N W J ( Y J Y ^ 纸袋 , T J )

      错误将所有未被选中的树的任何观察值设置为所有训练响应中预测的、加权的、最流行的类。如果有多个最受欢迎的课程,错误考虑第一个列在类名财产的树人模特最受欢迎。

  • 如果您指定“模式”,“合奏”,则加权误分类率是累积的加权误分类率向量的最后一个元素。