主要内容gydF4y2Ba

保证金gydF4y2Ba

多类纠错输出码(ECOC)模型的分类裕度gydF4y2Ba

描述gydF4y2Ba

米gydF4y2Ba=利润(gydF4y2BaMdlgydF4y2Ba,gydF4y2Ba资源描述gydF4y2Ba,gydF4y2BaResponseVarNamegydF4y2Ba)gydF4y2Ba返回gydF4y2Ba分类的利润率gydF4y2Ba(gydF4y2Ba米gydF4y2Ba)为训练后的多类纠错输出码(ECOC)模型gydF4y2BaMdlgydF4y2Ba利用表中的预测数据gydF4y2Ba资源描述gydF4y2Ba和类标签gydF4y2Ba资源描述。ResponseVarNamegydF4y2Ba.gydF4y2Ba

米gydF4y2Ba=利润(gydF4y2BaMdlgydF4y2Ba,gydF4y2Ba资源描述gydF4y2Ba,gydF4y2BaYgydF4y2Ba)gydF4y2Ba返回分类器的分类边距gydF4y2BaMdlgydF4y2Ba利用表中的预测数据gydF4y2Ba资源描述gydF4y2Ba类标签在向量中gydF4y2BaYgydF4y2Ba.gydF4y2Ba

例子gydF4y2Ba

米gydF4y2Ba=利润(gydF4y2BaMdlgydF4y2Ba,gydF4y2BaXgydF4y2Ba,gydF4y2BaYgydF4y2Ba)gydF4y2Ba返回分类器的分类边距gydF4y2BaMdlgydF4y2Ba利用矩阵中的预测数据gydF4y2BaXgydF4y2Ba和类标签gydF4y2BaYgydF4y2Ba.gydF4y2Ba

米gydF4y2Ba=利润(gydF4y2Ba___gydF4y2Ba,gydF4y2Ba名称,值gydF4y2Ba)gydF4y2Ba除前面语法中的任何输入参数组合外,还使用一个或多个名称-值对参数指定选项。例如,您可以指定解码方案、二进制学习者损失函数和冗长级别。gydF4y2Ba

例子gydF4y2Ba

全部折叠gydF4y2Ba

用支持向量机二元学习器计算ECOC模型的测试样本分类裕度。gydF4y2Ba

载入费雪的虹膜数据集。指定预测数据gydF4y2BaXgydF4y2Ba,响应数据gydF4y2BaYgydF4y2Ba中的类的顺序gydF4y2BaYgydF4y2Ba.gydF4y2Ba

负载gydF4y2BafisheririsgydF4y2BaX = meas;Y =类别(种);classOrder =唯一的(Y);gydF4y2Ba%班级顺序gydF4y2Barng (1)gydF4y2Ba%用于重现性gydF4y2Ba

使用支持向量机二分类器训练ECOC模型。指定30%抵制样本,使用支持向量机模板标准化预测器,并指定类顺序。gydF4y2Ba

t = templateSVM(gydF4y2Ba“标准化”gydF4y2Ba,真正的);PMdl = fitcecoc(X,Y,gydF4y2Ba“坚持”gydF4y2Ba, 0.30,gydF4y2Ba“学习者”gydF4y2BatgydF4y2Ba“类名”gydF4y2Ba, classOrder);Mdl = pmdl .受训{1};gydF4y2Ba%提取训练有素,紧凑的分类器gydF4y2Ba

PMdlgydF4y2Ba是一个gydF4y2BaClassificationPartitionedECOCgydF4y2Ba模型。它有这样的性质gydF4y2Ba训练有素的gydF4y2Ba的1 × 1单元格数组gydF4y2BaCompactClassificationECOCgydF4y2Ba软件使用训练集进行训练的模型。gydF4y2Ba

计算测试样本分类裕度。使用箱线图显示页边距的分布。gydF4y2Ba

testInds = test(PMdl.Partition);gydF4y2Ba提取测试指标gydF4y2BaXTest = X(testInds,:);YTest = Y(testInds,:);m = margin(Mdl,XTest,YTest);箱线图(m)标题(gydF4y2Ba测试样本的利润的gydF4y2Ba)gydF4y2Ba

图中包含一个axes对象。标题为Test-Sample margin的axes对象包含7个类型为line的对象。gydF4y2Ba

观测值的分类余量为正类负损失减去最大负类负损失。选择利润率相对较高的分类器。gydF4y2Ba

通过比较来自多个模型的测试样本裕度来进行特征选择。仅根据这种比较,边际最大的模型就是最好的模型。gydF4y2Ba

载入费雪的虹膜数据集。指定预测数据gydF4y2BaXgydF4y2Ba,响应数据gydF4y2BaYgydF4y2Ba中的类的顺序gydF4y2BaYgydF4y2Ba.gydF4y2Ba

负载gydF4y2BafisheririsgydF4y2BaX = meas;Y =类别(种);classOrder =唯一的(Y);gydF4y2Ba%班级顺序gydF4y2Barng (1);gydF4y2Ba%用于重现性gydF4y2Ba

将数据集划分为训练集和测试集。指定30%的样品进行测试。gydF4y2Ba

分区= cvpartition(Y,gydF4y2Ba“坚持”gydF4y2Ba, 0.30);testInds = test(分区);gydF4y2Ba测试集的%索引gydF4y2BaXTest = X(testInds,:);YTest = Y(testInds,:);gydF4y2Ba

分区gydF4y2Ba定义数据集分区。gydF4y2Ba

定义以下两个数据集:gydF4y2Ba

  • fullXgydF4y2Ba包含所有四个预测器。gydF4y2Ba

  • partXgydF4y2Ba仅包含萼片尺寸。gydF4y2Ba

fullX = X;partX = X(:,1:2);gydF4y2Ba

使用支持向量机二分类器对每个预测集训练ECOC模型。指定分区定义,使用SVM模板标准化预测器,并定义类顺序。gydF4y2Ba

t = templateSVM(gydF4y2Ba“标准化”gydF4y2Ba,真正的);fullPMdl = fitcecoc(fullX,Y,gydF4y2Ba“CVPartition”gydF4y2Ba分区,gydF4y2Ba“学习者”gydF4y2BatgydF4y2Ba…gydF4y2Ba“类名”gydF4y2Ba, classOrder);partPMdl = fitcecoc(partX,Y,gydF4y2Ba“CVPartition”gydF4y2Ba分区,gydF4y2Ba“学习者”gydF4y2BatgydF4y2Ba…gydF4y2Ba“类名”gydF4y2Ba, classOrder);fullMdl = fullpmdl .训练{1};partMdl = partpmdl .受训{1};gydF4y2Ba

fullPMdlgydF4y2Ba而且gydF4y2BapartPMdlgydF4y2Ba是gydF4y2BaClassificationPartitionedECOCgydF4y2Ba模型。每个模型都有属性gydF4y2Ba训练有素的gydF4y2Ba的1 × 1单元格数组gydF4y2BaCompactClassificationECOCgydF4y2Ba软件使用相应的训练集进行训练的模型。gydF4y2Ba

计算每个分类器的测试样本裕度。对于每个模型,使用箱线图显示边缘的分布。gydF4y2Ba

fullmargin = margin(fullMdl,XTest,YTest);partmargin = margin(partMdl,XTest(:,1:2),YTest);箱线图([fullMargins partMargins),gydF4y2Ba“标签”gydF4y2Ba,{gydF4y2Ba“所有预测”gydF4y2Ba,gydF4y2Ba“两个预测”gydF4y2Ba})标题(gydF4y2Ba“测试样本裕度箱线图”gydF4y2Ba)gydF4y2Ba

图中包含一个axes对象。标题为Boxplots of Test-Sample margin的axes对象包含14个类型为line的对象。gydF4y2Ba

的边际分布gydF4y2BafullMdlgydF4y2Ba的边际分布位置较高,变异性较小gydF4y2BapartMdlgydF4y2Ba.gydF4y2Ba

输入参数gydF4y2Ba

全部折叠gydF4y2Ba

完整或紧凑的多级ECOC模型,指定为gydF4y2BaClassificationECOCgydF4y2Ba或gydF4y2BaCompactClassificationECOCgydF4y2Ba模型对象。gydF4y2Ba

要创建完整或紧凑的ECOC模型,请参见gydF4y2BaClassificationECOCgydF4y2Ba或gydF4y2BaCompactClassificationECOCgydF4y2Ba.gydF4y2Ba

示例数据,指定为表。每一行gydF4y2Ba资源描述gydF4y2Ba对应一个观察结果,每一列对应一个预测变量。可选地,gydF4y2Ba资源描述gydF4y2Ba可以包含用于响应变量和观察权重的附加列。gydF4y2Ba资源描述gydF4y2Ba必须包含用于训练的所有预测器gydF4y2BaMdlgydF4y2Ba.不允许多列变量和字符向量的单元格数组以外的单元格数组。gydF4y2Ba

如果你训练gydF4y2BaMdlgydF4y2Ba中包含的样例数据gydF4y2Ba表格gydF4y2Ba,则为输入数据gydF4y2Ba保证金gydF4y2Ba也必须在表中。gydF4y2Ba

当训练gydF4y2BaMdlgydF4y2Ba,假设您设置gydF4y2Ba“标准化”,真的gydF4y2Ba中指定的模板对象gydF4y2Ba“学习者”gydF4y2Ba的名值对参数gydF4y2BafitcecocgydF4y2Ba.在这种情况下,为相应的二元学习者gydF4y2BajgydF4y2Ba,软件对新预测数据的列进行了标准化处理gydF4y2BaMdl.BinaryLearner {j} .MugydF4y2Ba的标准差gydF4y2BaMdl.BinaryLearner {j} .SigmagydF4y2Ba.gydF4y2Ba

数据类型:gydF4y2Ba表格gydF4y2Ba

中指定为变量名的响应变量名gydF4y2Ba资源描述gydF4y2Ba.如果gydF4y2Ba资源描述gydF4y2Ba包含用于训练的响应变量gydF4y2BaMdlgydF4y2Ba,则不需要指定gydF4y2BaResponseVarNamegydF4y2Ba.gydF4y2Ba

如果你指定gydF4y2BaResponseVarNamegydF4y2Ba,则必须以字符向量或字符串标量的形式执行。例如,如果响应变量存储为gydF4y2Batbl.ygydF4y2Ba,然后指定gydF4y2BaResponseVarNamegydF4y2Ba作为gydF4y2Ba“y”gydF4y2Ba.的所有列gydF4y2Ba资源描述gydF4y2Ba,包括gydF4y2Batbl.ygydF4y2Ba,作为预测指标。gydF4y2Ba

响应变量必须是类别、字符或字符串数组、逻辑或数字向量,或者字符向量的单元格数组。如果响应变量是字符数组,则每个元素必须对应数组中的一行。gydF4y2Ba

数据类型:gydF4y2Ba字符gydF4y2Ba|gydF4y2Ba字符串gydF4y2Ba

预测数据,指定为数值矩阵。gydF4y2Ba

每一行gydF4y2BaXgydF4y2Ba对应一个观察结果,每一列对应一个变量。列中的变量gydF4y2BaXgydF4y2Ba必须与训练分类器的变量相同gydF4y2BaMdlgydF4y2Ba.gydF4y2Ba

的行数gydF4y2BaXgydF4y2Ba必须等于中的行数gydF4y2BaYgydF4y2Ba.gydF4y2Ba

当训练gydF4y2BaMdlgydF4y2Ba,假设您设置gydF4y2Ba“标准化”,真的gydF4y2Ba中指定的模板对象gydF4y2Ba“学习者”gydF4y2Ba的名值对参数gydF4y2BafitcecocgydF4y2Ba.在这种情况下,为相应的二元学习者gydF4y2BajgydF4y2Ba,软件对新预测数据的列进行了标准化处理gydF4y2BaMdl.BinaryLearner {j} .MugydF4y2Ba的标准差gydF4y2BaMdl.BinaryLearner {j} .SigmagydF4y2Ba.gydF4y2Ba

数据类型:gydF4y2Ba双gydF4y2Ba|gydF4y2Ba单gydF4y2Ba

类标签,指定为类别、字符或字符串数组、逻辑或数字向量或字符向量的单元格数组。gydF4y2BaYgydF4y2Ba必须具有与?相同的数据类型gydF4y2BaMdl。一会gydF4y2Ba.gydF4y2Ba(该软件将字符串数组视为字符向量的单元格数组。)gydF4y2Ba

的行数gydF4y2BaYgydF4y2Ba必须等于中的行数gydF4y2Ba资源描述gydF4y2Ba或gydF4y2BaXgydF4y2Ba.gydF4y2Ba

数据类型:gydF4y2Ba分类gydF4y2Ba|gydF4y2Ba字符gydF4y2Ba|gydF4y2Ba字符串gydF4y2Ba|gydF4y2Ba逻辑gydF4y2Ba|gydF4y2Ba单gydF4y2Ba|gydF4y2Ba双gydF4y2Ba|gydF4y2Ba细胞gydF4y2Ba

名称-值参数gydF4y2Ba

指定可选参数对为gydF4y2BaName1 = Value1,…,以=家gydF4y2Ba,在那里gydF4y2Ba的名字gydF4y2Ba参数名称和gydF4y2Ba价值gydF4y2Ba对应的值。名-值参数必须出现在其他参数之后,但对的顺序并不重要。gydF4y2Ba

在R2021a之前,名称和值之间用逗号隔开,并括起来gydF4y2Ba的名字gydF4y2Ba在报价。gydF4y2Ba

例子:gydF4y2Ba保证金(Mdl、台、“y”,“BinaryLoss”,“指数”)gydF4y2Ba指定指数型二元学习器损失函数。gydF4y2Ba

二元学习者损失函数,指定为逗号分隔的对,由gydF4y2Ba“BinaryLoss”gydF4y2Ba和内置的损失函数名或函数句柄。gydF4y2Ba

  • 该表描述了内置函数gydF4y2BaygydF4y2BajgydF4y2Ba是特定二进制学习者(在集合{- 1,1,0}中)的类标签,gydF4y2Ba年代gydF4y2BajgydF4y2Ba分数是用来观察的吗gydF4y2BajgydF4y2Ba,gydF4y2BaggydF4y2Ba(gydF4y2BaygydF4y2BajgydF4y2Ba,gydF4y2Ba年代gydF4y2BajgydF4y2Ba)为二元损失公式。gydF4y2Ba

    价值gydF4y2Ba 描述gydF4y2Ba 分数域gydF4y2Ba ggydF4y2Ba(gydF4y2BaygydF4y2BajgydF4y2Ba,gydF4y2Ba年代gydF4y2BajgydF4y2Ba)gydF4y2Ba
    “binodeviance”gydF4y2Ba 二项异常gydF4y2Ba (-∞∞)gydF4y2Ba 日志[1 + exp(-2)]gydF4y2BaygydF4y2BajgydF4y2Ba年代gydF4y2BajgydF4y2Ba日志(2)])]/ [2gydF4y2Ba
    “指数”gydF4y2Ba 指数gydF4y2Ba (-∞∞)gydF4y2Ba exp (-gydF4y2BaygydF4y2BajgydF4y2Ba年代gydF4y2BajgydF4y2Ba) / 2gydF4y2Ba
    “汉明”gydF4y2Ba 汉明gydF4y2Ba [0,1]或(-∞,∞)gydF4y2Ba [1 - sign(gydF4y2BaygydF4y2BajgydF4y2Ba年代gydF4y2BajgydF4y2Ba) / 2gydF4y2Ba
    “枢纽”gydF4y2Ba 铰链gydF4y2Ba (-∞∞)gydF4y2Ba 马克斯(0,1 -gydF4y2BaygydF4y2BajgydF4y2Ba年代gydF4y2BajgydF4y2Ba) / 2gydF4y2Ba
    “线性”gydF4y2Ba 线性gydF4y2Ba (-∞∞)gydF4y2Ba (1 -gydF4y2BaygydF4y2BajgydF4y2Ba年代gydF4y2BajgydF4y2Ba) / 2gydF4y2Ba
    分对数的gydF4y2Ba 物流gydF4y2Ba (-∞∞)gydF4y2Ba 日志[1 + exp(- . LoggydF4y2BaygydF4y2BajgydF4y2Ba年代gydF4y2BajgydF4y2Ba日志(2)])]/ [2gydF4y2Ba
    “二次”gydF4y2Ba 二次gydF4y2Ba [0, 1]gydF4y2Ba (1 -gydF4y2BaygydF4y2BajgydF4y2Ba(2gydF4y2Ba年代gydF4y2BajgydF4y2Ba- 1))gydF4y2Ba2gydF4y2Ba/ 2gydF4y2Ba

    该软件将二进制损耗归一化,使损耗为0.5gydF4y2BaygydF4y2BajgydF4y2Ba= 0。此外,软件计算每个类的平均二进制损失。gydF4y2Ba

  • 例如,对于自定义的二进制损失函数gydF4y2BacustomFunctiongydF4y2Ba,指定其函数句柄gydF4y2BaBinaryLoss, @customFunctiongydF4y2Ba.gydF4y2Ba

    customFunctiongydF4y2Ba有这样的形式:gydF4y2Ba

    bls = customFunction(M,s)gydF4y2Ba

    • 米gydF4y2Ba是gydF4y2BaKgydF4y2Ba——- - - - - -gydF4y2BaBgydF4y2Ba存储在gydF4y2BaMdl。CodingMatrixgydF4y2Ba.gydF4y2Ba

    • 年代gydF4y2Ba是1乘-吗gydF4y2BaBgydF4y2Ba分类分数行向量。gydF4y2Ba

    • 布劳斯gydF4y2Ba是分类丢失。这个标量聚集了特定班级中每个学习者的二进制损失。例如,您可以使用平均二元损失来合计每个类的学习者的损失。gydF4y2Ba

    • KgydF4y2Ba是类的数量。gydF4y2Ba

    • BgydF4y2Ba是二元学习者的数量。gydF4y2Ba

    有关传递自定义二进制损耗函数的示例,请参见gydF4y2Ba利用自定义二元损耗函数预测ECOC模型的测试样本标签gydF4y2Ba.gydF4y2Ba

默认的gydF4y2BaBinaryLossgydF4y2Ba值取决于二元学习者返回的分数范围。该表标识了某些默认值gydF4y2BaBinaryLossgydF4y2Ba值是在使用默认得分转换(gydF4y2BaScoreTransformgydF4y2Ba模型的属性为gydF4y2Ba“没有”gydF4y2Ba).gydF4y2Ba

假设gydF4y2Ba 默认值gydF4y2Ba

所有的二元学习者都是以下任何一种:gydF4y2Ba

  • 分类决策树gydF4y2Ba

  • 判别分析模型gydF4y2Ba

  • kgydF4y2Ba-最近邻模型gydF4y2Ba

  • 逻辑回归学习者的线性或核分类模型gydF4y2Ba

  • 朴素贝叶斯模型gydF4y2Ba

“二次”gydF4y2Ba
所有的二元学习者都是支持向量机或支持向量机学习者的线性或核分类模型。gydF4y2Ba “枢纽”gydF4y2Ba
所有的二元学习者都是由gydF4y2BaAdaboostM1gydF4y2Ba或gydF4y2BaGentleBoostgydF4y2Ba.gydF4y2Ba “指数”gydF4y2Ba
所有的二元学习者都是由gydF4y2BaLogitBoostgydF4y2Ba.gydF4y2Ba “binodeviance”gydF4y2Ba
你指定通过设置来预测类的后验概率gydF4y2Ba“FitPosterior”,真的gydF4y2Ba在gydF4y2BafitcecocgydF4y2Ba.gydF4y2Ba “二次”gydF4y2Ba
二元学习者是异构的,使用不同的损失函数。gydF4y2Ba “汉明”gydF4y2Ba

要检查默认值,请使用点表示法来显示gydF4y2BaBinaryLossgydF4y2Ba在命令行中训练的模型的属性。gydF4y2Ba

例子:gydF4y2Ba“BinaryLoss”、“binodeviance”gydF4y2Ba

数据类型:gydF4y2Ba字符gydF4y2Ba|gydF4y2Ba字符串gydF4y2Ba|gydF4y2Bafunction_handlegydF4y2Ba

聚合二进制损耗的解码方案,指定为逗号分隔的对,由gydF4y2Ba“解码”gydF4y2Ba而且gydF4y2Ba“lossweighted”gydF4y2Ba或gydF4y2Ba“lossbased”gydF4y2Ba.有关更多信息,请参见gydF4y2Ba二元损失gydF4y2Ba.gydF4y2Ba

例子:gydF4y2Ba“解码”、“lossbased”gydF4y2Ba

预测器数据观测维数,指定为逗号分隔的对,由gydF4y2Ba“ObservationsIn”gydF4y2Ba而且gydF4y2Ba“列”gydF4y2Ba或gydF4y2Ba“行”gydF4y2Ba.gydF4y2BaMdl。B我naryLearners必须包含gydF4y2BaClassificationLineargydF4y2Ba模型。gydF4y2Ba

请注意gydF4y2Ba

如果你定位你的预测矩阵,使观察结果对应列和指定gydF4y2Ba“ObservationsIn”、“列”gydF4y2Ba,您可以体验到执行时间的显著减少。您不能指定gydF4y2Ba“ObservationsIn”、“列”gydF4y2Ba用于表中的预测数据。gydF4y2Ba

估计选项,指定为逗号分隔的对,由gydF4y2Ba“选项”gydF4y2Ba和返回的结构数组gydF4y2BastatsetgydF4y2Ba.gydF4y2Ba

调用并行计算:gydF4y2Ba

  • 您需要一个并行计算工具箱™许可证。gydF4y2Ba

  • 指定gydF4y2Ba“选项”,statset (UseParallel,真的)gydF4y2Ba.gydF4y2Ba

冗长级别,指定为逗号分隔的对,由gydF4y2Ba“详细”gydF4y2Ba而且gydF4y2Ba0gydF4y2Ba或gydF4y2Ba1gydF4y2Ba.gydF4y2Ba详细的gydF4y2Ba控制软件在命令窗口中显示的诊断消息的数量。gydF4y2Ba

如果gydF4y2Ba详细的gydF4y2Ba是gydF4y2Ba0gydF4y2Ba,则软件不显示诊断信息。否则,软件将显示诊断信息。gydF4y2Ba

例子:gydF4y2Ba“详细”,1gydF4y2Ba

数据类型:gydF4y2Ba单gydF4y2Ba|gydF4y2Ba双gydF4y2Ba

输出参数gydF4y2Ba

全部折叠gydF4y2Ba

分类的利润率gydF4y2Ba,作为数值列向量或数值矩阵返回。gydF4y2Ba

如果gydF4y2BaMdl。B我naryLearners包含gydF4y2BaClassificationLineargydF4y2Ba模型,然后gydF4y2Ba米gydF4y2Ba是一个gydF4y2BangydF4y2Ba——- - - - - -gydF4y2BalgydF4y2Ba向量,gydF4y2BangydF4y2Ba观察的数量在吗gydF4y2BaXgydF4y2Ba而且gydF4y2BalgydF4y2Ba为线性分类模型中正则化强度的个数(gydF4y2Ba元素个数(Mdl.BinaryLearners {1} .Lambda)gydF4y2Ba).的值gydF4y2Bam (i, j)gydF4y2Ba观察范围是多少gydF4y2Ba我gydF4y2Ba对于使用正则化强度训练的模型gydF4y2BaMdl.BinaryLearners {1} .Lambda (j)gydF4y2Ba.gydF4y2Ba

否则,gydF4y2Ba米gydF4y2Ba列向量的长度是多少gydF4y2BangydF4y2Ba.gydF4y2Ba

更多关于gydF4y2Ba

全部折叠gydF4y2Ba

二元损失gydF4y2Ba

的gydF4y2Ba二元损失gydF4y2Ba是类别和分类分数的函数,它决定了二元学习者将观察结果划分为类别的程度。gydF4y2Ba

假设:gydF4y2Ba

  • 米gydF4y2BakjgydF4y2Ba元素(gydF4y2BakgydF4y2Ba,gydF4y2BajgydF4y2Ba)的编码设计矩阵gydF4y2Ba米gydF4y2Ba也就是说,对应于类的代码gydF4y2BakgydF4y2Ba二元学习者gydF4y2BajgydF4y2Ba.gydF4y2Ba米gydF4y2Ba是一个gydF4y2BaKgydF4y2Ba——- - - - - -gydF4y2BaBgydF4y2Ba矩阵,gydF4y2BaKgydF4y2Ba是多少班,和gydF4y2BaBgydF4y2Ba是二元学习者的数量。gydF4y2Ba

  • 年代gydF4y2BajgydF4y2Ba是二元学习者的分数吗gydF4y2BajgydF4y2Ba观察一下。gydF4y2Ba

  • ggydF4y2Ba为二元损失函数。gydF4y2Ba

  • kgydF4y2Ba ^gydF4y2Ba 是观测的预测类。gydF4y2Ba

ECOC模型的解码方案规定了软件如何聚合二进制损耗并确定每个观测的预测类别。该软件支持两种解码方案:万博1manbetxgydF4y2Ba

  • 通过解码gydF4y2Ba[2]gydF4y2Ba(gydF4y2Ba解码gydF4y2Ba是gydF4y2Ba“lossbased”gydF4y2Ba) -观察结果的预测类别对应于在所有二元学习者中产生最小二元损失平均值的类别。gydF4y2Ba

    kgydF4y2Ba ^gydF4y2Ba =gydF4y2Ba argmingydF4y2Ba kgydF4y2Ba 1gydF4y2Ba BgydF4y2Ba ∑gydF4y2Ba jgydF4y2Ba =gydF4y2Ba 1gydF4y2Ba BgydF4y2Ba |gydF4y2Ba 米gydF4y2Ba kgydF4y2Ba jgydF4y2Ba |gydF4y2Ba ggydF4y2Ba (gydF4y2Ba 米gydF4y2Ba kgydF4y2Ba jgydF4y2Ba ,gydF4y2Ba 年代gydF4y2Ba jgydF4y2Ba )gydF4y2Ba .gydF4y2Ba

  • Loss-weighted解码gydF4y2Ba[3]gydF4y2Ba(gydF4y2Ba解码gydF4y2Ba是gydF4y2Ba“lossweighted”gydF4y2Ba) -观察结果的预测类别对应于产生对应类别的二元损失相对于二元学习者的最小平均值的类别。gydF4y2Ba

    kgydF4y2Ba ^gydF4y2Ba =gydF4y2Ba argmingydF4y2Ba kgydF4y2Ba ∑gydF4y2Ba jgydF4y2Ba =gydF4y2Ba 1gydF4y2Ba BgydF4y2Ba |gydF4y2Ba 米gydF4y2Ba kgydF4y2Ba jgydF4y2Ba |gydF4y2Ba ggydF4y2Ba (gydF4y2Ba 米gydF4y2Ba kgydF4y2Ba jgydF4y2Ba ,gydF4y2Ba 年代gydF4y2Ba jgydF4y2Ba )gydF4y2Ba ∑gydF4y2Ba jgydF4y2Ba =gydF4y2Ba 1gydF4y2Ba BgydF4y2Ba |gydF4y2Ba 米gydF4y2Ba kgydF4y2Ba jgydF4y2Ba |gydF4y2Ba .gydF4y2Ba

    分母对应于类的二元学习者的数量gydF4y2BakgydF4y2Ba.gydF4y2Ba[1]gydF4y2Ba提出损耗加权解码通过保持所有类的损耗值在相同的动态范围内来提高分类精度。gydF4y2Ba

的gydF4y2Ba预测gydF4y2Ba,gydF4y2BaresubPredictgydF4y2Ba,gydF4y2BakfoldPredictgydF4y2Ba函数返回目标函数的负数gydF4y2BaargmingydF4y2Ba作为第二个输出参数(gydF4y2BaNegLossgydF4y2Ba)。gydF4y2Ba

下表总结了支持的二进制损耗函数,其中万博1manbetxgydF4y2BaygydF4y2BajgydF4y2Ba是特定二进制学习者(在集合{- 1,1,0}中)的类标签,gydF4y2Ba年代gydF4y2BajgydF4y2Ba分数是用来观察的吗gydF4y2BajgydF4y2Ba,gydF4y2BaggydF4y2Ba(gydF4y2BaygydF4y2BajgydF4y2Ba,gydF4y2Ba年代gydF4y2BajgydF4y2Ba)为二元损失函数。gydF4y2Ba

价值gydF4y2Ba 描述gydF4y2Ba 分数域gydF4y2Ba ggydF4y2Ba(gydF4y2BaygydF4y2BajgydF4y2Ba,gydF4y2Ba年代gydF4y2BajgydF4y2Ba)gydF4y2Ba
“binodeviance”gydF4y2Ba 二项异常gydF4y2Ba (-∞∞)gydF4y2Ba 日志[1 + exp(-2)]gydF4y2BaygydF4y2BajgydF4y2Ba年代gydF4y2BajgydF4y2Ba日志(2)])]/ [2gydF4y2Ba
“指数”gydF4y2Ba 指数gydF4y2Ba (-∞∞)gydF4y2Ba exp (-gydF4y2BaygydF4y2BajgydF4y2Ba年代gydF4y2BajgydF4y2Ba) / 2gydF4y2Ba
“汉明”gydF4y2Ba 汉明gydF4y2Ba [0,1]或(-∞,∞)gydF4y2Ba [1 - sign(gydF4y2BaygydF4y2BajgydF4y2Ba年代gydF4y2BajgydF4y2Ba) / 2gydF4y2Ba
“枢纽”gydF4y2Ba 铰链gydF4y2Ba (-∞∞)gydF4y2Ba 马克斯(0,1 -gydF4y2BaygydF4y2BajgydF4y2Ba年代gydF4y2BajgydF4y2Ba) / 2gydF4y2Ba
“线性”gydF4y2Ba 线性gydF4y2Ba (-∞∞)gydF4y2Ba (1 -gydF4y2BaygydF4y2BajgydF4y2Ba年代gydF4y2BajgydF4y2Ba) / 2gydF4y2Ba
“分对数”gydF4y2Ba 物流gydF4y2Ba (-∞∞)gydF4y2Ba 日志[1 + exp(- . LoggydF4y2BaygydF4y2BajgydF4y2Ba年代gydF4y2BajgydF4y2Ba日志(2)])]/ [2gydF4y2Ba
“二次”gydF4y2Ba 二次gydF4y2Ba [0, 1]gydF4y2Ba (1 -gydF4y2BaygydF4y2BajgydF4y2Ba(2gydF4y2Ba年代gydF4y2BajgydF4y2Ba- 1))gydF4y2Ba2gydF4y2Ba/ 2gydF4y2Ba

该软件将二进制损耗归一化,使损耗为0.5gydF4y2BaygydF4y2BajgydF4y2Ba= 0,并使用二元学习者的平均值进行聚合。gydF4y2Ba

不要将二进制损耗与总体分类损耗(由gydF4y2BaLossFungydF4y2Ba的名称-值参数gydF4y2Ba损失gydF4y2Ba而且gydF4y2Ba预测gydF4y2Ba对象函数),它度量ECOC分类器作为一个整体的执行情况。gydF4y2Ba

分类保证金gydF4y2Ba

的gydF4y2Ba分类保证金gydF4y2Ba对于每个观测,是真实类的负损失与虚假类的最大负损失之间的差值。如果边际在相同的尺度上,那么它们就可以作为分类置信度量。在多个分类器中,利润率更高的分类器更好。gydF4y2Ba

提示gydF4y2Ba

  • 要比较几个ECOC分类器的边或边,可以在训练过程中使用模板对象指定分类器之间的公共评分转换函数。gydF4y2Ba

参考文献gydF4y2Ba

[1]奥尔温,E., R.夏皮尔,和Y.辛格。将多类简化为二进制:边距分类器的统一方法。gydF4y2Ba机器学习研究杂志gydF4y2Ba.第1卷,2000,第113-141页。gydF4y2Ba

[2] Escalera, S., O. Pujol和P. Radeva。用于纠错输出码稀疏设计的三元码的可分离性。gydF4y2BaRecog模式。列托人。gydF4y2Ba2009年第3期,第285-297页。gydF4y2Ba

[3] Escalera, S., O. Pujol和P. Radeva。三进制纠错输出码的译码过程。gydF4y2Ba模式分析与机器智能汇刊gydF4y2Ba.2010年第7期第32卷第120-134页。gydF4y2Ba

扩展功能gydF4y2Ba

版本历史gydF4y2Ba

在R2014b中引入gydF4y2Ba