预测GYdF4y2Ba

使用多类纠错输出码(ECOC)模型对观测进行分类GYdF4y2Ba

描述GYdF4y2Ba

实例GYdF4y2Ba

标签GYdF4y2Ba=预测(GYdF4y2BaMdlGYdF4y2Ba,GYdF4y2BaXGYdF4y2Ba)GYdF4y2Ba返回预测类标签的向量(GYdF4y2Ba标签GYdF4y2Ba)用于表或矩阵中的预测数据GYdF4y2BaXGYdF4y2Ba,基于训练有素的多款误差校正输出代码(ECOC)模型GYdF4y2BaMdlGYdF4y2Ba.经过训练的ECOC模型可以是完整的,也可以是紧凑的。GYdF4y2Ba

实例GYdF4y2Ba

标签GYdF4y2Ba=预测(GYdF4y2BaMdlGYdF4y2Ba,GYdF4y2BaXGYdF4y2Ba,GYdF4y2Ba名称、值GYdF4y2Ba)GYdF4y2Ba使用由一个或多个名称-值对参数指定的其他选项。例如,可以指定后验概率估计方法、解码方案和详细程度。GYdF4y2Ba

实例GYdF4y2Ba

[GYdF4y2Ba标签GYdF4y2Ba,GYdF4y2BaNegLossGYdF4y2Ba,GYdF4y2BaPBSCore.GYdF4y2Ba]=预测(GYdF4y2Ba___GYdF4y2Ba)GYdF4y2Ba使用前面语法中的任何输入参数组合,并额外返回:GYdF4y2Ba

  • 一组负平均值GYdF4y2Ba二进制损失GYdF4y2Ba(GYdF4y2BaNegLossGYdF4y2Ba).对于每一个GYdF4y2BaXGYdF4y2Ba,GYdF4y2Ba预测GYdF4y2Ba指定产生最大负平均二进制损失(或,等价地,最小平均二进制损失)的类的标签。GYdF4y2Ba

  • 一系列积极级别的分数(GYdF4y2BaPBSCore.GYdF4y2Ba)对于每个二进制学习者分类的观察结果。GYdF4y2Ba

实例GYdF4y2Ba

[GYdF4y2Ba标签GYdF4y2Ba,GYdF4y2BaNegLossGYdF4y2Ba,GYdF4y2BaPBSCore.GYdF4y2Ba,GYdF4y2Ba后GYdF4y2Ba]=预测(GYdF4y2Ba___GYdF4y2Ba)GYdF4y2Ba另外,返回观测值的后验类别概率估计值(GYdF4y2Ba后GYdF4y2Ba).GYdF4y2Ba

要获得后验类别概率,必须设置GYdF4y2Ba“是的,没错GYdF4y2Ba在培训ECOC模型时,使用GYdF4y2BafitcecocGYdF4y2Ba.否则,GYdF4y2Ba预测GYdF4y2Ba抛出一个错误。GYdF4y2Ba

例子GYdF4y2Ba

全部折叠GYdF4y2Ba

载入费雪的虹膜数据集。指定预测器数据GYdF4y2BaXGYdF4y2Ba,响应数据GYdF4y2BaYGYdF4y2Ba,以及课程的顺序GYdF4y2BaYGYdF4y2Ba.GYdF4y2Ba

负载GYdF4y2Ba鱼腥草GYdF4y2BaX=meas;Y=categorical(物种);classOrder=unique(Y);rng (1);GYdF4y2Ba%为了再现性GYdF4y2Ba

使用支持向量机二分类器训练ECOC模型。指定30%的拒绝样本,使用SVM模板标准化预测器,并指定类顺序。GYdF4y2Ba

t=模板SVM(GYdF4y2Ba“标准化”GYdF4y2Ba,对);PMdl=fitcecoc(X,Y,GYdF4y2Ba'坚持'GYdF4y2Ba,0.30,GYdF4y2Ba“学习者”GYdF4y2BaTGYdF4y2Ba“类名”GYdF4y2Ba, classOrder);Mdl = PMdl.Trained {1};GYdF4y2Ba%抽取训练的紧凑分类器GYdF4y2Ba

PMdlGYdF4y2Ba是A.GYdF4y2Ba分类分区GYdF4y2Ba模型。它具有GYdF4y2Ba训练有素GYdF4y2Ba,一个1 × 1单元数组,其中包含GYdF4y2BaCompactClassificationECOCGYdF4y2Ba软件使用训练集进行训练的模型。GYdF4y2Ba

预测样品标签。打印真实标签和预测标签的随机子集。GYdF4y2Ba

testInds=测试(PMdl.Partition);GYdF4y2Ba%提取测试指标GYdF4y2BaXTest = X (testInds:);欧美= Y (testInds:);标签=预测(Mdl XTest);idx = randsample (sum (testInds), 10);表(欧美(idx),标签(idx),GYdF4y2Ba...GYdF4y2Ba“VariableNames”GYdF4y2Ba,{GYdF4y2Ba“TrueLabels”GYdF4y2Ba,GYdF4y2Ba“PredictedLabels”GYdF4y2Ba})GYdF4y2Ba
ans=GYdF4y2Ba10×2表GYdF4y2Ba真实标签预测标签__________ _______________ setosa setosa versicolor vericolor vericolor setosa setosa setosa setosa setosaGYdF4y2Ba

MdlGYdF4y2Ba使用索引正确标记除一个试样观察值外的所有观察值GYdF4y2Baidx.GYdF4y2Ba.GYdF4y2Ba

载入费雪的虹膜数据集。指定预测器数据GYdF4y2BaXGYdF4y2Ba,响应数据GYdF4y2BaYGYdF4y2Ba,以及课程的顺序GYdF4y2BaYGYdF4y2Ba.GYdF4y2Ba

负载GYdF4y2Ba鱼腥草GYdF4y2BaX=meas;Y=categorical(物种);classOrder=unique(Y);GYdF4y2Ba%阶级秩序GYdF4y2Barng (1);GYdF4y2Ba%为了再现性GYdF4y2Ba

使用SVM二元分类器训练ECOC模型,并指定30%的保持样本。使用SVM模板标准化预测值,并指定类顺序。GYdF4y2Ba

t=模板SVM(GYdF4y2Ba“标准化”GYdF4y2Ba,对);PMdl=fitcecoc(X,Y,GYdF4y2Ba'坚持'GYdF4y2Ba,0.30,GYdF4y2Ba“学习者”GYdF4y2BaTGYdF4y2Ba“类名”GYdF4y2Ba, classOrder);Mdl = PMdl.Trained {1};GYdF4y2Ba%抽取训练的紧凑分类器GYdF4y2Ba

PMdlGYdF4y2Ba是A.GYdF4y2Ba分类分区GYdF4y2Ba模型。它具有GYdF4y2Ba训练有素GYdF4y2Ba,一个1 × 1单元数组,其中包含GYdF4y2BaCompactClassificationECOCGYdF4y2Ba软件使用训练集进行训练的模型。GYdF4y2Ba

支持向量机的分数被标记为从观测到决策边界的距离。因此,GYdF4y2Ba (GYdF4y2Ba -GYdF4y2Ba ∞GYdF4y2Ba ,GYdF4y2Ba ∞GYdF4y2Ba )GYdF4y2Ba 域。创建一个自定义二进制损耗函数,执行以下操作:GYdF4y2Ba

  • 映射编码设计矩阵(GYdF4y2BaMGYdF4y2Ba)和正向分类得分(GYdF4y2BasGYdF4y2Ba)对于每个学习者对每个观察的二进制损失。GYdF4y2Ba

  • 使用线性的损失。GYdF4y2Ba

  • 使用中位数汇总二元学习者损失。GYdF4y2Ba

您可以为二进制丢失功能创建一个单独的函数,然后将其保存在Matlab®路径上。或者,您可以指定匿名二进制丢失功能。在这种情况下,创建功能句柄(GYdF4y2BaCustomBl.GYdF4y2Ba)一个匿名二进制丢失函数。GYdF4y2Ba

CustomBl = @(m,s)纳米媒体(1  -  bsxfun(@ times,m,s),2)/ 2;GYdF4y2Ba

预测测试样本标签并估计每个类的中位数二进制损失。为随机的10个测试样本观察结果打印每个类的负二进制损失的中位数。GYdF4y2Ba

testInds=测试(PMdl.Partition);GYdF4y2Ba%提取测试指标GYdF4y2BaXTest = X (testInds:);欧美= Y (testInds:);[标签,NegLoss] =预测(Mdl XTest,GYdF4y2Ba'二元乐'GYdF4y2Ba,海关;idx=随机样本(总和(测试数),10);类顺序GYdF4y2Ba
classOrder =GYdF4y2Ba3x1分类GYdF4y2Basetosa杂色的virginicaGYdF4y2Ba
表(欧美(idx),标签(idx) NegLoss (idx:)GYdF4y2Ba“VariableNames”GYdF4y2Ba,GYdF4y2Ba...GYdF4y2Ba{GYdF4y2Ba“TrueLabel”GYdF4y2Ba,GYdF4y2Ba“PredictedLabel”GYdF4y2Ba,GYdF4y2Ba“负损失”GYdF4y2Ba})GYdF4y2Ba
ans=GYdF4y2Ba10×3表GYdF4y2BaTrueLabel PredictedLabel NegLoss ________________________ __________________________________ setosa versicolor 0.18578 1.9878 -3.6736 versicolor virginica -1.3316 -0.12355 -0.044843 setosa versicolor 0.13896 1.926 -3.565 virginica -1.5132 -0.38271 0.39588 versicolor versicolor 0.87218 0.74736 -1.3752 setosa versicolor 0.48406 1.9977维珍-1.5788 -0.83318 0.91194 setosa versicolor 0.51021 2.1212 -4.1314 setosa versicolor 0.36128 2.0596 -3.9209GYdF4y2Ba

列的顺序对应于元素GYdF4y2BaclassOrderGYdF4y2Ba. 软件根据最大否定损失预测标签。结果表明,线性损失的中位数可能不如其他损失。GYdF4y2Ba

使用SVM二元学习器训练ECOC分类器。首先预测训练样本标签和类后验概率。然后预测网格中每个点的最大类后验概率。将结果可视化。GYdF4y2Ba

加载Fisher的虹膜数据集。指定花瓣尺寸作为预测值,指定物种名称作为响应。GYdF4y2Ba

负载GYdF4y2Ba鱼腥草GYdF4y2BaX=MEA(:,3:4);Y=物种;rng(1);GYdF4y2Ba%为了再现性GYdF4y2Ba

创建一个SVM模板。标准化预测值,并指定高斯核。GYdF4y2Ba

t=模板SVM(GYdF4y2Ba“标准化”GYdF4y2Ba,真的,GYdF4y2Ba“KernelFunction”GYdF4y2Ba,GYdF4y2Ba“高斯”GYdF4y2Ba);GYdF4y2Ba

TGYdF4y2Ba是一个SVM模板。它的大多数属性都是空的。当软件训练ECOC分类器时,它会将适用的属性设置为默认值。GYdF4y2Ba

使用SVM模板训练ECOC分类器。将分类分数转换为类后验概率(由GYdF4y2Ba预测GYdF4y2Ba或GYdF4y2Ba再预测GYdF4y2Ba)使用GYdF4y2Ba“菲特莱斯特”GYdF4y2Ba名称-值对参数。使用该规定类订单GYdF4y2Ba“类名”GYdF4y2Ba名称-值对参数。通过使用培训期间显示诊断消息GYdF4y2Ba'verbose'GYdF4y2Ba名称-值对参数。GYdF4y2Ba

Mdl = fitcecoc (X, Y,GYdF4y2Ba“学习者”GYdF4y2BaTGYdF4y2Ba“菲特莱斯特”GYdF4y2Ba,真的,GYdF4y2Ba...GYdF4y2Ba“类名”GYdF4y2Ba,{GYdF4y2Ba“塞托萨”GYdF4y2Ba,GYdF4y2Ba“多色的”GYdF4y2Ba,GYdF4y2Ba“维吉尼亚”GYdF4y2Ba},GYdF4y2Ba...GYdF4y2Ba'verbose'GYdF4y2Ba,2);GYdF4y2Ba
训练二元学习者1(SVM),从3个二元学习者中选出50个消极观察值和50个积极观察值。负类指数:2个正类指数:1个拟合学习者1的后验概率(SVM)。训练二元学习者2(SVM),其中3个有50个负面观察和50个正面观察。负类指数:3个正类指数:1为学习者2拟合后验概率(SVM)。训练二元学习者3(SVM),共有50个负面观察值和50个正面观察值。负类指数:3个正类指数:2个拟合学习者3的后验概率(SVM)。GYdF4y2Ba

MdlGYdF4y2Ba是A.GYdF4y2BaClassificationECOCGYdF4y2Ba模型相同的SVM模板适用于每个二进制学习器,但您可以通过传入模板的单元向量来调整每个二进制学习器的选项。GYdF4y2Ba

预测训练样本标签和类后验概率。在计算标签和类别后验概率期间,使用GYdF4y2Ba'verbose'GYdF4y2Ba名称-值对参数。GYdF4y2Ba

[标签,~,~,后]= resubPredict (Mdl,GYdF4y2Ba'verbose'GYdF4y2Ba1);GYdF4y2Ba
对所有学习者的预测都进行了计算。计算了所有观测的损失。计算后验概率…GYdF4y2Ba
Mdl。B我naryLoss
ans =“二次”GYdF4y2Ba

该软件将观察结果分配给产生最小平均二进制损失的班级。由于所有二进制学习器都在计算后验概率,因此二进制损失函数为GYdF4y2Ba二次的GYdF4y2Ba.GYdF4y2Ba

显示一组随机的结果。GYdF4y2Ba

idx = randsample(size(x,1),10,1);mdl.classnames.GYdF4y2Ba
ans=GYdF4y2Ba3 x1细胞GYdF4y2Ba{'setosa'} {'versicolor'} {'virginica'}GYdF4y2Ba
表(Y(idx),标签(idx),后部(idx,:),GYdF4y2Ba...GYdF4y2Ba“VariableNames”GYdF4y2Ba,{GYdF4y2Ba“TrueLabel”GYdF4y2Ba,GYdF4y2Ba“PredLabel”GYdF4y2Ba,GYdF4y2Ba“后部”GYdF4y2Ba})GYdF4y2Ba
ans=GYdF4y2Ba10×3表GYdF4y2Ba“UUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUU017065 0.018261 0.96467{'virginica'}{'virginica'}0.014946 0.015854 0.9692{'versicolor'}{'versicolor'}{'versicolor'}2.2197e-14 0.87318 0.12682{'setosa'}0.999 0.00025091 0.0007464{'versicolor'}{'virginica'}2.2195e-14 0.059423 0.94058{'versicolor'}{'versicolor'}2.2194e-14 0.97002 0.029983{'setosa'}{'setosa'}0.999 0.00024989 0.00074741{'versicolor'}{'versicolor'}0.0085637 0.98259 0.0088481{'setosa'{'setosa'}0.000710GYdF4y2Ba

的列GYdF4y2Ba后GYdF4y2Ba对应于的类序GYdF4y2Bamdl.classnames.GYdF4y2Ba.GYdF4y2Ba

在观测的预测器空间中定义一个网格值。预测网格中每个实例的后验概率。GYdF4y2Ba

xMax = max (X);xMin = min (X);x1Pts = linspace (xMin (1) xMax (1));xMax x2Pts = linspace (xMin (2), (2));[x1Grid, x2Grid] = meshgrid (x1Pts x2Pts);[~, ~, ~, PosteriorRegion] =预测(Mdl, [x1Grid (:), x2Grid (:)));GYdF4y2Ba

对于网格上的每个坐标,绘制所有类别中的最大类别后验概率。GYdF4y2Ba

contourf (x1Grid x2Grid,GYdF4y2Ba...GYdF4y2Ba重塑(Max(Postiorregion,[],2),尺寸(x1grid,1),尺寸(x1grid,2)));h =彩色杆;h.ylabel.string =.GYdF4y2Ba最大后验的GYdF4y2Ba; h、 YLabel.FontSize=15;持有GYdF4y2Ba在GYdF4y2Bagh=gscatter(X(:,1),X(:,2),Y,GYdF4y2Ba“krk”GYdF4y2Ba,GYdF4y2Ba“*xd”GYdF4y2Ba8);gh(2)。L我neWidth = 2; gh(3).LineWidth = 2; title(“虹膜瓣测量和最大后角”GYdF4y2Ba)包含(GYdF4y2Ba“花瓣长度(厘米)”GYdF4y2Ba) ylabel (GYdF4y2Ba“花瓣宽度(cm)”GYdF4y2Ba)轴GYdF4y2Ba牢固的GYdF4y2Ba传奇(gh,GYdF4y2Ba“位置”GYdF4y2Ba,GYdF4y2Ba“西北”GYdF4y2Ba)举行GYdF4y2Ba从GYdF4y2Ba

训练一个多类ECOC模型,并使用并行计算估计后验概率。GYdF4y2Ba

加载GYdF4y2Ba心律失常GYdF4y2Ba数据集。检查响应数据GYdF4y2BaYGYdF4y2Ba,并确定类的数量。GYdF4y2Ba

负载GYdF4y2Ba心律失常GYdF4y2BaY =分类(Y);汇总(Y)GYdF4y2Ba
价值计数百分比124554.20%2449.73%3153.32%4153.32%5132.88%6255.53%730.66%820.44%991.99%1050111.06%1440.88%1551.11%16224.87%GYdF4y2Ba
K =元素个数(独特(Y));GYdF4y2Ba

在数据中没有表示几个类,并且许多其他类具有低相对频率。GYdF4y2Ba

指定使用VeandBoost方法和50个弱分类树学习者的集合学习模板。GYdF4y2Ba

t=模板集成(GYdF4y2Ba“绅士之声”GYdF4y2Ba, 50岁,GYdF4y2Ba'树'GYdF4y2Ba);GYdF4y2Ba

TGYdF4y2Ba是模板对象。它的大部分属性是空的(GYdF4y2Ba[]GYdF4y2Ba)。软件在培训期间对所有空属性使用默认值。GYdF4y2Ba

因为响应变量包含许多类,所以指定稀疏的随机编码设计。GYdF4y2Ba

rng (1);GYdF4y2Ba%为了再现性GYdF4y2Ba编码= designecoc (K,GYdF4y2Ba“斯巴瑟兰多姆”GYdF4y2Ba);GYdF4y2Ba

使用并行计算训练ECOC模型。指定15%的坚持样本,并拟合后验概率。GYdF4y2Ba

pool=parpool;GYdF4y2Ba%调用工人GYdF4y2Ba
使用“local”配置文件启动并行池(parpool)…连接到并行池(工作人员数量:6)。GYdF4y2Ba
选项=statset(GYdF4y2Ba“UseParallel”GYdF4y2Ba,对);PMdl=fitcecoc(X,Y,GYdF4y2Ba“学习者”GYdF4y2BaTGYdF4y2Ba'选项'GYdF4y2Ba,选项,GYdF4y2Ba“编码”GYdF4y2Ba、编码、GYdF4y2Ba...GYdF4y2Ba“菲特莱斯特”GYdF4y2Ba,真的,GYdF4y2Ba'坚持'GYdF4y2Ba,0.15);Mdl = PMdl.Trained {1};GYdF4y2Ba%抽取训练的紧凑分类器GYdF4y2Ba

PMdlGYdF4y2Ba是A.GYdF4y2Ba分类分区GYdF4y2Ba模型。它具有GYdF4y2Ba训练有素GYdF4y2Ba,一个1 × 1单元数组,其中包含GYdF4y2BaCompactClassificationECOCGYdF4y2Ba软件使用训练集进行训练的模型。GYdF4y2Ba

该池调用六个工作线程,尽管工作线程的数量可能因系统而异。GYdF4y2Ba

估计后验概率,并显示被归类为不具有心律失常(1)的后验概率(给定随机测试样本观察的数据)。GYdF4y2Ba

testInds=测试(PMdl.Partition);GYdF4y2Ba%提取测试指标GYdF4y2BaXTest = X (testInds:);欧美= Y (testInds:);[~, ~, ~,后]=预测(Mdl XTest,GYdF4y2Ba'选项'GYdF4y2Ba、选择);idx = randsample (sum (testInds), 10);表(idx,欧美(idx)、后(idx, 1),GYdF4y2Ba...GYdF4y2Ba“VariableNames”GYdF4y2Ba,{GYdF4y2Ba“TestSampleIndex”GYdF4y2Ba,GYdF4y2Ba“TrueLabel”GYdF4y2Ba,GYdF4y2Ba“后心律失常”GYdF4y2Ba})GYdF4y2Ba
ans=GYdF4y2Ba10×3表GYdF4y2BaTestSampleIndex TrueLabel posteriorno心律失常_______________ _________ _____________________ 11 6 0.60631 41 4 0.23674 512 0.13802 33 10 0.43831 12 1 0.94332 8 1 0.97278 37 1 0.62807 24 10 0.96876 56 16 0.29375 30 1 0.64512GYdF4y2Ba

输入参数GYdF4y2Ba

全部折叠GYdF4y2Ba

全或紧凑的多级ECOC模型,指定为GYdF4y2BaClassificationECOCGYdF4y2Ba或GYdF4y2BaCompactClassificationECOCGYdF4y2Ba模型对象。GYdF4y2Ba

创建完整或紧凑的Ecoc模型,请参阅GYdF4y2BaClassificationECOCGYdF4y2Ba或GYdF4y2BaCompactClassificationECOCGYdF4y2Ba.GYdF4y2Ba

要分类的预测数据,指定为数字矩阵或表格。GYdF4y2Ba

每一行的GYdF4y2BaXGYdF4y2Ba对应一个观察值,每列对应一个变量。GYdF4y2Ba

  • 对于数值矩阵:GYdF4y2Ba

    • 构成列的变量GYdF4y2BaXGYdF4y2Ba必须与训练的预测变量具有相同的顺序GYdF4y2BaMdlGYdF4y2Ba.GYdF4y2Ba

    • 如果你训练GYdF4y2BaMdlGYdF4y2Ba使用表格(例如,GYdF4y2BaTblGYdF4y2Ba)那么GYdF4y2BaXGYdF4y2Ba可以是数字矩阵,如果GYdF4y2BaTblGYdF4y2Ba包含所有数值预测变量。处理数值预测GYdF4y2BaTblGYdF4y2Ba作为培训期间的分类预测,使用GYdF4y2Ba分类预测因子GYdF4y2Ba的名称-值对参数GYdF4y2BafitcecocGYdF4y2Ba.如果GYdF4y2BaTblGYdF4y2Ba包含异构预测变量(例如,数字和分类数据类型)和GYdF4y2BaXGYdF4y2Ba是一个数字矩阵,然后GYdF4y2Ba预测GYdF4y2Ba抛出一个错误。GYdF4y2Ba

  • 对于表格:GYdF4y2Ba

    • 预测GYdF4y2Ba不支持多列变量和字万博1manbetx符向量的单元格数组以外的单元格数组。GYdF4y2Ba

    • 如果你训练GYdF4y2BaMdlGYdF4y2Ba使用表格(例如,GYdF4y2BaTblGYdF4y2Ba),然后在GYdF4y2BaXGYdF4y2Ba必须具有与训练的预测变量相同的变量名和数据类型GYdF4y2BaMdlGYdF4y2Ba(储存于GYdF4y2BaMdl。PredictorNamesGYdF4y2Ba)。但是GYdF4y2BaXGYdF4y2Ba不需要对应于的列顺序GYdF4y2BaTblGYdF4y2Ba.这两个GYdF4y2BaTblGYdF4y2Ba和GYdF4y2BaXGYdF4y2Ba可以包含其他变量(响应变量,观察权重等),但是GYdF4y2Ba预测GYdF4y2Ba忽略了它们。GYdF4y2Ba

    • 如果你训练GYdF4y2BaMdlGYdF4y2Ba使用数字矩阵,然后将预测值命名为GYdF4y2BaMdl。PredictorNamesGYdF4y2Ba和相应的预测变量名GYdF4y2BaXGYdF4y2Ba肯定是一样的。要在训练期间指定预测器名称,请参见GYdF4y2BaPredictorNamesGYdF4y2Ba的名称-值对参数GYdF4y2BafitcecocGYdF4y2Ba.所有的预测变量GYdF4y2BaXGYdF4y2Ba必须是数值向量。GYdF4y2BaXGYdF4y2Ba可以包含其他变量(响应变量,观察权重等),但是GYdF4y2Ba预测GYdF4y2Ba忽略了它们。GYdF4y2Ba

请注意GYdF4y2Ba

如果GYdF4y2BaMdl。B我naryLearners包含线性或内核分类模型(GYdF4y2BaClassificationLinearGYdF4y2Ba或GYdF4y2BaClassificationKernel.GYdF4y2Ba模型对象),则不能在表中指定样本数据。而是传递预测数据矩阵。GYdF4y2Ba

训练时GYdF4y2BaMdlGYdF4y2Ba,假设您设置了GYdF4y2Ba“标准化”,真的GYdF4y2Ba对于在中指定的模板对象GYdF4y2Ba“学习者”GYdF4y2Ba的名称-值对参数GYdF4y2BafitcecocGYdF4y2Ba. 在这种情况下,对于相应的二进制学习器GYdF4y2BaJGYdF4y2Ba,软件使用中的相应方法对新预测数据列进行标准化GYdF4y2BaMdl.BinaryLearner{j}.MuGYdF4y2Ba的标准差GYdF4y2BaMdl.BinaryLearner {j} .SigmaGYdF4y2Ba.GYdF4y2Ba

数据类型:GYdF4y2Ba表格GYdF4y2Ba|GYdF4y2Ba双重的GYdF4y2Ba|GYdF4y2Ba单身的GYdF4y2Ba

名称-值对参数GYdF4y2Ba

指定可选的逗号分隔的字符对GYdF4y2Ba名称、值GYdF4y2Ba论点。GYdF4y2Ba姓名GYdF4y2Ba参数名和GYdF4y2Ba价值GYdF4y2Ba为对应值。GYdF4y2Ba姓名GYdF4y2Ba必须出现在引号内。可以以任意顺序指定多个名称和值对参数GYdF4y2Ba名称1,值1,…,名称,值GYdF4y2Ba.GYdF4y2Ba

例子:GYdF4y2Ba预测(Mdl,X,'BinaryLoss','quadratic','Decoding','lossbase')GYdF4y2Ba指定二次二进制学习器损失函数和用于聚合二进制损失的基于损失的解码方案。GYdF4y2Ba

二进制学习者丢失功能,指定为逗号分隔对组成GYdF4y2Ba'二元乐'GYdF4y2Ba和内置丢失函数名称或功能句柄。GYdF4y2Ba

  • 此表介绍了内置函数,其中GYdF4y2BaYGYdF4y2BaJGYdF4y2Ba是一个特定二元学习者的类标签(在集合{- 1,1,0}中),GYdF4y2BasGYdF4y2BaJGYdF4y2Ba是观察的分数GYdF4y2BaJGYdF4y2Ba,GYdF4y2BaGGYdF4y2Ba(GYdF4y2BaYGYdF4y2BaJGYdF4y2Ba,GYdF4y2BasGYdF4y2BaJGYdF4y2Ba)是二进制损失公式。GYdF4y2Ba

    价值GYdF4y2Ba 描述GYdF4y2Ba 分数域GYdF4y2Ba GGYdF4y2Ba(GYdF4y2BaYGYdF4y2BaJGYdF4y2Ba,GYdF4y2BasGYdF4y2BaJGYdF4y2Ba)GYdF4y2Ba
    “偏差”GYdF4y2Ba 二项异常GYdF4y2Ba (–∞,∞)GYdF4y2Ba 日志(1 + exp (2GYdF4y2BaYGYdF4y2BaJGYdF4y2BasGYdF4y2BaJGYdF4y2Ba日志(2)])]/ [2GYdF4y2Ba
    “指数”GYdF4y2Ba 指数型GYdF4y2Ba (–∞,∞)GYdF4y2Ba exp (-GYdF4y2BaYGYdF4y2BaJGYdF4y2BasGYdF4y2BaJGYdF4y2Ba)/2GYdF4y2Ba
    “汉明”GYdF4y2Ba 哈明GYdF4y2Ba [0, 1]或(-∞,∞)GYdF4y2Ba [1–签名(GYdF4y2BaYGYdF4y2BaJGYdF4y2BasGYdF4y2BaJGYdF4y2Ba) / 2GYdF4y2Ba
    “枢纽”GYdF4y2Ba 铰链GYdF4y2Ba (–∞,∞)GYdF4y2Ba 最大值(0,1-GYdF4y2BaYGYdF4y2BaJGYdF4y2BasGYdF4y2BaJGYdF4y2Ba)/2GYdF4y2Ba
    “线性”GYdF4y2Ba 线性GYdF4y2Ba (–∞,∞)GYdF4y2Ba (1 -GYdF4y2BaYGYdF4y2BaJGYdF4y2BasGYdF4y2BaJGYdF4y2Ba)/2GYdF4y2Ba
    “罗吉特”GYdF4y2Ba 物流的GYdF4y2Ba (–∞,∞)GYdF4y2Ba 日志[1 + exp (-GYdF4y2BaYGYdF4y2BaJGYdF4y2BasGYdF4y2BaJGYdF4y2Ba日志(2)])]/ [2GYdF4y2Ba
    “二次”GYdF4y2Ba 二次GYdF4y2Ba [0, 1]GYdF4y2Ba (1 -GYdF4y2BaYGYdF4y2BaJGYdF4y2Ba(2GYdF4y2BasGYdF4y2BaJGYdF4y2Ba– 1)]GYdF4y2Ba2.GYdF4y2Ba/2GYdF4y2Ba

    该软件使二进制损失正常化,因此损失是0.5时GYdF4y2BaYGYdF4y2BaJGYdF4y2Ba= 0. 此外,软件还计算每个类别的平均二进制损失。GYdF4y2Ba

  • 例如,对于自定义二进制损耗函数GYdF4y2Ba自定义函数GYdF4y2Ba,指定其函数句柄GYdF4y2Ba'binaryloss',@ customfunctionGYdF4y2Ba.GYdF4y2Ba

    自定义函数GYdF4y2Ba这种形式:GYdF4y2Ba

    bLoss=自定义函数(M,s)GYdF4y2Ba
    哪里:GYdF4y2Ba

    • MGYdF4y2Ba是GYdF4y2BaKGYdF4y2Ba-借-GYdF4y2BaLGYdF4y2Ba编码矩阵存储在GYdF4y2Ba编码矩阵GYdF4y2Ba.GYdF4y2Ba

    • sGYdF4y2Ba是1 -GYdF4y2BaLGYdF4y2Ba分类得分的行向量。GYdF4y2Ba

    • blGYdF4y2Ba是分类损失。这个标量集合了特定班级中每个学习者的二进制损失。例如,您可以使用平均二进制损失来汇总每个类的学习者的损失。GYdF4y2Ba

    • KGYdF4y2Ba为类数。GYdF4y2Ba

    • LGYdF4y2Ba是二元学习者的数量。GYdF4y2Ba

    有关传递自定义二进制丢失功能的示例,请参阅GYdF4y2Ba用自定义二元损耗函数预测ECOC模型的试样标签GYdF4y2Ba.GYdF4y2Ba

默认的GYdF4y2Ba双星GYdF4y2Ba值取决于二进制学习者返回的分数范围。此表描述了一些默认设置GYdF4y2Ba双星GYdF4y2Ba基于给定假设的值。GYdF4y2Ba

假定GYdF4y2Ba 默认值GYdF4y2Ba
所有二元学习器都是支持向量机或支持向量机学习器的线性或核分类模型。GYdF4y2Ba “枢纽”GYdF4y2Ba
所有的二元学习者都是由GYdF4y2BaAdaboostM1GYdF4y2Ba或GYdF4y2Ba温柔的GYdF4y2Ba.GYdF4y2Ba “指数”GYdF4y2Ba
所有的二元学习者都是由GYdF4y2Ba后勤推进GYdF4y2Ba.GYdF4y2Ba “偏差”GYdF4y2Ba
所有二元学习者都是logistic回归学习者的线性或核分类模型。或者,你指定通过设置来预测类的后验概率GYdF4y2Ba“是的,没错GYdF4y2Ba在GYdF4y2BafitcecocGYdF4y2Ba.GYdF4y2Ba “二次”GYdF4y2Ba

若要检查默认值,请使用点符号来显示GYdF4y2Ba双星GYdF4y2Ba命令行中训练模型的属性。GYdF4y2Ba

例子:GYdF4y2Ba“二进制丢失”,“二进制偏差”GYdF4y2Ba

数据类型:GYdF4y2Ba烧焦GYdF4y2Ba|GYdF4y2Ba字符串GYdF4y2Ba|GYdF4y2Ba功能手柄GYdF4y2Ba

聚合二进制损失的解码方案,指定为逗号分隔对,由GYdF4y2Ba“解码”GYdF4y2Ba和GYdF4y2Ba“lossweighted”GYdF4y2Ba或GYdF4y2Ba'失败'GYdF4y2Ba.有关更多信息,请参见GYdF4y2Ba二元损失GYdF4y2Ba.GYdF4y2Ba

例子:GYdF4y2Ba“解码”、“lossbased”GYdF4y2Ba

通过Kullback-Leibler散度最小化拟合后验概率的随机初值数,指定为逗号分隔对,由GYdF4y2Ba“NumKLInitializations”GYdF4y2Ba和一个非负整数标量。GYdF4y2Ba

如果您不请求第四个输出参数(GYdF4y2Ba后GYdF4y2Ba)和组GYdF4y2Ba“PosteriorMethod”、“kl的GYdF4y2Ba(默认值),则软件忽略GYdF4y2BaNumklinitationsGYdF4y2Ba.GYdF4y2Ba

有关详细信息,请参阅GYdF4y2Ba使用Kullback-Leibler Divergence的后验估计GYdF4y2Ba.GYdF4y2Ba

例子:GYdF4y2Ba“NumKLInitializations”,5GYdF4y2Ba

数据类型:GYdF4y2Ba单身的GYdF4y2Ba|GYdF4y2Ba双重的GYdF4y2Ba

预测器数据观测维数,由指定的逗号分隔对组成GYdF4y2Ba“观测信号”GYdF4y2Ba和GYdF4y2Ba“列”GYdF4y2Ba或GYdF4y2Ba“行”GYdF4y2Ba.GYdF4y2BaMdl。B我naryLearners必须包含GYdF4y2BaClassificationLinearGYdF4y2Ba模型。GYdF4y2Ba

请注意GYdF4y2Ba

如果调整预测矩阵的方向,使观测值与列相对应,并指定GYdF4y2Ba“ObservationsIn”,“columns”GYdF4y2Ba,可以显著减少执行时间。GYdF4y2Ba

估计选项,指定为逗号分隔的对,由GYdF4y2Ba'选项'GYdF4y2Ba和返回的结构数组GYdF4y2Ba斯塔塞特GYdF4y2Ba.GYdF4y2Ba

要调用并行计算:GYdF4y2Ba

  • 你需要一个并行计算工具箱™ 许可证GYdF4y2Ba

  • 指定GYdF4y2Ba“选项”,statset('UseParallel',true)GYdF4y2Ba.GYdF4y2Ba

后概率估计方法,指定为逗号分隔对组成GYdF4y2Ba“PosteriorMethod”GYdF4y2Ba和GYdF4y2Ba“吉隆坡”GYdF4y2Ba或GYdF4y2Ba“qp”GYdF4y2Ba.GYdF4y2Ba

  • 如果GYdF4y2Ba后验法GYdF4y2Ba是GYdF4y2Ba“吉隆坡”GYdF4y2Ba,然后通过最小化二进制学习者返回的预测后验概率和期望后验概率之间的Kullback-Leibler差异来估计多类后验概率。有关详细信息,请参见GYdF4y2Ba使用Kullback-Leibler Divergence的后验估计GYdF4y2Ba.GYdF4y2Ba

  • 如果GYdF4y2Ba后验法GYdF4y2Ba是GYdF4y2Ba“qp”GYdF4y2Ba,利用二次规划求解最小二乘问题,估计多类后验概率。您需要一个Optimization Toolbox™许可才能使用此选项。有关详细信息,请参见GYdF4y2Ba二次规划的后验估计GYdF4y2Ba.GYdF4y2Ba

  • 如果您不请求第四个输出参数(GYdF4y2Ba后GYdF4y2Ba),则该软件忽略的价值GYdF4y2Ba后验法GYdF4y2Ba.GYdF4y2Ba

例子:GYdF4y2Ba“后验法”,“qp”GYdF4y2Ba

详细级别,指定为逗号分隔对组成GYdF4y2Ba'verbose'GYdF4y2Ba和GYdF4y2Ba0GYdF4y2Ba或GYdF4y2Ba1.GYdF4y2Ba.GYdF4y2Ba冗长的GYdF4y2Ba控制软件在命令窗口中显示的诊断消息的数量。GYdF4y2Ba

如果GYdF4y2Ba冗长的GYdF4y2Ba是GYdF4y2Ba0GYdF4y2Ba,然后软件不显示诊断消息。否则,软件显示诊断消息。GYdF4y2Ba

例子:GYdF4y2Ba“详细”,1GYdF4y2Ba

数据类型:GYdF4y2Ba单身的GYdF4y2Ba|GYdF4y2Ba双重的GYdF4y2Ba

输出参数GYdF4y2Ba

全部折叠GYdF4y2Ba

预测类标签,作为分类,字符,逻辑或数字阵列,或字符向量的小区数组。该软件通过将观察分配给阶级的观察来预测观察的分类,产生最大的否定平均二进制损失(或等效,平均二进制损失最小)。GYdF4y2Ba

标签GYdF4y2Ba是否具有与用于培训的类标签相同的数据类型GYdF4y2BaMdlGYdF4y2Ba行数和GYdF4y2BaXGYdF4y2Ba.GYdF4y2Ba(软件将字符串数组视为字符向量的单元数组。)GYdF4y2Ba

如果GYdF4y2BaMdl。B我naryLearners包含GYdF4y2BaClassificationLinearGYdF4y2Ba那么,模型GYdF4y2Ba标签GYdF4y2Ba是一个GYdF4y2BaMGYdF4y2Ba-借-GYdF4y2BaLGYdF4y2Ba矩阵,GYdF4y2BaMGYdF4y2Ba观察的次数在吗GYdF4y2BaXGYdF4y2Ba,GYdF4y2BaLGYdF4y2Ba是线性分类模型中正则化强度的数量(GYdF4y2Banumel(Mdl.BinaryLearners{1}.Lambda)GYdF4y2Ba).价值GYdF4y2Ba标签(i,j)GYdF4y2Ba是预测的观察标签GYdF4y2Ba我GYdF4y2Ba用于正则化强度训练的模型GYdF4y2BaMdl.BinaryLearners {1} .Lambda (j)GYdF4y2Ba.GYdF4y2Ba

否则,GYdF4y2Ba标签GYdF4y2Ba列向量是长度的吗GYdF4y2BaMGYdF4y2Ba.GYdF4y2Ba

否定平均数GYdF4y2Ba二进制损失GYdF4y2Ba,以数字矩阵或数组的形式返回。GYdF4y2Ba

  • 如果GYdF4y2BaMdl。B我naryLearners包含GYdF4y2BaClassificationLinearGYdF4y2Ba那么,模型GYdF4y2BaNegLossGYdF4y2Ba是一个GYdF4y2BaMGYdF4y2Ba-借-GYdF4y2BaKGYdF4y2Ba-借-GYdF4y2BaLGYdF4y2Ba数组中。GYdF4y2Ba

    • MGYdF4y2Ba观察的次数在吗GYdF4y2BaXGYdF4y2Ba.GYdF4y2Ba

    • KGYdF4y2Ba是训练数据中不同类的数量(GYdF4y2Ba元素个数(Mdl.ClassNames)GYdF4y2Ba).GYdF4y2Ba

    • LGYdF4y2Ba是线性分类模型中正则化强度的数量(GYdF4y2Banumel(Mdl.BinaryLearners{1}.Lambda)GYdF4y2Ba).GYdF4y2Ba

    NegLoss (k, j)GYdF4y2Ba对观测来说,负的平均二进制损失是多少GYdF4y2Ba我GYdF4y2Ba,对应上课GYdF4y2Bamdl.classnames(k)GYdF4y2Ba,用于使用正则化强度训练的模型GYdF4y2BaMdl.BinaryLearners {1} .Lambda (j)GYdF4y2Ba.GYdF4y2Ba

  • 否则,GYdF4y2BaNegLossGYdF4y2Ba是一个GYdF4y2BaMGYdF4y2Ba-借-GYdF4y2BaKGYdF4y2Ba矩阵。GYdF4y2Ba

每个二进制学习者的正数类分数,以数字矩阵或数组的形式返回。GYdF4y2Ba

  • 如果GYdF4y2BaMdl。B我naryLearners包含GYdF4y2BaClassificationLinearGYdF4y2Ba那么,模型GYdF4y2BaPBSCore.GYdF4y2Ba是一个GYdF4y2BaMGYdF4y2Ba-借-GYdF4y2BaBGYdF4y2Ba-借-GYdF4y2BaLGYdF4y2Ba数组中。GYdF4y2Ba

    • MGYdF4y2Ba观察的次数在吗GYdF4y2BaXGYdF4y2Ba.GYdF4y2Ba

    • BGYdF4y2Ba为二元学习者的人数(GYdF4y2Banumel(Mdl.BinaryLearners)GYdF4y2Ba).GYdF4y2Ba

    • LGYdF4y2Ba是线性分类模型中正则化强度的数量(GYdF4y2Banumel(Mdl.BinaryLearners{1}.Lambda)GYdF4y2Ba).GYdF4y2Ba

    PBSCORE(I,B,J)GYdF4y2Ba阳性评分是否用于观察GYdF4y2Ba我GYdF4y2Ba,使用二进制学习者GYdF4y2BaBGYdF4y2Ba,用于使用正则化强度训练的模型GYdF4y2BaMdl.BinaryLearners {1} .Lambda (j)GYdF4y2Ba.GYdF4y2Ba

  • 否则,GYdF4y2BaPBSCore.GYdF4y2Ba是一个GYdF4y2BaMGYdF4y2Ba-借-GYdF4y2BaBGYdF4y2Ba矩阵。GYdF4y2Ba

后验类概率,作为数字矩阵或数组返回。GYdF4y2Ba

  • 如果GYdF4y2BaMdl。B我naryLearners包含GYdF4y2BaClassificationLinearGYdF4y2Ba那么,模型GYdF4y2Ba后GYdF4y2Ba是一个GYdF4y2BaMGYdF4y2Ba-借-GYdF4y2BaKGYdF4y2Ba-借-GYdF4y2BaLGYdF4y2Ba数组中。有关维度定义,请参见GYdF4y2BaNegLossGYdF4y2Ba.GYdF4y2Ba后(I,K,J)GYdF4y2Ba后验概率是观察值吗GYdF4y2Ba我GYdF4y2Ba来自课堂GYdF4y2Bamdl.classnames(k)GYdF4y2Ba,用于使用正则化强度训练的模型GYdF4y2BaMdl.BinaryLearners {1} .Lambda (j)GYdF4y2Ba.GYdF4y2Ba

  • 否则,GYdF4y2Ba后GYdF4y2Ba是一个GYdF4y2BaMGYdF4y2Ba-借-GYdF4y2BaKGYdF4y2Ba矩阵。GYdF4y2Ba

更多关于GYdF4y2Ba

全部折叠GYdF4y2Ba

二元损失GYdF4y2Ba

A.GYdF4y2Ba二元损失GYdF4y2Ba是班级和分类分数的函数,它决定了二元学习者将观察结果分类到班级中的程度。GYdF4y2Ba

假设如下:GYdF4y2Ba

  • MGYdF4y2BakjGYdF4y2Ba是元素(GYdF4y2BaKGYdF4y2Ba,GYdF4y2BaJGYdF4y2Ba)的编码设计矩阵GYdF4y2BaMGYdF4y2Ba(即与类对应的代码GYdF4y2BaKGYdF4y2Ba二进制学习者GYdF4y2BaJGYdF4y2Ba).GYdF4y2Ba

  • sGYdF4y2BaJGYdF4y2Ba二元学习者的分数是多少GYdF4y2BaJGYdF4y2Ba作为观察。GYdF4y2Ba

  • GGYdF4y2Ba为二进制损失函数。GYdF4y2Ba

  • KGYdF4y2Ba ^GYdF4y2Ba 是观测的预测类。GYdF4y2Ba

在里面GYdF4y2Ba基于损耗的译码GYdF4y2Ba(Escalera等。)GYdF4y2Ba,对二进制学习者产生最小二进制损失和的类决定了观测的预测类,即,GYdF4y2Ba

KGYdF4y2Ba ^GYdF4y2Ba =GYdF4y2Ba 阿明GYdF4y2Ba KGYdF4y2Ba ∑GYdF4y2Ba JGYdF4y2Ba =GYdF4y2Ba 1.GYdF4y2Ba LGYdF4y2Ba |GYdF4y2Ba MGYdF4y2Ba KGYdF4y2Ba JGYdF4y2Ba |GYdF4y2Ba GGYdF4y2Ba (GYdF4y2Ba MGYdF4y2Ba KGYdF4y2Ba JGYdF4y2Ba ,GYdF4y2Ba sGYdF4y2Ba JGYdF4y2Ba )GYdF4y2Ba .GYdF4y2Ba

在里面GYdF4y2Baloss-weighted解码GYdF4y2Ba(Escalera等。)GYdF4y2Ba,产生二元学习者二元损失最小平均值的类决定了观察的预测类,即,GYdF4y2Ba

KGYdF4y2Ba ^GYdF4y2Ba =GYdF4y2Ba 阿明GYdF4y2Ba KGYdF4y2Ba ∑GYdF4y2Ba JGYdF4y2Ba =GYdF4y2Ba 1.GYdF4y2Ba LGYdF4y2Ba |GYdF4y2Ba MGYdF4y2Ba KGYdF4y2Ba JGYdF4y2Ba |GYdF4y2Ba GGYdF4y2Ba (GYdF4y2Ba MGYdF4y2Ba KGYdF4y2Ba JGYdF4y2Ba ,GYdF4y2Ba sGYdF4y2Ba JGYdF4y2Ba )GYdF4y2Ba ∑GYdF4y2Ba JGYdF4y2Ba =GYdF4y2Ba 1.GYdF4y2Ba LGYdF4y2Ba |GYdF4y2Ba MGYdF4y2Ba KGYdF4y2Ba JGYdF4y2Ba |GYdF4y2Ba .GYdF4y2Ba

Allwein等人。GYdF4y2Ba建议丢失加权解码通过在相同动态范围内保持所有类的损耗值来提高分类准确性。GYdF4y2Ba

该表总结了支持的损耗函数,其中万博1manbetxGYdF4y2BaYGYdF4y2BaJGYdF4y2Ba是一个特定二元学习者的类标签(在集合{- 1,1,0}中),GYdF4y2BasGYdF4y2BaJGYdF4y2Ba是观察的分数GYdF4y2BaJGYdF4y2Ba,GYdF4y2BaGGYdF4y2Ba(GYdF4y2BaYGYdF4y2BaJGYdF4y2Ba,GYdF4y2BasGYdF4y2BaJGYdF4y2Ba).GYdF4y2Ba

价值GYdF4y2Ba 描述GYdF4y2Ba 分数域GYdF4y2Ba GGYdF4y2Ba(GYdF4y2BaYGYdF4y2BaJGYdF4y2Ba,GYdF4y2BasGYdF4y2BaJGYdF4y2Ba)GYdF4y2Ba
“偏差”GYdF4y2Ba 二项异常GYdF4y2Ba (–∞,∞)GYdF4y2Ba 日志(1 + exp (2GYdF4y2BaYGYdF4y2BaJGYdF4y2BasGYdF4y2BaJGYdF4y2Ba日志(2)])]/ [2GYdF4y2Ba
“指数”GYdF4y2Ba 指数型GYdF4y2Ba (–∞,∞)GYdF4y2Ba exp (-GYdF4y2BaYGYdF4y2BaJGYdF4y2BasGYdF4y2BaJGYdF4y2Ba)/2GYdF4y2Ba
“汉明”GYdF4y2Ba 哈明GYdF4y2Ba [0, 1]或(-∞,∞)GYdF4y2Ba [1–签名(GYdF4y2BaYGYdF4y2BaJGYdF4y2BasGYdF4y2BaJGYdF4y2Ba) / 2GYdF4y2Ba
“枢纽”GYdF4y2Ba 铰链GYdF4y2Ba (–∞,∞)GYdF4y2Ba 最大值(0,1-GYdF4y2BaYGYdF4y2BaJGYdF4y2BasGYdF4y2BaJGYdF4y2Ba)/2GYdF4y2Ba
“线性”GYdF4y2Ba 线性GYdF4y2Ba (–∞,∞)GYdF4y2Ba (1 -GYdF4y2BaYGYdF4y2BaJGYdF4y2BasGYdF4y2BaJGYdF4y2Ba)/2GYdF4y2Ba
“罗吉特”GYdF4y2Ba 物流的GYdF4y2Ba (–∞,∞)GYdF4y2Ba 日志[1 + exp (-GYdF4y2BaYGYdF4y2BaJGYdF4y2BasGYdF4y2BaJGYdF4y2Ba日志(2)])]/ [2GYdF4y2Ba
“二次”GYdF4y2Ba 二次GYdF4y2Ba [0, 1]GYdF4y2Ba (1 -GYdF4y2BaYGYdF4y2BaJGYdF4y2Ba(2GYdF4y2BasGYdF4y2BaJGYdF4y2Ba– 1)]GYdF4y2Ba2.GYdF4y2Ba/2GYdF4y2Ba

该软件使二进制损失正常化,当损失是0.5GYdF4y2BaYGYdF4y2BaJGYdF4y2Ba= 0,并使用二进制学习者的平均值进行聚合GYdF4y2Ba[Allwein等]GYdF4y2Ba.GYdF4y2Ba

不要将二进制损失与总分类损失混淆(由GYdF4y2Ba'lockfun'GYdF4y2Ba名称 - 值对参数GYdF4y2Ba损失GYdF4y2Ba和GYdF4y2Ba预测GYdF4y2Ba对象函数),它衡量ECOC分类器作为一个整体的性能。GYdF4y2Ba

算法GYdF4y2Ba

全部折叠GYdF4y2Ba

该软件可以通过最小化Kullback-Leibler发散或使用二次规划来估计类后验概率。对于后验估计算法的如下描述,假设:GYdF4y2Ba

  • MGYdF4y2BakjGYdF4y2Ba是元素(GYdF4y2BaKGYdF4y2Ba,GYdF4y2BaJGYdF4y2Ba)的编码设计矩阵GYdF4y2BaMGYdF4y2Ba.GYdF4y2Ba

  • 我GYdF4y2Ba为指标函数。GYdF4y2Ba

  • PGYdF4y2Ba ^GYdF4y2Ba KGYdF4y2Ba 类的后验概率是类的估计吗GYdF4y2BaKGYdF4y2Ba一项观察,GYdF4y2BaKGYdF4y2Ba= 1,......,GYdF4y2BaKGYdF4y2Ba.GYdF4y2Ba

  • RGYdF4y2BaJGYdF4y2Ba二进制学习者的正类后验概率是多少GYdF4y2BaJGYdF4y2Ba. 就是,GYdF4y2BaRGYdF4y2BaJGYdF4y2Ba二进制学习者的概率是多少GYdF4y2BaJGYdF4y2Ba给定训练数据,将观察结果分类为正向类。GYdF4y2Ba

使用Kullback-Leibler Divergence的后验估计GYdF4y2Ba

默认情况下,软件最小化Kullback-Leibler散度以估计类后验概率。预期和观察到的正类后验概率之间的Kullback-Leibler散度为GYdF4y2Ba

ΔGYdF4y2Ba (GYdF4y2Ba RGYdF4y2Ba ,GYdF4y2Ba RGYdF4y2Ba ^GYdF4y2Ba )GYdF4y2Ba =GYdF4y2Ba ∑GYdF4y2Ba JGYdF4y2Ba =GYdF4y2Ba 1.GYdF4y2Ba LGYdF4y2Ba WGYdF4y2Ba JGYdF4y2Ba [GYdF4y2Ba RGYdF4y2Ba JGYdF4y2Ba 日志GYdF4y2Ba RGYdF4y2Ba JGYdF4y2Ba RGYdF4y2Ba ^GYdF4y2Ba JGYdF4y2Ba +GYdF4y2Ba (GYdF4y2Ba 1.GYdF4y2Ba −GYdF4y2Ba RGYdF4y2Ba JGYdF4y2Ba )GYdF4y2Ba 日志GYdF4y2Ba 1.GYdF4y2Ba −GYdF4y2Ba RGYdF4y2Ba JGYdF4y2Ba 1.GYdF4y2Ba −GYdF4y2Ba RGYdF4y2Ba ^GYdF4y2Ba JGYdF4y2Ba ]GYdF4y2Ba ,GYdF4y2Ba

在哪里GYdF4y2Ba WGYdF4y2Ba JGYdF4y2Ba =GYdF4y2Ba ∑GYdF4y2Ba sGYdF4y2Ba JGYdF4y2Ba WGYdF4y2Ba 我GYdF4y2Ba ∗GYdF4y2Ba 是二进制学习者的权重GYdF4y2BaJGYdF4y2Ba.GYdF4y2Ba

  • sGYdF4y2BaJGYdF4y2Ba这组观察指标是针对哪个二元学习者的GYdF4y2BaJGYdF4y2Ba是训练有素的。GYdF4y2Ba

  • WGYdF4y2Ba 我GYdF4y2Ba ∗GYdF4y2Ba 观察的重量是多少GYdF4y2Ba我GYdF4y2Ba.GYdF4y2Ba

该软件迭代最大限度地降低分歧。第一步是选择初始值GYdF4y2Ba PGYdF4y2Ba ^GYdF4y2Ba KGYdF4y2Ba (GYdF4y2Ba 0GYdF4y2Ba )GYdF4y2Ba ;GYdF4y2Ba KGYdF4y2Ba =GYdF4y2Ba 1.GYdF4y2Ba ,GYdF4y2Ba ...GYdF4y2Ba ,GYdF4y2Ba KGYdF4y2Ba 对于课程的后验概率。GYdF4y2Ba

  • 如果您没有指定GYdF4y2Ba'numklitions'GYdF4y2Ba,然后软件尝试下面描述的两组确定性初值,并选择使Δ最小化的集合。GYdF4y2Ba

    • PGYdF4y2Ba ^GYdF4y2Ba KGYdF4y2Ba (GYdF4y2Ba 0GYdF4y2Ba )GYdF4y2Ba =GYdF4y2Ba 1.GYdF4y2Ba /GYdF4y2Ba KGYdF4y2Ba ;GYdF4y2Ba KGYdF4y2Ba =GYdF4y2Ba 1.GYdF4y2Ba ,GYdF4y2Ba ...GYdF4y2Ba ,GYdF4y2Ba KGYdF4y2Ba .GYdF4y2Ba

    • PGYdF4y2Ba ^GYdF4y2Ba KGYdF4y2Ba (GYdF4y2Ba 0GYdF4y2Ba )GYdF4y2Ba ;GYdF4y2Ba KGYdF4y2Ba =GYdF4y2Ba 1.GYdF4y2Ba ,GYdF4y2Ba ...GYdF4y2Ba ,GYdF4y2Ba KGYdF4y2Ba 这是系统的解决方案GYdF4y2Ba

      MGYdF4y2Ba 01GYdF4y2Ba PGYdF4y2Ba ^GYdF4y2Ba (GYdF4y2Ba 0GYdF4y2Ba )GYdF4y2Ba =GYdF4y2Ba RGYdF4y2Ba ,GYdF4y2Ba

      在哪里GYdF4y2BaMGYdF4y2Ba01GYdF4y2Ba是GYdF4y2BaMGYdF4y2Ba与所有GYdF4y2BaMGYdF4y2BakjGYdF4y2Ba= -1替换为0GYdF4y2BaRGYdF4y2Ba是返回的正类后验概率的向量GYdF4y2BaLGYdF4y2Ba二进制学习者GYdF4y2Ba[Dieterich等人。]GYdF4y2Ba.软件使用GYdF4y2BalsqnonnegGYdF4y2Ba解这个方程组。GYdF4y2Ba

  • 如果您指定GYdF4y2Ba“NumKLIterations”,cGYdF4y2Ba哪里GYdF4y2BaCGYdF4y2Ba是自然数,那么软件做下面的选择集呢GYdF4y2Ba PGYdF4y2Ba ^GYdF4y2Ba KGYdF4y2Ba (GYdF4y2Ba 0GYdF4y2Ba )GYdF4y2Ba ;GYdF4y2Ba KGYdF4y2Ba =GYdF4y2Ba 1.GYdF4y2Ba ,GYdF4y2Ba ...GYdF4y2Ba ,GYdF4y2Ba KGYdF4y2Ba ,并选择使Δ最小化的集合。GYdF4y2Ba

    • 如前所述,软件尝试两组确定性初始值。GYdF4y2Ba

    • 软件随机生成GYdF4y2BaCGYdF4y2Ba向量的长度GYdF4y2BaKGYdF4y2Ba使用GYdF4y2Ba兰德GYdF4y2Ba,然后将每个向量标准化为1。GYdF4y2Ba

在迭代GYdF4y2BaTGYdF4y2Ba,软件将完成以下步骤:GYdF4y2Ba

  1. 计算GYdF4y2Ba

    RGYdF4y2Ba ^GYdF4y2Ba JGYdF4y2Ba (GYdF4y2Ba TGYdF4y2Ba )GYdF4y2Ba =GYdF4y2Ba ∑GYdF4y2Ba KGYdF4y2Ba =GYdF4y2Ba 1.GYdF4y2Ba KGYdF4y2Ba PGYdF4y2Ba ^GYdF4y2Ba KGYdF4y2Ba (GYdF4y2Ba TGYdF4y2Ba )GYdF4y2Ba 我GYdF4y2Ba (GYdF4y2Ba MGYdF4y2Ba KGYdF4y2Ba JGYdF4y2Ba =GYdF4y2Ba +GYdF4y2Ba 1.GYdF4y2Ba )GYdF4y2Ba ∑GYdF4y2Ba KGYdF4y2Ba =GYdF4y2Ba 1.GYdF4y2Ba KGYdF4y2Ba PGYdF4y2Ba ^GYdF4y2Ba KGYdF4y2Ba (GYdF4y2Ba TGYdF4y2Ba )GYdF4y2Ba 我GYdF4y2Ba (GYdF4y2Ba MGYdF4y2Ba KGYdF4y2Ba JGYdF4y2Ba =GYdF4y2Ba +GYdF4y2Ba 1.GYdF4y2Ba ∪GYdF4y2Ba MGYdF4y2Ba KGYdF4y2Ba JGYdF4y2Ba =GYdF4y2Ba −GYdF4y2Ba 1.GYdF4y2Ba )GYdF4y2Ba .GYdF4y2Ba

  2. 估计下一类后验概率GYdF4y2Ba

    PGYdF4y2Ba ^GYdF4y2Ba KGYdF4y2Ba (GYdF4y2Ba TGYdF4y2Ba +GYdF4y2Ba 1.GYdF4y2Ba )GYdF4y2Ba =GYdF4y2Ba PGYdF4y2Ba ^GYdF4y2Ba KGYdF4y2Ba (GYdF4y2Ba TGYdF4y2Ba )GYdF4y2Ba ∑GYdF4y2Ba JGYdF4y2Ba =GYdF4y2Ba 1.GYdF4y2Ba LGYdF4y2Ba WGYdF4y2Ba JGYdF4y2Ba [GYdF4y2Ba RGYdF4y2Ba JGYdF4y2Ba 我GYdF4y2Ba (GYdF4y2Ba MGYdF4y2Ba KGYdF4y2Ba JGYdF4y2Ba =GYdF4y2Ba +GYdF4y2Ba 1.GYdF4y2Ba )GYdF4y2Ba +GYdF4y2Ba (GYdF4y2Ba 1.GYdF4y2Ba −GYdF4y2Ba RGYdF4y2Ba JGYdF4y2Ba )GYdF4y2Ba 我GYdF4y2Ba (GYdF4y2Ba MGYdF4y2Ba KGYdF4y2Ba JGYdF4y2Ba =GYdF4y2Ba −GYdF4y2Ba 1.GYdF4y2Ba )GYdF4y2Ba ]GYdF4y2Ba ∑GYdF4y2Ba JGYdF4y2Ba =GYdF4y2Ba 1.GYdF4y2Ba LGYdF4y2Ba WGYdF4y2Ba JGYdF4y2Ba [GYdF4y2Ba RGYdF4y2Ba ^GYdF4y2Ba JGYdF4y2Ba (GYdF4y2Ba TGYdF4y2Ba )GYdF4y2Ba 我GYdF4y2Ba (GYdF4y2Ba MGYdF4y2Ba KGYdF4y2Ba JGYdF4y2Ba =GYdF4y2Ba +GYdF4y2Ba 1.GYdF4y2Ba )GYdF4y2Ba +GYdF4y2Ba (GYdF4y2Ba 1.GYdF4y2Ba −GYdF4y2Ba RGYdF4y2Ba ^GYdF4y2Ba JGYdF4y2Ba (GYdF4y2Ba TGYdF4y2Ba )GYdF4y2Ba )GYdF4y2Ba 我GYdF4y2Ba (GYdF4y2Ba MGYdF4y2Ba KGYdF4y2Ba JGYdF4y2Ba =GYdF4y2Ba −GYdF4y2Ba 1.GYdF4y2Ba )GYdF4y2Ba ]GYdF4y2Ba .GYdF4y2Ba

  3. 规范化GYdF4y2Ba PGYdF4y2Ba ^GYdF4y2Ba KGYdF4y2Ba (GYdF4y2Ba TGYdF4y2Ba +GYdF4y2Ba 1.GYdF4y2Ba )GYdF4y2Ba ;GYdF4y2Ba KGYdF4y2Ba =GYdF4y2Ba 1.GYdF4y2Ba ,GYdF4y2Ba ...GYdF4y2Ba ,GYdF4y2Ba KGYdF4y2Ba 所以它们的和是1。GYdF4y2Ba

  4. 检查收敛性。GYdF4y2Ba

有关详细信息,请参阅GYdF4y2Ba(Hastie等。)GYdF4y2Ba和GYdF4y2Ba[Zadrozny]GYdF4y2Ba.GYdF4y2Ba

二次规划的后验估计GYdF4y2Ba

使用二次规划的后验概率估计需要一个优化工具箱许可证。为了用这种方法估计一个观测的后验概率,软件完成以下步骤:GYdF4y2Ba

  1. 估计正类后验概率,GYdF4y2BaRGYdF4y2BaJGYdF4y2Ba,适用于二进制学习者GYdF4y2BaJGYdF4y2Ba= 1,......,GYdF4y2BaLGYdF4y2Ba.GYdF4y2Ba

  2. 利用GYdF4y2BaRGYdF4y2BaJGYdF4y2Ba和GYdF4y2Ba PGYdF4y2Ba ^GYdF4y2Ba KGYdF4y2Ba [吴等人。]GYdF4y2Ba,最大限度地减少GYdF4y2Ba

    ∑GYdF4y2Ba JGYdF4y2Ba =GYdF4y2Ba 1.GYdF4y2Ba LGYdF4y2Ba [GYdF4y2Ba −GYdF4y2Ba RGYdF4y2Ba JGYdF4y2Ba ∑GYdF4y2Ba KGYdF4y2Ba =GYdF4y2Ba 1.GYdF4y2Ba KGYdF4y2Ba PGYdF4y2Ba ^GYdF4y2Ba KGYdF4y2Ba 我GYdF4y2Ba (GYdF4y2Ba MGYdF4y2Ba KGYdF4y2Ba JGYdF4y2Ba =GYdF4y2Ba −GYdF4y2Ba 1.GYdF4y2Ba )GYdF4y2Ba +GYdF4y2Ba (GYdF4y2Ba 1.GYdF4y2Ba −GYdF4y2Ba RGYdF4y2Ba JGYdF4y2Ba )GYdF4y2Ba ∑GYdF4y2Ba KGYdF4y2Ba =GYdF4y2Ba 1.GYdF4y2Ba KGYdF4y2Ba PGYdF4y2Ba ^GYdF4y2Ba KGYdF4y2Ba 我GYdF4y2Ba (GYdF4y2Ba MGYdF4y2Ba KGYdF4y2Ba JGYdF4y2Ba =GYdF4y2Ba +GYdF4y2Ba 1.GYdF4y2Ba )GYdF4y2Ba ]GYdF4y2Ba 2.GYdF4y2Ba

    关于GYdF4y2Ba PGYdF4y2Ba ^GYdF4y2Ba KGYdF4y2Ba 和限制GYdF4y2Ba

    0GYdF4y2Ba ≤GYdF4y2Ba PGYdF4y2Ba ^GYdF4y2Ba KGYdF4y2Ba ≤GYdF4y2Ba 1.GYdF4y2Ba ∑GYdF4y2Ba KGYdF4y2Ba PGYdF4y2Ba ^GYdF4y2Ba KGYdF4y2Ba =GYdF4y2Ba 1.GYdF4y2Ba

    软件使用GYdF4y2BaquadprogGYdF4y2Ba.GYdF4y2Ba

工具书类GYdF4y2Ba

[1] Allwein,E.,R.Schapire和Y.Singer,“将多类减少为二类:保证金分类的统一方法。”GYdF4y2Ba机器学习研究杂志GYdF4y2Ba.卷。1,2000,pp。113-141。GYdF4y2Ba

[2] Dieterich,T.和G.Bakiri。“通过纠错输出代码解决多类学习问题。”GYdF4y2Ba人工智能研究杂志GYdF4y2Ba.卷。2,1995,第263-286页。GYdF4y2Ba

Pujol, S. Escalera, S. O. Pujol, P. Radeva。《论三元纠错输出码的译码过程》。GYdF4y2Ba模式分析与机器智能学报GYdF4y2Ba.2010年第32卷第7期120-134页。GYdF4y2Ba

[4] Escalera,S.,O. Pujol和P. Radeva。“用于纠错输出代码稀疏设计的三元代码的可分离。”GYdF4y2Ba模式识别GYdF4y2Ba第30卷,2009年第3期,第285-297页。GYdF4y2Ba

[5] 黑斯蒂、T.和R.蒂布什拉尼。“按成对耦合进行分类。”GYdF4y2Ba统计年鉴GYdF4y2Ba.1998年第26卷第2期第451-471页。GYdF4y2Ba

[6] Wu,T. F.,C. J. Lin和R. Weng。“通过成对耦合对多级分类的概率估计。”GYdF4y2Ba机器学习研究杂志GYdF4y2Ba.卷。5,2004,PP。975-1005。GYdF4y2Ba

[7] 通过耦合概率估计将多类还原为二进制GYdF4y2BaNIPS 2001:神经信息处理系统进展会议录14GYdF4y2Ba,2001,pp。1041-1048。GYdF4y2Ba

扩展能力GYdF4y2Ba

介绍了R2014bGYdF4y2Ba