resubPredict

在支持向量机分类观测(SVM)分类万博1manbetx

描述

标签= resubPredict(SVMModel返回预测类别标签的向量(标签)为经训练的支持向量机(SVM)分类万博1manbetxSVMModel使用该预测数据SVMModel.X

[标签得分] = resubPredict(SVMModel另外返回类似然度量,要么分数或后验概率。

例子

全部收缩

加载电离层数据集。

加载<小号pan style="color:#A020F0">电离层

训练SVM分类器。标准化的数据和指定'G'是正课。

SVMModel = fitcsvm(X,Y,<小号pan style="color:#A020F0">“类名”{<小号pan style="color:#A020F0">'B',<小号pan style="color:#A020F0">'G'},<小号pan style="color:#A020F0">“标准化”,真正);

SVMModelClassificationSVM分类。

预测训练样本标签和分数。显示第一个10个观察结果。

[标号,得分= resubPredict(SVMModel);表(Y(1:10),标签(1:10),分(1:10,2),<小号pan style="color:#A020F0">'VariableNames',<小号pan style="color:#0000FF">...{<小号pan style="color:#A020F0">'TrueLabel',<小号pan style="color:#A020F0">'PredictedLabel',<小号pan style="color:#A020F0">'得分'})
ANS =<小号pan class="emphasis">10×3的表TrueLabel PredictedLabel分数_________ ______________ _______ { 'G'} { 'G'} 1.4861 { 'B'} { 'B'} {-1.0002 'G'} { 'G'} 1.8684 { 'B'} { 'B'}-2.6459 { 'G'} { 'G'} 1.2805 { 'b'} { 'b'} {-1.4615 'G'} { 'G'} 2.1672 { 'b'} { 'b'} {-5.7081”G '} {' G '} 2.4796 {' b '} {' b'} -2.7809

加载电离层数据集。

加载<小号pan style="color:#A020F0">电离层

训练SVM分类器。标准化的数据和指定'G'是正课。

SVMModel = fitcsvm(X,Y,<小号pan style="color:#A020F0">“类名”{<小号pan style="color:#A020F0">'B',<小号pan style="color:#A020F0">'G'},<小号pan style="color:#A020F0">“标准化”,真正);

SVMModelClassificationSVM分类。

适合的最佳成绩 - 后概率的转换功能。

RNG(1);<小号pan style="color:#228B22">%用于重现ScoreSVMModel = fitPosterior(SVMModel)
ScoreSVMModel = ClassificationSVM ResponseName: 'Y' CategoricalPredictors:[]类名:{ 'B' 的 'g'} ScoreTransform: '@(S)S形(S,-9.479889e-01,-1.220433e-01)' NumObservations:351阿尔法:[90x1 double] Bias: -0.1342 KernelParameters: [1x1 struct] Mu: [1x34 double] Sigma: [1x34 double] BoxConstraints: [351x1 double] ConvergenceInfo: [1x1 struct] IsSupportVector: [351x1 logical] Solver: 'SMO' Properties, Methods

因为类是分不开的,分数转换功能(ScoreSVMModel.ScoreTransform)是S形函数。

估计训练数据的得分和正类的后验概率。显示第一个10个观察结果。

[标号,分数] = resubPredict(SVMModel);[〜,postProbs] = resubPredict(ScoreSVMModel);表(Y(1:10),标签(1:10),分数(1:10,2),postProbs(1:10,2),<小号pan style="color:#A020F0">'VariableNames',<小号pan style="color:#0000FF">...{<小号pan style="color:#A020F0">'TrueLabel',<小号pan style="color:#A020F0">'PredictedLabel',<小号pan style="color:#A020F0">'得分',<小号pan style="color:#A020F0">'PosteriorProbability'})
ANS =<小号pan class="emphasis">10×4表TrueLabel PredictedLabel分数PosteriorProbability _________ ______________ _______ ____________________ { 'G'} { 'G'} 1.4861 0.82213 { 'B'} { 'B'} -1.0002 0.30446 { 'G'} { 'G'} 1.8684 0.86913 { 'B'}{ 'b'} -2.6459 0.084225 { 'G'} { 'G'} 1.2805 0.79183 { 'b'} { 'b'} -1.4615 0.22039 { 'G'} { 'G'} 2.1672 0.89812 { 'b'}{ 'b'} -5.7081 0.0050204 { 'G'} { 'G'} 2.4796 0.9222 { 'b'} { 'b'} -2.7809 0.074869

输入参数

全部收缩

全面,训练有素的SVM分类,指定为ClassificationSVM模型的培训fitcsvm

输出参数

全部收缩

预测类别标签,返回作为分类或字符阵列,逻辑或数字载体,或字符向量的单元阵列。

预测类标签有以下几点:

  • 相同的数据类型所观察到的类别标签(SVMModel.Y

  • 长度等于行的数量SVMModel.X

对于一类学习,标签包含一个类表示在SVMModel.Y

预测类分数要么后验概率,返回作为数字列向量或数字矩阵。

  • 对于一类学习,得分是具有相同的行数作为列向量SVMModel.X。的元件是用于相应观测的正级得分。你不能获得一个一流的学习后验概率。

  • 对于两班学习,得分是具有相同的行数为两列的矩阵SVMModel.X

    • 如果您在使用适合的最佳成绩 - 后概率转换功能fitPosterior要么fitSVMPosterior, 然后得分包含一流的后验概率。也就是说,如果价值SVMModel.ScoreTransform不是没有,然后的第一和第二列得分包含负类(SVMModel.ClassNames {1})和阳性类(SVMModel.ClassNames {2})后验概率为相应的观察,分别。

    • 否则,第一列包含负级得分和第二列包含对应观测的正级得分。

如果SVMModel.KernelParameters.Function“线性”,则分类得分观察X

F X = X / 小号 β + b

SVMModel商店βb小号在属性Beta版偏压KernelParameters.Scale, 分别。

手动估算分类的分数,你必须先申请任何转换到该训练过程中应用的预测数据。具体来说,如果您指定“标准化”,真当使用fitcsvm,则必须使用手动平均标准化预测数据SVMModel.Mu和标准偏差SVMModel.Sigma,然后由内核规模划分结果SVMModel.KernelParameters.Scale

所有的SVM功能,如resubPredict预测,估计之前应用任何所需的转换。

如果SVMModel.KernelParameters.Function不是“线性”, 然后Beta版是空的 ([])。

更多关于

全部收缩

分类评分

该SVM分类评分对于分类观察X从符号距离X在决策边界,从-∞到+∞。一类正分表明,X被预测为在该类中。负分另有指示。

正类分类评分<小号pan class="inlineequation"> F X 是训练的SVM分类功能。<小号pan class="inlineequation"> F X 也是数值,预测响应X或分数预测X进入正类。

F X = Σ Ĵ = 1 ñ α Ĵ ÿ Ĵ G X Ĵ X + b

哪里<小号pan class="inlineequation"> α 1 ... α ñ b 是所估计的SVM的参数,<小号pan class="inlineequation"> G X Ĵ X 介于两者之间的预测空间的点积X和支承载体,以及万博1manbetx总和包括在训练集的意见。负类分类评分X或分数预测X成阴性类,是 -FX)。

如果GX<小号ub>ĴX)=X<小号ub>ĴX(线性内核),则该得分函数简化为

F X = X / 小号 β + b

小号是内核和规模β是线性拟合系数的矢量。

有关详细信息,请参阅理解支持向量机万博1manbetx

后验概率

后验概率是,观察属于一个特定类,给定数据的概率。

对于SVM,后验概率是得分的函数P小号)是观察Ĵ在类ķ= {-1,1}。

  • 对于可分离类,后验概率是阶梯函数

    P 小号 Ĵ = { 0 ; 小号 < 最大 ÿ ķ = - 1 小号 ķ π ; 最大 ÿ ķ = - 1 小号 ķ 小号 Ĵ ÿ ķ = + 1 小号 ķ 1 ; 小号 Ĵ > ÿ ķ = + 1 小号 ķ

    哪里:

    • 小号<小号ub>Ĵ是观察得分Ĵ

    • +1和-1表示正和负的类,分别。

    • π是先验概率的观察是在正类。

  • 对于不可分割类,后验概率是S形函数

    P 小号 Ĵ = 1 1 + EXP 一个 小号 Ĵ +

    其中参数一个是斜率和截距参数,分别。

先验概率

先验概率一类是与从该类观测发生在一个群体中的信相对频率。

提示

  • 如果您使用的分类线性SVM模型和模型有很多支持向量,然后使用万博1manbetxresubPredict对于预测方法可能是缓慢的。为了基于线性SVM模型有效地分类观察,通过使用删除模型对象支持向量万博1manbetxdiscard万博1manbetxSupportVectors

算法

  • 默认情况下,也不论模型核函数,MATLAB<小号up>®使用得分函数基于训练的SVM模型分类意见的双重代表性,特别是

    F ^ X = Σ Ĵ = 1 ñ α ^ Ĵ ÿ Ĵ G X X Ĵ + b ^

    该预测方法需要训练支持向量和万博1manbetxα系数(见万博1manbetxSupportVectorsΑ在SVM模型的属性)。

  • 默认情况下,软件将计算最佳的使用普氏法的后验概率[1]

    1. 执行10倍交叉验证。

    2. 符合双曲线函数参数,从交叉验证返回的分数。

    3. 通过输入交叉验证分数入拟合S形函数估计的后验概率。

  • 软件培训期间包含在SVM目标函数先验概率。

  • 对于SVM,预测resubPredict分类观测到类得到最大得分(最大后验概率)。该软件占误分类成本由训练分类之前以平均成本修正。也就是说,给定类之前矢量P,误判成本矩阵C,和观察权重向量w ^时,软件定义观察权重的新载体(w ^),使得

    w ^ Ĵ = w ^ Ĵ P Ĵ Σ ķ = 1 ķ C Ĵ ķ

参考

[1]普拉特,J。“概率输出用于支持向量机和比较,以正则似然方法”。万博1manbetx在大间隔分类进展。麻省理工学院出版社,1999,页61-74。

也可以看看

|<小号pan itemscope itemtype="//www.tianjin-qmedu.com/help/schema/MathWorksDocPage/SeeAlso" itemprop="seealso">|<小号pan itemscope itemtype="//www.tianjin-qmedu.com/help/schema/MathWorksDocPage/SeeAlso" itemprop="seealso">|<小号pan itemscope itemtype="//www.tianjin-qmedu.com/help/schema/MathWorksDocPage/SeeAlso" itemprop="seealso">|<小号pan itemscope itemtype="//www.tianjin-qmedu.com/help/schema/MathWorksDocPage/SeeAlso" itemprop="seealso">|<小号pan itemscope itemtype="//www.tianjin-qmedu.com/help/schema/MathWorksDocPage/SeeAlso" itemprop="seealso">

介绍了在R2014a