保证金

找到支持向量机分类器的分类边界万博1manbetx

描述

=余量(SVMModel资源描述ResponseVarName返回分类利润率)作为训练好的支持向量机分类器万博1manbetxSVMModel使用表的采样数据资源描述类标签进来了TBL.ResponseVarName

返回为一个数值向量具有相同的长度ÿ。该软件估计,每个条目使用经过训练的SVM分类器SVMModel中,相应的行X和真正的类标签ÿ

=余量(SVMModel资源描述ÿ返回分类边距()对于训练的SVM分类SVMModel使用表的采样数据资源描述类标签进来了ÿ

=余量(SVMModelXÿ返回分类利润率SVMModel使用矩阵预测数据X类标签进来了ÿ

例子

全部收缩

加载电离层数据集。

加载电离层RNG(1);%用于重现

训练一个SVM分类器。指定15%的不合格率样品进行测试,标准化数据,并指定‘g’是正课。

CVSVMModel = fitcsvm(X,Y,“坚持”,0.15,“类名”,{“b”‘g’},“标准化”,真正);= CompactSVMModel CVSVMModel.Trained {1};%提取经过训练的,紧凑的分类器testInds =测试(CVSVMModel.Partition);%提取测试指标XTest = X (testInds:);欧美= Y (testInds:);

CVSVMModel是一个ClassificationPartitionedModel分类。它包含属性训练有素的,它是一个1×1单元格数组,包含aCompactClassificationSVM分类,该软件使用训练集训练。

估计测试样品分类的利润率。

m =利润率(CompactSVMModel XTest、欧美);米(20)
ANS =11×13.5462 5.5943 4.9941 4.5604 -4.7961 5.5129 -2.8769 1.8668 9.4993 9.5026⋮

观察利润率是观察真实类分数减去最大假类成绩在各自类别的所有分数中。能产生相对大的边缘分类器是优选的。

从多个模型比较测试样品利润率执行特征选择。仅仅基于这一比较,最高的利润模型是最好的模型。

加载电离层数据集。

加载电离层RNG(1);%用于重现

将数据集划分为训练集和测试集。指定15%的坚持样本进行测试。

分区= cvpartition (Y,“坚持”,0.15);testInds =测试(分区);对于测试集%指数XTest = X (testInds:);欧美= Y (testInds:);

分区定义数据集分区。

定义这两个数据集:

  • fullX包含所有预测器(除0的所移除的列)。

  • partX包含最后20个预测器。

fullX = X;partX = X(:,端-20:端);

火车SVM分类的每个预测集。指定分区定义。

FullCVSVMModel = fitcsvm (fullX Y“CVPartition”、分区);PartCVSVMModel = fitcsvm (partX Y“CVPartition”、分区);FCSVMModel = FullCVSVMModel.Trained {1};PCSVMModel = PartCVSVMModel.Trained {1};

FullCVSVMModelPartCVSVMModelClassificationPartitionedModel分类。它们包含的属性训练有素的,它是一个1×1单元格数组,包含aCompactClassificationSVM分类,该软件使用训练集训练。

估计每个分类器的测试样品的利润率。

fullM =利润率(FCSVMModel XTest、欧美);partM =利润率(PCSVMModel XTest (:, end-20:结束),次);n =大小(XTest, 1);p = sum(fullM < partM)/n
p值= 0.2500

大约从整个模型的利润率为25%,低于那些用更少的预测模型。这一结果表明,与所有预测训练模型更好。

输入参数

全部收缩

SVM分类模型,指定为aClassificationSVM模型对象或CompactClassificationSVM模型对象通过返回fitcsvm紧凑的, 分别。

示例数据,指定为表。每行资源描述对应于一个观测,并且每一列对应于一个预测变量。(可选)资源描述可以包含用于响应变量和权重观察附加列。资源描述必须包含所有用于训练的预测SVMModel。多列变量和除字符向量的单元阵列的其他单元阵列是不允许的。

如果资源描述包含用于训练的响应变量SVMModel,则不需要指定ResponseVarNameÿ

如果你训练的SVMModel使用包含在表的样本数据,则对于输入数据保证金还必须在表中。

如果你设置“标准化”,真fitcsvm当训练SVMModel,然后软件使用相应的方法对预测数据的列进行标准化SVMModel.Mu和标准偏差SVMModel.Sigma

数据类型:

预测器数据,指定为数值矩阵。

每行X对应于一个观测(也称为一个实例或示例),并且每一列对应于一个变量(也称为特征)。在列变量X必须是一样的训练变量SVMModel分类。

长度ÿ还有行数X必须相等。

如果你设置“标准化”,真fitcsvm训练SVMModel,然后软件标准化的列X利用在相应的装置SVMModel.Mu和标准偏差SVMModel.Sigma

数据类型:|

中指定为变量名的响应变量名资源描述。如果资源描述包含用于训练的响应变量SVMModel,则不需要指定ResponseVarName

如果您指定ResponseVarName,则必须以字符向量或字符串标量的形式执行。例如,如果响应变量存储为TBL.Response,然后指定ResponseVarName“响应”。否则,软件处理的所有列资源描述,包括TBL.Response,作为预测。

响应变量必须是分类、字符或字符串数组、逻辑或数字向量或字符向量的单元数组。如果响应变量是一个字符数组,那么每个元素必须对应于数组的一行。

数据类型:字符|字符串

类标签,指定为分类、字符或字符串数组、逻辑或数字向量或字符向量的单元数组。ÿ必须是相同的数据类型SVMModel.ClassNames(该软件把字符串数组作为字符向量的单元阵列。)

长度ÿ必须等于行数资源描述或行的数X

更多关于

全部收缩

分类的优势

边缘的加权平均值是多少分类利润率

权重是事先类概率。如果你提供的权重,那么软件标准化他们总结的先验概率在各自所属类别。软件使用权重整化计算的加权平均。

多个分类中的一种方式进行选择,例如,进行特征选择,是选择产生最高边缘分类。

分类极限

分类极限用于二元分类,对每个观察,分类评分为真类和分类评分为假类之间的差。

软件定义的分类极限的二元分类为

= 2 ÿ F X

X是一个观察。如果真正标签X是正课,然后ÿ是1,否则为-1。FX)是正类别分类分值观察X。分类余量通常被定义为=ÿFX

如果边界在相同的尺度上,那么它们作为分类置信度。在多个分类器中,那些产生更大的利润是更好的。

分类分

的支持向量机分类评分对于分类观察X到的符号距离是多少X到决策边界的范围从-∞到+∞。一个类的正面分数表明了这一点X被预测为在该类中。负分另有指示。

正类分类评分 F X 是训练的SVM分类功能。 F X 的数值预测响应X或分数预测X进入积极类。

F X = Ĵ = 1 ñ α Ĵ ÿ Ĵ G X Ĵ X + b

在哪里 α 1 α ñ b 为SVM估计参数, G X Ĵ X 点积是否在区间内X和支持向量,和包万博1manbetx括训练集观测值。为负类分类分数X或分数预测X变成负类,是-FX)。

如果GXĴX)=XĴX(线性内核),则该得分函数简化为

F X = X / 小号 β + b

小号内核规模和β是线性拟合系数的矢量。

有关更多细节,请参见理解支持向量机万博1manbetx

算法

对于二元分类,软件定义观察保证金ĴĴ作为

Ĵ = 2 ÿ Ĵ F X Ĵ

在哪里ÿĴ∊{1}FXĴ)为预测观测值Ĵ对于正类。然而,Ĵ=ÿĴFXĴ)通常用来定义页边距。

参考

bb0 Christianini, N.和J. C. Shawe-Taylor。简介支持向量机和其他基于内核的学习方法万博1manbetx。英国剑桥:剑桥大学出版社,2000。

扩展功能

介绍了R2014a