fitcsvm

训练支持向量万博1manbetx机(SVM)分类器的单类和二元分类

在页面中全部折叠

语法

Mdl = fitcsvm(Tbl,ResponseVarName)

Mdl = fitcsvm(Tbl，公式)

Mdl = fitcsvm(Tbl,Y)

Mdl = fitcsvm(X,Y)

Mdl = fitcsvm(___、名称、值)

描述

fitcsvm在低维或中维预测器数据集上训练或交叉验证支持向量机(SV万博1manbetxM)模型，用于单类和两类(二进制)分类。fitcsvm万博1manbetx支持使用核函数映射预测器数据，支持顺序最小优化(SMO)，迭代单数据算法(ISDA)，或l1利用二次规划实现目标函数最小化的软裕度最小化。

训练线性支持向量机模型对高维数据集，即包含许多预测变量的数据集进行二元分类，使用fitclinear代替。

对于组合二进制支持向量机模型的多类学习，使用错误校正输出码(ECOC)。有关更多细节，请参见fitcecoc．

要训练支持向量机回归模型，请参见fitrsvm对于低维和中维预测器数据集，或fitrlinear对于高维数据集。

Mdl= fitcsvm (资源描述，ResponseVarName）返回一个万博1manbetx支持向量机(SVM)分类器Mdl使用表中包含的样例数据进行训练资源描述．ResponseVarName变量的名称是否在资源描述它包含单类或双类分类的类标签。

Mdl= fitcsvm (资源描述，公式）返回使用表中包含的样本数据训练的SVM分类器资源描述．公式是否有响应的解释模型和预测变量的子集资源描述曾经适合Mdl．

Mdl= fitcsvm (资源描述，Y）返回使用表中的预测变量训练的SVM分类器资源描述类标签在向量中Y．

例子

Mdl= fitcsvm (X，Y）返回使用矩阵中的预测器训练的SVM分类器X类标签在向量中Y用于单类或双类分类。

例子

Mdl= fitcsvm (___，名称,值）除先前语法中的输入参数外，还使用一个或多个名称-值对参数指定选项。例如，您可以指定交叉验证的类型、错误分类的代价以及分数转换函数的类型。

例子

全部折叠

训练支持向量机分类器

打开实时脚本

载入费雪的虹膜数据集。去除萼片的长度和宽度和所有观察到的濑花虹膜。

负载fisheririsInds = ~strcmp(物种，“setosa”）;X = meas(inds,3:4);Y =物种(inds);

使用处理过的数据集训练SVM分类器。

SVMModel = fitcsvm(X,y)

SVMModel = ClassificationSVM ResponseName: 'Y' CategoricalPredictors: [] ClassNames: {'versicolor' 'virginica'} ScoreTransform: 'none' NumObservations: 100 Alpha: [24x1 double] Bias: -14.4149 KernelParameters: [1x1 struct] BoxConstraints: [100x1 double] ConvergenceInfo: [1x1 struct] Is万博1manbetxSupportVector: [100x1 logical] Solver: 'SMO' Properties, Methods

SVMModel是经过训练的ClassificationSVM分类器。显示属性SVMModel．例如，要确定类顺序，可以使用点表示法。

classOrder = SVMModel。一会

classOrder =2 x1细胞{'versicolor'} {'virginica'}

第一节课(“多色的”)为负类，第二类(“virginica”)是积极的阶级。方法可以在训练期间更改类顺序“类名”名称-值对参数。

绘制数据的散点图并圈出支持向量。万博1manbetx

sv = svmmodel 万博1manbetx. supportvector;图gscatter(X(:，1)，X(:，2)，y)保持在情节(sv (: 1), sv (:, 2),“柯”，“MarkerSize”10)传说(“多色的”，“virginica”，“万博1manbetx支持向量”)举行从

支持向量万博1manbetx是发生在估计类边界或超出估计类边界的观察值。

方法在训练期间设置框约束，可以调整边界(以及支持向量的数量)万博1manbetx“BoxConstraint”名称-值对参数。

训练和交叉验证SVM分类器

打开实时脚本

加载电离层数据集。

负载电离层rng (1);%用于重现性

使用径向基核训练SVM分类器。让软件为内核函数找到一个缩放值。标准化预测器。

SVMModel = fitcsvm(X,Y，“标准化”,真的,“KernelFunction”，“RBF”，.．.“KernelScale”，“汽车”）;

SVMModel是经过训练的ClassificationSVM分类器。

交叉验证SVM分类器。默认情况下，该软件使用10次交叉验证。

CVSVMModel = crossval(SVMModel);

CVSVMModel是一个ClassificationPartitionedModel旨在分类器。

估计样本外误分类率。

classLoss = kfoldLoss(CVSVMModel)

classLoss = 0.0484

泛化率约为5%。

使用支持向量机和单类学习检测异常值

打开实时脚本

修改Fisher的虹膜数据集，将所有虹膜分配到同一类。在修改后的数据集中检测异常值，并确定异常值所占观测值的预期比例。

载入费雪的虹膜数据集。去掉花瓣的长度和宽度。把所有的鸢尾都当作来自同一类。

负载fisheririsX = meas(:，1:2);y = ones(size(X,1)，1);

使用修改后的数据集训练SVM分类器。假设5%的观测值是异常值。标准化预测器。

rng (1);SVMModel = fitcsvm(X,y，“KernelScale”，“汽车”，“标准化”,真的,.．.“OutlierFraction”, 0.05);

SVMModel是经过训练的ClassificationSVM分类器。默认情况下，软件使用高斯内核进行单类学习。

绘制观察结果和决策边界。标记支持向量和潜在万博1manbetx异常值。

svInd = svm . issup万博1manbetxportvector;H = 0.02;%网格步长[X1,X2] = meshgrid(min(X(:，1)):h:max(X(:，1))，.．.min (X (:, 2)): h:马克斯(X (:, 2)));[~，score] = predict(SVMModel，[X1(:)，X2(:)]);scoreGrid = shape(score,size(X1,1)，size(X2,2));图绘制(X (: 1), (:, 2),“k”。)举行在情节(X (svInd, 1), X (svInd, 2),“罗”，“MarkerSize”，10)轮廓(X1,X2,scoreGrid)颜色栏;标题({\bf基于单类支持向量机的虹膜离群值检测})包含(“萼片长度(厘米)”) ylabel (“萼片宽度(厘米)”)传说(“观察”，“万博1manbetx支持向量”)举行从

将异常值与其余数据分隔开的边界出现在轮廓值所在的位置0．

验证交叉验证数据中阴性分数的观测值的比例接近5%。

CVSVMModel = crossval(SVMModel);[~，scorePred] = kfoldPredict(CVSVMModel);outlierRate = mean(scorePred<0)

outlierRate = 0.0467

利用二值支持向量机寻找多个类边界

打开实时脚本

创建一个散点图fisheriris数据集。将图中网格的坐标视为来自数据集分布的新观察值，并通过将坐标分配给数据集中的三个类中的一个来查找类边界。

载入费雪的虹膜数据集。用花瓣的长度和宽度作为预测因子。

负载fisheririsX = meas(:，3:4);Y =物种;

检查数据的散点图。

图gscatter (X (: 1), (:, 2), Y);H = gca;Lims = [h;Xl我米h.YLim];提取x轴和y轴的限制标题('{\bf虹膜测量散点图}'）;包含(“花瓣长度(厘米)”）;ylabel (“花瓣宽度(厘米)”）;传奇(“位置”，“西北”）;

该数据包含三类，其中一类是线性可分的。

每个班级:

创建一个逻辑向量(indx)表示观察结果是否属于该类。
使用预测器数据和训练支持向量机分类器indx．
将分类器存储在单元格数组的单元格中。

定义类顺序。

SVMModels = cell(3,1);类=唯一的(Y);rng (1);%用于重现性为j = 1:numel(classes) indx = strcmp(Y,classes(j));为每个分类器创建二进制类SVMModels{j} = fitcsvm(X,indx，“类名”(虚假的真实),“标准化”,真的,.．.“KernelFunction”，“rbf”，“BoxConstraint”1);结束

SVMModels是3 × 1单元格数组，每个单元格包含ClassificationSVM分类器。对于每个细胞，阳性类分别是setosa, versicolor和virginica。

在图中定义一个精细网格，并将坐标视为来自训练数据分布的新观察值。使用每个分类器估计新观察结果的得分。

D = 0.02;[x1Grid, x2Grid] = meshgrid (min (X (: 1)): d:马克斯(X (: 1)).．.min (X (:, 2)): d:马克斯(X (:, 2)));xGrid = [x1Grid(:)，x2Grid(:)];N = size(xGrid,1);Scores = 0 (N,numel(classes));为j = 1:numel(classes) [~，score] = predict(svm模型{j}，xGrid);Scores(:，j) = score(:，2);%第二列包含积极的班级分数结束

每一行分数包含三个分数。得分最大的元素的索引是新类观察最有可能属于的类的索引。

将每个新的观察结果与给出最高分的分类器关联起来。

[~，maxScore] = max(Scores，[]，2);

根据对应的新观察结果所属的类别，在图的区域中设置颜色。

图h(1:3) = gscatter(xGrid(:，1)，xGrid(:，2)，maxScore，.．.[0.1 0.5 0.5;0.5 0.1 0.5;0.5 0.5 0.1]);持有在h(4:6) = gscatter(X(:，1)，X(:，2)，Y);标题('{\bf虹膜分类区域}'）;包含(“花瓣长度(厘米)”）;ylabel (“花瓣宽度(厘米)”）;传奇(h, {“setosa地区”，“杂色的地区”，“virginica地区”，.．.“观察setosa”，的观察到的多色的，“观察virginica”}，.．.“位置”，“西北”）;轴紧持有从

优化SVM分类器

打开实时脚本

自动优化超参数使用fitcsvm．

加载电离层数据集。

负载电离层

通过使用自动超参数优化找到最小化五倍交叉验证损失的超参数。为了再现性，设置随机种子并使用“expected-improvement-plus”采集功能。

rng默认的Mdl = fitcsvm(X,Y，“OptimizeHyperparameters”，“汽车”，.．.“HyperparameterOptimizationOptions”结构(“AcquisitionFunctionName”，.．.“expected-improvement-plus”）)

|=====================================================================================================| | Iter | Eval客观客观| | | BestSoFar | BestSoFar | BoxConstraint | KernelScale | | |结果| |运行时| | (estim(观察) .) | | | |=====================================================================================================| | 最好1 | | 0.21652 | 17.039 | 0.21652 | 0.21652 | 64.836 | 0.0015729 |

| 2 |接受| 0.35897 | 0.07617 | 0.21652 | 0.22539 | 0.036335 | 5.5755 |

| 3 |最佳|.13105 | 6.632 | 0.13105 | 0.14152 | 0.0022147 | 0.0023957 |

| 4 |接受| 0.35897 | 0.074778 | 0.13105 | 0.13108 | 5.1259 | 98.62 |

| 5 |接受| 0.1339 | 13.599 | 0.13105 | 0.13111 | 0.0011599 | 0.0010098 |

| 6 |接受| 0.13105 | 3.171 | 0.13105 | 0.13106 | 0.0010151 | 0.0045756 |

| 7 |最佳|.12821 | 8.4294 | 0.12821 | 0.12819 | 0.0010563 | 0.0022307 |

| 8 |接受| 0.1339 | 10.901 | 0.12821 | 0.13013 | 0.0010113 | 0.0026572 |

| 9 |接受| 0.12821 | 6.1095 | 0.12821 | 0.12976 | 0.0010934 | 0.0022461 |

| 10 |接受| 0.12821 | 3.646 | 0.12821 | 0.12933 | 0.0010315 | 0.0023551 |

| 11 |接受| 0.1396 | 16.231 | 0.12821 | 0.12954 | 994.04 | 0.20756 |

| 12 |接受| 0.13105 | 15.216 | 0.12821 | 0.12945 | 20.145 | 0.044584 |

| 13 |接受| 0.21368 | 17.538 | 0.12821 | 0.12787 | 903.79 | 0.056122 |

| 14 |接受| 0.1339 | 0.25382 | 0.12821 | 0.12939 | 0.018688 | 0.038639 |

| 15 |接受| 0.12821 | 2.712 | 0.12821 | 0.1295 | 5.6464 | 0.15938 |

| 16 |接受| 0.13675 | 9.392 | 0.12821 | 0.12798 | 0.5485 | 0.020716 |

| 17 |接受| 0.12821 | 6.1911 | 0.12821 | 0.12955 | 1.2899 | 0.063233 |

| 18 |接受| 0.1339 | 9.0842 | 0.12821 | 0.12957 | 869.51 | 0.94889 |

| 19 |接受| 0.13675 | 9.2152 | 0.12821 | 0.12957 | 112.89 | 0.31231 |

| 20 |接受| 0.13105 | 0.09432 | 0.12821 | 0.12958 | 0.0010803 | 0.03695 |

|=====================================================================================================| | Iter | Eval客观客观| | | BestSoFar | BestSoFar | BoxConstraint | KernelScale | | |结果| |运行时| | (estim(观察) .) | | | |=====================================================================================================| | 21日|接受| 0.13675 | 9.1747 | 0.12821 | 0.1299 | 7.7299 | 0.076169 |

| 22最佳|.12536 | 0.14985 | 0.12536 | 0.13007 | 0.0010485 | 0.013248 |

| 23 |接受| 0.20228 | 16.954 | 0.12536 | 0.12548 | 0.060212 | 0.0010323 |

| 24 |接受| 0.1339 | 0.21183 | 0.12536 | 0.12556 | 0.30698 | 0.16097 |

| 25 |接受| 0.1339 | 14.522 | 0.12536 | 0.12923 | 963.05 | 0.5183 |

| 26 |接受| 0.13675 | 0.24834 | 0.12536 | 0.12888 | 0.0039748 | 0.015475 |

| 27 |接受| 0.1339 | 1.4307 | 0.12536 | 0.12889 | 0.33582 | 0.066787 |

| 28 |接受| 0.1339 | 14.534 | 0.12536 | 0.12884 | 4.2069 | 0.032774 |

| 0.12536 | 0.11308 | 0.12536 | 0.12658 | 0.0010233 | 0.017839 |

| 0.12536 | 0.12514 | 0.12536 | 0.12579 | 0.0010316 | 0.019592 |

__________________________________________________________ 优化完成。最大目标:达到30。总运行时间:234.177秒。最佳可行观测点:BoxConstraint KernelScale _____________ ___________ 0.0010233 0.017839观测目标函数值= 0.12536估计目标函数值= 0.12579函数评估时间= 0.11308最佳估计可行点(根据模型):BoxConstraint KernelScale _____________ ___________ 0.0010233 0.017839估计目标函数值= 0.12579估计函数评估时间= 0.13623

Mdl = ClassificationSVM ResponseName: 'Y' CategoricalPredictors: [] ClassNames: {'b' 'g'} ScoreTransform: 'none' NumObservations: 351 HyperparameterOptimizationResults: [1×1 BayesianOptimization] Alpha: [91×1 double] Bias: -5.6976 KernelParameters: [1×1 struct] BoxConstraints: [351×1 double] ConvergenceInfo: [1×1 struct] Is万博1manbetxSupportVector: [351×1 logical] Solver: 'SMO'属性，方法

输入参数

全部折叠

`资源描述`- - - - - -样本数据
表格

用于训练模型的样例数据，指定为表。每一行资源描述对应一个观察结果，每一列对应一个预测变量。可选地,资源描述可以为响应变量包含一个附加列。不允许多列变量和字符向量的单元格数组以外的单元格数组。

如果资源描述包含响应变量，并且希望在中使用所有剩余变量资源描述作为预测器，然后通过使用指定响应变量ResponseVarName．

如果资源描述包含响应变量，并且您希望仅使用其余变量的子集资源描述作为预测器，然后用指定公式公式．

如果资源描述不包含响应变量，则使用Y．中的响应变量的长度和行数资源描述必须是平等的。

数据类型:表格

`ResponseVarName`- - - - - -响应变量名
变量的名称`资源描述`

中指定为变量名的响应变量名资源描述．

您必须指定ResponseVarName作为字符向量或字符串标量。例如，如果响应变量Y存储为资源描述。Y，然后将其指定为“Y”．的所有列资源描述,包括Y，作为训练模型时的预测因子。

响应变量必须是类别、字符或字符串数组、逻辑或数字向量，或者字符向量的单元格数组。如果Y是字符数组，则响应变量的每个元素必须对应于数组的一行。

类指定类的顺序是一个好的实践一会名称-值对参数。

数据类型:字符|字符串

`公式`- - - - - -响应变量和预测变量子集的解释模型
特征向量|字符串标量

响应变量和预测变量子集的解释模型，在形式中指定为字符向量或字符串标量“Y ~ X1 + X2 + X3”．在这种形式中，Y表示响应变量，和X1，X2,X3表示预测变量。

中指定变量的子集资源描述使用公式作为训练模型的预测因子。如果您指定了一个公式，那么该软件将不使用任何变量资源描述没有出现在公式．

公式中的变量名必须是资源描述（Tbl.Properties.VariableNames)和有效的MATLAB^®标识符。

中的变量名可以进行验证资源描述通过使用isvarname函数。以下代码返回合乎逻辑的结果1（真正的)用于每个具有有效变量名的变量。

cellfun (@isvarname Tbl.Properties.VariableNames)

如果变量名在资源描述是无效的，那么使用matlab.lang.makeValidName函数。

table . properties . variablenames = matlab.lang.makeValidName(table . properties . variablenames);

数据类型:字符|字符串

`Y`- - - - - -类标签
分类数组|字符数组|字符串数组|逻辑向量|数值向量|字符向量的单元格数组

将SVM模型训练到的类标签指定为类别、字符或字符串数组、逻辑或数字向量或字符向量的单元格数组。

Y最多只能包含两个不同的类。对于多课学习，参见fitcecoc．
如果Y是字符数组，则类标签的每个元素必须对应于数组的一行。
的长度Y的行数资源描述或X必须是平等的。
类指定类顺序是一个很好的实践一会名称-值对参数。

数据类型:分类|字符|字符串|逻辑|单|双|细胞

`X`- - - - - -预测数据
数值矩阵

支持向量机分类器训练的预测器数据，指定为数值矩阵。

每一行X对应一个观察结果(也称为实例或示例)，每一列对应一个预测器(也称为特征)。

的长度Y的行数X必须是平等的。

以预测符的出现顺序指定它们的名称X，使用“PredictorNames”名称-值对参数。

数据类型:双|单

名称-值对实参

指定逗号分隔的可选对名称,值参数。的名字参数名称和价值对应的值。的名字必须出现在引号内。可以以任意顺序指定多个名称和值对参数Name1, Value1,…,的家．

例子:fitcsvm (X, Y, KFold, 10日,“成本”,[0 2;1 0],“ScoreTransform”、“标志”)执行10倍交叉验证，对假阳性和假阴性施加双倍的惩罚，并使用符号函数转换分数。

支持向量机的选择

全部折叠

`“BoxConstraint”`- - - - - -箱约束
1(默认)|积极的标量

箱约束，指定为逗号分隔的对，由“BoxConstraint”一个正的标量。

对于单类学习，软件总是将框约束设置为1．

的关系和算法行为的详细信息BoxConstraint，成本，之前，标准化,权重,请参阅算法．

例子:“BoxConstraint”,100年

数据类型:双|单

`“KernelFunction”`- - - - - -核函数
`“线性”`|`“高斯”`|`“rbf”`|`多项式的`|函数名

核函数用来计算元素的格拉姆矩阵，指定为逗号分隔的对，由“KernelFunction”和一个核函数名。假设G（x_j，x_k)是元素(j，k)，其中x_j和x_k是p表示观察结果的-维向量j和k在X．该表描述了支持的内核函数名称及其函数形式。万博1manbetx

内核函数名称描述公式

内核函数名称	描述	公式
`“高斯”`或`“rbf”`	高斯或径向基函数(RBF)核，默认用于单类学习	$G （ x_{j} ， x_{k} ）＝经验值（ - {为 x_{j} - x_{k} 为}^{2} ）$
`“线性”`	线性内核，默认为两类学习	$G （ x_{j} ， x_{k} ）＝ x_{j} ” x_{k}$
`多项式的`	多项式的内核。使用`“PolynomialOrder”,问`指定一个多项式的有序核`问`．	$G （ x_{j} ， x_{k} ）＝ {（ 1 + x_{j} ” x_{k} ）}^{问}$

“高斯”或“rbf”

高斯或径向基函数(RBF)核，默认用于单类学习

$G （ x_{j} ， x_{k} ）＝经验值（ - {为 x_{j} - x_{k} 为}^{2} ）$

“线性”

线性内核，默认为两类学习

$G （ x_{j} ， x_{k} ）＝ x_{j} ” x_{k}$

多项式的

多项式的内核。使用“PolynomialOrder”,问指定一个多项式的有序核问．

$G （ x_{j} ， x_{k} ）＝ {（ 1 + x_{j} ” x_{k} ）}^{问}$

你可以设置你自己的核函数，例如，内核，通过设置“KernelFunction”、“内核”．的值内核必须有这个表格。

函数G =核(U,V)

地点:

U是一个米——- - - - - -p矩阵。列对应预测变量，行对应观察结果。
V是一个n——- - - - - -p矩阵。列对应预测变量，行对应观察结果。
G是一个米——- - - - - -n格拉姆矩阵一排排的U和V．

kernel.m必须在MATLAB路径上。

避免为内核函数使用泛型名是一个很好的实践。例如，调用sigmoid核函数“mysigmoid”而不是“乙状结肠”．

例子:“KernelFunction”、“高斯”

数据类型:字符|字符串

`“KernelScale”`- - - - - -核尺度参数
`1`(默认)|`“汽车”`|积极的标量

内核比例参数，指定为逗号分隔的对，由“KernelScale”和“汽车”或者一个正的标量。该软件对预测矩阵的所有元素进行除法X的值KernelScale．然后，应用相应的核范数计算Gram矩阵。

如果你指定“汽车”，然后软件采用启发式程序选择一个合适的比例因子。这种启发式过程使用子抽样，因此每次调用的估计值可能不同。因此，为了再现结果，设置一个随机数种子使用rng前培训。
如果你指定KernelScale举个例子，你的核函数，“KernelFunction”、“内核”，那么软件就会抛出一个错误。你必须应用内部缩放内核．

例子:“KernelScale”、“汽车”

数据类型:双|单|字符|字符串

`“PolynomialOrder”`- - - - - -多项式核函数阶
`3.`(默认)|正整数

多项式核函数的顺序，指定为逗号分隔的对，由“PolynomialOrder”一个正整数。

如果你设置“PolynomialOrder”和KernelFunction不是多项式的，那么软件就会抛出一个错误。

例子:“PolynomialOrder”,2

数据类型:双|单

`“KernelOffset”`- - - - - -内核偏移量参数
负的标量

内核偏移量参数，指定为逗号分隔的对，由“KernelOffset”一个非负的标量。

软件增加了KernelOffsetGram矩阵的每个元素。

默认值为:

0如果求解器是SMO(也就是说，您设置“规划求解”、“SMO的）
0．1如果求解器是ISDA(也就是说，您设置“规划求解”、“ISDA的）

例子:“KernelOffset”,0

数据类型:双|单

`“标准化”`- - - - - -标志以标准化预测器数据
`假`(默认)|`真正的`

标志以标准化预测器数据，指定为逗号分隔的对，由“标准化”和真正的（1)或假（0)．

如果你设置“标准化”,真的：

软件中心和缩放每个预测变量(X或资源描述)用相应的加权列均值和标准差表示。有关加权标准化的详细信息，请参见算法．MATLAB没有对为类别预测器生成的虚拟变量列中包含的数据进行标准化。
该软件使用标准化的预测器训练分类器，但将非标准化的预测器作为矩阵或表存储在分类器属性中X．

例子:“标准化”,真的

数据类型:逻辑

`“规划求解”`- - - - - -优化程序
`ISDA的`|`“L1QP”`|`SMO的`

优化例程，指定为逗号分隔的对，由“规划求解”和这个表中的一个值。

价值	描述
`ISDA的`	迭代单数据算法(见[30]）
`“L1QP”`	使用`quadprog`来实现l1 .二次规划的软裕度最小化。此选项需要一个优化工具箱™许可证。有关更多细节，请参见二次规划的定义(优化工具箱)。
`SMO的`	顺序最小优化(参见[17]）

默认值为ISDA的如果你设置“OutlierFraction”以正值为二班学习，和SMO的否则。

例子:“规划求解”、“ISDA的

`“α”`- - - - - -系数的初始估计
非负值的数值向量

系数的初始估计值，用逗号分隔的对表示“α”和非负值的数值向量。的长度α必须等于的行数X．

的每个元素“α”中的一个观察结果X．
“α”不能包含南年代。
如果你指定“α”和交叉验证名值对参数中的任何一个(“CrossVal”，“CVPartition”，“坚持”，“KFold”,或“Leaveout”)，然后软件返回一个错误。

如果Y的所有行，然后删除Y，X,“α”对应于缺失的值。也就是说，输入:

idx = ~isundefined(category (Y));Y = Y(idx，:);X = X(idx，:);Alpha = Alpha (idx);

然后通过Y，X,α分别为响应、预测量和初始估计值。

默认值为:

0.5 * 1(大小(X, 1), 1)单类学习
0(大小(X, 1), 1)对于两类学习

例子:“阿尔法”,0.1 *(大小(X, 1), 1)

数据类型:双|单

`“CacheSize”`- - - - - -缓存大小
`1000`(默认)|`“最大”`|积极的标量

缓存大小，指定为逗号分隔的对，由“CacheSize”和“最大”或者一个正的标量。

如果CacheSize是“最大”，那么软件就会保留足够的内存来保存整个n——- - - - - -n格拉姆矩阵．

如果CacheSize是一个正的标量，那么软件储备呢CacheSize兆字节的内存用于训练模型。

例子:“CacheSize”、“最大”

数据类型:双|单|字符|字符串

`“ClipAlphas”`- - - - - -标记来剪辑alpha系数
`真正的`(默认)|`假`

标记来剪辑alpha系数，指定为逗号分隔的对，由“ClipAlphas”,要么真正的或假．

假设观察的系数j是α_j观察的盒子约束j是C_j，j= 1,…,n,在那里n是训练样本量。

价值	描述
`真正的`	在每次迭代中，如果α_j是接近0还是接近C_j，然后MATLAB集α_j到0或到C_j,分别。
`假`	MATLAB在优化过程中不改变alpha系数。

的最终值α在α属性。

ClipAlphas会影响SMO和ISDA的收敛。

例子:“ClipAlphas”,假的

数据类型:逻辑

`“怒”`- - - - - -ν单类学习参数
`0．5`(默认)|积极的标量

ν参数看到下面成了一个学习，指定为逗号分隔的对，由“怒”一个正的标量。ν必须大于0最多1．

集ν在确保大多数训练样本在正类和最小化得分函数中的权重之间控制权衡。

例子:“怒”,0.25

数据类型:双|单

`“NumPrint”`- - - - - -优化诊断消息输出之间的迭代次数
`1000`(默认)|非负整数

优化诊断消息输出之间的迭代次数，指定为逗号分隔的对，由“NumPrint”和一个非负整数。

如果你指定“详细”,1和NumPrint, NumPrint，则软件将显示来自SMO和ISDA的所有优化诊断信息numprint命令窗口中的迭代。

例子:“NumPrint”,500年

数据类型:双|单

`“OutlierFraction”`- - - - - -训练数据中异常值的预期比例
`0`(默认)|区间[0,1)中的数值标量

训练数据中异常值的期望比例，指定为逗号分隔的对，由“OutlierFraction”和区间[0,1)中的数值标量。

假设你设OutlierFraction, OutlierFraction,在那里outlierfraction大于0的值。

对于两类学习，软件实现强劲的学习．换句话说，该软件试图删除100*outlierfraction优化算法收敛时观测值的%。被删除的观测值对应于量级较大的梯度。
对于单类学习，软件会找到一个合适的偏差项，如outlierfraction训练集中的观察结果都是负的。

例子:“OutlierFraction”,0.01

数据类型:双|单

`“RemoveDuplicates”`- - - - - -标记以用单个观察值替换重复的观察值
`假`(默认)|`真正的`

标记来用训练数据中的单个观察值替换重复的观察值，指定为逗号分隔的对，由“RemoveDuplicates”和真正的或假．

如果RemoveDuplicates是真正的,然后fitcsvm用相同值的单个观察值替换训练数据中的重复观察值。单个观测值的权重等于相应删除的重复数据的权重之和权重)．

提示

如果您的数据集包含许多重复的观察结果，那么指定“RemoveDuplicates”,真的可以大大缩短收敛时间。

数据类型:逻辑

`“详细”`- - - - - -冗长的水平
`0`(默认)|`1`|`2`

冗长级别，指定为逗号分隔的对，由“详细”和0，1,或2．的价值详细的控制软件在命令窗口中显示的优化信息的数量，并将信息作为结构保存到Mdl.ConvergenceInfo.History．

此表总结了可用的冗长级别选项。

价值	描述
`0`	软件不显示和保存收敛信息。
`1`	软件显示诊断信息，并保存每天的收敛条件`numprint`迭代,`numprint`名称-值对参数的值`“NumPrint”`．
`2`	软件在每次迭代时显示诊断信息并保存收敛条件。

例子:“详细”,1

数据类型:双|单

其他分类选择

全部折叠

`“CategoricalPredictors”`- - - - - -分类预测器列表
正整数向量|逻辑向量|字符矩阵|字符串数组|字符向量的单元格数组|`“所有”`

类别预测器列表，指定为逗号分隔的对，由“CategoricalPredictors”和这个表中的一个值。

价值	描述
正整数向量	向量中的每个条目都是一个索引值，对应于预测器数据的列(`X`或`资源描述`)，它包含一个类别变量。
逻辑向量	一个`真正的`条目指预测器数据的对应列(`X`或`资源描述`)是一个类别变量。
字符矩阵	矩阵的每一行都是一个预测变量的名称。中的条目名称必须匹配`PredictorNames`．用额外的空格填充名字，这样字符矩阵的每一行都有相同的长度。
字符向量的字符串数组或单元格数组	数组中的每个元素都是一个预测变量的名称。中的条目名称必须匹配`PredictorNames`．
`“所有”`	所有的预测都是绝对的。

默认情况下，如果预测器数据在表中(资源描述)，fitcsvm如果变量是逻辑向量、分类向量、字符数组、字符串数组或字符向量的单元格数组，则假定该变量是分类的。如果预测器数据是一个矩阵(X)，fitcsvm假设所有的预测器都是连续的。要将任何其他预测器标识为类别预测器，请使用“CategoricalPredictors”名称-值对参数。

对于已识别的类别预测因子，fitcsvm使用两种不同的方案创建虚拟变量，具体取决于类别变量是无序的还是有序的。详情请参见虚拟变量的自动创建．

例子:“CategoricalPredictors”、“所有”

数据类型:单|双|逻辑|字符|字符串|细胞

`“类名”`- - - - - -用于培训的类的名称
分类数组|字符数组|字符串数组|逻辑向量|数值向量|字符向量的单元格数组

用于训练的类名，指定为逗号分隔的对，由“类名”和类别、字符或字符串数组、逻辑或数字向量或字符向量的单元格数组。一会必须具有与?相同的数据类型Y．

如果一会是字符数组，则每个元素必须对应于数组的一行。

使用“类名”:

在培训期间订购课程。
指定与类顺序对应的任何输入或输出参数维度的顺序。例如，使用“类名”指定…尺寸的顺序成本返回的分类分数的列顺序预测．
选择培训类的一个子集。例如，假设所有不同的类名的集合Y是{' a ', ' b ', ' c '}．使用类的观察来训练模型“一个”和“c”只是,指定“类名”,{' a ', ' c '}．

的默认值。一会所有不同的类名的集合是否在Y．

例子:“类名”,{' b ', ' g '}

数据类型:分类|字符|字符串|逻辑|单|双|细胞

`“成本”`- - - - - -误分类代价
方阵|结构数组

错误分类代价指定为逗号分隔的对，由“成本”和一个方阵或结构数组。

如果你指定了方阵成本观察的真正类别是我,然后成本(i, j)将一个点分类到类的成本是多少j．也就是说，行对应真正的类，列对应预测的类。的相应行和列的类顺序成本，也指定一会名称-值对参数。
如果指定了结构年代，那么它必须有两个字段:
- S.ClassNames，其中将类名作为数据类型与Y
- S.ClassificationCosts，其中包含成本矩阵，其行和列的顺序为S.ClassNames

对于两类学习，如果你指定了一个成本矩阵，那么软件通过合并成本矩阵中描述的惩罚来更新先验概率。因此，成本矩阵重置为默认值。的关系和算法行为的详细信息BoxConstraint，成本，之前，标准化,权重,请参阅算法．

默认值为:

成本= 0单类学习
成本(i,j) = 1如果I ~= j和成本(i,j) = 0如果I = j对于两类学习

例子:“成本”,(0,1,2,0)

数据类型:双|单|结构体

`“PredictorNames”`- - - - - -预测器变量名
唯一名称的字符串数组|唯一字符向量的单元格数组

预测器变量名，指定为逗号分隔的一对，由“PredictorNames”和唯一名称的字符串数组或唯一字符向量的单元格数组。的功能“PredictorNames”这取决于你提供训练数据的方式。

如果你提供X和Y，然后你可以使用“PredictorNames”给出预测变量X的名字。
- 名字的顺序PredictorNames的列顺序必须对应X．也就是说,PredictorNames {1}是X (: 1)，PredictorNames {2}是X (:, 2)，等等。同时,大小(X, 2)和元素个数(PredictorNames)必须是平等的。
- 默认情况下,PredictorNames是{x1, x2,…}．
如果你提供资源描述，然后你可以使用“PredictorNames”选择在训练中使用的预测变量。也就是说,fitcsvm中的预测变量PredictorNames训练中的响应变量。
- PredictorNames的子集Tbl.Properties.VariableNames和不能包含响应变量的名称。
- 默认情况下,PredictorNames包含所有预测变量的名称。
- 一个好的实践是使用任意一种方法指定训练的预测器“PredictorNames”或公式只有。

例子:PredictorNames,{‘SepalLength’,‘SepalWidth’,‘PetalLength’,‘PetalWidth}

数据类型:字符串|细胞

`“之前”`- - - - - -先验概率
`“经验”`(默认)|`“统一”`|数值向量|结构数组

每个类的先验概率，指定为逗号分隔的对，由“之前”和这个表中的一个值。

价值	描述
`“经验”`	类的先验概率是类的相对频率`Y`．
`“统一”`	所有类的先验概率都等于1/K,在那里K是类的数量。
数值向量	向量中的每个元素都是一个类先验概率。对元素进行排序`Mdl。ClassNames`方法指定顺序`一会`名称-值对参数。软件对求和的元素进行规范化`1`．
结构	一个结构`年代`有两个字段: `S.ClassNames`作为类型相同的变量包含类名`Y`． `S.ClassProbs`包含相应先验概率的向量。软件对要求和的向量的元素进行归一化`1`．

对于两类学习，如果你指定了一个成本矩阵，那么软件通过合并成本矩阵中描述的惩罚来更新先验概率。的关系和算法行为的详细信息BoxConstraint，成本，之前，标准化,权重,请参阅算法．

例子:结构(“类名”,{{setosa,杂色的,‘virginica}}, ClassProbs, 1:3)

数据类型:字符|字符串|双|单|结构体

`“ResponseName”`- - - - - -响应变量名
`“Y”`(默认)|特征向量|字符串标量

响应变量名，指定为逗号分隔的对“ResponseName”和字符向量或字符串标量。

如果你提供Y，然后你可以使用“ResponseName”为响应变量指定名称。
如果你提供ResponseVarName或公式，那么你就不能使用“ResponseName”．

例子:“ResponseName”、“响应”

数据类型:字符|字符串

`“ScoreTransform”`- - - - - -分数转换
`“没有”`(默认)|`“doublelogit”`|`“invlogit”`|`“ismax”`|`分对数的`|函数处理|……

分数转换，指定为逗号分隔的对组成“ScoreTransform”和字符向量、字符串标量或函数句柄。

这个表总结了可用的字符向量和字符串标量。

价值	描述
`“doublelogit”`	1 / (1 +e^2x）
`“invlogit”`	日志(x/ (1 -x）)
`“ismax”`	将分数最大的类的分数设置为1，并将所有其他类的分数设置为0
`分对数的`	1 / (1 +e^{- - - - - -x}）
`“没有”`或`“身份”`	x(转换)
`“标志”`	1x< 0 为0x= 0 1x> 0
`“对称”`	2x- 1
`“symmetricismax”`	将分数最大的类的分数设置为1，并将所有其他类的分数设置为-1
`“symmetriclogit”`	2 / (1 +e^{- - - - - -x}) - 1

对于MATLAB函数或您定义的函数，使用它的函数句柄进行分数变换。函数句柄必须接受一个矩阵(原始分数)并返回一个相同大小的矩阵(转换后的分数)。

例子:“ScoreTransform”、“分对数的

数据类型:字符|字符串|function_handle

`“重量”`- - - - - -观察权重
数值向量|变量的名称`资源描述`

观察权值，用逗号分隔的对表示“重量”和一个正数值向量或者一个变量的名字资源描述．软件对每一行的观察结果进行加权X或资源描述的对应值权重．的大小权重必须等于中的行数X或资源描述．

如果将输入数据指定为表资源描述,然后权重变量的名称可以在资源描述它包含一个数字向量。在这种情况下，您必须指定权重作为字符向量或字符串标量。例如，如果权重向量W存储为资源描述。W，然后将其指定为' W '．的所有列资源描述,包括W，作为模型训练时的预测变量或响应变量。

默认情况下,权重是(n，1),在那里n观察的数量在吗X或资源描述．

软件规范化权重加起来等于各自类的先验概率的值。的关系和算法行为的详细信息BoxConstraint，成本，之前，标准化,权重,请参阅算法．

数据类型:双|单|字符|字符串

请注意

方法不能使用任何交叉验证名值对参数“OptimizeHyperparameters”名称-值对参数。的交叉验证“OptimizeHyperparameters”只有使用“HyperparameterOptimizationOptions”名称-值对参数。

交叉验证选择

全部折叠

`“CrossVal”`- - - - - -标志来训练交叉验证的分类器
`“关闭”`(默认)|`“上”`

标志来训练交叉验证的分类器，指定为逗号分隔的对，由“Crossval”和“上”或“关闭”．

如果你指定“上”，然后该软件用10次折叠训练交叉验证的分类器。

方法可以覆盖此交叉验证设置CVPartition，坚持，KFold,或Leaveout名称-值对参数。您一次只能使用一个交叉验证名称-值对参数来创建交叉验证模型。

或者，稍后通过传递交叉验证Mdl来crossval．

例子:“Crossval”,“上”

`“CVPartition”`- - - - - -交叉验证分区
`［］`(默认)|`cvpartition`分区对象

交叉验证分区，指定为逗号分隔的对，由“CVPartition”和一个cvpartition创建的分区对象cvpartition．分区对象指定交叉验证的类型以及训练集和验证集的索引。

要创建交叉验证的模型，你只能使用以下四个名称-值对参数中的一个:CVPartition，坚持，KFold,或Leaveout．

例子:假设您创建一个随机分区，对500个观察结果进行5次交叉验证cvp = cvpartition(500，'KFold'，5)．然后，您可以使用指定交叉验证的模型“CVPartition”,本量利．

`“坚持”`- - - - - -保留验证的部分数据
(0,1)范围内的标量值

用于抵制验证的数据的一部分，指定为逗号分隔的对，由“坚持”和(0,1)范围内的标量值。如果你指定‘坚持’,p，然后软件完成以下步骤:

随机选择和保留p * 100%的数据作为验证数据，并使用其余的数据训练模型。
存储紧凑的，训练过的模型训练有素的属性的交叉验证模型。

要创建交叉验证的模型，你只能使用以下四个名称-值对参数中的一个:CVPartition，坚持，KFold,或Leaveout．

例子:“坚持”,0.1

数据类型:双|单

`“KFold”`- - - - - -折叠数
`10`(默认)|大于1的正整数

交叉验证模型中使用的折叠数，指定为逗号分隔的对，由“KFold”和一个大于1的正整数。如果你指定KFold, k，然后软件完成以下步骤:

将数据随机划分为k集。
对于每个集合，保留该集合作为验证数据，并使用另一个集合训练模型k- 1集。
存储k训练有素的小型模型k中的-by-1单元格向量训练有素的属性的交叉验证模型。

要创建交叉验证的模型，你只能使用以下四个名称-值对参数中的一个:CVPartition，坚持，KFold,或Leaveout．

例子:“KFold”,5

数据类型:单|双

`“Leaveout”`- - - - - -保留一个交叉验证标志
`“关闭”`(默认)|`“上”`

省略一个交叉验证标志，指定为逗号分隔的对，由“Leaveout”和“上”或“关闭”．如果你指定“Leaveout”,“上”，那么，对于每一个n观察(n不包括遗漏观测的观测数是否在NumObservations属性)，软件完成以下步骤:

保留观测数据作为验证数据，并使用其他数据训练模型n- 1次观察。
存储n紧凑，训练有素的模型在牢房里n中的-by-1单元格向量训练有素的属性的交叉验证模型。

要创建交叉验证的模型，你只能使用以下四个名称-值对参数中的一个:CVPartition，坚持，KFold,或Leaveout．

例子:“Leaveout”,“上”

收敛控制选项

全部折叠

`“DeltaGradientTolerance”`- - - - - -梯度差公差
负的标量

对顺序最小优化(SMO)或迭代单数据算法(ISDA)得到的上下违例者之间梯度差的容忍度，指定为逗号分隔的对，由“DeltaGradientTolerance”一个非负的标量。

如果DeltaGradientTolerance是0，则软件不使用梯度差的公差来检查优化收敛性。

默认值为:

1 e - 3如果求解器是SMO(例如，您设置“规划求解”、“SMO的）
0如果求解器是ISDA(例如，您设置“规划求解”、“ISDA的）

例子:依照“DeltaGradientTolerance”,1

数据类型:双|单

`“GapTolerance”`- - - - - -可行性间隙公差
`0`(默认)|负的标量

由SMO或ISDA获得的可行性间隙公差，指定为逗号分隔的对，由“GapTolerance”一个非负的标量。

如果GapTolerance是0，则软件不使用可行性间隙容差来检查优化收敛性。

例子:依照“GapTolerance”,1

数据类型:双|单

`“IterationLimit”`- - - - - -数值优化迭代的最大次数
`1 e6`(默认)|正整数

数值优化迭代的最大次数，指定为逗号分隔的对，由“IterationLimit”一个正整数。

无论优化例程是否成功收敛，软件都会返回一个经过训练的模型。Mdl。C在vergenceInfo包含收敛信息。

例子:“IterationLimit”,1 e8

数据类型:双|单

`“KKTTolerance”`- - - - - -Karush-Kuhn-Tucker互补条件违例容忍度
负的标量

Karush-Kuhn-Tucker (KKT)互补条件违例容忍，指定为逗号分隔的对，由“KKTTolerance”一个非负的标量。

如果KKTTolerance是0，则该软件不使用KKT互补条件违例容忍度来检查优化收敛性。

默认值为:

0如果求解器是SMO(例如，您设置“规划求解”、“SMO的）
1 e - 3如果求解器是ISDA(例如，您设置“规划求解”、“ISDA的）

例子:依照“KKTTolerance”,1

数据类型:双|单

`“ShrinkagePeriod”`- - - - - -活动集约简之间的迭代次数
`0`(默认)|非负整数

活动集的约简之间的迭代次数，指定为逗号分隔的对，由“ShrinkagePeriod”和一个非负整数。

如果你设置“ShrinkagePeriod”,0，则软件不收缩活动集。

例子:“ShrinkagePeriod”,1000年

数据类型:双|单

超参数优化选项

全部折叠

`“OptimizeHyperparameters”`- - - - - -待优化参数
`“没有”`(默认)|`“汽车”`|`“所有”`|合格参数名称的字符串数组或单元格数组|向量的`optimizableVariable`对象

参数要优化，指定为逗号分隔的对，由“OptimizeHyperparameters”其中一个价值观是:

“没有”-不要优化。
“汽车”——使用{“BoxConstraint”、“KernelScale”}．
“所有”—优化所有符合条件的参数。
合格参数名称的字符串数组或单元格数组。
向量的optimizableVariable的输出hyperparameters．

优化尝试最小化交叉验证的损失(错误)fitcsvm通过改变参数。有关交叉验证丢失的信息，请参见分类损失．要控制交叉验证类型和优化的其他方面，请使用HyperparameterOptimizationOptions名称-值对参数。

请注意

“OptimizeHyperparameters”值覆盖使用其他名称-值对参数设置的任何值。例如，设置“OptimizeHyperparameters”来“汽车”导致“汽车”要应用的值。

符合条件的参数fitcsvm是:

BoxConstraint- - - - - -fitcsvm在正数值之间搜索，默认情况下按对数缩放范围(1 e - 3, 1 e3)．
KernelScale- - - - - -fitcsvm在正数值之间搜索，默认情况下按对数缩放范围(1 e - 3, 1 e3)．
KernelFunction- - - - - -fitcsvm搜索中“高斯”，“线性”,多项式的．
PolynomialOrder- - - - - -fitcsvm在范围内的整数之间进行搜索(2、4)．
标准化- - - - - -fitcsvm搜索中“真正的”和“假”．

通过传递vector来设置非默认参数optimizableVariable具有非默认值的对象。例如:

负载fisheriris参数=超参数(“fitcsvm”量,物种);参数(1)。Range = [1e-4,1e6];

通过参数个数的价值OptimizeHyperparameters．

默认情况下，迭代显示出现在命令行中，并根据优化中的超参数的数量显示图形。对于优化和绘图，目标函数为Log(1 +交叉验证损失)回归和分类的误分类率。要控制迭代显示，请设置详细的的字段“HyperparameterOptimizationOptions”名称-值对参数。要控制情节，设置ShowPlots的字段“HyperparameterOptimizationOptions”名称-值对参数。

示例请参见优化SVM分类器．

例子:“汽车”

`“HyperparameterOptimizationOptions”`- - - - - -优化选项
结构

选项，指定为逗号分隔的对，由“HyperparameterOptimizationOptions”还有一个结构。的效果OptimizeHyperparameters名称-值对参数。结构中的所有字段都是可选的。

字段名	值	默认的
`优化器`	`“bayesopt”`-使用贝叶斯优化。在内部，这个设置调用`bayesopt`． `“gridsearch”`-使用网格搜索`NumGridDivisions`每个维度的值。 `“randomsearch”`-在其中随机搜索`MaxObjectiveEvaluations`点。 `“gridsearch”`以随机顺序进行搜索，使用统一采样而不从网格中替换。优化后，可以使用该命令获得网格顺序的表`sortrows (Mdl.HyperparameterOptimizationResults)`．	`“bayesopt”`
`AcquisitionFunctionName`	`“expected-improvement-per-second-plus”` `“expected-improvement”` `“expected-improvement-plus”` `“expected-improvement-per-second”` `“lower-confidence-bound”` `“probability-of-improvement”` 获取函数，其名称包括`每秒`不会产生可重复的结果，因为优化依赖于目标函数的运行时间。获取函数，其名称包括`+`当他们过度开发某一区域时，修改他们的行为。有关更多细节，请参见采集功能类型．	`“expected-improvement-per-second-plus”`
`MaxObjectiveEvaluations`	目标函数评价的最大次数。	`30.`为`“bayesopt”`或`“randomsearch”`，和整个网格`“gridsearch”`
`MaxTime`	时间限制，指定为正实数。时间限制以秒为单位，用`抽搐`和`toc`．运行时间可能超过`MaxTime`因为`MaxTime`不会中断函数的计算。	`正`
`NumGridDivisions`	为`“gridsearch”`，表示每个维度的值的个数。该值可以是一个给出每个维度值数量的正整数向量，也可以是一个适用于所有维度的标量。对于类别变量，该字段将被忽略。	`10`
`ShowPlots`	指示是否显示图形的逻辑值。如果`真正的`，该字段根据迭代次数绘制最佳目标函数值。如果有一个或两个优化参数，如果`优化器`是`“bayesopt”`,然后`ShowPlots`并根据参数绘制了目标函数模型。	`真正的`
`SaveIntermediateResults`	指示何时是否保存结果的逻辑值`优化器`是`“bayesopt”`．如果`真正的`，该字段将覆盖名为`“BayesoptResults”`在每次迭代中。变量是a`BayesianOptimization`对象。	`假`
`详细的`	显示到命令行。 `0`-无迭代显示 `1`-迭代显示 `2`-迭代显示额外的信息详细信息请参见`bayesopt详细的`名称-值对参数。	`1`
`UseParallel`	指示是否并行运行贝叶斯优化的逻辑值，这需要并行计算工具箱™。由于并行时序的不可再现性，并行贝叶斯优化不一定产生可再现的结果。详情请参见并行贝叶斯优化．	`假`
`重新分区`	指示是否在每次迭代时重新划分交叉验证的逻辑值。如果`假`，优化器使用单个分区进行优化。 `真正的`通常会给出最健壮的结果，因为该设置考虑了分区噪声。然而，为了得到好的结果，`真正的`需要至少两倍的函数求值。	`假`
使用以下三个字段名称中的一个。
`CVPartition`	一个`cvpartition`对象，如由`cvpartition`．	`“Kfold”,5`如果不指定任何交叉验证字段
`坚持`	范围内的标量`(0,1)`表示抵制分数。
`Kfold`	大于1的整数。

例子:“HyperparameterOptimizationOptions”、结构(MaxObjectiveEvaluations, 60)

数据类型:结构体

输出参数

全部折叠

`Mdl`-训练过的SVM分类模型
`ClassificationSVM`模型对象|`ClassificationPartitionedModel`交叉验证的模型对象

训练过的SVM分类模型，返回为ClassificationSVM模型对象或ClassificationPartitionedModel交叉验证的模型对象。

如果设置任何名称-值对参数KFold，坚持，Leaveout，CrossVal,或CVPartition,然后Mdl是一个ClassificationPartitionedModel旨在分类器。否则,Mdl是一个ClassificationSVM分类器。

的属性来引用Mdl，使用点表示法。例如，输入Mdl。一个lpha在命令窗口中显示训练过的拉格朗日乘子。

限制

fitcsvm训练支持向量机分类器用于单类或两类学习应用。若要使用包含两个以上类的数据训练支持向量机分类器，请使用fitcecoc．
fitcsvm万博1manbetx支持低维和中维数据集。对于高维数据集，使用fitclinear代替。

提示

除非您的数据集很大，否则总是尝试将预测器标准化(参见标准化)．标准化使得预测器对它们所测量的尺度不敏感。
交叉验证是一个很好的实践KFold名称-值对参数。交叉验证结果决定了SVM分类器的泛化程度。
单类学习:
- 名称-值对参数的默认设置α会导致训练时间过长。为了加快训练速度，设置α到一个主要由。组成的向量0年代。
- 设置名称-值对参数ν接近于的值0从而产生更少的支持向量，从而得万博1manbetx到更平滑但粗糙的决策边界。
支持向量的稀疏性是支持向万博1manbetx量机分类器的一个理想属性。若要减少支持向量的数量，请设置万博1manbetxBoxConstraint到一个较大的值。这个操作增加了训练时间。
为最佳训练时间，设置CacheSize尽可能高的内存限制您的计算机允许。
如果您期望的支持向量比训练集中的观察值要少得多，那万博1manbetx么您可以使用名称-值对参数缩小活动集，从而显著加快收敛速度“ShrinkagePeriod”．指定是一个很好的实践“ShrinkagePeriod”,1000年．
远离决策边界的重复观察结果不会影响收敛。然而，只要在决策边界附近出现一些重复的观察结果，就会大大减慢收敛速度。要加快收敛速度，请指定“RemoveDuplicates”,真的如果:
- 你的数据集包含许多重复的观察结果。
- 您怀疑一些重复的观察落在决策边界附近。
为了在训练期间保持原始数据集，fitcsvm必须临时存储不同的数据集:原始数据集和没有重复观测的数据集。因此，如果指定真正的对于包含少量副本的数据集，那么fitcsvm消耗的内存接近原始数据的两倍。
在训练一个模型之后，您可以生成预测新数据标签的C/ c++代码。生成C/ c++代码需要MATLAB编码器™．详情请参见代码生成简介．

算法

支持向量机二元分类算法的数学公式见万博1manbetx二值分类的支持向量机和理解支持向量机万博1manbetx．
南，<定义>，空字符向量(”，空字符串(＂＂),< >失踪值表示缺失值。fitcsvm删除与丢失响应对应的整行数据。在计算总权重时(见下一个项目)，fitcsvm忽略与至少一个缺失预测因子的观察结果相对应的任何权重。在平衡类问题中，这种行为会导致不平衡先验概率。因此，观察箱的约束可能不相等BoxConstraint．
fitcsvm去除权值为零或先验概率为零的观测值。
对于两类学习，如果你指定成本矩阵 $C$ (见成本)，然后软件更新类先验概率p(见之前)p_c通过合并在 $C$ ．
具体地说,fitcsvm完成以下步骤:
1. 计算 $p_{c}^{*} ＝ p ” C ．$
2. 正常化p_c^＊所以更新后的先验概率和为1。
  
  $p_{c} ＝ \frac{1}{\sum_{j ＝ 1}^{K} p_{c ， j}^{*}} p_{c}^{*} ．$
  
  K是类的数量。
3. 重置成本矩阵为默认值
  
  $C ＝［ \begin{matrix} 0 & 1 \\ 1 & 0 \end{matrix} ］．$
4. 从先验概率为零的类对应的训练数据中去除观察值。
对于两类学习，fitcsvm标准化所有的观察权重(参见权重)加起来为1。然后，该函数将归一化的权值重新归一化，使其之和为观测值所属类的更新先验概率。也就是观察的总权重j在课堂上k是

$w_{j}^{*} ＝ \frac{w_{j}}{\sum_{\forall j \in 类 k} w_{j}} p_{c ， k} ．$

w_j归一化权值是否用于观察j；p_c，k是类的更新先验概率吗k(见前面的项目)。
对于两类学习，fitcsvm为训练数据中的每个观察值分配一个框约束。观察框约束的公式j是

$C_{j} ＝ n C_{0} w_{j}^{*} ．$

n是训练样本量，C₀初始框约束(参见“BoxConstraint”名称-值对参数)，和 $w_{j}^{*}$ 观察的总权重是多少j(见前面的项目)。
如果你设置“标准化”,真的和“成本”，“之前”,或“重量”那么，名称-值对参数fitcsvm使用相应的加权平均数和加权标准差对预测因子进行标准化。也就是说,fitcsvm标准化预测j（x_j)使用

$x_{j}^{*} ＝ \frac{x_{j} - μ_{j}^{*}}{σ_{j}^{*}} ．$

$μ_{j}^{*} ＝ \frac{1}{\sum_{k} w_{k}^{*}} \sum_{k} w_{k}^{*} x_{j k} ．$
x_jk是观察k(行)的预测器j(列)。
${（ σ_{j}^{*} ）}^{2} ＝ \frac{v_{1}}{v_{1}^{2} - v_{2}} \sum_{k} w_{k}^{*} {（ x_{j k} - μ_{j}^{*} ）}^{2} ．$
$v_{1} ＝ \sum_{j} w_{j}^{*} ．$
$v_{2} ＝ \sum_{j} {（ w_{j}^{*} ）}^{2} ．$
假设p你在训练数据中期望的异常值的比例，和你设置的异常值的比例OutlierFraction, p．
- 对于单类学习，软件训练偏差项使100p训练数据中%的观察结果为负值。
- 软件实现强劲的学习对于两类学习。换句话说，该软件试图删除100个p优化算法收敛时观测值的%。被删除的观测值对应于量级较大的梯度。
如果你的预测数据包含分类变量，那么软件通常对这些变量使用全虚拟编码。该软件为每个类别变量的每一级创建一个虚拟变量。
- 的PredictorNames属性为每个原始预测器变量名存储一个元素。例如，假设有三个预测器，其中一个是具有三个级别的类别变量。然后PredictorNames是包含预测器变量的原始名称的字符向量的1 × 3单元格数组。
- 的ExpandedPredictorNames属性为每个预测器变量(包括虚拟变量)存储一个元素。例如，假设有三个预测器，其中一个是具有三个级别的类别变量。然后ExpandedPredictorNames是一个1 × 5的字符向量单元格数组，其中包含预测变量和新的虚拟变量的名称。
- 类似地,β属性为每个预测器(包括虚拟变量)存储一个beta系数。
- 的万博1manbetxSupportVectors属性存储支持向量(包括虚拟变量)的预测器值。万博1manbetx例如，假设有米万博1manbetx支持向量和三个预测因子，其中一个是三级分类变量。然后万博1manbetxSupportVectors是一个n5矩阵。
- 的X属性将训练数据作为原始输入存储，不包含虚拟变量。当输入是一个表时，X只包含用作预测器的列。
对于表中指定的预测器，如果任何变量包含有序(序数)类别，则软件对这些变量使用序数编码。
- 对于一个变量k软件会创建有序的关卡k- 1虚拟变量。的j虚变量为1适用于以下级别j,＋1的水平j+ 1通过k．
- 对象中存储的虚拟变量的名称ExpandedPredictorNames属性用值指示第一个级别＋1．软件商店k- 1虚拟变量的其他预测器名称，包括级别2、3、…k．
所有求解器实现l1 .软边际最小化。
对于单类学习，软件估计拉格朗日乘数，α₁、……α_n，以致于

$\sum_{j ＝ 1}^{n} α_{j} ＝ n ν ．$

参考文献

[1] Christianini, N.和J. C. Shawe-Taylor。支持向量机和其他基于核的学习方法简介万博1manbetx．英国剑桥:剑桥大学出版社，2000年。

[2]风扇，r.e。,林志信。和c.j。林。用二阶信息选择工作集来训练支持向量机。万博1manbetx机器学习研究杂志， 2005年第6卷，1889-1918页。

[3]哈斯蒂，T.， R.蒂布希拉尼，J.弗里德曼。统计学习的要素，第二版。纽约:施普林格，2008。

凯克曼V.， t。黄和M.沃格特。从巨大数据集训练核机器的迭代单数据算法:理论和性能。万博1manbetx支持向量机:理论与应用．王立波主编，255-274。柏林:Springer-Verlag, 2005。

[5]肖科普夫，B. J. C.普拉特，J. C.肖-泰勒，A. J.斯莫拉，R. C.威廉姆森。"估计高维分布的支持度"万博1manbetx神经第一版， 2001年第13卷第7期，第1443-1471页。

[6] Scholkopf, B.和A. Smola。用核学习:支持向量机，正则化，优化和超越，自适万博1manbetx应计算和机器学习．马萨诸塞州剑桥:麻省理工学院出版社，2002年。

扩展功能

自动平行支撑万博1manbetx
通过使用并行计算工具箱™自动并行运行计算来加速代码。

若要并行运行，请设置“UseParallel”选项真正的．

要执行并行超参数优化，请使用“HyperparameterOptions”、结构(UseParallel,真的)此函数调用中的名称-值对参数。

有关并行超参数优化的更多信息，请参见并行贝叶斯优化．

有关并行计算的更多一般信息，请参见运行MATLAB函数与自动并行支持万博1manbetx(并行计算工具箱)。

GPU数组
通过使用并行计算工具箱™在图形处理单元(GPU)上运行来加速代码。

使用注意事项和限制:

的“KernelFunction”选项不能指定自定义内核。
的“规划求解”Option可设置为onlySMO的．
的“OutlierFraction”选项不支持。万博1manbetx
的“α”选项必须指定一个可行的起点。
的“OptimizeHyperparameters”选项不支持。万博1manbetx
不支持单类分类。万博1manbetx标签必须包含两个不同的类。

有关更多信息，请参见在图形处理器上运行MATLAB函数(并行计算工具箱)。

另请参阅

fitcsvm

语法

描述

例子

训练支持向量机分类器

训练和交叉验证SVM分类器

使用支持向量机和单类学习检测异常值

利用二值支持向量机寻找多个类边界

优化SVM分类器

输入参数

资源描述- - - - - -样本数据表格

ResponseVarName- - - - - -响应变量名变量的名称资源描述

公式- - - - - -响应变量和预测变量子集的解释模型特征向量|字符串标量

Y- - - - - -类标签分类数组|字符数组|字符串数组|逻辑向量|数值向量|字符向量的单元格数组

X- - - - - -预测数据数值矩阵

名称-值对实参

支持向量机的选择

“BoxConstraint”- - - - - -箱约束1(默认)|积极的标量

“KernelFunction”- - - - - -核函数“线性”|“高斯”|“rbf”|多项式的|函数名

“KernelScale”- - - - - -核尺度参数1(默认)|“汽车”|积极的标量

“PolynomialOrder”- - - - - -多项式核函数阶3.(默认)|正整数

“KernelOffset”- - - - - -内核偏移量参数负的标量

“标准化”- - - - - -标志以标准化预测器数据假(默认)|真正的

“规划求解”- - - - - -优化程序ISDA的|“L1QP”|SMO的

“α”- - - - - -系数的初始估计非负值的数值向量

“CacheSize”- - - - - -缓存大小1000(默认)|“最大”|积极的标量

“ClipAlphas”- - - - - -标记来剪辑alpha系数真正的(默认)|假

“怒”- - - - - -ν单类学习参数0．5(默认)|积极的标量

“NumPrint”- - - - - -优化诊断消息输出之间的迭代次数1000(默认)|非负整数

“OutlierFraction”- - - - - -训练数据中异常值的预期比例0(默认)|区间[0,1)中的数值标量

“RemoveDuplicates”- - - - - -标记以用单个观察值替换重复的观察值假(默认)|真正的

提示

“详细”- - - - - -冗长的水平0(默认)|1|2

其他分类选择

“CategoricalPredictors”- - - - - -分类预测器列表正整数向量|逻辑向量|字符矩阵|字符串数组|字符向量的单元格数组|“所有”

“类名”- - - - - -用于培训的类的名称分类数组|字符数组|字符串数组|逻辑向量|数值向量|字符向量的单元格数组

“成本”- - - - - -误分类代价方阵|结构数组

“PredictorNames”- - - - - -预测器变量名唯一名称的字符串数组|唯一字符向量的单元格数组

“之前”- - - - - -先验概率“经验”(默认)|“统一”|数值向量|结构数组

“ResponseName”- - - - - -响应变量名“Y”(默认)|特征向量|字符串标量

“ScoreTransform”- - - - - -分数转换“没有”(默认)|“doublelogit”|“invlogit”|“ismax”|分对数的|函数处理|……

“重量”- - - - - -观察权重数值向量|变量的名称资源描述

请注意

交叉验证选择

“CrossVal”- - - - - -标志来训练交叉验证的分类器“关闭”(默认)|“上”

“CVPartition”- - - - - -交叉验证分区［］(默认)|cvpartition分区对象

“坚持”- - - - - -保留验证的部分数据(0,1)范围内的标量值

“KFold”- - - - - -折叠数10(默认)|大于1的正整数

“Leaveout”- - - - - -保留一个交叉验证标志“关闭”(默认)|“上”

收敛控制选项

“DeltaGradientTolerance”- - - - - -梯度差公差负的标量

“GapTolerance”- - - - - -可行性间隙公差0(默认)|负的标量

“IterationLimit”- - - - - -数值优化迭代的最大次数1 e6(默认)|正整数

“KKTTolerance”- - - - - -Karush-Kuhn-Tucker互补条件违例容忍度负的标量

“ShrinkagePeriod”- - - - - -活动集约简之间的迭代次数0(默认)|非负整数

超参数优化选项

“OptimizeHyperparameters”- - - - - -待优化参数“没有”(默认)|“汽车”|“所有”|合格参数名称的字符串数组或单元格数组|向量的optimizableVariable对象

请注意

“HyperparameterOptimizationOptions”- - - - - -优化选项结构

输出参数

Mdl-训练过的SVM分类模型ClassificationSVM模型对象|ClassificationPartitionedModel交叉验证的模型对象

限制

更多关于

箱约束

格拉姆矩阵

Karush-Kuhn-Tucker (KKT)互补条件

看到下面成了一个学习

万博1manbetx支持向量

万博1manbetx二值分类的支持向量机

提示

算法

参考文献

扩展功能

自动平行支撑万博1manbetx通过使用并行计算工具箱™自动并行运行计算来加速代码。

GPU数组通过使用并行计算工具箱™在图形处理单元(GPU)上运行来加速代码。

另请参阅

主题

在R2014a中介绍

统计和机器学习工具箱文档

万博1manbetx

`资源描述`- - - - - -样本数据
表格

`ResponseVarName`- - - - - -响应变量名
变量的名称`资源描述`

`公式`- - - - - -响应变量和预测变量子集的解释模型
特征向量|字符串标量

`Y`- - - - - -类标签
分类数组|字符数组|字符串数组|逻辑向量|数值向量|字符向量的单元格数组

`X`- - - - - -预测数据
数值矩阵

`“BoxConstraint”`- - - - - -箱约束
1(默认)|积极的标量

`“KernelFunction”`- - - - - -核函数
`“线性”`|`“高斯”`|`“rbf”`|`多项式的`|函数名

`“KernelScale”`- - - - - -核尺度参数
`1`(默认)|`“汽车”`|积极的标量

`“PolynomialOrder”`- - - - - -多项式核函数阶
`3.`(默认)|正整数

`“KernelOffset”`- - - - - -内核偏移量参数
负的标量

`“标准化”`- - - - - -标志以标准化预测器数据
`假`(默认)|`真正的`

`“规划求解”`- - - - - -优化程序
`ISDA的`|`“L1QP”`|`SMO的`

`“α”`- - - - - -系数的初始估计
非负值的数值向量

`“CacheSize”`- - - - - -缓存大小
`1000`(默认)|`“最大”`|积极的标量

`“ClipAlphas”`- - - - - -标记来剪辑alpha系数
`真正的`(默认)|`假`

`“怒”`- - - - - -ν单类学习参数
`0．5`(默认)|积极的标量

`“NumPrint”`- - - - - -优化诊断消息输出之间的迭代次数
`1000`(默认)|非负整数

`“OutlierFraction”`- - - - - -训练数据中异常值的预期比例
`0`(默认)|区间[0,1)中的数值标量

`“RemoveDuplicates”`- - - - - -标记以用单个观察值替换重复的观察值
`假`(默认)|`真正的`

`“详细”`- - - - - -冗长的水平
`0`(默认)|`1`|`2`

`“CategoricalPredictors”`- - - - - -分类预测器列表
正整数向量|逻辑向量|字符矩阵|字符串数组|字符向量的单元格数组|`“所有”`

`“类名”`- - - - - -用于培训的类的名称
分类数组|字符数组|字符串数组|逻辑向量|数值向量|字符向量的单元格数组

`“成本”`- - - - - -误分类代价
方阵|结构数组

`“PredictorNames”`- - - - - -预测器变量名
唯一名称的字符串数组|唯一字符向量的单元格数组

`“之前”`- - - - - -先验概率
`“经验”`(默认)|`“统一”`|数值向量|结构数组

`“ResponseName”`- - - - - -响应变量名
`“Y”`(默认)|特征向量|字符串标量

`“ScoreTransform”`- - - - - -分数转换
`“没有”`(默认)|`“doublelogit”`|`“invlogit”`|`“ismax”`|`分对数的`|函数处理|……

`“重量”`- - - - - -观察权重
数值向量|变量的名称`资源描述`

`“CrossVal”`- - - - - -标志来训练交叉验证的分类器
`“关闭”`(默认)|`“上”`

`“CVPartition”`- - - - - -交叉验证分区
`［］`(默认)|`cvpartition`分区对象

`“坚持”`- - - - - -保留验证的部分数据
(0,1)范围内的标量值

`“KFold”`- - - - - -折叠数
`10`(默认)|大于1的正整数

`“Leaveout”`- - - - - -保留一个交叉验证标志
`“关闭”`(默认)|`“上”`

`“DeltaGradientTolerance”`- - - - - -梯度差公差
负的标量

`“GapTolerance”`- - - - - -可行性间隙公差
`0`(默认)|负的标量

`“IterationLimit”`- - - - - -数值优化迭代的最大次数
`1 e6`(默认)|正整数

`“KKTTolerance”`- - - - - -Karush-Kuhn-Tucker互补条件违例容忍度
负的标量

`“ShrinkagePeriod”`- - - - - -活动集约简之间的迭代次数
`0`(默认)|非负整数

`“OptimizeHyperparameters”`- - - - - -待优化参数
`“没有”`(默认)|`“汽车”`|`“所有”`|合格参数名称的字符串数组或单元格数组|向量的`optimizableVariable`对象

`“HyperparameterOptimizationOptions”`- - - - - -优化选项
结构

`Mdl`-训练过的SVM分类模型
`ClassificationSVM`模型对象|`ClassificationPartitionedModel`交叉验证的模型对象

自动平行支撑万博1manbetx
通过使用并行计算工具箱™自动并行运行计算来加速代码。

GPU数组
通过使用并行计算工具箱™在图形处理单元(GPU)上运行来加速代码。