ClassificationSVM

1.クラスおよびバイナリ分類用のサポートベクターマシン（支持向量机）

説明

ClassificationSVMは 1.クラスおよび 2.クラス学習用のサポートベクターマシン(SVM)分類器です。学習済みのClassificationSVM分類器には,学習データ,パラメーター値,事前確率,サポートベクターおよびアルゴリズムの実装情報が格納されます。これらの分類器を使用して,スコアから事後確率に変換する関数のあてはめ(fitPosteriorを参照)や新しいデータに対するラベルの予測(预测を参照) などのタスクを実行できます。

作成

ClassificationSVMオブジェクトの作成にはfitcsvmを使用します。

プロパティ

すべて展開する

支持向量机のプロパティ

`α`- - - - - -学習済み分類器の係数
数値ベクトル

このプロパティは読み取り専用です。

学習済み分類器の係数。年代行 1 列の数値ベクトルを指定します。s は学習済み分類器に含まれているサポートベクターの個数 (总和(Mdl.IsS万博1manbetxupportVector))です。

αには,双対問題に対する学習済み分類器の係数,つまり推定したラグランジュ乗数が格納されます。fitcsvmの名前と値のペアの引数RemoveDuplicatesを使用して重複を削除した場合,サポートベクターである重複する観測値の特定の集合に対して,集合全体に対応する1つの係数がαに格納されます。つまり,MATLAB^®は,ある非ゼロ係数を重複集合内の1つの観測値によるものとし,係数0は集合内の他のすべての重複観測値によるものとします。

データ型:单|双

`β`- - - - - -線形予測子の係数
数値ベクトル

このプロパティは読み取り専用です。

線形予測子の係数。数値ベクトルを指定します。βの長さは,モデルの学習に使用する予測子の個数と同じです。

MATLABでは,完全なダミーエンコードを使用して予測子データ内のカテゴリカル変数が拡張されます。つまり,MATLABでは各カテゴリカル変数の各レベルについて1つずつダミー変数が作成されます。βには、ダミー変数を含む各予測子変数について 1.つずつ値が格納されます。たとえば、3.つの予測子があり、そのうちの 1.つは 3.つのレベルがあるカテゴリカル変数である場合、βは5つの値が含まれている数値ベクトルになります。

KernelParameters。函数が“线性”である場合,観測値xの分類スコアは次のようになります。

$f （ x ）＝（ x / 年代） ” β + b ．$

Mdlでは,β,bおよび年代がそれぞれβ、偏见およびKernelParameters。规模プロパティに格納されます。

分類スコアを手動で推定するには,はじめに,学習時に適用したすべての変換を予測子データに適用しなければなりません。具体的には,fitcsvmを使用するときに“标准化”，没错を指定した場合は、平均Mdl.Muと標準偏差Mdl。σを使用して予測子データを手動で標準化してから,結果をMdl.KernelParameters.Scale内のカーネルスケールで除算しなければなりません。

resubPredictや预测など,すべてのSVM関数で,必要な変換の適用は推定の前に行われます。

KernelParameters。函数が“线性”ではない場合,βは空(［］) になります。

データ型:单|双

`偏见`- - - - - -バイアス項
スカラー

このプロパティは読み取り専用です。

バイアス項。スカラーを指定します。

データ型:单|双

`BoxConstraints`- - - - - -ボックス制約
数値ベクトル

このプロパティは読み取り専用です。

ボックス制約。ボックス制約が含まれている N行 1.列の数値ベクトルを指定します。Nは学習データ内の観測値の個数 (NumObservationsプロパティを参照) です。

fitcsvmの名前と値のペアの引数RemoveDuplicatesを使用して重複を削除した場合,重複する観測値の特定の集合に対してMATLABはボックス制約を合計し,この合計が1つの観測値からのものと見なします。MATLABは,0のボックス制約が集合内の他のすべての観測値によるものと見なします。

データ型:单|双

`CacheInfo`- - - - - -キャッシュ情報
構造体配列

このプロパティは読み取り専用です。

キャッシュ情報。構造体配列を指定します。キャッシュ情報には、次の表に記載されているフィールドが含まれます。

フィールド	説明
サイズ	支持向量机分類器に学習をさせるために予約されているキャッシュのサイズ(MB単位)。詳細については,`“CacheSize”`を参照してください。
アルゴリズム	最適化時に使用されるキャッシュアルゴリズム。現在、使用可能なキャッシュアルゴリズムは`队列`のみです。キャッシュアルゴリズムは設定できません。

CacheInfoのフィールドを表示するには,ドット表記を使用します。たとえば,Mdl.CacheInfo.Sizeはキャッシュサイズの値を表示します。

データ型:结构体

`Is万博1manbetxSupportVector`- - - - - -サポートベクターのインジケーター
逻辑ベクトル

このプロパティは読み取り専用です。

サポートベクターのインジケーター。予測子データ行列内の対応する観測値がサポートベクターであるかどうかを示す N行 1.列の必然的ベクトルを指定します。Nは学習データ内の観測値の個数 (NumObservationsを参照) です。

fitcsvmの名前と値のペアの引数RemoveDuplicatesを使用して重複を削除した場合,サポートベクターである重複する観測値の特定の集合に対して,Is万博1manbetxSupportVectorは1つの観測値のみにサポートベクターであるというフラグを設定します。

データ型:逻辑

`KernelParameters`- - - - - -カーネルパラメーター
構造体配列

このプロパティは読み取り専用です。

カーネルパラメーター。構造体配列を指定します。カーネルパラメータープロパティには、次の表に記載されているフィールドが含まれます。

フィールド	説明
関数	グラム行列の要素を計算するために使用するカーネル関数。詳細については,`“KernelFunction”`を参照してください。
スケール	モデルに学習させる予測子データのすべての要素をスケーリングするために使用するカーネルスケールパラメーター。詳細については,`“KernelScale”`を参照してください。

KernelParametersの値を表示するには,ドット表記を使用します。たとえば,Mdl.KernelParameters.Scaleはカーネルスケールパラメーターの値を表示します。

KernelParametersは入力として使用され、値は変更されません。

データ型:结构体

`ν`- - - - - -1クラス学習のパラメーター
正のスカラー

このプロパティは読み取り専用です。

1.クラス学習のパラメーターν。正のスカラーを指定します。

データ型:单|双

`离群分数`- - - - - -外れ値の比率
数値スカラー

このプロパティは読み取り専用です。

学習データに含まれている外れ値の比率。数値スカラーを指定します。

データ型:双

`解算器`- - - - - -最適化ルーチン
`ISDA的`|`“L1QP”`|`SMO的`

このプロパティは読み取り専用です。

支持向量机分類器の学習に使用する最適化ルーチン。ISDA的、“L1QP”,またはSMO的を指定します。詳細については、“解算器”を参照してください。

`万博1manbetx支持向量标签`- - - - - -サポートベクターのクラスラベル
行1列の数値ベクトル

このプロパティは読み取り専用です。

サポートベクターのクラスラベル。s行 1.列の数値ベクトルを指定します。sは学習済み分類器に含まれているサポートベクターの個数 (总和(Mdl.IsS万博1manbetxupportVector))です。

万博1manbetx支持向量标签の+1という値は,対応するサポートベクターが陽性クラス(一会{2})に含まれることを示します。1という値は,対応するサポートベクターが陰性クラス(一会{1})に含まれていることを示します。

fitcsvmの名前と値のペアの引数RemoveDuplicatesを使用して重複を削除した場合,サポートベクターである重複する観測値の特定の集合に対して,万博1manbetx支持向量标签には一意なサポートベクターのラベルが1つ含まれます。

データ型:单|双

`万博1manbetxSupportVectors`- - - - - -サポートベクター
s行 P列の数値行列

このプロパティは読み取り専用です。

学習済み分類器内のサポートベクター。s行p列の数値行列を指定します。年代は学習済み分類器内のサポートベクターの個数 (总和(Mdl.IsS万博1manbetxupportVector)), pは予測子データ内の予測子変数の個数です。

万博1manbetxSupportVectorsには,MATLABでサポートベクターと見なされる予測子データXの行が格納されます。fitcsvmを使用して支持向量机分類器に学習をさせるときに“标准化”，没错を指定した場合,万博1manbetxSupportVectorsには標準化されたXの行が格納されます。

fitcsvmの名前と値のペアの引数RemoveDuplicatesを使用して重複を削除した場合,サポートベクターである重複する観測値の特定の集合に対して,万博1manbetxSupportVectorsには一意なサポートベクターが1つ含まれます。

データ型:单|双

他の分類のプロパティ

`CategoricalPredictors`- - - - - -カテゴリカル予測子のインデックス
正の整数のベクトル|`［］`

このプロパティは読み取り専用です。

カテゴリカル予測子のインデックス。正の整数のベクトルを指定します。CategoricalPredictorsには、カテゴリカル予測子が含まれている予測子データの列に対応するインデックス値を格納します。どの予測子もカテゴリカルではない場合、このプロパティは空 (［］) になります。

データ型:双

`一会`- - - - - -一意のクラスラベル
绝对配列|文字配列|逻辑ベクトル|数値ベクトル|文字ベクトルの细胞配列

このプロパティは読み取り専用です。

学習で使用する一意なクラスラベル。绝对配列、文字配列、逻辑ベクトル、数値ベクトル,または文字ベクトルの细胞配列を指定します。一会のデータ型はクラスラベルYと同じです。(字符串配列は文字ベクトルの细胞配列として扱われます)。一会はクラスの順序も決定します。

データ型:单|双|逻辑|字符|细胞|分类

`成本`- - - - - -誤分類のコスト
数値正方行列

このプロパティは読み取り専用です。

誤分類コスト。数値正方行列を指定します。成本（i，j）は,真のクラスが我である場合に点をクラスjに分類するコストです。

学習時に、コスト行列で表されているペナルティが組み込まれて、事前確率が更新されます。

2クラス学習の成本は、i~=jの場合は成本（i，j）=1、i=jの場合は成本（i，j）=0という形式に必ずなります。行は真のクラスに、列は予測するクラスに対応します。成本の行と列の順序は、一会のクラスの順序に対応します。
1クラス学習では,成本= 0です。

詳細は,アルゴリズムを参照してください。

データ型:双

`ExpandedPredictorNames`- - - - - -展開された予測子名
文字ベクトルの细胞配列

このプロパティは読み取り専用です。

展開された予測子名。文字ベクトルの细胞配列を指定します。

モデルでカテゴリカル変数用にダミー変数のエンコードを使用している場合,ExpandedPredictorNamesには展開された変数を表す名前が含まれます。それ以外の場合,ExpandedPredictorNamesはPredictorNamesと同じです。

データ型:细胞

`梯度`- - - - - -学習データの勾配の値
数値ベクトル

このプロパティは読み取り専用です。

学習データの勾配の値。数値ベクトルを指定します。梯度の長さは,観測値の個数(NumObservations) と同じです。

データ型:单|双

`模型参数`- - - - - -モデルの学習に使用するパラメーター
オブジェクト

このプロパティは読み取り専用です。

ClassificationSVMモデルの学習に使用するパラメーター。オブジェクトを指定します。模型参数には,支持向量机分類器の学習に使用する名前と値のペアの引数の値などのパラメーター値が格納されます。推定したパラメーターは模型参数に格納されません。

模型参数のプロパティにアクセスするには,ドット表記を使用します。たとえば,αを推定するための初期値にアクセスするには,Mdl.ModelParameters.Alphaを使用します。

`μ`- - - - - -予測子の平均
数値ベクトル|`［］`

このプロパティは読み取り専用です。

予測子の平均。数値ベクトルを指定します。fitcsvmを使用して支持向量机分類器に学習をさせるときに“标准化”,1または“标准化”，没错を指定した場合,μの長さは予測子の個数と同じです。

MATLABでは,完全なダミーエンコードを使用して予測子データ内のカテゴリカル変数が拡張されます。つまり,MATLABでは各カテゴリカル変数の各レベルについて1つずつダミー変数が作成されます。μには,ダミー変数を含む各予測子変数について1つずつ値が格納されます。ただし,カテゴリカル変数が含まれている列はMATLABでは標準化されません。

fitcsvmを使用して支持向量机分類器に学習をさせるときに“标准化”,假的を設定した場合,μは空ベクトル (［］)です。

データ型:单|双

`NumObservations`- - - - - -観測値の数
数値スカラー

このプロパティは読み取り専用です。

XおよびYに格納されている学習データ内の観測値の個数。数値スカラーを指定します。

データ型:双

`PredictorNames`- - - - - -予測子変数名
文字ベクトルの细胞配列

このプロパティは読み取り専用です。

予測子変数の名前。文字ベクトルの单间牢房配列を指定します。PredictorNamesの要素の順序は,予測子名が学習データに現れる順序に対応します。

データ型:细胞

`之前`- - - - - -事前確率
数値ベクトル

このプロパティは読み取り専用です。

各クラスの事前確率。数値ベクトルを指定します。之前の要素の順序はMdl。ClassNamesの要素に対応します。

2クラス学習の場合,コスト行列を指定すると,そのコスト行列で指定されているペナルティが組み込まれ,事前確率が更新されます。

詳細は,アルゴリズムを参照してください。

データ型:单|双

`ResponseName`- - - - - -応答変数名
文字ベクトル

このプロパティは読み取り専用です。

応答変数名。文字ベクトルを指定します。

データ型:字符

`RowsUsed`- - - - - -あてはめに使用した行
`［］`|逻辑ベクトル

このプロパティは読み取り専用です。

ClassificationSVMモデルのあてはめに使用した元の学習データの行。逻辑ベクトルを指定します。すべての行を使用した場合、このプロパティは空になります。

データ型:逻辑

`ScoreTransform`- - - - - -スコア変換
文字ベクトル|関数ハンドル

スコア変換。文字ベクトルまたは関数ハンドルを指定します。ScoreTransformは,組み込みの変換関数または予測した分類スコアを変換する関数のハンドルを表します。

スコア変換関数を函数などに変更するには,ドット表記を使用します。

組み込み関数の場合は,文字ベクトルを入力します。

Mdl。ScoreTransform =“函数”;

次の表は,使用可能な組み込み関数の一覧です。

値	説明
`“doublelogit”`	1 / (1 + e^–2倍）
`“invlogit”`	对数（x/（1-x））
`“ismax”`	最大のスコアをもつクラスのスコアを1に設定し,他のすべてのクラスのスコアを0に設定する
`分对数的`	1 / (1 + e^{- x}）
`“没有”`または`“身份”`	x(変換なし)
`“标志”`	x < 0のとき1 x=0のとき 0 x>0のとき 1.
`“对称”`	2 x - 1
`“symmetricismax”`	最大のスコアをもつクラスのスコアを1に設定し,他のすべてのクラスのスコアを1に設定する
`“symmetriclogit”`	2 / (1 + e^{- x}) - 1

MATLAB関数やユーザー定義関数の場合は、関数ハンドルを入力します。
```
Mdl。ScoreTransform = @function;
```
函数は,行列(元のスコア)を受け入れて同じサイズの行列(変換したスコア)を返さなければなりません。

データ型:字符|function_handle

`σ`- - - - - -予測子の標準偏差
`［］`(既定値) |数値ベクトル

このプロパティは読み取り専用です。

予測子の標準偏差。数値ベクトルを指定します。

fitcsvmを使用して支持向量机分類器に学習をさせるときに“标准化”，没错を指定した場合,σの長さは予測子変数の個数と同じです。

MATLABでは,完全なダミーエンコードを使用して予測子データ内のカテゴリカル変数が拡張されます。つまり,MATLABでは各カテゴリカル変数の各レベルについて1つずつダミー変数が作成されます。σには,ダミー変数を含む各予測子変数について1つずつ値が格納されます。ただし,カテゴリカル変数が含まれている列はMATLABでは標準化されません。

fitcsvmを使用して支持向量机分類器に学習をさせるときに“标准化”,假的を設定した場合,σは空ベクトル (［］)です。

データ型:单|双

`W`- - - - - -観測値の重み
数値ベクトル

このプロパティは読み取り専用です。

支持向量机分類器の学習に使用する観測値の重み。n行1列の数値ベクトルを指定します。nは観測値の個数(NumObservationsを参照) です。

fitcsvmは,特定のクラスにおけるWの要素の合計がそのクラスの事前確率になるように,名前と値のペアの引数“重量”で指定された観測値の重みを正規化します。

データ型:单|双

`X`- - - - - -標準化されていない予測子
数値行列|テーブル

このプロパティは読み取り専用です。

支持向量机分類器の学習に使用する,標準化されていない予測子。数値行列またはテーブルを指定します。

Xの各行は1つの観測値に対応し,各列は1つの変数に対応します。

MATLABでは,欠損値が少なくとも1つ含まれている観測値が除外され,対応する要がYから削除されます。

データ型:单|双

`Y`- - - - - -クラスラベル
绝对配列|文字配列|逻辑ベクトル|数値ベクトル|文字ベクトルの细胞配列

このプロパティは読み取り専用です。

支持向量机分類器の学習に使用するクラスラベル。绝对配列、文字配列、逻辑ベクトル、数値ベクトル,または文字ベクトルの细胞配列を指定します。Yのデータ型はfitcsvmの入力引数Yと同じです。(字符串配列は文字ベクトルの细胞配列として扱われます)。

Yの各行は,Xの対応する行の観測された分類を表します。

MATLABでは、欠損値が含まれている要素が除外され、対応する観測値がXから削除されます。

データ型:单|双|逻辑|字符|细胞|分类

収束制御のプロパティ

`ConvergenceInfo`- - - - - -収束情報
構造体配列

このプロパティは読み取り専用です。

収束情報。構造体配列を指定します。

フィールド	説明
`聚合`	アルゴリズムが収束したかどうかを示す論理フラグ (`1`は収束を示す)。
`ReasonForConvergence`	使用する収束検出条件を示す文字ベクトル。
`差距`	双対目的関数と主目的関数の間の実行可能性ギャップを示すスカラー。
`GapTolerance`	実行可能性ギャップの許容誤差を示すスカラー。この許容誤差を、たとえば`1)依照`に設定するには,`fitcsvm`の名前と値のペアの引数`依照“GapTolerance”,1`を使用します。
`DeltaGradient`	スカラーで取得された,上位の違反値と下位の違反値の間の勾配差分
`DeltaGradientTolerance`	上位の違反値と下位の違反値の間の勾配差分に対するスカラーの許容誤差。この許容誤差を,たとえば`1)依照`に設定するには,`fitcsvm`の名前と値のペアの引数`依照“DeltaGradientTolerance”,1`を使用します。
`LargestKKTViolation`	カルーシュ・キューン・タッカー（KKT）違反の最大値を示すスカラー。
`KKTTolerance`	马違反の最大値に対するスカラーの許容誤差。この許容誤差を,たとえば`1 e - 3`に設定するには,`fitcsvm`の名前と値のペアの引数`“KKTTolerance”,1 e - 3`を使用します。
`历史`	設定された最適化反復での収束情報を含む構造体配列。フィールドは次のとおりです。 `NumIterations`:収束情報の記録の対象となる反復インデックスの数値ベクトル `差距`:反復時の`差距`値の数値ベクトル `DeltaGradient`:反復時の`DeltaGradient`値の数値ベクトル `LargestKKTViolation`:反復時の`LargestKKTViolation`値の数値ベクトル `Num万博1manbetxSupportVectors`:反復時のサポートベクターの数を示す数値ベクトル `客观的`:反復時の`客观的`値の数値ベクトル
`客观的`	双対目的関数のスカラー値。

データ型:结构体

`NumIterations`- - - - - -反復回数
正の整数

このプロパティは読み取り専用です。

最適化ルーチンが収束するために必要な反復回数。正の整数を指定します。

反復回数の制限を,たとえば1000に設定するには,fitcsvmを使用して支持向量机分類器に学習をさせるときに“IterationLimit”,1000年を指定します。

データ型:双

`收缩期`- - - - - -アクティブセットの縮小間の反復数
非負の整数

このプロパティは読み取り専用です。

アクティブセットの縮小間の反復回数。非負の整数値を指定します。

縮小期間を,たとえば1000に設定するには,fitcsvmを使用して支持向量机分類器に学習をさせるときに“收缩期”，1000を指定します。

データ型:单|双

ハイパーパラメーター最適化のプロパティ

`HyperparameterOptimizationResults`- - - - - -ハイパーパラメーターの交差検証最適化の説明
`BayesianOptimization`オブジェクト|テーブル

このプロパティは読み取り専用です。

ハイパーパラメーターの交差検証最適化の説明。BayesianOptimizationオブジェクト、またはハイパーパラメーターおよび関連する値が含まれているテーブルを指定します。作成時にfitcsvmの名前と値のペアの引数“优化超参数”が空以外であった場合、このプロパティは空以外になります。HyperparameterOptimizationResultsの値は,次の表で説明されているように,作成時のfitcsvmの構造体HyperparameterOptimizationOptionsにおける优化器フィールドの設定によって変化します。

`优化器`フィールドの値	`HyperparameterOptimizationResults`の値
`“bayesopt”`(既定の設定)	`BayesianOptimization`クラスのオブジェクト
`“网格搜索”`または`“randomsearch”`	使用したハイパーパラメーター,観測された目的関数の値(交差検証損失),および最低(最良)から最高(最悪)までの観測値の順位が格納されているテーブル

オブジェクト関数

`紧凑的`	機械学習モデルのサイズの縮小
`compareHoldout`	新しいデータを使用して 2.つの分類モデルの精度を比較
`crossval`	機械学習モデルの交差検証
`丢弃支持向量万博1manbetx`	線形サポートベクターマシン(SVM)分類器のサポートベクターを破棄
`边`	サポートベクターマシン（支持向量机）分類器の分類エッジを計算
`fitPosterior`	サポートベクターマシン(SVM)分類器の事後確率のあてはめ
`incrementalLearner`	バイナリ分類サポートベクターマシン（支持向量机）モデルのインクリメンタル学習器への変換
`损失`	サポートベクターマシン(SVM)分類器の分類誤差を計算
`保证金`	サポートベクターマシン(SVM)分類器の分類マージンを計算
`partialDependence`	部分従属の計算
`plotPartialDependence`	部分依存プロット(PDP)および個別条件付き期待値(ICE)プロットの作成
`预测`	サポートベクターマシン(SVM)分類器を使用して観測値を分類
`resubEdge`	再代入分類エッジ
`石灰`	本地可解释模型不可知解释(LIME)
`resubLoss`	再代入分類損失
`resubMargin`	再代入分類マージン
`resubPredict`	学習済み分類器を使用した学習データの分類
`的简历`	サポートベクターマシン(SVM)分類器の学習を再開
`沙普利`	シャープレイ値
`testckfold`	交差検証の反復により2つの分類モデルの精度を比較

例

すべて折りたたむ

支持向量机分類器の学習

ライブスクリプトを開く

フィッシャーのアヤメのデータセットを読み込みます。がく片の長さと幅および観測済みのすべての setosa 種のアヤメを削除します。

负载fisheriris第1 = ~ strcmp(物种,“setosa”）;X =量(第1 3:4);y =物种(第1);

処理済みのデータセットを使用して支持向量机分類器に学習させます。

SVMModel = fitcsvm (X, y)

SVMModel = ClassificationSVM ResponseName:‘Y’CategoricalPredictors:[]类名:{“癣”“virginica”}ScoreTransform:“没有一个”NumObservations: 100α:[24 x1双]偏见:-14.4149 KernelParameters: [1 x1 struct] BoxConstraints: x1双[100]ConvergenceInfo: [1 x1 struct] IsSupportVector: x1逻辑[100]解算器:SMO的属性,方法万博1manbetx

SVMModelは学習させたClassificationSVM分類器です。SVMModelのプロパティを表示します。たとえば,クラスの順序を確認するには、ドット表記を使用します。

classOrder=SVMModel.ClassNames

类顺序=2 x1细胞{“癣”}{' virginica '}

最初のクラス (“多色的”) は陰性のクラスで、2.番目のクラス (“virginica”)は陽性のクラスです。“类名”名前と値のペアの引数を使用すると、学習中にクラスの順序を変更できます。

データの散布図をプロットし,サポートベクターを円で囲みます。

sv = SVMModel.万博1manbetxSupportVectors;图gscatter (X (: 1), (:, 2), y)在…上情节(sv (: 1), sv (:, 2),“柯”，“MarkerSize”10)传说(“多色的”，“virginica”，“万博1manbetx支持向量”)举行关

图中包含一个坐标轴。轴线包含3个线型对象。这些对象代表花斑，维珍，支持向量。万博1manbetx

サポートベクターは,推定されたクラス境界の上または外側で発生する観測値です。

名前と値のペアの引数“BoxConstraint”を使用して学習時のボックス制約を設定すると,境界(および結果的にサポートベクターの個数)を調整できます。

支持向量机分類器の学習と交差検証

ライブスクリプトを開く

电离层データセットを読み込みます。

负载电离层

支持向量机分類器の学習と交差検証を行います。予測子データを標準化し,クラスの順序を指定します。

rng (1);%的再现性CVSVMModel = fitcsvm (X, Y,“标准化”符合事实的．..“类名”,{“b”，‘g’}，“克罗斯瓦尔”，“上”）

CVSVMModel=ClassificationPartitionedModel CrossValidatedModel:'SVM'预测名称：{1x34 cell}响应名称：'Y'numobervations:351 KFold:10 Partition:[1x1 cvpartition]类名：{b''g'}ScoreTransform:'none'属性、方法

CVSVMModelはClassificationPartitionedModel交差検証SVM分類器です。既定では10分割交差検証が実行されます。

あるいは,学習済みのClassificationSVM分類器をcrossvalに渡すことにより,この分類器を交差検証できます。

ドット表記を使用して,学習させた分割のいずれかを検査します。

CVSVMModel.Trained{1}

ans = CompactClassificationSVM ResponseName: 'Y' CategoricalPredictors: [] ClassNames: {'b' ' 'g'} ScoreTransform: 'none' Alpha: [78x1 double] Bias: -0.2209 KernelParameters: [1x1 struct] Mu: [1x34 double] Sigma: [1x34 double万博1manbetx] SupportVectors: [78x34 double] SupportVectorLabels: [78x1 double]属性，方法

各分割は、データの 90% で学習済みのCompactClassificationSVM分類器です。

汎化誤差を推定します。

genError = kfoldLoss (CVSVMModel)

genError = 0.1168

平均すると汎化誤差は約12%です。

詳細

すべて展開する

ボックス制約

ボックス制約は,マージンに違反している観測値に課せられる最大ペナルティを制御するパラメーターであり,過適合の防止(正則化)に役立ちます。

ボックス制約の値を大きくすると,支持向量机分類器が割り当てるサポートベクターは少なくなります。ただし,ボックス制約の値を大きくすると,学習時間が長くなる場合があります。

グラム行列

n個のベクトルの組{x₁. . x_n；x_j∊R^p}のグラム行列とは,n行n列の行列で,要素(j, k)はG (x_j，x_k)=<ν（x）_j),ϕ(x_k) >(カーネル関数ϕを使用して変換された予測子の内積)として定義されます。

非線形SVMの場合,予測子データXの行を使用してグラム行列が形成されます。双対形式化によりX内の観測値の内積が,形成されるグラム行列の対応する要素に置き換えられます(“カーネルトリック”と呼ばれます)。この結果,分離超平面を求めるために,変換された予測子空間で非線形SVMが作用します。

カルーシュ・キューン・タッカー相補性条件

马相補性条件は,最適な非線形計画法の解決に必要な最適化制約です。

SVMでは,すべてのj = 1,……nについてKKT 相補性条件は次のようになります。

$｛ \begin{array}{l} α_{j} ［ y_{j} f （ x_{j} ） - 1 + ξ_{j} ］＝ 0 \\ ξ_{j} （ C - α_{j} ）＝ 0 \end{array}$

ここで, $f （ x_{j} ）＝ ϕ （ x_{j} ） ” β + b ，$ であり、ϕ はカーネル関数 (グラム行列を参照)、ξ_jはスラック変数です。クラスが完全に可分な場合、すべての j=1，…，nに対して ξ_j= 0となります。

1.クラス学習

1クラス学習(教師なしSVM)は,(元の予測子空間ではない)高次元予測子空間の原点からデータを分離することを目的としており,外れ値の検出に使用されるアルゴリズムです。

このアルゴリズムはバイナリ分類のSVMのアルゴリズムと類似しています。目的は、 $α_{1} ，．.. ， α_{n}$ に関して次の双対式を最小化することです。

$0．5 \sum_{j k} α_{j} α_{k} G （ x_{j} ， x_{k} ）$

これには,すべてのj = 1,……nについて $0 \leq α_{j} \leq 1$ と次の式を満たすという条件があります。

$\sum α_{j} ＝ n ν$

G (x_j，x_k)の値は,グラム行列の要素（j，k）です。

νの値が小さいとサポートベクターが少なくなるので,判定境界は起伏が少なく柔軟性が低いものとなります。νの値が大きいとサポートベクターが多くなるので,判定境界は起伏が多く柔軟性が高いものとなります。νの最適値は,データの複雑さを取り込めるだけの大きさがあり,過学習が発生しない程度に小さい値です。また0 <ν≤1です。

詳細は,[5]を参照してください。

サポートベクター

サポートベクターは,α₁,…,α_nの厳密に正の推定値に対応する観測値です。

特定の学習セットに対して生成されるサポートベクターが少ないSVM分類器の方が推奨されます。

バイナリ分類のサポートベクターマシン

SVMバイナリ分類アルゴリズムでは,データを2つのクラスに分離する最適超平面が検索されます。クラスが可分な場合,最適超平面は周囲の"マージン"(観測値がない領域) を最大化します。これにより、陽性のクラスと陰性のクラスの境界が作成されます。クラスが不可分な場合でも目的は同じですが、クラスの境界の誤った側にあるすべての観測のマージンの長さに対し、アルゴリズムによりペナルティが課されます。

線形SVMスコア関数は次のようになります。

$f （ x ）＝ x ” β + b ，$

ここで

xは観測値です(Xの行に対応します)。
ベクトル β には超平面に直交するベクトルを定義する係数 (Mdl。βに対応)が含まれています。可分データの場合,最適なマージンの長さは $2 / 为 β 为．$ です。
bは(偏误に対応する)バイアス項です。

特定の係数に対する f（x）の根により超平面が定義されます。特定の超平面について、f（z）は点 Zから超平面までの距離です。

このアルゴリズムでは、陽性（y=1）のクラスと陰性（y=-1）のクラスを分離したままマージンの最大長を求めます。

可分クラスの場合,目的はβおよびbに関して $为 β 为$ を最小化することです。これには,すべてのj = 1, . .nについてy_jf（x）_j)≥1という条件があります。これが可分クラスの"主"問題の定式化です。
不可分クラスの場合,このアルゴリズムではスラック変数(ξ_j)を使用して,クラスのマージン境界を超える観測値の目的関数にペナルティを課します。クラスのマージン境界を超えない観測値ではξ_j= 0であり,そうでない場合はξ_j≥ 0です。
目的は,β,bおよびξ_jに関して $0．5 {为 β 为}^{2} + C \sum ξ_{j}$ を最小化することです。これには,すべてのj = 1, . .nおよび正のスカラーボックス制約Cについて $y_{j} f （ x_{j} ） \geq 1 - ξ_{j}$ および $ξ_{j} \geq 0$ という条件があります。これは不可分クラスの主問題の定式化です。

このアルゴリズムでは、ラグランジュ乗数法を使用して目的関数を最適化します。これにより、(Mdl。αに対応する)n個の係数α₁,…,α_nが導入されます。線形SVMの双対形式化は次のようになります。

可分クラスの場合、α₁,…,α_nに関して次の式を最小化します。

$0．5 \sum_{j ＝ 1}^{n} \sum_{k ＝ 1}^{n} α_{j} α_{k} y_{j} y_{k} x_{j} ” x_{k} - \sum_{j ＝ 1}^{n} α_{j}$

これには,すべてのj = 1,……nについて $\sum α_{j} y_{j} ＝ 0$ , α_j≥0という条件とカルーシュ・キューン・タッカー（KKT）相補性条件が適用されます。
不可分クラスの場合,目的関数は可分クラスの場合と同じですが,すべてのj = 1, . .nについて $0 \leq α_{j} \leq C$ という条件が加わります。

生成されるスコア関数は次のようになります。

$\overset{＾}{f} （ x ）＝ \sum_{j ＝ 1}^{n} {\overset{＾}{α}}_{j} y_{j} x ” x_{j} + \overset{＾}{b} ．$

$\overset{＾}{b}$ はバイアスの推定値, ${\overset{＾}{α}}_{j}$ はベクトル $\overset{＾}{α}$ の J番目の推定値です（j=1，…，n）このように記述すると、主問題を定式化した結果、スコア関数は β の推定値の影響を受けなくなります。

SVMアルゴリズムでは, $签名（ \overset{＾}{f} （ z ））．$ を使用して新しい観測値 Zを分類します。

場合によっては,非線形境界によってクラスが分離されます。“非線形SVM”は変換済み予測子空間で,最適な分離超平面を検索します。

非線形支持向量机の双対問題は、α₁,…,α_nに関して次のように定式化されます。

$0．5 \sum_{j ＝ 1}^{n} \sum_{k ＝ 1}^{n} α_{j} α_{k} y_{j} y_{k} G （ x_{j} ， x_{k} ） - \sum_{j ＝ 1}^{n} α_{j}$

これには,すべてのj = 1, . .nについて $\sum α_{j} y_{j} ＝ 0$ ， $0 \leq α_{j} \leq C$ という条件と KKT相補性条件が適用されます。G（x）_k，x_j)はグラム行列の要素です。生成されるスコア関数は次のようになります。

$\overset{＾}{f} （ x ）＝ \sum_{j ＝ 1}^{n} {\overset{＾}{α}}_{j} y_{j} G （ x ， x_{j} ） + \overset{＾}{b} ．$

詳細は,サポートベクターマシンについて、［1］および[3]を参照してください。

アルゴリズム

SVMバイナリ分類アルゴリズムの数学的定式化については,バイナリ分類のサポートベクターマシンとサポートベクターマシンについてを参照してください。
南、<定义>、空の文字ベクトル ('')、空の串(""),および< >失踪値は,欠損値を示します。fitcsvmは、欠損応答に対応するデータ行全体を削除します。fitcsvmは、重みの合計を計算するときに (以下の項目を参照)、欠損している予測子が 1.つ以上ある観測値に対応する重みを無視します。これにより、平衡なクラスの問題で不平衡な事前確率が発生する可能性があります。したがって、観測値のボックス制約がBoxConstraintに等しくならない可能性があります。
fitcsvmは,重みまたは事前確率がゼロの観測値を削除します。
2クラス学習でコスト行列 $C$ （成本を参照)を指定した場合, $C$ で表されているペナルティを組み込むことにより、クラスの事前確率 p(之前を参照)がp_cに更新されます。
具体的には,fitcsvmは以下のステップを完了します。
1. $p_{c}^{*} ＝ p ” C ．$ を計算します。
2. 更新された事前確率の合計が1になるようにp_c^＊を正規化します。
  
  $p_{c} ＝ \frac{1}{\sum_{j ＝ 1}^{K} p_{c ， j}^{*}} p_{c}^{*} ．$
  
  Kはクラスの個数です。
3. コスト行列を既定値にリセットします。
  
  $C ＝［ \begin{matrix} 0 & 1 \\ 1 & 0 \end{matrix} ］．$
4. 事前確率がゼロのクラスに対応する観測値を学習データから削除します。
2クラス学習の場合,fitcsvmは合計が 1.になるようにすべての観測値の重み (权重を参照) を正規化します。その後、観測値が属しているクラスの更新後の事前確率に重みの合計が等しくなるように、正規化された重みを再度正規化します。つまり、クラス Kの観測値 Jについて、重みの合計は次のようになります。

$w_{j}^{*} ＝ \frac{w_{j}}{\sum_{\forall j \in 类 k} w_{j}} p_{c ， k} ．$

ここで,w_jは観測値jの正規化された重み,p_{c k}はクラスkの更新された事前確率(前の項目を参照)です。
2クラス学習の場合,fitcsvmは学習データの各観測値にボックス制約を割り当てます。観測値jのボックス制約の式は,次のようになります。

$C_{j} ＝ n C_{0} w_{j}^{*} ．$

ここでnは学習標本のサイズ,C₀は初期のボックス制約 (名前と値のペアの引数“BoxConstraint”を参照), $w_{j}^{*}$ は観測値jの重みの合計(前の項目を参照)です。
“标准化”，没错と訛れと値のペアの引数“成本”、“之前”または“重量”を設定した場合,fitcsvmは対応する加重平均および加重標準偏差を使用して予測子を標準化します。つまり,fitcsvmは以下を使用して予測子 j（x）_j)を標準化します。

$x_{j}^{*} ＝ \frac{x_{j} - μ_{j}^{*}}{σ_{j}^{*}} ．$

$μ_{j}^{*} ＝ \frac{1}{\sum_{k} w_{k}^{*}} \sum_{k} w_{k}^{*} x_{j k} ．$
x_jkは,予測子j(列)の観測値k(行)です。
${（ σ_{j}^{*} ）}^{2} ＝ \frac{v_{1}}{v_{1}^{2} - v_{2}} \sum_{k} w_{k}^{*} {（ x_{j k} - μ_{j}^{*} ）}^{2} ．$
$v_{1} ＝ \sum_{j} w_{j}^{*} ．$
$v_{2} ＝ \sum_{j} {（ w_{j}^{*} ）}^{2} ．$
pは学習データで予期される外れ値の比率であり,“离群分数”，pを設定したと仮定します。
- 1クラス学習では,バイアス項の学習により,学習データの観測値のうち100p% が負のスコアをもつようになります。
- 2.クラス学習では"ロバスト学習"が行われます。この方式では,最適化アルゴリズムが収束すると,観測値のうち100p%の削除が試行されます。削除された観測値は,勾配の大きいものに対応します。
予測子データにカテゴリカル変数が含まれている場合,一般にこれらの変数について完全なダミーエンコードが使用されます。各カテゴリカル変数の各レベルについて,1つずつダミー変数が作成されます。
- PredictorNamesプロパティには、元の予測子変数名のそれぞれについて 1.つずつ要素が格納されます。たとえば、3.つの予測子があり、そのうちの 1.つは 3.つのレベルがあるカテゴリカル変数であるとします。この場合、PredictorNamesは元の予測子変数名が含まれている1行3列の文字ベクトルの细胞配列になります。
- ExpandedPredictorNamesプロパティには,ダミー変数を含む予測子変数のそれぞれについて1つずつ要素が格納されます。たとえば,3 つの予測子があり、そのうちの 1 つは 3 つのレベルがあるカテゴリカル変数であるとします。この場合、ExpandedPredictorNamesは予測子変数および新しいダミー変数の名前が含まれている 1.行 5.列の文字ベクトルの单间牢房配列になります。
- 同様に,βプロパティには,ダミー変数を含む各予測子について1つずつベータ係数が格納されます。
- 万博1manbetxSupportVectorsプロパティには,ダミー変数を含むサポートベクターの予測子の値が格納されます。たとえば,m 個のサポートベクターと 3 つの予測子があり、そのうちの 1 つは 3 つのレベルがあるカテゴリカル変数であるとします。この場合、万博1manbetxSupportVectorsは N行 5.列の行列になります。
- Xプロパティには,はじめに入力されたときの状態で学習データが格納され,ダミー変数は含まれません。入力がテーブルの場合,Xには予測子として使用した列のみが格納されます。
テーブルで予測子を指定した場合,いずれかの変数に順序付きのカテゴリが含まれていると,これらの変数について順序付きエンコードが使用されます。
- K個の順序付きレベルが変数に含まれている場合、k-1個のダミー変数が作成されます。j番目のダミー変数は、j までのレベルについては1、j + 1からkまでのレベルについては+1になります。
- ExpandedPredictorNamesプロパティに格納されるダミー変数の名前は1番目のレベルを示し,値は+1になります。レベル 2，3，…，kの名前を含むk-1個の追加予測子名がダミー変数について格納されます。
どのソルバーも L1ソフトマージン最小化を実装します。
1クラス学習の場合,次の条件を満たすラグランジュ乗数α₁,…,α_nが推定されます。

$\sum_{j ＝ 1}^{n} α_{j} ＝ n ν ．$

参照

[1] 《统计学习的要素》，第二版。纽约：斯普林格，2008。

Scholkopf, B.， J. C. Platt, J. C. shaw - taylor, A. J. Smola, R. C. Williamson。"估算高维分布的支持度"万博1manbetx神经第一版。，Vol. 13, Number 7, 2001, pp. 1443–1471.

克里斯汀尼尼，N。c。肖-泰勒。支持向量机和其他基于核的学习方法简介。万博1manbetx英国剑桥:剑桥大学出版社，2000年。

[4] Scholkopf, B.和A. Smola。核学习:支持向量机，正则化，优化和超越，自适应万博1manbetx计算和机器学习。麻省理工学院出版社，2002年。

拡張機能

C / c++コード生成
MATLAB®编码器™を使用してCおよびc++コードを生成します。

使用上の注意事項および制限事項:

詳細は,コード生成の紹介を参照してください。

参考

fitcsvm|CompactClassificationSVM|ClassificationPartitionedModel

トピック

R2014aで導入

ClassificationSVM

説明

作成

プロパティ

支持向量机のプロパティ

α- - - - - -学習済み分類器の係数数値ベクトル

β- - - - - -線形予測子の係数数値ベクトル

偏见- - - - - -バイアス項スカラー

BoxConstraints- - - - - -ボックス制約数値ベクトル

CacheInfo- - - - - -キャッシュ情報構造体配列

Is万博1manbetxSupportVector- - - - - -サポートベクターのインジケーター逻辑ベクトル

KernelParameters- - - - - -カーネル パラメーター構造体配列

ν- - - - - -1クラス学習のパラメーター正のスカラー

离群分数- - - - - -外れ値の比率数値スカラー

解算器- - - - - -最適化ルーチンISDA的|“L1QP”|SMO的

万博1manbetx支持向量标签- - - - - -サポートベクターのクラスラベル行1列の数値ベクトル

万博1manbetxSupportVectors- - - - - -サポート ベクターs行 P列の数値行列

他の分類のプロパティ

CategoricalPredictors- - - - - -カテゴリカル予測子のインデックス正の整数のベクトル|［］

一会- - - - - -一意のクラスラベル绝对配列|文字配列|逻辑ベクトル|数値ベクトル|文字ベクトルの细胞配列

成本- - - - - -誤分類のコスト数値正方行列

ExpandedPredictorNames- - - - - -展開された予測子名文字ベクトルの细胞配列

梯度- - - - - -学習データの勾配の値数値ベクトル

模型参数- - - - - -モデルの学習に使用するパラメーターオブジェクト

μ- - - - - -予測子の平均数値ベクトル|［］

NumObservations- - - - - -観測値の数数値スカラー

PredictorNames- - - - - -予測子変数名文字ベクトルの细胞配列

之前- - - - - -事前確率数値ベクトル

ResponseName- - - - - -応答変数名文字ベクトル

RowsUsed- - - - - -あてはめに使用した行［］|逻辑ベクトル

ScoreTransform- - - - - -スコア変換文字ベクトル|関数ハンドル

σ- - - - - -予測子の標準偏差［］(既定値) |数値ベクトル

W- - - - - -観測値の重み数値ベクトル

X- - - - - -標準化されていない予測子数値行列|テーブル

Y- - - - - -クラスラベル绝对配列|文字配列|逻辑ベクトル|数値ベクトル|文字ベクトルの细胞配列

収束制御のプロパティ

ConvergenceInfo- - - - - -収束情報構造体配列

NumIterations- - - - - -反復回数正の整数

收缩期- - - - - -アクティブセットの縮小間の反復数非負の整数

ハイパーパラメーター最適化のプロパティ

HyperparameterOptimizationResults- - - - - -ハイパーパラメーターの交差検証最適化の説明BayesianOptimizationオブジェクト|テーブル

オブジェクト関数

例

支持向量机分類器の学習

支持向量机分類器の学習と交差検証

詳細

ボックス制約

グラム行列

カルーシュ・キューン・タッカー相補性条件

1.クラス学習

サポート ベクター

バイナリ分類のサポートベクターマシン

アルゴリズム

参照

拡張機能

C / c++コード生成MATLAB®编码器™を使用してCおよびc++コードを生成します。

参考

トピック

统计和机器学习工具箱ドキュメンテーション

サポート

機械学習をマスターする: MATLABステップ・バイ・ステップ ガイド

`α`- - - - - -学習済み分類器の係数
数値ベクトル

`β`- - - - - -線形予測子の係数
数値ベクトル

`偏见`- - - - - -バイアス項
スカラー

`BoxConstraints`- - - - - -ボックス制約
数値ベクトル

`CacheInfo`- - - - - -キャッシュ情報
構造体配列

`Is万博1manbetxSupportVector`- - - - - -サポートベクターのインジケーター
逻辑ベクトル

`KernelParameters`- - - - - -カーネルパラメーター
構造体配列

`ν`- - - - - -1クラス学習のパラメーター
正のスカラー

`离群分数`- - - - - -外れ値の比率
数値スカラー

`解算器`- - - - - -最適化ルーチン
`ISDA的`|`“L1QP”`|`SMO的`

`万博1manbetx支持向量标签`- - - - - -サポートベクターのクラスラベル
行1列の数値ベクトル

`万博1manbetxSupportVectors`- - - - - -サポートベクター
s行 P列の数値行列

`CategoricalPredictors`- - - - - -カテゴリカル予測子のインデックス
正の整数のベクトル|`［］`

`一会`- - - - - -一意のクラスラベル
绝对配列|文字配列|逻辑ベクトル|数値ベクトル|文字ベクトルの细胞配列

`成本`- - - - - -誤分類のコスト
数値正方行列

`ExpandedPredictorNames`- - - - - -展開された予測子名
文字ベクトルの细胞配列

`梯度`- - - - - -学習データの勾配の値
数値ベクトル

`模型参数`- - - - - -モデルの学習に使用するパラメーター
オブジェクト

`μ`- - - - - -予測子の平均
数値ベクトル|`［］`

`NumObservations`- - - - - -観測値の数
数値スカラー

`PredictorNames`- - - - - -予測子変数名
文字ベクトルの细胞配列

`之前`- - - - - -事前確率
数値ベクトル

`ResponseName`- - - - - -応答変数名
文字ベクトル

`RowsUsed`- - - - - -あてはめに使用した行
`［］`|逻辑ベクトル

`ScoreTransform`- - - - - -スコア変換
文字ベクトル|関数ハンドル

`σ`- - - - - -予測子の標準偏差
`［］`(既定値) |数値ベクトル

`W`- - - - - -観測値の重み
数値ベクトル

`X`- - - - - -標準化されていない予測子
数値行列|テーブル

`Y`- - - - - -クラスラベル
绝对配列|文字配列|逻辑ベクトル|数値ベクトル|文字ベクトルの细胞配列

`ConvergenceInfo`- - - - - -収束情報
構造体配列

`NumIterations`- - - - - -反復回数
正の整数

`收缩期`- - - - - -アクティブセットの縮小間の反復数
非負の整数

`HyperparameterOptimizationResults`- - - - - -ハイパーパラメーターの交差検証最適化の説明
`BayesianOptimization`オブジェクト|テーブル

サポートベクター

C / c++コード生成
MATLAB®编码器™を使用してCおよびc++コードを生成します。

機械学習をマスターする: MATLABステップ・バイ・ステップガイド