紧凑分类

サポートベクターマシン(SVM)などの分類器用のコンパクトなマルチクラスモデル

説明

紧凑分类は,コンパクトなバージョンのマルチクラス誤り訂正出力符号(ECOC)モデルです。コンパクトな分類器には,マルチクラスECOCモデルの学習に使用したデータが格納されません。このため,コンパクトな分類器を使用しても,交差検証など一部のタスクは実行できません。コンパクトなマルチクラスECOCモデルは,新しいデータの分類(预测) などのタスクに使用します。

作成

紧凑分类モデルは 2.つの方法で作成できます。

オブジェクト関数紧凑的を使用して、学習済みの分类モデルからコンパクトなECOCモデルを作成する。
関数fitcecocを使用し、名前と値のペアの引数“学习者”として“线性”、“内核”、templateLinearオブジェクト,模板核オブジェクト,またはこれらのオブジェクトの细胞配列を指定して,コンパクトなECOCモデルを作成する。

プロパティ

すべて展開する

紧凑分类モデルオブジェクトを作成した後で,ドット表記を使用してプロパティにアクセスできます。たとえば,经济合作分類器の学習と交差検証を参照してください。

经济合作のプロパティ

`二元收入者`—学習済みバイナリ学習器
モデルオブジェクトの细胞ベクトル

学習済みバイナリ学習器。モデルオブジェクトの细胞ベクトルを指定します。バイナリ学習器の個数は,Y内のクラス数と符号化設計によって異なります。

BinaryLearner {j}の学習は、编码矩阵（：，j）によって指定されるバイナリ問題に従って行われます。たとえば,SVM 学習器を使用したマルチクラス学習では、二元收入者の各要素はCompactClassificationSVM分類器です。

データ型:单间牢房

`双星`—バイナリ学習器損失関数
`“偏差”`|`“指数”`|`“哈明”`|`“枢纽”`|`“线性”`|`“罗吉特”`|`“二次”`

バイナリ学習器の損失関数。損失関数名を表す文字ベクトルを指定します。

異なる損失関数を使用するバイナリ学習器によって学習させる場合,双星は“哈明”に設定されます。精度が向上する可能性を高めるには,预测または损失の名前と値のペアの引数“BinaryLoss”を使用して予測または損失を計算するときに、既定以外のバイナリ損失関数を指定します。

データ型:字符

`编码矩阵`—クラス割り当て符号
数値行列

バイナリ学習器のクラス割り当て符号。数値行列を指定します。编码矩阵は K行 L列の行列で、Kはクラスの個数、Lはバイナリ学習器の個数です。

编码矩阵の要素は1、0または1.であり,値は二分法によるクラス割り当てに対応します。次の表に,学習器Jがクラス我の観測値を编码矩阵（i，j）の値に対応する二分クラスに割り当てる方法を示します。

値	二分法によるクラス割り当て
`1`	学習器`J`は,クラス`我`の観測値を陰性クラスに割り当てます。
`0`	学習の前に、学習器`J`はクラス`我`の観測値をデータセットから削除します。
`1.`	学習器`J`は,クラス`我`の観測値を陽性クラスに割り当てます。

データ型:双|单|int8|int16|int32|int64

`学习者重量`—バイナリ学習器の重み
数値行ベクトル

バイナリ学習器の重み。数値行ベクトルを指定します。学习者重量の長さは、バイナリ学習器の個数 (长度（Mdl.BinaryLearners）) と同じです。

LearnerWeights (j)は、分類器に学習をさせるためにバイナリ学習器Jが使用する観測値の重みの合計です。

学习者重量を使用し、カルバック・ライブラーダイバージェンスの最小化により事後確率をあてはめます。事後確率の推定に二次計画法を使用する場合、学习者重量は無視されます。

データ型:双|单

他の分類のプロパティ

`CategoricalPredictors`—カテゴリカル予測子のインデックス
正の整数のベクトル|`［］`

カテゴリカル予測子のインデックス。正の整数のベクトルとして指定します。予測子データの行に観測値が含まれていると仮定すると、CategoricalPredictorsには,カテゴリカル予測子が含まれている予測子データの列に対応するインデックス値が格納されます。どの予測子もカテゴリカルではない場合,このプロパティは空(［］) になります。

データ型:单|双

`类名`—一意のクラスラベル
绝对配列|文字配列|必然的ベクトル|数値ベクトル|文字ベクトルの细胞配列

学習で使用する一意なクラスラベル。绝对配列、文字配列、Logical ベクトル、数値ベクトル、または文字ベクトルの cell 配列を指定します。类名のデータ型はクラスラベルYと同じです。(字符串配列は文字ベクトルの细胞配列として扱われます)。类名はクラスの順序も決定します。

データ型:分类|字符|必然的|单|双|单间牢房

`成本`—誤分類のコスト
正方数値行列

このプロパティは読み取り専用です。

誤分類のコスト。正方数値行列として指定します。成本にはK個の行および列が含まれ,Kはクラスの数です。

成本（i，j）は,真のクラスが我である点をクラスJに分類するコストです。成本の行と列の順序は、类名のクラスの順序に対応します。

fitcecocは、異なるタイプのバイナリ学習器に異なる誤分類のコストを組み込みます。

データ型:双

`PredictorNames`—予測子名
文字ベクトルの细胞配列

予測子データに現れる順序で並んでいる予測子名。文字ベクトルの单间牢房配列として指定します。PredictorNamesの長さは,予測子変数として使用される学習データXまたは资源描述に含まれている変数の数と等しくなります。

データ型:单间牢房

`ExpandedPredictorNames`—展開された予測子名
文字ベクトルの细胞配列

展開された予測子名。文字ベクトルの单间牢房配列を指定します。

モデルがカテゴリカル変数用のエンコーディングを使用している場合、ExpandedPredictorNamesには展開された変数を表す名前が格納されます。それ以外の場合,ExpandedPredictorNamesはPredictorNamesと同じです。

データ型:单间牢房

`之前`—前のクラスの確率
数値ベクトル

このプロパティは読み取り専用です。

クラスの事前確率。数値ベクトルを指定します。之前の要素数は类名のクラス数と同じであり、要素の順序は类名内のクラスの順序に対応します。

fitcecocは、異なるタイプのバイナリ学習器に異なる誤分類のコストを組み込みます。

データ型:双

`反应胺`—応答変数名
文字ベクトル

応答変数名。文字ベクトルを指定します。

データ型:字符

`ScoreTransform`—予測されたスコアに適用するスコア変換関数
`“doublelogit”`|`“invlogit”`|`“ismax”`|`“罗吉特”`|`“没有”`|関数ハンドル|……

予測されたスコアに適用するスコア変換関数。関数名または関数ハンドルを指定します。

スコア変換関数を作用などに変更するには,ドット表記を使用します。

組み込み関数の場合、作用を表の値に置き換えて次のコードを入力します。

Mdl.ScoreTransform='函数'；

値	説明
`“doublelogit”`	1 / (1 + e^–2倍)
`“invlogit”`	对数（x/（1-x））
`“ismax”`	最大のスコアをもつクラスのスコアを1に設定し,他のすべてのクラスのスコアを0に設定する
`“罗吉特”`	1 / (1 + e^{- x})
`“没有”`または`“身份”`	x(変換なし)
`“标志”`	x<0のとき –1. x=0のとき 0 x>0のとき 1.
`“对称”`	2 x - 1
`“symmetricismax”`	最大のスコアをもつクラスのスコアを 1.に設定し、他のすべてのクラスのスコアを –1.に設定する
`“symmetriclogit”`	2 / (1 + e^{- x}) – 1

MATLAB^®関数やユーザー定義関数の場合は,関数ハンドルを入力します。
```
Mdl。ScoreTransform = @function;
```
作用は,行列(元のスコア)を受け入れて同じサイズの行列(変換したスコア)を返さなければなりません。

データ型:字符|功能手柄

オブジェクト関数

`比较控股`	新しいデータを使用して2つの分類モデルの精度を比較
`丢弃支持向量万博1manbetx`	ECOCモデルの線形SVMバイナリ学習器のサポートベクターを破棄
`边`	マルチクラス誤り訂正出力符号(ECOC)モデルの分類エッジ
`石灰`	局部可解释模型不可知解释（LIME）
`损失`	マルチクラス誤り訂正出力符号（经济合作委员会）モデルの分類損失
`保证金`	マルチクラス誤り訂正出力符号(ECOC)モデルの分類マージン
`部分依赖`	部分従属の計算
`plotPartialDependence`	部分依存プロット(PDP)および個別条件付き期待値(ICE)プロットの作成
`预测`	マルチクラス誤り訂正出力符号(ECOC)モデルを使用して観測値を分類
`夏普利`	シャープレイ値
`选择模型`	バイナリ`分类线性`学習器から構成されるマルチクラス经济合作モデルのサブセットを選択
`更新`	コード生成用にモデルパラメーターを更新

例

すべて折りたたむ

完全なECOCモデルのサイズの縮小

ライブスクリプトを開く

学習データを削除することにより,完全なECOCモデルのサイズを縮小します。完全な经济合作モデル (分类モデル) には、学習データが保持されます。効率を向上させるため、より小さい分類器を使用します。

フィッシャーのアヤメのデータセットを読み込みます。予測子データX、応答データY、およびY内のクラスの順序を指定します。

负载鱼腥草X =量;Y =分类(物种);classOrder =独特(Y);

SVMバイナリ分類器を使用してECOCモデルを学習させます。SVMテンプレートTを使用して予測子データを標準化し、クラスの順序を指定します。学習時に、Tの空のオプションについては既定値が使用されます。

t = templateSVM (“标准化”，真）；Mdl=FITCECOCC（X，Y，“学习者”t“类名”, classOrder);

Mdlは分类モデルです。

经济合作モデルのサイズを小さくします。

CompactMdl =紧凑(Mdl)

CompactMdl = CompactClassificationECOC ResponseName: 'Y' CategoricalPredictors: [] ClassNames: [setosa versicolor virginica] ScoreTransform: 'none' BinaryLearners: {3x1 cell} CodingMatrix: [3x3 double]属性，方法

CompactMdlは紧凑分类モデルです。CompactMdlでは、Mdlで保存されるすべてのプロパティが保存されるわけではありません。具体的には,学習データが保存されません。

各分類器が使用するメモリの量を表示します。

谁(“CompactMdl”,“Mdl”)

名称大小字节类属性CompactMdl 1x1 15116 classreg.learning.classif.CompactClassificationCoc Mdl 1x1 28357 ClassificationCoc

完全な经济合作モデル (Mdl) はコンパクトな经济合作モデル (CompactMdl)のほぼ2倍のサイズです。

新しい観測値のラベルを効率的に設定するため、MdlをMATLAB®ワークスペースから削除し,CompactMdlと新しい予測子の値を预测に渡すことができます。

经济合作分類器の学習と交差検証

ライブスクリプトを開く

複数の異なるバイナリ学習器および1対他の符号化設計を使用して,ECOC分類器に学習をさせ交差検証を実行します。

フィッシャーのアヤメのデータセットを読み込みます。予測子データXと応答データYを指定します。クラスの名前と個数を調べます。

负载鱼腥草X=meas；Y=species；类名=unique（species（~strcmp（species，'')））%删除空类

类名=3x1电池{'setosa'}{'versicolor'}{'virginica'}

K =元素个数(类名)%类数

K = 3

类名を使用して学習中のクラスの順序を指定できます。

この例では1対他の符号化設計用にK= 3個のバイナリ学習器を使用します。次のようにバイナリ学習器のテンプレートを指定します。

バイナリ学習器 1.および 2.は単純ベイズ分類器である。既定では、各予測子は与えられたラベルに対して条件付きで正規分布になります。
バイナリ学習器 3.は支持向量机分類器である。ガウスカーネルの使用を指定します。

rng (1);%的再现性tNB=templateNaiveBayes（）；tSVM=templateSVM(“内核函数”,“高斯”)；tLearners={tNB tNB tSVM}；

tNBとtSVMはそれぞれ単純ベイズおよび支持向量机学習のテンプレートオブジェクトです。これらのオブジェクトは、学習時に使用するオプションを指定します。名前と値のペアの引数で指定したものを除き、ほとんどのプロパティは空です。学習時は、空のプロパティに対して既定値が設定されます。

バイナリ学習器テンプレートおよび1対他の符号化設計を使用して,ECOC分類器に学習をさせ交差検証を実行します。クラスの順序を指定します。既定では,単純ベイズ分類器はスコアとして事後確率を使用しますが,支持向量机分類器は判定境界からの距離を使用します。したがって,バイナリ学習器を集約するには,事後確率をあてはめるように指定しなければなりません。

CVMdl = fitcecoc (X, Y,“类名”一会,“克罗斯瓦尔”,“开”,．．．“学习者”tLearners,“菲特莱斯特”,真正的);

CVMdlは、ClassificationPartitionedECOC交差検証済みモデルです。既定では、10分割交差検証が実行されます。スコアはバイナリ学習器間で同じ形式 (つまり事後確率) なので、バイナリ分類の結果を正しく集約できます。

ドット表記を使用して,学習させた分割のいずれかを検査します。

CVMdl。训练有素的{1}

ans = CompactClassificationECOC ResponseName: 'Y' CategoricalPredictors: [] ClassNames: {'setosa' 'versicolor' 'virginica'} ScoreTransform: 'none' BinaryLearners: {3x1 cell} CodingMatrix: [3x3 double]属性，方法

各分割はデータの90%で学習させた紧凑分类モデルです。

バイナリ学習器の結果には、ドット表記およびセルのインデックス付けを使用してアクセスできます。最初の分割内で学習させた支持向量机分類器 (3 番目のバイナリ学習器) を表示します。

CVMdl.Trained {1} .BinaryLearners {3}

ans=CompactClassificationSVM ResponseName:'Y'分类预测值：[]类名：[-11]分数转换：“@（S）sigmoid（S，-4.016735e+00，-3.243061e-01）”Alpha:[33x1双精度]偏差：-0.1345内核参数：[1x1结构]支持向量：[33x4双精度]支持向量标签：[33x1双精度]属性、方法万博1manbetx

汎化誤差を推定します。

genError = kfoldLoss (CVMdl)

genError = 0.0333

平均すると汎化誤差は約 3% です。

アルゴリズム

すべて展開する

ランダム符号化設計行列

K個のクラスに対して、ランダム符号化設計行列が以下のように生成されます。

次のいずれかの行列が生成されます。
1. 密なランダム — K行 L_D列の符号化設計行列の各要素に同じ確率で 1.または –1.が割り当てられます。ここで $L_{D} \approx ⌈ 10 {日志}_{2.} K ⌉$ です。
2. スパースランダム — K行 L_s列の符号化設計行列の各要素に 0.25の確率で 1、0.25 の確率で -1、0.5 の確率で 0が割り当てられます。ここで $L_{s} \approx ⌈ 15 {日志}_{2.} K ⌉$ です。
1.つ以上の 1.および 1.つ以上の –1.が列に含まれていない場合、その列は削除されます。
異なる列uおよびvについてu = vまたはu = vである場合,vが符号化設計行列から削除されます。

既定では 10,000 個の行列が無作為に生成されます。次によって与えられるハミング尺度 ([4])に基づき,行の最小ペアワイズ距離が最大になる行列が保持されます。

$Δ (K_{1.}, K_{2.}) = ０．５ \sum_{L = 1.}^{L} | M_{K_{1.} L} | | M_{K_{2.} L} | | M_{K_{1.} L} - M_{K_{2.} L} |,$

ここで,m_{K_JL}は符号化設計行列jの要素です。

サポートベクターの保存

既定では、効率を向上させるため、fitcecocはすべての線形SVMバイナリ学習器のα、万博1manbetx支持向量标签および万博1manbetxSupportVectorsプロパティを空にします。fitcecocは、αではなくβをモデル表示で出力します。

α、万博1manbetx支持向量标签および万博1manbetxSupportVectorsを保存するには,サポートベクターをfitcecocに保存するよう指定する線形SVMテンプレートを渡します。たとえば,次のように入力します。

t = templateSVM (“Save万博1manbetxSupportVectors”Mdl = fitcecoc(X,Y，“学习者”，t）；

サポートベクターおよび関連する値は,生成された分类モデルを丢弃支持向量万博1manbetxに渡すことにより削除できます。

参照

[1] 约翰内斯·弗恩克兰兹，《循环分类》，《机器学习研究杂志》，2002年第2卷，第721-747页。

[2] 《用于纠错输出码稀疏设计的三元码的可分性》，《模式识别快报》，第30卷，2009年第3期，第285-297页。

拡張機能

C / c++コード生成
MATLAB®编码器™を使用してCおよびc++コードを生成します。

使用上の注意事項および制限事項:

関数预测および更新はコード生成をサポートします。
fitcecocを使用してECOCモデルに学習をさせる場合,以下の制限が適用されます。
- 名前と値のペアの引数“菲特莱斯特”を使用して事後確率をあてはめることはできません。
- すべてのバイナリ学習器がSVM分類器または線形分類モデルでなければなりません。名前と値のペアの引数“学习者”について以下を指定できます。
  - “支持向量机”または“线性”
  - SVMテンプレートオブジェクトまたはこのオブジェクトの细胞配列(templateSVMを参照)
  - 線形分類モデルテンプレートオブジェクトまたはこのオブジェクトの细胞配列(templateLinearを参照)
- 预测と更新に対してコーダーコンフィギュアラーを使用してコードを生成する場合,以下の追加制限がバイナリ学習器に適用されます。
  - SVMテンプレートオブジェクトの细胞配列を使用する場合,SVM学習器の“标准化”の値は一貫していなければなりません。たとえば、ある支持向量机学習器に対して“标准化”，没错を指定した場合,すべてのSVM学習器に対して同じ値を指定しなければなりません。
  - 支持向量机テンプレートオブジェクトの单间牢房配列を使用し、ある支持向量机学習器では線形カーネル (“KernelFunction”、“线性”) を、別の支持向量机学習器では異なるタイプのカーネル関数を使用する場合、線形カーネルの学習器に対して“Save万博1manbetxSupportVectors”符合事实的を指定しなければなりません。
  詳細については,ClassificationECOCCoderConfigurerを参照してください。モデルを再学習させる際に変更できない名前と値のペアの引数の詳細については、ヒントを参照してください。
- 支持向量机分類器と線形分類モデルのコード生成の制限は,選択したバイナリ学習器に応じてECOC分類器にも適用されます。詳細については,CompactClassificationSVMクラスのコード生成とコード生成クラスの分类线性を参照してください。

詳細は,コード生成の紹介を参照してください。

参考

R2014bで導入

紧凑分类

説明

作成

プロパティ

经济合作のプロパティ

`二元收入者`—学習済みバイナリ学習器
モデルオブジェクトの细胞ベクトル

`双星`—バイナリ学習器損失関数
`“偏差”`|`“指数”`|`“哈明”`|`“枢纽”`|`“线性”`|`“罗吉特”`|`“二次”`

`编码矩阵`—クラス割り当て符号
数値行列

`学习者重量`—バイナリ学習器の重み
数値行ベクトル

他の分類のプロパティ

`CategoricalPredictors`—カテゴリカル予測子のインデックス
正の整数のベクトル|`［］`

`类名`—一意のクラスラベル
绝对配列|文字配列|必然的ベクトル|数値ベクトル|文字ベクトルの细胞配列

`成本`—誤分類のコスト
正方数値行列

`PredictorNames`—予測子名
文字ベクトルの细胞配列

`ExpandedPredictorNames`—展開された予測子名
文字ベクトルの细胞配列

`之前`—前のクラスの確率
数値ベクトル

`反应胺`—応答変数名
文字ベクトル

`ScoreTransform`—予測されたスコアに適用するスコア変換関数
`“doublelogit”`|`“invlogit”`|`“ismax”`|`“罗吉特”`|`“没有”`|関数ハンドル|……

オブジェクト関数

例

完全なECOCモデルのサイズの縮小

经济合作分類器の学習と交差検証

アルゴリズム

ランダム符号化設計行列

サポートベクターの保存

参照

拡張機能

C / c++コード生成
MATLAB®编码器™を使用してCおよびc++コードを生成します。

参考

统计和机器学习工具箱ドキュメンテーション

サポート

機械学習をマスターする:MATLABステップ・バイ・ステップガイド

紧凑分类

説明

作成

プロパティ

经济合作のプロパティ

二元收入者—学習済みバイナリ学習器モデルオブジェクトの细胞ベクトル

双星—バイナリ学習器損失関数“偏差”|“指数”|“哈明”|“枢纽”|“线性”|“罗吉特”|“二次”

编码矩阵—クラス割り当て符号数値行列

学习者重量—バイナリ学習器の重み数値行ベクトル

他の分類のプロパティ

CategoricalPredictors—カテゴリカル予測子のインデックス正の整数のベクトル|［］

类名—一意のクラス ラベル绝对配列|文字配列|必然的ベクトル|数値ベクトル|文字ベクトルの细胞配列

成本—誤分類のコスト正方数値行列

PredictorNames—予測子名文字ベクトルの细胞配列

ExpandedPredictorNames—展開された予測子名文字ベクトルの细胞配列

之前—前のクラスの確率数値ベクトル

反应胺—応答変数名文字ベクトル

ScoreTransform—予測されたスコアに適用するスコア変換関数“doublelogit”|“invlogit”|“ismax”|“罗吉特”|“没有”|関数ハンドル|……

オブジェクト関数

例

完全なECOCモデルのサイズの縮小

经济合作分類器の学習と交差検証

アルゴリズム

ランダム符号化設計行列

サポート ベクターの保存

参照

拡張機能

C / c++コード生成MATLAB®编码器™を使用してCおよびc++コードを生成します。

参考

统计和机器学习工具箱ドキュメンテーション

サポート

機械学習をマスターする:MATLABステップ・バイ・ステップガイド

`二元收入者`—学習済みバイナリ学習器
モデルオブジェクトの细胞ベクトル

`双星`—バイナリ学習器損失関数
`“偏差”`|`“指数”`|`“哈明”`|`“枢纽”`|`“线性”`|`“罗吉特”`|`“二次”`

`编码矩阵`—クラス割り当て符号
数値行列

`学习者重量`—バイナリ学習器の重み
数値行ベクトル

`CategoricalPredictors`—カテゴリカル予測子のインデックス
正の整数のベクトル|`［］`

`类名`—一意のクラスラベル
绝对配列|文字配列|必然的ベクトル|数値ベクトル|文字ベクトルの细胞配列

`成本`—誤分類のコスト
正方数値行列

`PredictorNames`—予測子名
文字ベクトルの细胞配列

`ExpandedPredictorNames`—展開された予測子名
文字ベクトルの细胞配列

`之前`—前のクラスの確率
数値ベクトル

`反应胺`—応答変数名
文字ベクトル

`ScoreTransform`—予測されたスコアに適用するスコア変換関数
`“doublelogit”`|`“invlogit”`|`“ismax”`|`“罗吉特”`|`“没有”`|関数ハンドル|……

サポートベクターの保存

C / c++コード生成
MATLAB®编码器™を使用してCおよびc++コードを生成します。