预测

分類木の使用によるラベルの予測

このページをすべて展開する

構文

标签=预测(Mdl, X)

标签=预测(Mdl X、名称、值)

(标签、分数、节点cnum) =预测(＿＿＿）

説明

标签=预测(Mdl，X）は,学習済みの完全またはコンパクトな分類木Mdlに基づいて,テーブルまたは行列X内の予測子データに対する予測クラスラベルのベクトルを返します。

标签=预测(Mdl，X，名称,值）は1つ以上の名称,值引数のペアによって指定された追加オプションを使用します。たとえば,Mdlを特定のレベルまで枝刈りした後にラベルを予測するように指定できます。

［标签，分数，节点，cnum) =预测(＿＿＿）は,前の構文の入力引数のいずれかを使用して,さらに以下を返します。

ラベルが特定のクラスから派生する尤度を示す分類スコアの行列(分数)。分類木の場合、スコアは事後確率です。X内の各観測値について,予測クラスラベルは,すべてのクラスの中で最小の予測誤分類コストに対応します。
分類の予測ノード番号のベクトル(节点)。
分類の予測クラス番号のベクトル(cnum)。

入力引数

すべて展開する

`Mdl`- - - - - -学習済みの分類木
`ClassificationTree`モデルオブジェクト|`CompactClassificationTree`モデルオブジェクト

学習済みの分類木。ClassificationTreeまたはCompactClassificationTreeモデルオブジェクトとして指定します。つまり,Mdlはfitctreeまたは紧凑的が返す学習済み分類モデルです。

`X`- - - - - -分類対象の予測子データ
数値行列|テーブル

分類対象の予測子データ。数値行列またはテーブルを指定します。

Xの各行は1つの観測値に対応し,各列は1つの変数に対応します。

数値行列の場合
- Xの列を構成する変数の順序は,Mdlに学習させた予測子変数の順序と同じでなければなりません。
- テーブル(たとえば资源描述)を使用してMdlに学習をさせた場合,资源描述に含まれている予測子変数がすべて数値変数であれば,Xを数値行列にすることができます。学習時に资源描述内の数値予測子をカテゴリカルとして扱うには,fitctreeの名前と値のペアの引数CategoricalPredictorsを使用してカテゴリカル予測子を同定します。资源描述に種類の異なる予測子変数(数値および直言データ型など)が混在し,Xが数値行列である場合,预测でエラーがスローされます。
テーブルの場合
- 预测は,文字ベクトルの细胞配列ではない细胞配列や複数列の変数をサポートしません。
- テーブル(たとえば资源描述)を使用してMdlに学習をさせた場合,X内のすべての予測子変数は変数名およびデータ型が,Mdlに学習させた(Mdl。PredictorNamesに格納されている)変数と同じでなければなりません。ただし,Xの列の順序が资源描述の列の順序に対応する必要はありません。资源描述とXに追加の変数(応答変数や観測値の重みなど)を含めることができますが,预测はこれらを無視します。
- 数値行列を使用してMdlに学習をさせた場合,Mdl。PredictorNames内の予測子名とX内の対応する予測子変数名が同じでなければなりません。学習時に予測子の名前を指定する方法については,fitctreeの名前と値のペアの引数PredictorNamesを参照してください。X内の予測子変数はすべて数値ベクトルでなければなりません。Xに追加の変数(応答変数や観測値の重みなど)を含めることができますが,预测はこれらを無視します。

データ型:表格|双|单

名前と値のペアの引数

オプションの名称,值引数のコンマ区切りペアを指定します。的名字は引数名で,价值は対応する値です。的名字は引用符で囲まなければなりません。Name1, Value1,…,的家のように,複数の名前と値のペアの引数を,任意の順番で指定できます。

`子树`- - - - - -枝刈りレベル
0(既定値) |非負の整数のベクトル|`“所有”`

枝刈りレベル。“子树”と昇順の非負の整数のベクトルまたは“所有”から構成されるコンマ区切りのペアとして指定します。

ベクトルを指定する場合,すべての要素が0から马克斯(Mdl.PruneList)の範囲になければなりません。0は枝刈りしない完全な木を,马克斯(Mdl.PruneList)は完全に枝刈りした木(つまり,ルートノードのみ)を表します。

“所有”を指定した場合,预测はすべての部分木(枝刈り順序全体)に作用します。これは,0:马克斯(Mdl.PruneList)を指定することと同じです。

预测では,子树で指定された各レベルまでMdlの枝刈りを行ってから,対応する出力引数を推定します。子树のサイズにより,一部の出力引数のサイズが決まります。

子树を呼び出すために,MdlのPruneListプロパティまたはPruneAlphaプロパティを空にすることはできません。言い換えると,“删除”,“上”を設定してMdlを成長させるか,修剪を使用してMdlの枝刈りを行います。

例:“子树”,“所有”

データ型:单|双|字符|字符串

出力引数

すべて展開する

`标签`——予測クラスラベル
ベクトル|配列

予測クラスラベル。ベクトルまたは配列として返されます。标签の各エントリは,Xに対応する行で予測コストが最小のクラスと一致します。

子树はT個の要素が含まれている数値ベクトルであり(“所有”の場合,子树参照)、XにはN行があるとします。

応答のデータ型が字符の場合,次のようになります。
- T= 1の場合,标签はN行が含まれている文字行列になります。各行には,部分木子树によって生成された予測ラベルが格納されます。
- T> 1の場合,标签はN行T列の细胞配列になります。
それ以外の場合,标签は応答と同じデータ型のN行T列の配列になります。(字符串配列は文字ベクトルの细胞配列として扱われます)。

後の2つの場合,部分木子树(j）によって生成された予測ラベルのベクトルが标签の列jに格納されます。

`分数`——事後確率
数値行列

事後確率。N行K列の数値行列として返されます。NはXに含まれている観測値(行)の数,Kは(Mdl。ClassNamesに含まれている)クラスの数です。评分(i, j)は,Xの行我がクラスjである事後確率です。

子树にT個の要素が,XにN個の行が含まれている場合,分数はNxKxTの配列,节点とcnumはN行T列の行列になります。

`节点`——ノード番号
数値ベクトル

予測したクラスのノード番号。数値ベクトルとして返されます。各エントリは、Xの対応する行でMdl内の予測されるノードに対応します。

`cnum`——クラス番号
数値ベクトル

予測した标签に対応するクラスの番号。数値ベクトルとして返されます。cnumの各エントリは,Xの対応する行で予測されるクラス番号に対応します。

例

すべて展開する

分類木によるラベルの予測

ライブスクリプトを開く

学習から除外されたデータセットの数行について予測を確認します。

フィッシャーのアヤメのデータセットを読み込みます。

负载fisheriris

データを学習セット(50%)と検定セット(50%)に分割します。

1) n =大小(量;rng (1)%的再现性idxTrn = false (n, 1);idxTrn (randsample (n,圆(0.5 * n))) = true;%训练集逻辑索引idxVal = idxTrn == false;%验证设置逻辑索引

学習セットを使用して分類木を成長させます。

Mdl = fitctree(量(idxTrn:),物种(idxTrn));

検定データのラベルを予測します。誤分類した観測値の数をカウントします。

标签=预测(Mdl量(idxVal:));标签(randsample(元素个数(标签),5))显示几个预测的标签

ans =5 x1细胞{' setosa}{‘setosa}{‘setosa}{‘virginica}{“癣”}

numMisclass =总和(~ strcmp(标签,物种(idxVal)))

numMisclass = 3

3つの標本外観測値が誤分類されています。

分類木によるクラス事後確率の推定

ライブスクリプトを開く

フィッシャーのアヤメのデータセットを読み込みます。

负载fisheriris

データを学習セット(50%)と検定セット(50%)に分割します。

1) n =大小(量;rng (1)%的再现性idxTrn = false (n, 1);idxTrn (randsample (n,圆(0.5 * n))) = true;%训练集逻辑索引idxVal = idxTrn == false;%验证设置逻辑索引

学習セットを使用して分類木を成長させ,表示します。

Mdl = fitctree(量(idxTrn:),物种(idxTrn));视图(Mdl,“模式”，“图”）

图分类树查看器包含一个轴和其他类型的uimenu, uicontrol对象。轴包含18个类型为line, text的对象。

生成された木には4つのレベルがあります。

レベル1および3まで枝刈りした部分木を使用して,検定セットの事後確率を推定します。

[~,后]=预测(Mdl量(idxVal:)“子树”3 [1]);Mdl。ClassNames

ans =3 x1细胞{'setosa'} {'versicolor'} {'virginica'}

后(randsample(大小(后,1),5),:,:),．..显示几个后验概率

ans = ans (:: 1) = 1.0000 0 0 0 0 0 0 0 0 1.0000 1.0000 1.0000 0.8571 - 0.1429 ans (:,: 2) = 0.3733 0.3200 0.3067 0.3733 0.3200 0.3067 0.3733 0.3200 0.3067 0.3733 0.3200 0.3067 0.3733 0.3200 0.3067

后の要素はクラスの事後確率です。

各行は検定セットの観測値に対応します。
各列はMdl。ClassNamesに含まれているクラスに対応します。
各ページは部分木に対応します。

レベル1まで枝刈りした部分木は,レベル3(ルートノード)まで枝刈りした部分木より予測が確実です。

詳細

すべて展開する

予測クラスラベル

预测は,予測される誤分類コストを最小化することにより分類します。

$\overset{＾}{y} ＝ \underset{y ＝ 1 ，．.. ， K}{参数最小值} \sum_{j ＝ 1}^{K} \overset{＾}{P} （ j | x ） C （ y | j ），$

ここで,

$\overset{＾}{y}$ は,予測された分類です。
Kはクラスの数です。
$\overset{＾}{P} （ j | x ）$ は,観測値xのクラスjの事後確率です。
$C （ y | j ）$ は,真のクラスがjの場合に観測値をyとして分類するコストです。

スコア(ツリー)

ツリーの場合,葉ノードの分類の“スコア”は,そのノードでの分類の事後確率です。あるノードにおける分類の事後確率とは,分類によって実際にそのノードに達するのに要した学習シーケンスの数を,そのノードまでの学習シーケンスの数で除算した値です。

たとえば,X<0．15またはX>0.95である場合は予測子Xを真正的に分類し,それ以外の場合はXを假に分類するとします。

100年個の点を無作為に生成し,分類します。

rng (0,“旋风”）%的再现性X =兰德(100 1);Y = (abs(X - .55) > .4);树= fitctree (X, Y);视图(树,“模式”，“图”）

ツリーを枝刈りします。

tree1 =修剪(树,“水平”1);视图(tree1,“模式”，“图”）

枝刈りされたツリーは,0.15未満の観測値を正しく真正的に分類しています。また,。15から．94 までの観測値についても、正しく假に分類しています。しかし,0.94より大きい観測は假と誤って分類されます。そのため,0.15より大きい観測値のスコアは,真正的では. 05 / .85 = 0。06假では。8 / .85 =。94年になります。

Xの先頭から10行までの予測スコアを計算します。

[~,分数]=预测(tree1 X (1:10));(分数X (1:10)):

ans =10×30.9059 0.0941 0.8147 0.9059 0.0941 0.9058 0 1.0000 0.1270 0.9059 0.0941 0.9134 0.9059 0.0941 0.6324 0 1.0000 0.0975 0.9059 0.0941 0.2785 0.9059 0.0941 0.5469 0.9059 0.0941 0.9575 0.9059 0.0941 0.9649

実際に,X0.15でより小さいすべての値(右端の列)には,0と1のスコアが関連付けられ(左の列と中央の列),Xのその他の値には,0.91と0.09のスコアが関連付けられています。スコアの違い(想定した06ではなく,0.09)は統計変動によるものです。範囲(1) .95のXには,想定した5個ではなく8個の観測値があります。

真の誤分類コスト

真の誤分類コストは,観測値を誤ったクラスに分類するコストです。

分類器の作成時に,名前と値の引数“成本”を使用してクラスごとの真の誤分類コストを設定できます。成本(i, j)は,真のクラスが我の場合に観測値をクラスjに分類するコストです。既定では,成本(i, j) = 1（我~ = jの場合)および成本(i, j) = 0（我=我の場合)です。つまり,正しい分類のコストは0,誤った分類のコストは1です。

予測コスト

観測値ごとの予測誤分類コストは,観測をそれぞれのクラスに分類する平均コストです。

学習済みの分類器を使用して脑袋個の観測値を分類するとします。また,K個のクラスがあるとします。1行に1観測ずつ、観測値を行列Xに置きます。

予測コスト行列CEのサイズは,脑袋行K列です。CEの各行には,観測をそれぞれのクラスKに分類する予測(平均)コストが含まれます。CE (n, k)は次のとおりです。

$\sum_{我＝ 1}^{K} \overset{＾}{P} （我 | X （ n ）） C （ k | 我），$

ここで,

Kはクラスの数です。
$\overset{＾}{P} （我 | X （ n ））$ は,観測値X (n)のクラス我の事後確率です。
$C （ k | 我）$ は,真のクラスが我である観測値をkに分類する真の誤分類コストです。

アルゴリズム

预测は,葉ノードまたは欠損値に達するまで,Mdlの枝に沿って予測を生成します。预测が,葉ノードに達したら,そのノードの分類が返されます。

预测が予測子の欠損値をもつノードに達した場合の振る舞いは,fitctreeでMdlを作成したときの代理名前と値のペアの設定により異なります。

代理＝“关闭”(既定値)预测は,そのノードに達する学習標本の最大数をもつラベルを返します。
代理＝“上”- - - - - -预测は,そのノードで最適な代理分岐を使用します。正の"関連性予測尺度"を含むすべての代理分岐変数がない場合,预测は,そのノードに達する学習標本の最大数をもつラベルを返します。この定義については,関連性予測尺度を参照してください。

代替機能

万博1manbetx仿真软件ブロック

万博1manbetx^®に分類木モデルの予測を統合するには,统计和机器学习工具箱™ライブラリにあるClassificationTree预测ブロックを使用するか,MATLAB^®函数ブロックを関数预测と共に使用します。例については,ClassificationTree预测ブロックの使用によるクラスラベルの予測とMATLAB函数ブロックの使用によるクラスラベルの予測を参照してください。

使用するアプローチを判断する際は,以下を考慮してください。

统计和机器学习工具箱ライブラリブロックを使用する場合,固定小数点ツール(定点设计师)を使用して浮動小数点モデルを固定小数点に変換できます。
MATLAB函数ブロックを関数预测と共に使用する場合は,可変サイズの配列に対するサポートを有効にしなければなりません。
MATLAB函数ブロックを使用する場合,予測の前処理や後処理のために,同じMATLAB函数ブロック内でMATLAB関数を使用することができます。

拡張機能

高配列
メモリの許容量を超えるような多数の行を含む配列を計算します。

この関数は,高配列を完全にサポートします。この関数でインメモリデータまたは高データに対して学習を行ったモデルを使用できます。

詳細は,高配列を参照してください。

C / c++コード生成
MATLAB®编码器™を使用してCおよびc++コードを生成します。

使用上の注意事項および制限事項:

コーダーコンフィギュアラーを使用して,预测と更新の両方についてC / c++コードを生成できます。または,saveLearnerForCoder、loadLearnerForCoder,およびcodegenを使用して预测のコードのみを生成します。
- 预测と更新に対するコード生成-learnerCoderConfigurerを使用してコーダーコンフィギュアラーを作成してから,generateCodeを使用してコードを生成します。これにより,生成されたコードのモデルパラメーターは,コードの再生成を必要としない更新が可能になります。
- 预测のコード生成-saveLearnerForCoderを使用して,学習済みモデルを保存します。loadLearnerForCoderを使用して保存済みモデルを読み込んで関数预测を呼び出す,エントリポイント関数を定義します。次に,codegen(MATLAB编码器)を使用して,エントリポイント関数のコードを生成します。

预测用の単精度C / c++コードを生成するには,関数loadLearnerForCoderを呼び出すときに名前と値の引数“数据类型”、“单”を指定します。
预测に対する固定小数点のC / c++コードを生成することもできます。固定小数点コードの生成には,予測に必要な変数の固定小数点データ型を定義する追加の手順が必要です。generateLearnerDataTypeFcnによって生成されるデータ型関数を使用して固定小数点データ型構造体を作成し,その構造体をエントリポイント関数でloadLearnerForCoderの入力引数として使用します。固定小数点のC / c++コードを生成するには,MATLAB编码器™および定点设计师™が必要です。

次の表は,预测の引数に関する注意です。この表に含まれていない引数は,完全にサポートされています。

引数	注意と制限
`Mdl`	モデルオブジェクトの使用上の注意および制限については,`CompactClassificationTree`オブジェクトのコード生成を参照してください。
`X`	一般的なコード生成の場合,`X`は,単精度または倍精度の行列か,数値変数,カテゴリカル変数,またはその両方を含む表でなければなりません。コーダーコンフィギュアラーワークフローでは,`X`は単精度または倍精度の行列でなければなりません。固定小数点コードの生成の場合,`X`は固定小数点の行列でなければなりません。 `X`の行数,または観測値の数は可変サイズにすることができますが,`X`の列数は固定でなければなりません。 `X`を表として指定する場合,モデルは表を使用して学習させたものでなければならず,かつ予測のためのエントリポイント関数が次を行うようにしなければなりません。データを配列として受け入れる。データ入力の引数から表を作成し,その表内で変数名を指定する。表を`预测`に渡す。このテーブルのワークフローの例については,表のデータを分類するためのコードの生成を参照してください。コード生成におけるテーブルの使用の詳細については、表のコード生成(MATLAB编码器)およびコード生成における表の制限事項(MATLAB编码器)を参照してください。
`标签`	応答のデータ型が`字符`であり,`子树`の値がスカラーであることを`codegen`が確定できない場合,`标签`は文字ベクトルの细胞配列になります。
`“子树”`	名前と値のペアの引数に含まれる名前はコンパイル時の定数でなければなりません。たとえば,生成されたコードでユーザー定義の枝刈りレベルを可能にするには,`{coder.Constant(子树),coder.typeof (0, (1, n), [0,1])}`を`codegen`(MATLAB编码器)の`arg游戏`の値に含めます。`n`は`马克斯(Mdl.PruneList)`です。コーダーコンフィギュアラーワークフローでは,名前と値のペアの引数`“子树”`はサポートされていません。固定小数点コードの生成では,`“子树”`の値は`coder.Constant(所有的)`であるか,整数データ型にしなければなりません。

詳細は,コード生成の紹介を参照してください。

参考

fitctree|紧凑的|修剪|损失|边缘|保证金|CompactClassificationTree|ClassificationTree

トピック

コード生成用の可変サイズ引数の指定

R2011aで導入

预测

構文

説明

入力引数

`Mdl`- - - - - -学習済みの分類木
`ClassificationTree`モデルオブジェクト|`CompactClassificationTree`モデルオブジェクト

`X`- - - - - -分類対象の予測子データ
数値行列|テーブル

名前と値のペアの引数

`子树`- - - - - -枝刈りレベル
0(既定値) |非負の整数のベクトル|`“所有”`

出力引数

`标签`——予測クラスラベル
ベクトル|配列

`分数`——事後確率
数値行列

`节点`——ノード番号
数値ベクトル

`cnum`——クラス番号
数値ベクトル

例

分類木によるラベルの予測

分類木によるクラス事後確率の推定

詳細

予測クラスラベル

スコア(ツリー)

真の誤分類コスト

予測コスト

関連性予測尺度

アルゴリズム

代替機能

万博1manbetx仿真软件ブロック

拡張機能

高配列
メモリの許容量を超えるような多数の行を含む配列を計算します。

C / c++コード生成
MATLAB®编码器™を使用してCおよびc++コードを生成します。

参考

トピック

统计和机器学习工具箱ドキュメンテーション

サポート

機械学習をマスターする:MATLABステップ・バイ・ステップガイド

预测

構文

説明

入力引数

Mdl- - - - - -学習済みの分類木ClassificationTreeモデルオブジェクト|CompactClassificationTreeモデルオブジェクト

X- - - - - -分類対象の予測子データ数値行列|テーブル

名前と値のペアの引数

子树- - - - - -枝刈りレベル0(既定値) |非負の整数のベクトル|“所有”

出力引数

标签——予測クラスラベルベクトル|配列

分数——事後確率数値行列

节点——ノード番号数値ベクトル

cnum——クラス番号数値ベクトル

例

分類木によるラベルの予測

分類木によるクラス事後確率の推定

詳細

予測クラスラベル

スコア(ツリー)

真の誤分類コスト

予測コスト

関連性予測尺度

アルゴリズム

代替機能

万博1manbetx仿真软件ブロック

拡張機能

高配列メモリの許容量を超えるような多数の行を含む配列を計算します。

C / c++コード生成MATLAB®编码器™を使用してCおよびc++コードを生成します。

参考

トピック

统计和机器学习工具箱ドキュメンテーション

サポート

機械学習をマスターする:MATLABステップ・バイ・ステップガイド

`Mdl`- - - - - -学習済みの分類木
`ClassificationTree`モデルオブジェクト|`CompactClassificationTree`モデルオブジェクト

`X`- - - - - -分類対象の予測子データ
数値行列|テーブル

`子树`- - - - - -枝刈りレベル
0(既定値) |非負の整数のベクトル|`“所有”`

`标签`——予測クラスラベル
ベクトル|配列

`分数`——事後確率
数値行列

`节点`——ノード番号
数値ベクトル

`cnum`——クラス番号
数値ベクトル

高配列
メモリの許容量を超えるような多数の行を含む配列を計算します。

C / c++コード生成
MATLAB®编码器™を使用してCおよびc++コードを生成します。