石灰

本地可解释模型不可知解释(LIME)

説明

石灰は、重要な予測子を見つけて解釈可能な単純モデルをあてはめることにより、クエリ点に対する機械学習モデル (分類または回帰) の予測を説明します。

クエリ点(查询点)と重要な予測子の数(重要预测因子) を指定して、機械学習モデル用の石灰オブジェクトを作成できます。ソフトウェアは合成データセットを生成し,クエリ点周辺の合成データに対する予測を効果的に説明する重要な予測子の解釈可能な単純モデルをあてはめます。単純モデルにできるのは,線形モデル(既定)または決定木モデルです。

あてはめられた単純モデルを使用して、指定したクエリ点での機械学習モデルの予測を局所的に説明します。関数情节を使用して、石灰の結果を可視化します。局所的な説明に基づいて,機械学習モデルを信頼するかどうかを判断できます。

別のクエリ点には、関数适合を使用して、新しい単純モデルをあてはめます。

作成

構文

结果=石灰（黑盒）

结果=石灰（黑盒，X）

结果=石灰（黑框、'CustomSyntheticData'，CustomSyntheticData）

结果=石灰(＿＿＿,‘QueryPoint QueryPoint NumImportantPredictors, NumImportantPredictors)

结果=石灰(＿＿＿，名称，值）

説明

结果=石灰(黑箱）は、予測子データを含む機械学習モデルオブジェクト黑箱を使用して,石灰オブジェクトを作成します。関数石灰は,合成予測子データセットの標本を生成し,その標本の予測を計算します。単純モデルをあてはめるには,関数适合を结果と共に使用します。

例

结果=石灰(黑箱，X）は、X内の予測子データを使用して石灰オブジェクトを作成します。

结果=石灰(黑箱“CustomSyntheticData”,自定义数据）は、事前生成されたカスタム合成予測子データセット自定义数据を使用して石灰オブジェクトを作成します。関数石灰は、自定义数据の標本についての予測を計算します。

例

结果=石灰(＿＿＿，“查询点”，查询点，“NumImportantPredictors”，重要预测因子）も、指定された数の重要な予測子を検索し、クエリ点查询点に対して線形単純モデルをあてはめます。前の構文におけるいずれかの入力引数の組み合わせに加えて,查询点および重要预测因子を指定できます。

例

结果=石灰(＿＿＿，名称,值）では1つ以上の名前と値の引数を使用して追加オプションを指定します。たとえば,“SimpleModelType”，“树”は、単純モデルのタイプを決定木モデルとして指定します。

入力引数

すべて展開する

`黑箱`- - - - - -解釈される機械学習モデル
回帰モデルオブジェクト|分類モデルオブジェクト|関数ハンドル

解釈される機械学習モデル。完全またはコンパクトな回帰または分類モデルオブジェクトとして指定するか、関数ハンドルとして指定します。

完全またはコンパクトなモデルオブジェクト — オブジェクト関数预测をもつ、完全またはコンパクトな、回帰または分類モデルオブジェクトを指定できます。ソフトウェアは、関数预测を使用して,クエリ点についての予測と合成予測子データセットを計算します。

予測子データを含まないモデルオブジェクト (コンパクトなモデルなど) を指定する場合、Xまたは自定义数据を使用して予測子データを提供しなければなりません。
石灰は、スパース行列で学習させたモデルオブジェクトをサポートしません。モデルに学習させる場合は、行が各観測値に対応する非スパースの数値行列または桌子を予測子データに使用してください。

回帰モデルオブジェクト

サポートされているモデル	完全またはコンパクトな回帰モデルオブジェクト
回帰モデルのアンサンブル	`回归套`，`RegressionBaggedEnsemble`，`压缩回归套`
ランダムな特徴量拡張を使用したガウスカーネル回帰モデル	`RegressionKernel`
ガウス過程回帰	`回归方程`，`CompactRegressionGP`
一般化加法モデル	`回归Gam`，`紧回归GAM`
高次元データの線形回帰	`RegressionLinear`
ニューラルネットワーク回帰モデル	`回归神经网络`，`CompactRegressionNeuralNetwork`
回帰木	`回归树`，`CompactRegressionTree`
サポートベクターマシン回帰	`回归`，`压缩回归`

分類モデルオブジェクト

サポートされているモデル	完全またはコンパクトな分類モデルオブジェクト
マルチクラス分類用の二分決定木	`分类树`，`CompactClassificationTree`
判別分析分類器	`ClassificationDiscriminant`，`CompactClassificationDiscriminant`
分類用のアンサンブル学習器	`分类符号`，`压缩分类插入码`，`分类BaggedAssemble`
ランダムな特徴量拡張を使用したガウスカーネル分類モデル	`分类核`
一般化加法モデル	`分类`，`CompactClassificationGAM`
k最近傍モデル	`ClassificationKNN`
線形分類モデル	`ClassificationLinear`
サポートベクターマシンまたはその他の分類器用のマルチクラスモデル	`分类`，`紧凑分类`
単純ベイズモデル	`分类朴素贝叶斯`，`紧分类朴素贝叶斯`
ニューラルネットワーク分類器	`分类神经网络`，`紧分类神经网络`
バイナリ分類用のサポートベクターマシン	`分类VM`，`CompactClassificationSVM`

関数ハンドル——予測子データを受け入れ,予測子データの各観測値についての予測が格納された列ベクトルを返す関数ハンドルを指定できます。予測は,回帰の場合は予測された応答,分類の場合は分類されたラベルになります。Xまたは自定义数据を使用して予測子データを提供し、名前と値の引数“类型”を指定しなければなりません。

`X`- - - - - -予測子データ
数値行列|テーブル

予測子データ。数値行列またはテーブルとして指定します。Xの各行は1つの観測値に対応し,各列は1つの変数に対応します。

Xは、黑箱。Xに格納されている,黑箱の学習に使用した予測子データと一致しなければなりません。指定する値に応答変数を含めてはなりません。

Xは、黑箱の学習に使用した予測子変数 (たとえば、列车) と同じデータ型でなければなりません。Xの列を構成する変数の個数と順序は,列车と同じでなければなりません。
- 数値行列を使用して黑箱に学習をさせる場合、Xは数値行列でなければなりません。
- 表を使用して黑箱に学習をさせる場合、Xは桌子でなければなりません。X内のすべての予測子変数は、変数名およびデータ型が列车と同じでなければなりません。
石灰はスパース行列をサポートしません。

黑箱が予測子データを含まないモデルオブジェクトまたは関数ハンドルである場合,Xまたは自定义数据を指定しなければなりません。黑箱が完全な機械学習モデルオブジェクトである場合にこの引数を指定すると、石灰で黑箱の予測子データは使用されません。指定した予測子データのみが使用されます。

データ型:仅有一个的|双重的|桌子

`自定义数据`- - - - - -事前生成されたカスタム合成予測子データセット
`[]`(既定値) |数値行列|テーブル

事前生成されたカスタム合成予測子データセット。数値行列またはテーブルとして指定します。

事前生成されたデータセットを提供する場合、石灰は新しい合成予測子データセットを生成する代わりに、提供されたデータセットを使用します。

自定义数据は、黑箱。Xに格納されている,黑箱の学習に使用した予測子データと一致しなければなりません。指定する値に応答変数を含めてはなりません。

自定义数据は、黑箱の学習に使用した予測子変数 (たとえば、列车) と同じデータ型でなければなりません。自定义数据の列を構成する変数の個数と順序は,列车と同じでなければなりません。
- 数値行列を使用して黑箱に学習をさせる場合、自定义数据は数値行列でなければなりません。
- テーブルを使用して黑箱に学習をさせる場合、自定义数据はテーブルでなければなりません。自定义数据内のすべての予測子変数は、変数名およびデータ型が列车と同じでなければなりません。
石灰はスパース行列をサポートしません。

黑箱が予測子データを含まないモデルオブジェクトまたは関数ハンドルである場合,Xまたは自定义数据を指定しなければなりません。黑箱が完全な機械学習モデルオブジェクトであり、この引数を指定する場合、石灰は黑箱の予測子データを使用しません。指定した予測子データのみを使用します。

データ型:仅有一个的|双重的|桌子

`查询点`- - - - - -クエリ点
数値の行ベクトル|単一行テーブル

石灰が予測を説明するクエリ点。数値の行ベクトルまたは単一行テーブルとして指定します。查询点のデータ型および列の数は,X、自定义数据、または黑箱の予測子データと同じでなければなりません。

重要预测因子と查询点を指定すると,関数石灰は石灰オブジェクトを作成するときに単純モデルをあてはめます。

查询点に欠損値が含まれていてはなりません。

例:blackbox.X（1，：）は,完全な機械学習モデル黑箱の予測子データの最初の観測値としてクエリ点を指定します。

データ型:仅有一个的|双重的|桌子

`重要预测因子`- - - - - -単純モデルで使用する重要な予測子の数
正の整数スカラー値

単純モデルで使用する重要な予測子の数。正の整数スカラー値として指定します。

“SimpleModelType”が“线性”である場合,ソフトウェアは,指定された数の重要な予測子を選択し,選択した予測子の線形モデルをあてはめます。
“SimpleModelType”が“树”である場合、ソフトウェアは、重要な予測子の数として決定分岐 (枝ノード) の最大数を指定し、あてはめられた決定木が、指定された数を上限に予測子を使用するようにします。

重要预测因子と查询点を指定すると,関数石灰は石灰オブジェクトを作成するときに単純モデルをあてはめます。

データ型:仅有一个的|双重的

名前と値のペアの引数

オプションの名称,值引数のコンマ区切りペアを指定します。名称は引数名で、价值は対応する値です。名称は引用符で囲まなければなりません。名称1，值1，…，名称，值のように,複数の名前と値のペアの引数を,任意の順番で指定できます。

例:石灰（黑箱，“QueryPoint”问,“NumImportantPredictors”n“SimpleModelType”,“树”)は、クエリ点を问,単純モデルに使用するための重要な予測子の数をn,単純モデルのタイプを決定木モデルとして指定します。石灰は,合成予測子データセットの標本を生成し,標本の予測を計算し,指定数が最大の予測子を使用してクエリ点に決定木モデルをあてはめます。

合成予測子データのオプション

すべて展開する

`DataLocality`- - - - - -データ生成する合成データの局所性
`“全球”`(既定値) |`“本地”`

データ生成する合成データの局所性。“DataLocality”と“全球”または“本地”で構成されるコンマ区切りのペアとして指定します。

“全球”— ソフトウェアが、予測子データセット全体 (Xまたは黑箱の予測子データ)を使用して分布パラメーターを推定します。ソフトウェアは,推定されたパラメーターを使用して合成予測子データセットを生成し、任意のクエリ点への単純モデルのあてはめにそのデータセットを使用します。
“本地”—ソフトウェアが、クエリ点の K最近傍を使用して分布パラメーターを推定します。ここで、Kは“纽曼尼斯堡”個の値です。ソフトウェアは、指定されたクエリ点に単純モデルをあてはめるたびに、新しい合成予測子データセットを生成します。

詳細は、石灰を参照してください。

例:“数据位置”，“本地”

データ型:烧焦|字符串

`NumNeighbors`- - - - - -クエリ点の近傍の数
1500(既定値) |正の整数スカラー値

クエリ点の近傍の数。“纽曼尼斯堡”と正の整数スカラー値で構成されるコンマ区切りのペアとして指定します。この引数は,“DataLocality”が“本地”である場合のみ有効です。

指定された値が予測子データセット(黑箱のXまたは予測子データ) 内の観測値の数より大きい場合、石灰はすべての観測値を使用します。

例:《纽曼尼斯堡》，2000年

データ型:仅有一个的|双重的

`NumSyntheticData`- - - - - -合成データセットのために生成する標本の数
5000(既定値) |正の整数スカラー値

合成データセットのために生成する標本の数。“NumSyntheticData”と正の整数スカラー値で構成されるコンマ区切りのペアとして指定します。この引数は,“DataLocality”が“本地”である場合のみ有効です。

例:“NumSyntheticData”,2500年

データ型:仅有一个的|双重的

単純モデルのオプション

すべて展開する

`KernelWidth`- - - - - -カーネルの幅
0.75(既定値) |数値スカラー値

二乗指数(またはガウス)カーネル関数のカーネルの幅。“KernelWidth”と数値スカラー値で構成されるコンマ区切りのペアとして指定します。

関数石灰は、クエリ点と合成予測子データセット内の標本の間の距離を計算し、その距離を二乗指数カーネル関数を使用して重みに変換します。“KernelWidth”値を低くすると、石灰が使用する重みは、クエリ点に近い標本に重点を置くものになります。詳細については、石灰を参照してください。

例:“KernelWidth”,0.5

データ型:仅有一个的|双重的

`SimpleModelType`- - - - - -単純モデルのタイプ
`“线性”`(既定値) |`“树”`

単純モデルのタイプ。“SimpleModelType”と“线性”または“树”で構成されるコンマ区切りのペアとして指定します。

“线性”— ソフトウェアは、回帰には菲特利恩を、分類にはfitclinearを使用して、線形モデルをあてはめます。
“树”— ソフトウェアは、回帰にはfitrtreeを、分類にはfitctreeを使用して、決定木モデルをあてはめます。

例:“SimpleModelType”，“树”

データ型:烧焦|字符串

機械学習モデルのオプション

すべて展開する

`分类预测因子`- - - - - -カテゴリカル予測子のリスト
正の整数のベクトル|逻辑ベクトル|文字行列|字符串配列|文字ベクトルの细胞配列|`“全部”`

カテゴリカル予測子のリスト。“CategoricalPredictors”と次の表のいずれかの値から構成されるコンマ区切りのペアとして指定します。

値	説明
正の整数のベクトル	ベクトルの各エントリは、カテゴリカル変数が含まれている予測子データの列に対応するインデックス値です。インデックス値の範囲は 1 ～`p`です。`p`はモデルの学習に使用した予測子の数です。 `黑箱`が入力変数のサブセットを予測子として使用する場合、ソフトウェアはサブセットのみを使用して予測子にインデックスを作成します。応答変数、観測値の重み変数、および関数で使用されないその他の変数は、`“CategoricalPredictors”`値でカウントされません。
逻辑ベクトル	`符合事实的`というエントリは、予測子データの対応する列がカテゴリカル変数であることを意味します。ベクトルの長さは`p`です。
文字行列	行列の各行は予測子変数の名前です。名前は、桌子形式の予測子データの変数名と一致しなければなりません。文字行列の各行が同じ長さになるように、名前を余分な空白で埋めてください。
文字ベクトルの单间牢房配列または一串配列	配列の各要素は予測子変数の名前です。名前は、表形式の予測子データの変数名と一致しなければなりません。
`“全部”`	すべての予測子がカテゴリカルです。

黑箱を関数ハンドルとして指定する場合,石灰は予測子データXまたは自定义数据からカテゴリカル予測子を識別します。予測子データがテーブル内にある場合,石灰は、その変数が必然的ベクトル、順序付けのない明确的ベクトル、文字配列、一串配列または文字ベクトルの单间牢房配列のいずれかである場合に、変数を明确的であると見なします。予測子データが行列である場合、石灰はすべての予測子が連続的であると見なします。
黑箱を回帰または分類モデルオブジェクトとして指定する場合,石灰はモデルオブジェクトの分类预测因子プロパティを使用してカテゴリカル予測子を識別します。

石灰は順序付きのカテゴリカル予測子をサポートしていません。

例:“分类预测因子”，“全部”

データ型:仅有一个的|双重的|逻辑|烧焦|字符串|细胞

`类型`- - - - - -機械学習モデルのタイプ
`的回归`|`“分类”`

機械学習モデルのタイプ。“类型”と的回归または“分类”で構成されるコンマ区切りのペアとして指定します。

黑箱を関数ハンドルとして指定するときは,この引数を指定しなければなりません。黑箱を回帰または分類モデルオブジェクトとして指定した場合,石灰はモデルのタイプに応じて“类型”の値を決定します。

例:“类型”，“分类”

データ型:烧焦|字符串

距離計算のオプション

すべて展開する

`距离`- - - - - -距離計量
文字ベクトル|一串スカラー|関数ハンドル

距離計量。“距离”と文字ベクトル,弦スカラー,または関数ハンドルで構成されるコンマ区切りのペアとして指定します。

予測子データに連続変数のみが含まれる場合、石灰はこれらの距離計量をサポートします。

値	説明
`“欧几里得”`	ユークリッド距離。
`“seuclidean”`	標準化されたユークリッド距離。観測値間の各座標差は、標準偏差`S=std（PD，'omitnan'）`の対応する要素で除算することによりスケーリングされます。ここで、`PD`は予測子データ、または合成予測子データです。別のスケーリングを指定するには、名前と値の引数`“规模”`を使用します。
`“mahalanobis”`	`PD`の標本共分散を使用したマハラノビス距離、`C=cov（PD，'omitrows'）`。共分散行列の値を変更するには、名前と値の引数`“浸”`を使用します。
`“cityblock”`	市街地距離。
`“明可夫斯基”`	ミンコフスキー距離。既定の指数は 2.です。別の指数を指定するには、名前と値の引数`“P”`を使用します。
`“切比切夫”`	チェビシェフ距離 (最大座標差)。
`“余弦”`	1から,ベクトルとして扱われる点の間の夾角の余弦を引いた値。
`“相关性”`	1.から、値の系列として扱われる点の間の標本相関を引いた値。
`“枪兵”`	1.から、観測値間の標本スピアマンの順位相関 (値の系列として扱われる) を引いた値。
`＠迪斯芬`	カスタム距離関数のハンドル。距離関数の形式は次のようになります。函数ZJ D2 = distfun(子)%距离计算．.. ここで `梓`は,単一の観測値が含まれている`1`行`t`列のベクトルです。 `ZJ`は、複数の観測値が含まれている`年代`行`t`列の行列です。`迪斯芬`は,任意の個数の観測値が含まれている行列`ZJ`を受け入れなければなりません。 `D2`は`年代`行`1`列の距離のベクトルであり、`D2（k）`は観測値`梓`と`ZJ（k，：）`の間の距離です。データがスパースでない場合、通常は関数ハンドルではなく組み込みの距離計量を使用する方が高速に距離を計算できます。

予測子データに連続変数とカテゴリカル変数の両方が含まれる場合,石灰はこれらの距離計量をサポートします。

値	説明
`“Goodall 3”`	異形グドール距離
`“ofd”`	出現頻度距離

定義については距離計量を参照してください。

既定値は、予測子データに連続変数のみが含まれる場合は“欧几里得”、予測子データに連続変数とカテゴリカル変数の両方が含まれる場合は“Goodall 3”です。

例:“距离”，“ofd”

データ型:烧焦|字符串|function_handle

`浸`- - - - - -マハラノビス距離計量の共分散行列
正定値行列

マハラノビス距離計量の共分散行列。“浸”とK行K列の正定値行列で構成されるコンマ区切りのペアとして指定します。Kは予測子の数です。

この引数は,“距离”が“mahalanobis”である場合のみ有効です。

既定の“浸”値は浸(PD omitrows)です。ここで、PDは予測子データ,または合成予測子データです。“浸”値を指定しなかった場合、ソフトウェアは、予測子データおよび合成予測子データの両方の距離を計算するときに、異なる共分散行列を使用します。

例:“Cov”，眼睛（3）

データ型:仅有一个的|双重的

`P`- - - - - -ミンコフスキー距離計量の指数
`2`(既定値) |正のスカラー

ミンコフスキー距離計量の指数。“P”と正のスカラー値をコンマで区切って指定します。

この引数は,“距离”が“明可夫斯基”である場合のみ有効です。

例:“P”3

データ型:仅有一个的|双重的

`规模`- - - - - -標準化されたユークリッド距離計量のスケールパラメーター値
非負の数値ベクトル

標準化されたユークリッド距離計量のスケールパラメーター値。“规模”と長さKの非負の数値ベクトルで構成されるコンマ区切りのペアとして指定します。Kは予測子の数です。

この引数は,“距离”が“seuclidean”である場合のみ有効です。

既定の“规模”値は性病(PD omitnan)です。ここで、PDは予測子データ,または合成予測子データです。“规模”値を指定しなかった場合、ソフトウェアは、予測子データおよび合成予測子データの両方の距離を計算するときに、異なるスケールパラメーターを使用します。

例:“规模”,分位数(0.75 X)——分位数(0.25 X))

データ型:仅有一个的|双重的

プロパティ

すべて展開する

指定されるプロパティ

石灰オブジェクトを作成するときに、以下のプロパティを指定できます。

`BlackboxModel`- - - - - -解釈される機械学習モデル
回帰モデルオブジェクト|分類モデルオブジェクト|関数ハンドル

このプロパティは読み取り専用です。

解釈される機械学習モデル。回帰または分類モデルオブジェクトとして指定するか、関数ハンドルとして指定します。

黑箱引数によってこのプロパティが設定されます。

`分类预测因子`- - - - - -カテゴリカル予測子のインデックス
正の整数のベクトル|`[]`

このプロパティは読み取り専用です。

カテゴリカル予測子のインデックス。正の整数のベクトルを指定します。分类预测因子には、カテゴリカル予測子が含まれている予測子データの列に対応するインデックス値を格納します。どの予測子もカテゴリカルではない場合、このプロパティは空 ([]) になります。

関数ハンドルを使用して黑箱を指定した場合、石灰は予測子データXまたは自定义数据からカテゴリカル予測子を識別します。名前と値の引数“CategoricalPredictors”を指定した場合にこのプロパティが設定されます。
黑箱を回帰または分類モデルオブジェクトとして指定した場合,石灰はモデルオブジェクトの分类预测因子プロパティを使用してこのプロパティを決定します。

石灰は順序付きのカテゴリカル予測子をサポートしていません。

“SimpleModelType”が“线性”の場合(既定),石灰は識別されたそれぞれのカテゴリカル予測子についてダミー変数を作成します。石灰は、指定されたクエリ点のカテゴリを基準グループとして扱い、カテゴリの数より 1.つ少ないダミー変数を作成します。詳細は、基準グループを使用したダミー変数を参照してください。

データ型:仅有一个的|双重的

`DataLocality`- - - - - -データ生成する合成データの局所性
`“全球”`|`“本地”`

このプロパティは読み取り専用です。

データ生成する合成データの局所性。“全球”または“本地”として指定します。

名前と値の引数“DataLocality”によってこのプロパティが設定されます。

`重要预测因子`- - - - - -単純モデルで使用する重要な予測子の数
正の整数スカラー値

このプロパティは読み取り専用です。

単純モデル (简单模型)で使用する重要な予測子の数。正の整数スカラー値として指定します。

石灰の重要预测因子引数,または适合の重要预测因子引数によってこのプロパティが設定されます。

データ型:仅有一个的|双重的

`NumSyntheticData`- - - - - -合成データセットの標本数
正の整数スカラー値

このプロパティは読み取り専用です。

合成データセットの標本数。正の整数スカラー値として指定します。

自定义数据を指定した場合,カスタム合成データセットの標本数によってこのプロパティが設定されます。
そうでない場合、石灰の名前と値の引数“NumSyntheticData”、または适合の名前と値の引数“NumSyntheticData”によってこのプロパティが設定されます。

データ型:仅有一个的|双重的

`查询点`- - - - - -クエリ点
数値の行ベクトル|単一行テーブル

このプロパティは読み取り専用です。

石灰が単純モデル (简单模型) を使用して予測子を説明するクエリ点。数値の行ベクトルまたは単一行テーブルとして指定します。

石灰の查询点引数,または适合の查询点引数によってこのプロパティが設定されます。

データ型:仅有一个的|双重的|桌子

`类型`- - - - - -機械学習モデルのタイプ
`的回归`|`“分类”`

このプロパティは読み取り専用です。

機械学習モデル(BlackboxModel) のタイプ。的回归または“分类”として指定します。

黑箱を回帰または分類モデルオブジェクトとして指定した場合,石灰はモデルのタイプに応じてこのプロパティを決定します。
関数ハンドルを使用して黑箱を指定した場合、名前と値の引数“类型”によってこのプロパティが設定されます。

`X`- - - - - -予測子データ
数値行列|テーブル

このプロパティは読み取り専用です。

予測子データ。数値行列またはテーブルとして指定します。

Xの各行は1つの観測値に対応し,各列は1つの変数に対応します。

X引数を指定した場合にこのプロパティが設定されます。
自定义数据引数を指定した場合、このプロパティは空になります。
黑箱を完全な機械学習モデルオブジェクトとして指定し、Xまたは自定义数据を指定しなかった場合,このプロパティ値が黑箱の学習に使用される予測子データになります。

石灰は欠損値を含む行は使用せず、それらの行はXに格納されません。

データ型:仅有一个的|双重的|桌子

計算されるプロパティ

以下のプロパティはソフトウェアによって計算されます。

`黑匣子`- - - - - -機械学習モデルによって計算されたクエリ点の予測
スカラー

このプロパティは読み取り専用です。

機械学習モデル(BlackboxModel) によって計算されたクエリ点の予測。スカラーとして指定します。予測は、回帰の場合は予測された応答、分類の場合は分類されたラベルになります。

データ型:仅有一个的|双重的|明确的|逻辑|烧焦|字符串|细胞

`合身`- - - - - -機械学習モデルによって計算された合成予測子データの予測
ベクトル

このプロパティは読み取り専用です。

機械学習モデル(BlackboxModel) によって計算された合成予測子データの予測。ベクトルとして指定します。

データ型:仅有一个的|双重的|明确的|逻辑|烧焦|字符串|细胞

`重要预言家`- - - - - -重要な予測子のインデックス
正の整数のベクトル

このプロパティは読み取り専用です。

重要な予測子のインデックス。正の整数のベクトルとして指定します。重要预言家には単純モデル(简单模型)で使用される予測子の列に対応するインデックス値が格納されます。

データ型:仅有一个的|双重的

`简单模型`- - - - - -単純モデル
`RegressionLinear`モデルオブジェクト|`回归树`モデルオブジェクト|`ClassificationLinear`モデルオブジェクト|`分类树`モデルオブジェクト

このプロパティは読み取り専用です。

単純モデル。RegressionLinear、回归树、ClassificationLinear、または分类树モデルオブジェクトとして指定します。石灰は機械学習モデルのタイプ (类型) および単純モデルのタイプ (“SimpleModelType”) に応じて単純モデルオブジェクトのタイプを決定します。

`简单模型`- - - - - -単純モデルによって計算されたクエリ点の予測
スカラー

このプロパティは読み取り専用です。

単純モデル (简单模型)によって計算されたクエリ点の予測。スカラーとして指定します。

简单模型がClassificationLinearの場合、简单模型の値は 1.または –1.になります。

简单模型の値が1になるのは,単純モデルからの予測が黑匣子(機械学習モデルからの予測)と同じである場合です。
简单模型の値が –1.になるのは、単純モデルからの予測が黑匣子と異なる場合です。黑匣子の値が一个であった場合、関数情节は简单模型の値を不是一个として表示します。

データ型:仅有一个的|双重的|明确的|逻辑|烧焦|字符串|细胞

`综合数据`- - - - - -合成予測子データ
数値行列|テーブル

このプロパティは読み取り専用です。

合成予測子データ。数値行列または桌子として指定します。

自定义数据入力引数を指定した場合にこのプロパティが設定されます。
そうでない場合、石灰は、予測子データXから分布パラメーターを推定して合成予測子データセットを生成します。

データ型:仅有一个的|双重的|桌子

オブジェクト関数

`适合`	局部可解释模型不可知解释（LIME）の単純モデルのあてはめ
`情节`	局部可解释模型不可知解释（LIME）の結果のプロット

例

すべて折りたたむ

単純な決定木モデルを使った予測の説明

ライブスクリプトを開く

分類モデルの学習を行い、単純な決定木モデルを使用する石灰オブジェクトを作成します。石灰オブジェクトを作成するときに、クエリ点と重要な予測子の数を指定して、ソフトウェアが合成データセットの標本を生成し、重要な予測子を使って単純モデルをクエリ点にあてはめるようにします。次に、オブジェクト関数情节を使用して、予測子の推定重要度を単純モデルに表示します。

信用评级データセットを読み込みます。データセットには,顧客ID,顧客の財務比率,業種ラベル,および信用格付けが格納されています。

tbl=可读(“CreditRating_Historical.dat”）;

テーブルの最初の 3.行を表示します。

头部（待定，3）

ans=3×8表这是一个两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两}424440.3110.3670.0741.9350.3661{'A'}

tblから顧客IDと信用格付けの列を削除して,予測子変数の表を作成します。

tblX = removevars(资源描述,“ID”，“评级”]）;

関数fitcecocを使用して,信用格付けの黑箱モデルに学習させます。

黑盒=fitcecoc（tblX，tbl.额定值，“CategoricalPredictors”，“工业”）;

単純な決定木モデルを使用して最後の観測値の予測を説明する石灰オブジェクトを作成します。最大 6.つの重要な予測子を見つけるため、“NumImportantPredictors”を 6.に指定します。石灰オブジェクトを作成するときに“QueryPoint”と“NumImportantPredictors”の値を指定した場合、ソフトウェアは合成データセットの標本を生成し、解釈可能な単純モデルを合成データセットにあてはめます。

queryPoint=tblX（结束：）

查询点=1×6表企业所得税息税前利润（MVE）为行业所得税息税息税息税息税息税息税息税息税息税息税息税息税息税息税息税息税息税息税息税息税息税息税息税息税息税息税息税息税息税息税息税息税息税息税行业所得税息税息税息税息税息税息税息税息税息税息税息税息税息税息税息税息税息税息税息税息税息税息税息税息税息税息税息税息税息税息税

rng(“默认”）%为了再现性结果=石灰（黑盒，“QueryPoint”，查询点，“NumImportantPredictors”6.．..“SimpleModelType”，“树”）

结果=带属性的lime:BlackboxModel:[1x1 ClassificationCoC]数据位置：'global'分类预测因子：6类型：'classification'X:[3932x6表]查询点：[1x6表]NUM重要预测因子：6 NUM合成数据：5000合成数据：[5000x6表]拟合：{5000x1单元格}简单模型：[1x1 ClassificationTree]重要预测因子：[2x1 double]BlackboxFitted:{'AA'}SimpleModelFitted:{'AA'}

オブジェクト関数情节を使用して,石灰オブジェクト结果をプロットします。予測子名に含まれるアンダースコアを表示するには、座標軸のTickLabelInterpreter値を“没有”に変更します。

f=绘图（结果）；f.CurrentAxis.TickLabelInterpreter=“没有”；

图中包含一个轴。带有决策树模型标题的轴包含一个bar类型的对象。

プロットには、クエリ点についての 2.つの予測値が示されています。この予測値は、结果の黑匣子プロパティと简单模型プロパティに対応します。

横棒グラフは,予測子の重要度の並べ替えられた値を示しています。石灰はクエリ点の重要な予測子として財務比率変数息税前利润および沃库塔を求めます。

バーの長さは,データヒントまたは酒吧のプロパティを使用して読み取ることができます。たとえば,関数芬多布吉を使用して酒吧オブジェクトを検索し、関数文本を使用して、バーの端にラベルを追加できます。

b = findobj (f,“类型”，“酒吧”）;文本(b.YEndPoints + 0.001, b.XEndPoints字符串(b.YData))

图中包含一个轴。带有标题和决策树模型的轴包含3个类型为bar、text的对象。

あるいは,予測子変数名をもつ表に係数値を表示することもできます。

imp=b.YData；flipud（数组2）table（imp',，．..“RowNames”，f.currentAxis.YTickLabel，“VariableNames”,{“预测重要性”}))

ans=2×1表预测器重要性0.088412 RE_TA 0.0018061

線形単純モデルを使用した予測の説明

ライブスクリプトを開く

回帰モデルの学習を行い,線形単純モデルを使用する石灰オブジェクトを作成します。石灰オブジェクトを作成するときに,クエリ点と重要な予測子の数を指定しなかった場合,ソフトウェアは合成データセットの標本を生成しますが,単純モデルのあてはめは行いません。オブジェクト関数适合を使用して、クエリ点に単純モデルをあてはめます。次に、オブジェクト関数情节を使用して,あてはめた線形単純モデルの係数を表示します。

carbigデータセットを読み込みます。このデータセットには,1970年代と1980年代初期に製造された自動車の測定値が格納されています。

负载carbig

加速度、气缸などの予測子変数と応答変数英里/加仑が格納された桌子を作成します。

台=表(加速度、汽缸、排量、马力、Model_Year重量,MPG);

学習セットの欠損値を削除すると、メモリ消費量を減らして関数菲特克内尔の学習速度を向上させることができます。tblの欠損値を削除します。

tbl=RML缺失（tbl）；

tblから応答変数を削除して、予測子変数のテーブルを作成します。

tblX=移除变量（tbl，“英里”）;

関数菲特克内尔を使用して英里/加仑の黑匣子モデルの学習を行います。

rng(“默认”）%为了再现性mdl=fitrkernel（tblX，tbl.MPG，“CategoricalPredictors”[2 - 5]);

石灰オブジェクトを作成します。mdlには予測子データが含まれないため,予測子データセットを指定します。

结果=石灰(mdl tblX)

结果=石灰与属性:BlackboxModel: [1 x1 RegressionKernel] DataLocality:“全球”CategoricalPredictors:[2 5]类型:“回归”X: [392 x6表]QueryPoint: [] NumImportantPredictors: [] NumSyntheticData: 5000 SyntheticData: [5000 x6表)安装:x1双[5000]SimpleModel: [] ImportantPredictors: [] BlackboxFitted:[] SimpleModelFitted: []

结果には、生成された合成データセットが含まれます。简单模型プロパティは空 ([]) です。

tblXの最初の観測値に線形単純モデルをあてはめます。検出する重要な予測子の数を 3.に指定します。

: queryPoint = tblX (1)

查询点=1×6表加速气缸位移马力Model_Year重量  ____________ _________ ____________ __________ __________ ______ 12 8 307 130 70 3504

结果=适合(结果,queryPoint, 3);

f=绘图（结果）；f.CurrentAxis.TickLabelInterpreter=“没有”；

图中包含一个轴。标题为“线性模型”的轴包含一个bar类型的对象。

プロットには、クエリ点についての 2.つの予測値が示されています。この予測値は、结果の黑匣子プロパティと简单模型プロパティに対応します。

横棒グラフは、絶対値で並べ替えられた、単純モデルの係数値を示します。石灰は、クエリ点の重要な予測子として、马力、车型年款、および气缸を見つけます。

车型年款および气缸は複数のカテゴリをもつカテゴリカル予測子です。線形単純モデルの場合,各カテゴリカル予測子について,カテゴリの数よりも1つ少ないダミー変数が作成されます。棒グラフには最も重要なダミー変数のみが表示されます。他のダミー変数の係数は结果の简单模型プロパティを使用して確認できます。すべてのカテゴリカルダミー変数を含む並べ替えられた係数の値を表示します。

[~，I]=sort（abs（results.SimpleModel.Beta），“下”)；表（results.SimpleModel.expandedPredictor名称（I）”，results.SimpleModel.Beta（I），．..“VariableNames”,{'扩展预测程序名称'，“系数”})

ans=17×2表Exteded预测名字系数  __________________________ ___________ {' -3.4485马力的}e-05 {Model_Year(74和70)的}-6.1279 e-07{“Model_Year(80和70)的}-4.015 e-07{“Model_Year(81和70)的}3.4176 e-07{“Model_Year(82和70)的}-2.2483 e-07{的圆柱体(6和8)}-1.9024 e-07{“Model_Year(76和70)的}1.8136 e-07{圆柱体(5 vs。8)'} 1.746e -07 {'Model_Year (75 vs. 70)'} 1.5456e-07 {'Model_Year (77 vs. 70)'} 1.4272e-07 {'Model_Year (78 vs. 70)'} 6.7001e-08 {'Model_Year (72 vs. 70)'} 4.7214e-08 {' cylinder (4 vs. 8)'} 4.518e -08 {'Model_Year (79 vs. 70)'} -2.2598e-08⋮

黑匣子モデルを関数ハンドルとして指定

ライブスクリプトを開く

回帰モデルの学習を行い、モデルの関数预测の関数ハンドルを使用する石灰オブジェクトを作成します。オブジェクト関数适合を使用して,指定したクエリ点に単純モデルをあてはめます。次に,オブジェクト関数情节を使用して,あてはめた線形単純モデルの係数を表示します。

carbigデータセットを読み込みます。このデータセットには,1970年代と1980年代初期に製造された自動車の測定値が格納されています。

负载carbig

予測子変数加速度、气缸などを格納する桌子を作成します。

tbl=表（加速度、气缸、排量、马力、车型年份、重量）；

関数树人を使用して英里/加仑の黑匣子モデルの学習を行います。

rng(“默认”）%为了再现性Mdl=TreeBagger（100，tbl，MPG，“方法”，“回归”，“CategoricalPredictors”[2 - 5]);

石灰は树人オブジェクトを直接はサポートしないため,石灰の最初の入力引数(黑箱モデル)を树人オブジェクトとして指定することはできません。代わりに、関数预测の関数ハンドルを使用できます。関数预测のオプションも関数の名前と値の引数を使用して指定できます。

树人オブジェクトMdlの関数预测の関数ハンドルを作成します。使用する木のインデックスの配列を1:50と指定します。

myPredict = @(tbl) predict(Mdl,tbl，)“树”,1:50);

関数ハンドル我的预测を使用して石灰オブジェクトを作成します。黑箱モデルを関数ハンドルとして指定する場合、予測子データを提供し、名前と値の引数“类型”を指定しなければなりません。tblには、双重的データ型のカテゴリカル予測子(圆柱および车型年款)が含まれています。既定では,石灰は双重的データ型の変数をカテゴリカル予測子として扱いません。2.番目 (圆柱) と 5.番目 (车型年款)の変数をカテゴリカル予測子として指定します。

结果=石灰（myPredict，tbl，“类型”，“回归”，“CategoricalPredictors”[2 - 5]);

tblの最初の観測値に線形単純モデルをあてはめます。予測子名に含まれるアンダースコアを表示するには、座標軸のTickLabelInterpreter値を“没有”に変更します。

结果=适合(结果,台(1:),4);f=绘图（结果）；f.CurrentAxis.TickLabelInterpreter=“没有”；

图中包含一个轴。标题为“线性模型”的轴包含一个bar类型的对象。

石灰は、重要な予測子として马力、取代、气缸、および车型年款を見つけます。

詳細

すべて展開する

距離計量

距離計量は、2.つの観測値の間の距離を定義する関数です。石灰は,連続変数用のさまざまな距離計量や,連続変数とカテゴリカル変数の混在をサポートします。

連続変数の距離計量
mx行 N列のデータ行列 X（mx個の 1.行 N列の行ベクトル x₁, x₂、、、x_mxとして扱われる) と、我的行 N列のデータ行列 Y（我的個の 1.行 N列の行ベクトル Y₁y₂Y_我的として扱われる)が与えられた場合,ベクトルx_年代とy_tの間のさまざまな距離は次のように定義されます。
- ユークリッド距離
  
  $d_{年代 t}^{2} ＝（ x_{年代} - y_{t} ）（ x_{年代} - y_{t} ）^{”} ．$
  
  ユークリッド距離はミンコフスキー距離の特殊なケース,p=2の場合です。
- 標準化されたユークリッド距離
  
  $d_{年代 t}^{2} ＝（ x_{年代} - y_{t} ） V^{- 1} （ x_{年代} - y_{t} ）^{”} ，$
  
  ここで、vは J番目の対角要素が(S (j))²であるn行n列の対角行列です。年代は各次元のスケーリング係数のベクトルです。
- マハラノビス距離
  
  $d_{年代 t}^{2} ＝（ x_{年代} - y_{t} ） C^{- 1} （ x_{年代} - y_{t} ）^{”} ，$
  
  ここで、Cは共分散行列です。
- 市街地距離
  
  $d_{年代 t} ＝ \sum_{j ＝ 1}^{n} | x_{年代 j} - y_{t j} | ．$
  
  市街地距離はミンコフスキー距離の特殊なケース、p=1の場合です。
- ミンコフスキー距離
  
  $d_{年代 t} ＝ \sqrt[p]{\sum_{j ＝ 1}^{n} {| x_{年代 j} - y_{t j} |}^{p}} ．$
  
  p=1という特殊なケースでは,ミンコフスキー距離は市街地距離を与えます。p=2という特殊なケースでは,ミンコフスキー距離はユークリッド距離を与えます。p =∞という特殊なケースでは、ミンコフスキー距離はチェビシェフ距離を与えます。
- チェビシェフ距離
  
  $d_{年代 t} ＝ {最大值}_{j} ｛ | x_{年代 j} - y_{t j} | ｝．$
  
  チェビシェフ距離はミンコフスキー距離の特殊なケース、p =∞の場合です。
- コサイン距離
  
  $d_{年代 t} ＝（ 1 - \frac{x_{年代} {y^{”}}_{t}}{\sqrt{（ x_{年代} {x^{”}}_{年代} ）（ y_{t} {y^{”}}_{t} ）}} ）．$
- 相関距離
  
  $d_{年代 t} ＝ 1 - \frac{（ x_{年代} - {\bar{x}}_{年代} ） {（ y_{t} - {\bar{y}}_{t} ）}^{”}}{\sqrt{（ x_{年代} - {\bar{x}}_{年代} ） {（ x_{年代} - {\bar{x}}_{年代} ）}^{”}} \sqrt{（ y_{t} - {\bar{y}}_{t} ） {（ y_{t} - {\bar{y}}_{t} ）}^{”}}} ，$
  
  ここで
  
  ${\bar{x}}_{年代} ＝ \frac{1}{n} \sum_{j} x_{年代 j}$
  
  および
  
  ${\bar{y}}_{t} ＝ \frac{1}{n} \sum_{j} y_{t j} ．$
- スピアマン距離
  
  $d_{年代 t} ＝ 1 - \frac{（ r_{年代} - {\bar{r}}_{年代} ） {（ r_{t} - {\bar{r}}_{t} ）}^{”}}{\sqrt{（ r_{年代} - {\bar{r}}_{年代} ） {（ r_{年代} - {\bar{r}}_{年代} ）}^{”}} \sqrt{（ r_{t} - {\bar{r}}_{t} ） {（ r_{t} - {\bar{r}}_{t} ）}^{”}}} ，$
  
  ここで
  - r_sjは、tiedrankにより計算される,x_1j, x_2j、…x_mx，jから取得された x_sjの順位です。
  - r_tjは、tiedrankにより計算されるy_1jy_2jY_我,我から取得された Y_tjの順位です。
  - r_年代および R_tはx_年代および Y_tの座標単位の順位ベクトルです。つまり、R_年代= (r_年代₁, r_年代₂R_锡) および R_t= (r_t1, r_t2R_总氮) です。
  - ${\bar{r}}_{年代} ＝ \frac{1}{n} \sum_{j} r_{年代 j} ＝ \frac{（ n + 1 ）}{2}$ ．
  - ${\bar{r}}_{t} ＝ \frac{1}{n} \sum_{j} r_{t j} ＝ \frac{（ n + 1 ）}{2}$ ．
連続変数とカテゴリカル変数が混在する場合の距離計量
- 異形グドール距離
  この距離は,グドール距離のバリアントであり,他の値の頻度に関係なく,一致する値が互いに離れた場所にある場合に小さな距離を割り当てます。不一致の場合,予測子の距離寄与は1 /(変数の数)です。
- 出現頻度距離
  一致の場合,出現頻度距離はゼロ距離を割り当てます。不一致の場合,出現頻度距離は,頻度の低い値に高い距離を割り当て,頻度の高い値に低い距離を割り当てます。

アルゴリズム

すべて展開する

石灰

手順 1 ～ 5 の記載のとおり、石灰[1]を使用して機械学習モデルの予測を説明するため、ソフトウェアは、合成データセットを生成し、石灰と适合を使用して解釈可能な単純モデルを合成データセットにあてはめます。

石灰の查询点値と重要预测因子値を指定した場合、関数石灰はすべての手順を実行します。
查询点および重要预测因子を指定せずに“DataLocality”を“全球”(既定の設定) として指定した場合、関数石灰が合成データセットを生成し(手順1 ~ 2),関数适合が単純モデルをあてはめます (手順 3 ～ 5)。
查询点および重要预测因子を指定せずに“DataLocality”を“本地”として指定した場合、関数适合はすべての手順を実行します。

関数石灰および适合は,以下の手順を実行します。

連続変数には多変量正規分布を、各カテゴリカル変数には多変量分布を使用して、合成予測子データセット X_年代を生成します。名前と値の引数“NumSyntheticData”を使用して、生成する標本の数を指定できます。
- “DataLocality”が“全球”(既定の設定)である場合,ソフトウェアは,予測子データセット全体(Xまたは黑箱内の予測子データ) から分布パラメーターを推定します。
- “DataLocality”が“本地”である場合,ソフトウェアは,クエリ点のk個の最近傍を使用して分布パラメーターを推定します。ここでkは“纽曼尼斯堡”値です。名前と値の引数“距离”を使用して、最近傍を見つけるための距離計量を指定できます。
ソフトウェアは、分布パラメーターを推定する際、予測子データセット内の欠損値を無視します。
あるいは、石灰の入力引数自定义数据を使用することで,事前生成されたカスタム合成予測子データセットを提供できます。
合成データセットX_年代についての予測値Y_年代を計算します。この予測値は,回帰,または分類を行うための分類済みラベルについての予測応答です。ソフトウェアは,黑箱モデルの関数预测を使用して予測値を計算します。黑箱を関数ハンドルとして指定した場合,ソフトウェアは,その関数ハンドルを使用して予測値を計算します。
“距离”によって指定された距離計量を使用して,クエリ点と合成予測子データセット内の標本の距離dを計算します。
二乗指数 (またはガウス) カーネル関数を使用して、クエリ点 Qに対する合成予測子データセット内の標本の重み値 W_问を計算します。

$w_{问} （ x_{年代} ）＝经验值（ - \frac{1}{2} {（ \frac{d （ x_{年代} ，问）}{\sqrt{p} σ} ）}^{2} ）．$
- x_年代は,合成予測子データセットX_年代内の標本です。
- d（x）_年代问)は、標本 x_年代とクエリ点 Qの距離です。
- Pは、X_年代内の予測子の数です。
- σ はカーネルの幅です。名前と値の引数“KernelWidth”を使用して指定できます。既定の“KernelWidth”値は 0.75です。
クエリ点における重み値は1であり,距離の値が大きくなるにつれ,0に収束していきます。“KernelWidth”値は、重み値が 0に収束する速度を制御します。“KernelWidth”値が小さければ,重み値はより速く0に収束します。その結果,アルゴリズムは,クエリ点に近い標本に,より大きな重みを付与します。このような重み値がアルゴリズムによって使用されることで,選択された重要な予測子,およびあてはめられた単純モデルによる,クエリ点周辺の合成データについての予測子の局所的な説明が有効となります。
単純モデルをあてはめます。
- “SimpleModelType”が“线性”(既定の設定)である場合,ソフトウェアは,重要な予測子を選択し,選択した重要な予測子の線形モデルをあてはめます。
  - グループ直交マッチング追跡（OMP）アルゴリズム[2][3]を使用して、N個の重要な予測子 ( ${\tilde{X}}_{年代}$ ) を選択します。ここで、Nは重要预测因子値です。このアルゴリズムは、合成予測子データセット (十)_年代)、予測子（Y）_年代),および重み値(w_问) を使用します。
  - 重み値（w）_问) を使用して、選択した重要な予測子 ( ${\tilde{X}}_{年代}$ )の線形モデルを予測子(Y_年代) にあてはめます。ソフトウェアは、回帰には菲特利恩を、分類にはfitclinearを使用します。マルチクラスモデルの場合,ソフトウェアは,1対他(卵子)方式を使用してバイナリ分類問題を作成します。陽性クラスは黑箱モデルからのクエリ点についての予測クラスであり、陰性クラスはその他のクラスを指します。
- “SimpleModelType”が“树”である場合、ソフトウェアは、回帰にはfitrtreeを、分類にはfitctreeを使用して決定木モデルをあてはめます。ソフトウェアは、重要な予測子の数として決定分岐 (枝ノード) の最大数を指定し、あてはめられた決定木が、指定された数を上限に予測子を使用するようにします。

参照

（1）里贝罗、Marco Tulio、S. Singh和C. Guestrin。“我为什么要信任你？”：解释任何分类器的预测。“在第二十二届ACM SigkDD知识发现和数据挖掘国际会议论文中，1135—44。旧金山，加利福尼亚：ACM，2016。

[2] Świrszcz, Grzegorz, Naoki Abe, Aurélie C. Lozano。“变量选择和预测的分组正交匹配追踪”神经信息处理系统进展(2009):1150-58。

[3] Lozano Aurélie C.， Grzegorz Świrszcz，和Naoki Abe。逻辑回归的组正交匹配追踪。第十四届人工智能与统计国际会议论文集(2011):452-60。

参考

局部依赖|沙普利

トピック

用LIME解释表格数据的深度网络预测（深度学习工具箱）
機械学習モデルの解釈

R2020bで導入

石灰

説明

作成

構文

説明

入力引数

黑箱- - - - - -解釈される機械学習モデル回帰モデル オブジェクト|分類モデル オブジェクト|関数ハンドル

X- - - - - -予測子データ数値行列|テーブル

自定义数据- - - - - -事前生成されたカスタム合成予測子データ セット[](既定値) |数値行列|テーブル

查询点- - - - - -クエリ点数値の行ベクトル|単一行テーブル

重要预测因子- - - - - -単純モデルで使用する重要な予測子の数正の整数スカラー値

DataLocality- - - - - -データ生成する合成データの局所性“全球”(既定値) |“本地”

NumNeighbors- - - - - -クエリ点の近傍の数1500(既定値) |正の整数スカラー値

NumSyntheticData- - - - - -合成データセットのために生成する標本の数5000(既定値) |正の整数スカラー値

KernelWidth- - - - - -カーネルの幅0.75(既定値) |数値スカラー値

SimpleModelType- - - - - -単純モデルのタイプ“线性”(既定値) |“树”

分类预测因子- - - - - -カテゴリカル予測子のリスト正の整数のベクトル|逻辑ベクトル|文字行列|字符串配列|文字ベクトルの细胞配列|“全部”

类型- - - - - -機械学習モデルのタイプ的回归|“分类”

距离- - - - - -距離計量文字ベクトル|一串スカラー|関数ハンドル

浸- - - - - -マハラノビス距離計量の共分散行列正定値行列

P- - - - - -ミンコフスキー距離計量の指数2(既定値) |正のスカラー

规模- - - - - -標準化されたユークリッド距離計量のスケール パラメーター値非負の数値ベクトル

プロパティ

指定されるプロパティ

BlackboxModel- - - - - -解釈される機械学習モデル回帰モデル オブジェクト|分類モデル オブジェクト|関数ハンドル

分类预测因子- - - - - -カテゴリカル予測子のインデックス正の整数のベクトル|[]

DataLocality- - - - - -データ生成する合成データの局所性“全球”|“本地”

重要预测因子- - - - - -単純モデルで使用する重要な予測子の数正の整数スカラー値

NumSyntheticData- - - - - -合成データ セットの標本数正の整数スカラー値

查询点- - - - - -クエリ点数値の行ベクトル|単一行テーブル

类型- - - - - -機械学習モデルのタイプ的回归|“分类”

X- - - - - -予測子データ数値行列|テーブル

計算されるプロパティ

黑匣子- - - - - -機械学習モデルによって計算されたクエリ点の予測スカラー

合身- - - - - -機械学習モデルによって計算された合成予測子データの予測ベクトル

重要预言家- - - - - -重要な予測子のインデックス正の整数のベクトル

简单模型- - - - - -単純モデルRegressionLinearモデルオブジェクト|回归树モデルオブジェクト|ClassificationLinearモデルオブジェクト|分类树モデルオブジェクト

简单模型- - - - - -単純モデルによって計算されたクエリ点の予測スカラー

综合数据- - - - - -合成予測子データ数値行列|テーブル

オブジェクト関数

例

単純な決定木モデルを使った予測の説明

線形単純モデルを使用した予測の説明

黑匣子モデルを関数ハンドルとして指定

詳細

距離計量

アルゴリズム

石灰

参照

参考

トピック

统计和机器学习工具箱ドキュメンテーション

サポート

機械学習をマスターする: MATLABステップ・バイ・ステップ ガイド

`黑箱`- - - - - -解釈される機械学習モデル
回帰モデルオブジェクト|分類モデルオブジェクト|関数ハンドル

`X`- - - - - -予測子データ
数値行列|テーブル

`自定义数据`- - - - - -事前生成されたカスタム合成予測子データセット
`[]`(既定値) |数値行列|テーブル

`查询点`- - - - - -クエリ点
数値の行ベクトル|単一行テーブル

`重要预测因子`- - - - - -単純モデルで使用する重要な予測子の数
正の整数スカラー値

`DataLocality`- - - - - -データ生成する合成データの局所性
`“全球”`(既定値) |`“本地”`

`NumNeighbors`- - - - - -クエリ点の近傍の数
1500(既定値) |正の整数スカラー値

`NumSyntheticData`- - - - - -合成データセットのために生成する標本の数
5000(既定値) |正の整数スカラー値

`KernelWidth`- - - - - -カーネルの幅
0.75(既定値) |数値スカラー値

`SimpleModelType`- - - - - -単純モデルのタイプ
`“线性”`(既定値) |`“树”`

`分类预测因子`- - - - - -カテゴリカル予測子のリスト
正の整数のベクトル|逻辑ベクトル|文字行列|字符串配列|文字ベクトルの细胞配列|`“全部”`

`类型`- - - - - -機械学習モデルのタイプ
`的回归`|`“分类”`

`距离`- - - - - -距離計量
文字ベクトル|一串スカラー|関数ハンドル

`浸`- - - - - -マハラノビス距離計量の共分散行列
正定値行列

`P`- - - - - -ミンコフスキー距離計量の指数
`2`(既定値) |正のスカラー

`规模`- - - - - -標準化されたユークリッド距離計量のスケールパラメーター値
非負の数値ベクトル

`BlackboxModel`- - - - - -解釈される機械学習モデル
回帰モデルオブジェクト|分類モデルオブジェクト|関数ハンドル

`分类预测因子`- - - - - -カテゴリカル予測子のインデックス
正の整数のベクトル|`[]`

`DataLocality`- - - - - -データ生成する合成データの局所性
`“全球”`|`“本地”`

`重要预测因子`- - - - - -単純モデルで使用する重要な予測子の数
正の整数スカラー値

`NumSyntheticData`- - - - - -合成データセットの標本数
正の整数スカラー値

`查询点`- - - - - -クエリ点
数値の行ベクトル|単一行テーブル

`类型`- - - - - -機械学習モデルのタイプ
`的回归`|`“分类”`

`X`- - - - - -予測子データ
数値行列|テーブル

`黑匣子`- - - - - -機械学習モデルによって計算されたクエリ点の予測
スカラー

`合身`- - - - - -機械学習モデルによって計算された合成予測子データの予測
ベクトル

`重要预言家`- - - - - -重要な予測子のインデックス
正の整数のベクトル

`简单模型`- - - - - -単純モデル
`RegressionLinear`モデルオブジェクト|`回归树`モデルオブジェクト|`ClassificationLinear`モデルオブジェクト|`分类树`モデルオブジェクト

`简单模型`- - - - - -単純モデルによって計算されたクエリ点の予測
スカラー

`综合数据`- - - - - -合成予測子データ
数値行列|テーブル

機械学習をマスターする: MATLABステップ・バイ・ステップガイド