主要内容

このページの翻訳は最新ではありません。ここをクリックして,英語の最新版を参照してください。

石灰

本地可解释模型不可知解释(LIME)

    説明

    石灰は、重要な予測子を見つけて解釈可能な単純モデルをあてはめることにより、クエリ点に対する機械学習モデル (分類または回帰) の予測を説明します。

    クエリ点(查询点)と重要な予測子の数(重要预测因子) を指定して、機械学習モデル用の石灰オブジェクトを作成できます。ソフトウェアは合成データセットを生成し,クエリ点周辺の合成データに対する予測を効果的に説明する重要な予測子の解釈可能な単純モデルをあてはめます。単純モデルにできるのは,線形モデル(既定)または決定木モデルです。

    あてはめられた単純モデルを使用して、指定したクエリ点での機械学習モデルの予測を局所的に説明します。関数情节を使用して、石灰の結果を可視化します。局所的な説明に基づいて,機械学習モデルを信頼するかどうかを判断できます。

    別のクエリ点には、関数适合を使用して、新しい単純モデルをあてはめます。

    作成

    説明

    结果=石灰(黑箱は、予測子データを含む機械学習モデル オブジェクト黑箱を使用して,石灰オブジェクトを作成します。関数石灰は,合成予測子データセットの標本を生成し,その標本の予測を計算します。単純モデルをあてはめるには,関数适合结果と共に使用します。

    结果=石灰(黑箱Xは、X内の予測子データを使用して石灰オブジェクトを作成します。

    结果=石灰(黑箱“CustomSyntheticData”,自定义数据は、事前生成されたカスタム合成予測子データ セット自定义数据を使用して石灰オブジェクトを作成します。関数石灰は、自定义数据の標本についての予測を計算します。

    结果=石灰(___,“查询点”,查询点,“NumImportantPredictors”,重要预测因子も、指定された数の重要な予測子を検索し、クエリ点查询点に対して線形単純モデルをあてはめます。前の構文におけるいずれかの入力引数の組み合わせに加えて,查询点および重要预测因子を指定できます。

    结果=石灰(___名称,值では1つ以上の名前と値の引数を使用して追加オプションを指定します。たとえば,“SimpleModelType”,“树”は、単純モデルのタイプを決定木モデルとして指定します。

    入力引数

    すべて展開する

    解釈される機械学習モデル。完全またはコンパクトな回帰または分類モデル オブジェクトとして指定するか、関数ハンドルとして指定します。

    予測子データ。数値行列またはテーブルとして指定します。Xの各行は1つの観測値に対応し,各列は1つの変数に対応します。

    Xは、黑箱。Xに格納されている,黑箱の学習に使用した予測子データと一致しなければなりません。指定する値に応答変数を含めてはなりません。

    • Xは、黑箱の学習に使用した予測子変数 (たとえば、列车) と同じデータ型でなければなりません。Xの列を構成する変数の個数と順序は,列车と同じでなければなりません。

      • 数値行列を使用して黑箱に学習をさせる場合、Xは数値行列でなければなりません。

      • 表を使用して黑箱に学習をさせる場合、Xは 桌子でなければなりません。X内のすべての予測子変数は、変数名およびデータ型が列车と同じでなければなりません。

    • 石灰はスパース行列をサポートしません。

    黑箱が予測子データを含まないモデルオブジェクトまたは関数ハンドルである場合,Xまたは自定义数据を指定しなければなりません。黑箱が完全な機械学習モデル オブジェクトである場合にこの引数を指定すると、石灰黑箱の予測子データは使用されません。指定した予測子データのみが使用されます。

    データ型:仅有一个的|双重的|桌子

    事前生成されたカスタム合成予測子データセット。数値行列またはテーブルとして指定します。

    事前生成されたデータ セットを提供する場合、石灰は新しい合成予測子データ セットを生成する代わりに、提供されたデータ セットを使用します。

    自定义数据は、黑箱。Xに格納されている,黑箱の学習に使用した予測子データと一致しなければなりません。指定する値に応答変数を含めてはなりません。

    • 自定义数据は、黑箱の学習に使用した予測子変数 (たとえば、列车) と同じデータ型でなければなりません。自定义数据の列を構成する変数の個数と順序は,列车と同じでなければなりません。

      • 数値行列を使用して黑箱に学習をさせる場合、自定义数据は数値行列でなければなりません。

      • テーブルを使用して黑箱に学習をさせる場合、自定义数据はテーブルでなければなりません。自定义数据内のすべての予測子変数は、変数名およびデータ型が列车と同じでなければなりません。

    • 石灰はスパース行列をサポートしません。

    黑箱が予測子データを含まないモデルオブジェクトまたは関数ハンドルである場合,Xまたは自定义数据を指定しなければなりません。黑箱が完全な機械学習モデル オブジェクトであり、この引数を指定する場合、石灰黑箱の予測子データを使用しません。指定した予測子データのみを使用します。

    データ型:仅有一个的|双重的|桌子

    石灰が予測を説明するクエリ点。数値の行ベクトルまたは単一行テーブルとして指定します。查询点のデータ型および列の数は,X自定义数据、または黑箱の予測子データと同じでなければなりません。

    重要预测因子查询点を指定すると,関数石灰石灰オブジェクトを作成するときに単純モデルをあてはめます。

    查询点に欠損値が含まれていてはなりません。

    例:blackbox.X(1,:)は,完全な機械学習モデル黑箱の予測子データの最初の観測値としてクエリ点を指定します。

    データ型:仅有一个的|双重的|桌子

    単純モデルで使用する重要な予測子の数。正の整数スカラー値として指定します。

    • “SimpleModelType”“线性”である場合,ソフトウェアは,指定された数の重要な予測子を選択し,選択した予測子の線形モデルをあてはめます。

    • “SimpleModelType”“树”である場合、ソフトウェアは、重要な予測子の数として決定分岐 (枝ノード) の最大数を指定し、あてはめられた決定木が、指定された数を上限に予測子を使用するようにします。

    重要预测因子查询点を指定すると,関数石灰石灰オブジェクトを作成するときに単純モデルをあてはめます。

    データ型:仅有一个的|双重的

    名前と値のペアの引数

    オプションの名称,值引数のコンマ区切りペアを指定します。名称は引数名で、价值は対応する値です。名称は引用符で囲まなければなりません。名称1,值1,…,名称,值のように,複数の名前と値のペアの引数を,任意の順番で指定できます。

    例:石灰黑箱“QueryPoint”问,“NumImportantPredictors”n“SimpleModelType”,“树”)は、クエリ点を,単純モデルに使用するための重要な予測子の数をn,単純モデルのタイプを決定木モデルとして指定します。石灰は,合成予測子データセットの標本を生成し,標本の予測を計算し,指定数が最大の予測子を使用してクエリ点に決定木モデルをあてはめます。
    合成予測子データのオプション

    すべて展開する

    データ生成する合成データの局所性。“DataLocality”“全球”または“本地”で構成されるコンマ区切りのペアとして指定します。

    • “全球”— ソフトウェアが、予測子データ セット全体 (Xまたは黑箱の予測子データ)を使用して分布パラメーターを推定します。ソフトウェアは,推定されたパラメーターを使用して合成予測子データ セットを生成し、任意のクエリ点への単純モデルのあてはめにそのデータ セットを使用します。

    • “本地”—ソフトウェアが、クエリ点の K最近傍を使用して分布パラメーターを推定します。ここで、Kは“纽曼尼斯堡”個の値です。ソフトウェアは、指定されたクエリ点に単純モデルをあてはめるたびに、新しい合成予測子データ セットを生成します。

    詳細は、石灰を参照してください。

    例:“数据位置”,“本地”

    データ型:烧焦|字符串

    クエリ点の近傍の数。“纽曼尼斯堡”と正の整数スカラー値で構成されるコンマ区切りのペアとして指定します。この引数は,“DataLocality”“本地”である場合のみ有効です。

    指定された値が予測子データセット(黑箱Xまたは予測子データ) 内の観測値の数より大きい場合、石灰はすべての観測値を使用します。

    例:《纽曼尼斯堡》,2000年

    データ型:仅有一个的|双重的

    合成データ セットのために生成する標本の数。“NumSyntheticData”と正の整数スカラー値で構成されるコンマ区切りのペアとして指定します。この引数は,“DataLocality”“本地”である場合のみ有効です。

    例:“NumSyntheticData”,2500年

    データ型:仅有一个的|双重的

    単純モデルのオプション

    すべて展開する

    二乗指数(またはガウス)カーネル関数のカーネルの幅。“KernelWidth”と数値スカラー値で構成されるコンマ区切りのペアとして指定します。

    関数石灰は、クエリ点と合成予測子データ セット内の標本の間の距離を計算し、その距離を二乗指数カーネル関数を使用して重みに変換します。“KernelWidth”値を低くすると、石灰が使用する重みは、クエリ点に近い標本に重点を置くものになります。詳細については、石灰を参照してください。

    例:“KernelWidth”,0.5

    データ型:仅有一个的|双重的

    単純モデルのタイプ。“SimpleModelType”“线性”または“树”で構成されるコンマ区切りのペアとして指定します。

    • “线性”— ソフトウェアは、回帰には菲特利恩を、分類にはfitclinearを使用して、線形モデルをあてはめます。

    • “树”— ソフトウェアは、回帰にはfitrtreeを、分類にはfitctreeを使用して、決定木モデルをあてはめます。

    例:“SimpleModelType”,“树”

    データ型:烧焦|字符串

    機械学習モデルのオプション

    すべて展開する

    カテゴリカル予測子のリスト。“CategoricalPredictors”と次の表のいずれかの値から構成されるコンマ区切りのペアとして指定します。

    説明
    正の整数のベクトル

    ベクトルの各エントリは、カテゴリカル変数が含まれている予測子データの列に対応するインデックス値です。インデックス値の範囲は 1 ~pです。pはモデルの学習に使用した予測子の数です。

    黑箱が入力変数のサブセットを予測子として使用する場合、ソフトウェアはサブセットのみを使用して予測子にインデックスを作成します。応答変数、観測値の重み変数、および関数で使用されないその他の変数は、“CategoricalPredictors”値でカウントされません。

    逻辑ベクトル

    符合事实的というエントリは、予測子データの対応する列がカテゴリカル変数であることを意味します。ベクトルの長さはpです。

    文字行列 行列の各行は予測子変数の名前です。名前は、桌子形式の予測子データの変数名と一致しなければなりません。文字行列の各行が同じ長さになるように、名前を余分な空白で埋めてください。
    文字ベクトルの 单间牢房配列または 一串配列 配列の各要素は予測子変数の名前です。名前は、表形式の予測子データの変数名と一致しなければなりません。
    “全部” すべての予測子がカテゴリカルです。

    • 黑箱を関数ハンドルとして指定する場合,石灰は予測子データXまたは自定义数据からカテゴリカル予測子を識別します。予測子データがテーブル内にある場合,石灰は、その変数が 必然的ベクトル、順序付けのない 明确的ベクトル、文字配列、一串配列または文字ベクトルの 单间牢房配列のいずれかである場合に、変数を 明确的であると見なします。予測子データが行列である場合、石灰はすべての予測子が連続的であると見なします。

    • 黑箱を回帰または分類モデルオブジェクトとして指定する場合,石灰はモデル オブジェクトの分类预测因子プロパティを使用してカテゴリカル予測子を識別します。

    石灰は順序付きのカテゴリカル予測子をサポートしていません。

    例:“分类预测因子”,“全部”

    データ型:仅有一个的|双重的|逻辑|烧焦|字符串|细胞

    機械学習モデルのタイプ。“类型”的回归または“分类”で構成されるコンマ区切りのペアとして指定します。

    黑箱を関数ハンドルとして指定するときは,この引数を指定しなければなりません。黑箱を回帰または分類モデルオブジェクトとして指定した場合,石灰はモデルのタイプに応じて“类型”の値を決定します。

    例:“类型”,“分类”

    データ型:烧焦|字符串

    距離計算のオプション

    すべて展開する

    距離計量。“距离”と文字ベクトル,弦スカラー,または関数ハンドルで構成されるコンマ区切りのペアとして指定します。

    • 予測子データに連続変数のみが含まれる場合、石灰はこれらの距離計量をサポートします。

      説明
      “欧几里得”

      ユークリッド距離。

      “seuclidean”

      標準化されたユークリッド距離。観測値間の各座標差は、標準偏差S=std(PD,'omitnan')の対応する要素で除算することによりスケーリングされます。ここで、PDは予測子データ、または合成予測子データです。別のスケーリングを指定するには、名前と値の引数“规模”を使用します。

      “mahalanobis”

      PDの標本共分散を使用したマハラノビス距離、C=cov(PD,'omitrows')。共分散行列の値を変更するには、名前と値の引数“浸”を使用します。

      “cityblock”

      市街地距離。

      “明可夫斯基”

      ミンコフスキー距離。既定の指数は 2.です。別の指数を指定するには、名前と値の引数“P”を使用します。

      “切比切夫”

      チェビシェフ距離 (最大座標差)。

      “余弦”

      1から,ベクトルとして扱われる点の間の夾角の余弦を引いた値。

      “相关性”

      1.から、値の系列として扱われる点の間の標本相関を引いた値。

      “枪兵”

      1.から、観測値間の標本スピアマンの順位相関 (値の系列として扱われる) を引いた値。

      迪斯芬

      カスタム距離関数のハンドル。距離関数の形式は次のようになります。

      函数ZJ D2 = distfun(子)%距离计算...
      ここで

      • は,単一の観測値が含まれている1t列のベクトルです。

      • ZJは、複数の観測値が含まれている年代t列の行列です。迪斯芬は,任意の個数の観測値が含まれている行列ZJを受け入れなければなりません。

      • D2年代1列の距離のベクトルであり、D2(k)は観測値ZJ(k,:)の間の距離です。

      データがスパースでない場合、通常は関数ハンドルではなく組み込みの距離計量を使用する方が高速に距離を計算できます。

    • 予測子データに連続変数とカテゴリカル変数の両方が含まれる場合,石灰はこれらの距離計量をサポートします。

      説明
      “Goodall 3”

      異形グドール距離

      “ofd”

      出現頻度距離

    定義については距離計量を参照してください。

    既定値は、予測子データに連続変数のみが含まれる場合は“欧几里得”、予測子データに連続変数とカテゴリカル変数の両方が含まれる場合は“Goodall 3”です。

    例:“距离”,“ofd”

    データ型:烧焦|字符串|function_handle

    マハラノビス距離計量の共分散行列。“浸”とK行K列の正定値行列で構成されるコンマ区切りのペアとして指定します。Kは予測子の数です。

    この引数は,“距离”“mahalanobis”である場合のみ有効です。

    既定の“浸”値は浸(PD omitrows)です。ここで、PDは予測子データ,または合成予測子データです。“浸”値を指定しなかった場合、ソフトウェアは、予測子データおよび合成予測子データの両方の距離を計算するときに、異なる共分散行列を使用します。

    例:“Cov”,眼睛(3)

    データ型:仅有一个的|双重的

    ミンコフスキー距離計量の指数。“P”と正のスカラー値をコンマで区切って指定します。

    この引数は,“距离”“明可夫斯基”である場合のみ有効です。

    例:“P”3

    データ型:仅有一个的|双重的

    標準化されたユークリッド距離計量のスケールパラメーター値。“规模”と長さKの非負の数値ベクトルで構成されるコンマ区切りのペアとして指定します。Kは予測子の数です。

    この引数は,“距离”“seuclidean”である場合のみ有効です。

    既定の“规模”値は性病(PD omitnan)です。ここで、PDは予測子データ,または合成予測子データです。“规模”値を指定しなかった場合、ソフトウェアは、予測子データおよび合成予測子データの両方の距離を計算するときに、異なるスケール パラメーターを使用します。

    例:“规模”,分位数(0.75 X)——分位数(0.25 X))

    データ型:仅有一个的|双重的

    プロパティ

    すべて展開する

    指定されるプロパティ

    石灰オブジェクトを作成するときに、以下のプロパティを指定できます。

    このプロパティは読み取り専用です。

    解釈される機械学習モデル。回帰または分類モデルオブジェクトとして指定するか、関数ハンドルとして指定します。

    黑箱引数によってこのプロパティが設定されます。

    このプロパティは読み取り専用です。

    カテゴリカル予測子のインデックス。正の整数のベクトルを指定します。分类预测因子には、カテゴリカル予測子が含まれている予測子データの列に対応するインデックス値を格納します。どの予測子もカテゴリカルではない場合、このプロパティは空 ([]) になります。

    • 関数ハンドルを使用して黑箱を指定した場合、石灰は予測子データXまたは自定义数据からカテゴリカル予測子を識別します。名前と値の引数“CategoricalPredictors”を指定した場合にこのプロパティが設定されます。

    • 黑箱を回帰または分類モデルオブジェクトとして指定した場合,石灰はモデル オブジェクトの分类预测因子プロパティを使用してこのプロパティを決定します。

    石灰は順序付きのカテゴリカル予測子をサポートしていません。

    “SimpleModelType”“线性”の場合(既定),石灰は識別されたそれぞれのカテゴリカル予測子についてダミー変数を作成します。石灰は、指定されたクエリ点のカテゴリを基準グループとして扱い、カテゴリの数より 1.つ少ないダミー変数を作成します。詳細は、基準グループを使用したダミー変数を参照してください。

    データ型:仅有一个的|双重的

    このプロパティは読み取り専用です。

    データ生成する合成データの局所性。“全球”または“本地”として指定します。

    名前と値の引数“DataLocality”によってこのプロパティが設定されます。

    このプロパティは読み取り専用です。

    単純モデル (简单模型)で使用する重要な予測子の数。正の整数スカラー値として指定します。

    石灰重要预测因子引数,または适合重要预测因子引数によってこのプロパティが設定されます。

    データ型:仅有一个的|双重的

    このプロパティは読み取り専用です。

    合成データ セットの標本数。正の整数スカラー値として指定します。

    • 自定义数据を指定した場合,カスタム合成データセットの標本数によってこのプロパティが設定されます。

    • そうでない場合、石灰の名前と値の引数“NumSyntheticData”、または适合の名前と値の引数“NumSyntheticData”によってこのプロパティが設定されます。

    データ型:仅有一个的|双重的

    このプロパティは読み取り専用です。

    石灰が単純モデル (简单模型) を使用して予測子を説明するクエリ点。数値の行ベクトルまたは単一行テーブルとして指定します。

    石灰查询点引数,または适合查询点引数によってこのプロパティが設定されます。

    データ型:仅有一个的|双重的|桌子

    このプロパティは読み取り専用です。

    機械学習モデル(BlackboxModel) のタイプ。的回归または“分类”として指定します。

    • 黑箱を回帰または分類モデルオブジェクトとして指定した場合,石灰はモデルのタイプに応じてこのプロパティを決定します。

    • 関数ハンドルを使用して黑箱を指定した場合、名前と値の引数“类型”によってこのプロパティが設定されます。

    このプロパティは読み取り専用です。

    予測子データ。数値行列またはテーブルとして指定します。

    Xの各行は1つの観測値に対応し,各列は1つの変数に対応します。

    • X引数を指定した場合にこのプロパティが設定されます。

    • 自定义数据引数を指定した場合、このプロパティは空になります。

    • 黑箱を完全な機械学習モデル オブジェクトとして指定し、Xまたは自定义数据を指定しなかった場合,このプロパティ値が黑箱の学習に使用される予測子データになります。

    石灰は欠損値を含む行は使用せず、それらの行はXに格納されません。

    データ型:仅有一个的|双重的|桌子

    計算されるプロパティ

    以下のプロパティはソフトウェアによって計算されます。

    このプロパティは読み取り専用です。

    機械学習モデル(BlackboxModel) によって計算されたクエリ点の予測。スカラーとして指定します。予測は、回帰の場合は予測された応答、分類の場合は分類されたラベルになります。

    データ型:仅有一个的|双重的|明确的|逻辑|烧焦|字符串|细胞

    このプロパティは読み取り専用です。

    機械学習モデル(BlackboxModel) によって計算された合成予測子データの予測。ベクトルとして指定します。

    データ型:仅有一个的|双重的|明确的|逻辑|烧焦|字符串|细胞

    このプロパティは読み取り専用です。

    重要な予測子のインデックス。正の整数のベクトルとして指定します。重要预言家には単純モデル(简单模型)で使用される予測子の列に対応するインデックス値が格納されます。

    データ型:仅有一个的|双重的

    このプロパティは読み取り専用です。

    単純モデル。RegressionLinear回归树ClassificationLinear、または分类树モデルオブジェクトとして指定します。石灰は機械学習モデルのタイプ (类型) および単純モデルのタイプ (“SimpleModelType”) に応じて単純モデル オブジェクトのタイプを決定します。

    このプロパティは読み取り専用です。

    単純モデル (简单模型)によって計算されたクエリ点の予測。スカラーとして指定します。

    简单模型ClassificationLinearの場合、简单模型の値は 1.または –1.になります。

    • 简单模型の値が1になるのは,単純モデルからの予測が黑匣子(機械学習モデルからの予測)と同じである場合です。

    • 简单模型の値が –1.になるのは、単純モデルからの予測が黑匣子と異なる場合です。黑匣子の値が一个であった場合、関数情节简单模型の値を不是一个として表示します。

    データ型:仅有一个的|双重的|明确的|逻辑|烧焦|字符串|细胞

    このプロパティは読み取り専用です。

    合成予測子データ。数値行列または 桌子として指定します。

    • 自定义数据入力引数を指定した場合にこのプロパティが設定されます。

    • そうでない場合、石灰は、予測子データXから分布パラメーターを推定して合成予測子データセットを生成します。

    データ型:仅有一个的|双重的|桌子

    オブジェクト関数

    适合 局部可解释模型不可知解释(LIME)の単純モデルのあてはめ
    情节 局部可解释模型不可知解释(LIME)の結果のプロット

    すべて折りたたむ

    分類モデルの学習を行い、単純な決定木モデルを使用する石灰オブジェクトを作成します。石灰オブジェクトを作成するときに、クエリ点と重要な予測子の数を指定して、ソフトウェアが合成データ セットの標本を生成し、重要な予測子を使って単純モデルをクエリ点にあてはめるようにします。次に、オブジェクト関数情节を使用して、予測子の推定重要度を単純モデルに表示します。

    信用评级データセットを読み込みます。データセットには,顧客ID,顧客の財務比率,業種ラベル,および信用格付けが格納されています。

    tbl=可读(“CreditRating_Historical.dat”);

    テーブルの最初の 3.行を表示します。

    头部(待定,3)
    ans=3×8表这是一个两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两两}424440.3110.3670.0741.9350.3661{'A'}

    tblから顧客IDと信用格付けの列を削除して,予測子変数の表を作成します。

    tblX = removevars(资源描述,“ID”“评级”]);

    関数fitcecocを使用して,信用格付けの黑箱モデルに学習させます。

    黑盒=fitcecoc(tblX,tbl.额定值,“CategoricalPredictors”“工业”);

    単純な決定木モデルを使用して最後の観測値の予測を説明する石灰オブジェクトを作成します。最大 6.つの重要な予測子を見つけるため、“NumImportantPredictors”を 6.に指定します。石灰オブジェクトを作成するときに“QueryPoint”“NumImportantPredictors”の値を指定した場合、ソフトウェアは合成データ セットの標本を生成し、解釈可能な単純モデルを合成データ セットにあてはめます。

    queryPoint=tblX(结束:)
    查询点=1×6表企业所得税息税前利润(MVE)为行业所得税息税息税息税息税息税息税息税息税息税息税息税息税息税息税息税息税息税息税息税息税息税息税息税息税息税息税息税息税息税息税息税息税息税息税行业所得税息税息税息税息税息税息税息税息税息税息税息税息税息税息税息税息税息税息税息税息税息税息税息税息税息税息税息税息税息税息税
    rng(“默认”%为了再现性结果=石灰(黑盒,“QueryPoint”,查询点,“NumImportantPredictors”6....“SimpleModelType”“树”
    结果=带属性的lime:BlackboxModel:[1x1 ClassificationCoC]数据位置:'global'分类预测因子:6类型:'classification'X:[3932x6表]查询点:[1x6表]NUM重要预测因子:6 NUM合成数据:5000合成数据:[5000x6表]拟合:{5000x1单元格}简单模型:[1x1 ClassificationTree]重要预测因子:[2x1 double]BlackboxFitted:{'AA'}SimpleModelFitted:{'AA'}

    オブジェクト関数情节を使用して,石灰オブジェクト结果をプロットします。予測子名に含まれるアンダースコアを表示するには、座標軸のTickLabelInterpreter値を“没有”に変更します。

    f=绘图(结果);f.CurrentAxis.TickLabelInterpreter=“没有”

    图中包含一个轴。带有决策树模型标题的轴包含一个bar类型的对象。

    プロットには、クエリ点についての 2.つの予測値が示されています。この予測値は、结果黑匣子プロパティと简单模型プロパティに対応します。

    横棒グラフは,予測子の重要度の並べ替えられた値を示しています。石灰はクエリ点の重要な予測子として財務比率変数息税前利润および沃库塔を求めます。

    バーの長さは,データヒントまたは酒吧のプロパティを使用して読み取ることができます。たとえば,関数芬多布吉を使用して酒吧オブジェクトを検索し、関数文本を使用して、バーの端にラベルを追加できます。

    b = findobj (f,“类型”“酒吧”);文本(b.YEndPoints + 0.001, b.XEndPoints字符串(b.YData))

    图中包含一个轴。带有标题和决策树模型的轴包含3个类型为bar、text的对象。

    あるいは,予測子変数名をもつ表に係数値を表示することもできます。

    imp=b.YData;flipud(数组2)table(imp',,...“RowNames”,f.currentAxis.YTickLabel,“VariableNames”,{“预测重要性”}))
    ans=2×1表预测器重要性0.088412 RE_TA 0.0018061

    回帰モデルの学習を行い,線形単純モデルを使用する石灰オブジェクトを作成します。石灰オブジェクトを作成するときに,クエリ点と重要な予測子の数を指定しなかった場合,ソフトウェアは合成データセットの標本を生成しますが,単純モデルのあてはめは行いません。オブジェクト関数适合を使用して、クエリ点に単純モデルをあてはめます。次に、オブジェクト関数情节を使用して,あてはめた線形単純モデルの係数を表示します。

    carbigデータセットを読み込みます。このデータセットには,1970年代と1980年代初期に製造された自動車の測定値が格納されています。

    负载carbig

    加速度气缸などの予測子変数と応答変数英里/加仑が格納された 桌子を作成します。

    台=表(加速度、汽缸、排量、马力、Model_Year重量,MPG);

    学習セットの欠損値を削除すると、メモリ消費量を減らして関数菲特克内尔の学習速度を向上させることができます。tblの欠損値を削除します。

    tbl=RML缺失(tbl);

    tblから応答変数を削除して、予測子変数のテーブルを作成します。

    tblX=移除变量(tbl,“英里”);

    関数菲特克内尔を使用して英里/加仑の 黑匣子モデルの学習を行います。

    rng(“默认”%为了再现性mdl=fitrkernel(tblX,tbl.MPG,“CategoricalPredictors”[2 - 5]);

    石灰オブジェクトを作成します。mdlには予測子データが含まれないため,予測子データセットを指定します。

    结果=石灰(mdl tblX)
    结果=石灰与属性:BlackboxModel: [1 x1 RegressionKernel] DataLocality:“全球”CategoricalPredictors:[2 5]类型:“回归”X: [392 x6表]QueryPoint: [] NumImportantPredictors: [] NumSyntheticData: 5000 SyntheticData: [5000 x6表)安装:x1双[5000]SimpleModel: [] ImportantPredictors: [] BlackboxFitted:[] SimpleModelFitted: []

    结果には、生成された合成データ セットが含まれます。简单模型プロパティは空 ([]) です。

    tblXの最初の観測値に線形単純モデルをあてはめます。検出する重要な予測子の数を 3.に指定します。

    : queryPoint = tblX (1)
    查询点=1×6表加速气缸位移马力Model_Year重量  ____________ _________ ____________ __________ __________ ______ 12 8 307 130 70 3504
    结果=适合(结果,queryPoint, 3);

    オブジェクト関数情节を使用して,石灰オブジェクト结果をプロットします。予測子名に含まれるアンダースコアを表示するには、座標軸のTickLabelInterpreter値を“没有”に変更します。

    f=绘图(结果);f.CurrentAxis.TickLabelInterpreter=“没有”

    图中包含一个轴。标题为“线性模型”的轴包含一个bar类型的对象。

    プロットには、クエリ点についての 2.つの予測値が示されています。この予測値は、结果黑匣子プロパティと简单模型プロパティに対応します。

    横棒グラフは、絶対値で並べ替えられた、単純モデルの係数値を示します。石灰は、クエリ点の重要な予測子として、马力车型年款、および气缸を見つけます。

    车型年款および气缸は複数のカテゴリをもつカテゴリカル予測子です。線形単純モデルの場合,各カテゴリカル予測子について,カテゴリの数よりも1つ少ないダミー変数が作成されます。棒グラフには最も重要なダミー変数のみが表示されます。他のダミー変数の係数は结果简单模型プロパティを使用して確認できます。すべてのカテゴリカル ダミー変数を含む並べ替えられた係数の値を表示します。

    [~,I]=sort(abs(results.SimpleModel.Beta),“下”);表(results.SimpleModel.expandedPredictor名称(I)”,results.SimpleModel.Beta(I),...“VariableNames”,{'扩展预测程序名称'“系数”})
    ans=17×2表Exteded预测名字系数  __________________________ ___________ {' -3.4485马力的}e-05 {Model_Year(74和70)的}-6.1279 e-07{“Model_Year(80和70)的}-4.015 e-07{“Model_Year(81和70)的}3.4176 e-07{“Model_Year(82和70)的}-2.2483 e-07{的圆柱体(6和8)}-1.9024 e-07{“Model_Year(76和70)的}1.8136 e-07{圆柱体(5 vs。8)'} 1.746e -07 {'Model_Year (75 vs. 70)'} 1.5456e-07 {'Model_Year (77 vs. 70)'} 1.4272e-07 {'Model_Year (78 vs. 70)'} 6.7001e-08 {'Model_Year (72 vs. 70)'} 4.7214e-08 {' cylinder (4 vs. 8)'} 4.518e -08 {'Model_Year (79 vs. 70)'} -2.2598e-08⋮

    回帰モデルの学習を行い、モデルの関数预测の関数ハンドルを使用する石灰オブジェクトを作成します。オブジェクト関数适合を使用して,指定したクエリ点に単純モデルをあてはめます。次に,オブジェクト関数情节を使用して,あてはめた線形単純モデルの係数を表示します。

    carbigデータセットを読み込みます。このデータセットには,1970年代と1980年代初期に製造された自動車の測定値が格納されています。

    负载carbig

    予測子変数加速度气缸などを格納する 桌子を作成します。

    tbl=表(加速度、气缸、排量、马力、车型年份、重量);

    関数树人を使用して英里/加仑の 黑匣子モデルの学習を行います。

    rng(“默认”%为了再现性Mdl=TreeBagger(100,tbl,MPG,“方法”“回归”“CategoricalPredictors”[2 - 5]);

    石灰树人オブジェクトを直接はサポートしないため,石灰の最初の入力引数(黑箱モデル)を树人オブジェクトとして指定することはできません。代わりに、関数预测の関数ハンドルを使用できます。関数预测のオプションも関数の名前と値の引数を使用して指定できます。

    树人オブジェクトMdlの関数预测の関数ハンドルを作成します。使用する木のインデックスの配列を1:50と指定します。

    myPredict = @(tbl) predict(Mdl,tbl,)“树”,1:50);

    関数ハンドル我的预测を使用して石灰オブジェクトを作成します。黑箱モデルを関数ハンドルとして指定する場合、予測子データを提供し、名前と値の引数“类型”を指定しなければなりません。tblには、双重的データ型のカテゴリカル予測子(圆柱および车型年款)が含まれています。既定では,石灰双重的データ型の変数をカテゴリカル予測子として扱いません。2.番目 (圆柱) と 5.番目 (车型年款)の変数をカテゴリカル予測子として指定します。

    结果=石灰(myPredict,tbl,“类型”“回归”“CategoricalPredictors”[2 - 5]);

    tblの最初の観測値に線形単純モデルをあてはめます。予測子名に含まれるアンダースコアを表示するには、座標軸のTickLabelInterpreter値を“没有”に変更します。

    结果=适合(结果,台(1:),4);f=绘图(结果);f.CurrentAxis.TickLabelInterpreter=“没有”

    图中包含一个轴。标题为“线性模型”的轴包含一个bar类型的对象。

    石灰は、重要な予測子として马力取代气缸、および车型年款を見つけます。

    詳細

    すべて展開する

    アルゴリズム

    すべて展開する

    参照

    (1)里贝罗、Marco Tulio、S. Singh和C. Guestrin。“我为什么要信任你?”:解释任何分类器的预测。“在第二十二届ACM SigkDD知识发现和数据挖掘国际会议论文中,1135—44。旧金山,加利福尼亚:ACM,2016。

    [2] Świrszcz, Grzegorz, Naoki Abe, Aurélie C. Lozano。“变量选择和预测的分组正交匹配追踪”神经信息处理系统进展(2009):1150-58。

    [3] Lozano Aurélie C., Grzegorz Świrszcz,和Naoki Abe。逻辑回归的组正交匹配追踪。第十四届人工智能与统计国际会议论文集(2011):452-60。

    R2020bで導入