主要内容

このページの翻訳は最新ではありません。ここをクリックして,英語の最新版を参照してください。

情节

本地可Model-agnostic解释(石灰)の結果のプロット

    説明

    f=情节(结果は,石灰オブジェクト结果の石灰の結果を可視化します。関数は数字オブジェクトfを返します。fを使用して,作成後の图の图のプロパティをクエリまたは変更します。

    • 图には,単純な線形モデルの係数値または単純な決定木モデルの予測子の重要度の値を示す横棒グラフが含まれています。结果结果SimpleModelプロパティ)の単純なモデルに応じて決まります。

    • 图は機械学習モデルと単純なモデルをそれぞれ使用して計算されたクエリ点の2つの予測を表示します。これらの値は,结果BlackboxFittedプロパティとSimpleModelFittedプロパティに対応します。

    すべて折りたたむ

    分類モデルの学習を行い,単純な決定木モデルを使用する石灰オブジェクトを作成します。石灰オブジェクトを作成するときに,クエリ点と重要な予測子の数を指定して,ソフトウェアが合成データセットの標本を生成し,重要な予測子を使って単純モデルをクエリ点にあてはめるようにします。次に,オブジェクト関数情节を使用して,予測子の推定重要度を単純モデルに表示します。

    CreditRating_Historicalデータセットを読み込みます。データセットには,顧客ID,顧客の財務比率,業種ラベル,および信用格付けが格納されています。

    台= readtable (“CreditRating_Historical.dat”);

    テーブルの最初の3行を表示します。

    头(资源描述,3)
    ans =3×8表ID WC_TA RE_TA EBIT_TA MVE_BVTD S_TA行业评级  _____ _____ _____ _______ ________ _____ ________ ______ 62394 0.013 0.104 0.036 0.447 0.142 3{“BB”}48608 0.232 0.335 0.062 1.969 0.281 8 {A} 42444 0.311 0.367 0.074 1.935 0.366 1 {A}

    资源描述から顧客IDと信用格付けの列を削除して,予測子変数の表を作成します。

    tblX = removevars(资源描述,“ID”“评级”]);

    関数fitcecocを使用して,信用格付けの黑箱モデルに学習させます。

    黑箱= fitcecoc (tblX,资源描述。评级,“CategoricalPredictors”“行业”);

    単純な決定木モデルを使用して最後の観測値の予測を説明する石灰オブジェクトを作成します。最大6つの重要な予測子を見つけるため,“NumImportantPredictors”を6に指定します。石灰オブジェクトを作成するときに“QueryPoint”“NumImportantPredictors”の値を指定した場合,ソフトウェアは合成データセットの標本を生成し,解釈可能な単純モデルを合成データセットにあてはめます。

    queryPoint = tblX(最终,:)
    queryPoint =1×6表WC_TA RE_TA EBIT_TA MVE_BVTD S_TA行业  _____ _____ _______ ________ ____ ________ 0.239 0.463 0.065 2.924 0.34 - 2
    rng (“默认”%的再现性结果=石灰(黑盒,“QueryPoint”queryPoint,“NumImportantPredictors”6...“SimpleModelType”“树”
    结果=石灰与属性:BlackboxModel: [1 x1 ClassificationECOC] DataLocality:“全球”CategoricalPredictors: 6类型:“分类”X: [3932 x6表]QueryPoint: [1 x6表]NumImportantPredictors: 6 NumSyntheticData: 5000 SyntheticData: [5000 x6表)安装:{5000}x1细胞SimpleModel: [1 x1 ClassificationTree] ImportantPredictors:[2x1 double] BlackboxFitted: {'AA'} SimpleModelFitted: {'AA'}

    オブジェクト関数情节を使用して,石灰オブジェクト结果をプロットします。予測子名に含まれるアンダースコアを表示するには,座標軸のTickLabelInterpreter値を“没有”に変更します。

    f =情节(结果);f.CurrentAxes.TickLabelInterpreter =“没有”

    图中包含一个坐标轴。标题为“LIME with Decision Tree Model”的轴包含一个bar类型的对象。

    プロットには,クエリ点についての2つの予測値が示されています。この予測値は,结果BlackboxFittedプロパティとSimpleModelFittedプロパティに対応します。

    横棒グラフは,予測子の重要度の並べ替えられた値を示しています。石灰はクエリ点の重要な予測子として財務比率変数EBIT_TAおよびWC_TAを求めます。

    バーの長さは,データヒントまたは酒吧のプロパティを使用して読み取ることができます。たとえば,関数findobjを使用して酒吧オブジェクトを検索し,関数文本を使用して,バーの端にラベルを追加できます。

    b = findobj (f,“类型”“酒吧”);文本(b.YEndPoints + 0.001, b.XEndPoints字符串(b.YData))

    图中包含一个坐标轴。标题为LIME with Decision Tree Model的轴包含3个类型为bar, text的对象。

    あるいは,予測子変数名をもつ表に係数値を表示することもできます。

    小鬼= b.YData;flipud (array2table(小鬼”,...“RowNames”f.CurrentAxes.YTickLabel,“VariableNames”, {“预测的重要性”}))
    ans =2×1表预测的重要性  ____________________ MVE_BVTD 0.088412 RE_TA 0.0018061

    回帰モデルの学習を行い,線形単純モデルを使用する石灰オブジェクトを作成します。石灰オブジェクトを作成するときに,クエリ点と重要な予測子の数を指定しなかった場合,ソフトウェアは合成データセットの標本を生成しますが,単純モデルのあてはめは行いません。オブジェクト関数适合を使用して,クエリ点に単純モデルをあてはめます。次に,オブジェクト関数情节を使用して,あてはめた線形単純モデルの係数を表示します。

    carbigデータセットを読み込みます。このデータセットには,1970年代と1980年代初期に製造された自動車の測定値が格納されています。

    负载carbig

    加速度气缸などの予測子変数と応答変数英里/加仑が格納された表を作成します。

    台=表(加速度、汽缸、排量、马力、Model_Year重量,MPG);

    学習セットの欠損値を削除すると,メモリ消費量を減らして関数fitrkernelの学習速度を向上させることができます。资源描述の欠損値を削除します。

    台= rmmissing(台);

    资源描述から応答変数を削除して,予測子変数のテーブルを作成します。

    tblX = removevars(资源描述,“英里”);

    関数fitrkernelを使用して英里/加仑の黑箱モデルの学習を行います。

    rng (“默认”%的再现性mdl = fitrkernel (tblX,资源描述。英里/加仑,“CategoricalPredictors”[2 - 5]);

    石灰オブジェクトを作成します。mdlには予測子データが含まれないため,予測子データセットを指定します。

    结果=石灰(mdl tblX)
    结果=石灰与属性:BlackboxModel: [1 x1 RegressionKernel] DataLocality:“全球”CategoricalPredictors:[2 5]类型:“回归”X: [392 x6表]QueryPoint: [] NumImportantPredictors: [] NumSyntheticData: 5000 SyntheticData: [5000 x6表)安装:x1双[5000]SimpleModel: [] ImportantPredictors: [] BlackboxFitted:[] SimpleModelFitted: []

    结果には,生成された合成データセットが含まれます。SimpleModelプロパティは空([])です。

    tblXの最初の観測値に線形単純モデルをあてはめます。検出する重要な予測子の数を3に指定します。

    : queryPoint = tblX (1)
    queryPoint =1×6表加速气缸位移马力Model_Year重量  ____________ _________ ____________ __________ __________ ______ 12 8 307 130 70 3504
    结果=适合(结果,queryPoint, 3);

    オブジェクト関数情节を使用して,石灰オブジェクト结果をプロットします。予測子名に含まれるアンダースコアを表示するには,座標軸のTickLabelInterpreter値を“没有”に変更します。

    f =情节(结果);f.CurrentAxes.TickLabelInterpreter =“没有”

    图中包含一个坐标轴。标题为LIME with Linear Model的轴包含一个bar类型的对象。

    プロットには,クエリ点についての2つの予測値が示されています。この予測値は,结果BlackboxFittedプロパティとSimpleModelFittedプロパティに対応します。

    横棒グラフは,絶対値で並べ替えられた,単純モデルの係数値を示します。石灰は,クエリ点の重要な予測子として,马力Model_Year,および气缸を見つけます。

    Model_Yearおよび气缸は複数のカテゴリをもつカテゴリカル予測子です。線形単純モデルの場合,各カテゴリカル予測子について,カテゴリの数よりも1つ少ないダミー変数が作成されます。棒グラフには最も重要なダミー変数のみが表示されます。他のダミー変数の係数は结果SimpleModelプロパティを使用して確認できます。すべてのカテゴリカル ダミー変数を含む並べ替えられた係数の値を表示します。

    [~,我]=排序(abs (results.SimpleModel.Beta),“下”);表(results.SimpleModel.ExpandedPredictorNames (I)”,results.SimpleModel.Beta(我),...“VariableNames”, {“Exteded预测的名字”“系数”})
    ans =17×2表Exteded预测名字系数  __________________________ ___________ {' -3.4485马力的}e-05 {Model_Year(74和70)的}-6.1279 e-07{“Model_Year(80和70)的}-4.015 e-07{“Model_Year(81和70)的}3.4176 e-07{“Model_Year(82和70)的}-2.2483 e-07{的圆柱体(6和8)}-1.9024 e-07{“Model_Year(76和70)的}1.8136 e-07{圆柱体(5 vs。8)'} 1.746e -07 {'Model_Year (75 vs. 70)'} 1.5456e-07 {'Model_Year (77 vs. 70)'} 1.4272e-07 {'Model_Year (78 vs. 70)'} 6.7001e-08 {'Model_Year (72 vs. 70)'} 4.7214e-08 {' cylinder (4 vs. 8)'} 4.518e -08 {'Model_Year (79 vs. 70)'} -2.2598e-08⋮

    入力引数

    すべて折りたたむ

    石灰の結果。石灰オブジェクトとして指定します。结果SimpleModelプロパティは,あてはめ済みの単純なモデルを含んでいなければなりません。

    参照

    [1] Ribeiro, Marco Tulio, S. Singh, C. Guestrin。“‘我为什么要相信你?’:解释任何分类器的预测。”第22届ACM SIGKDD知识发现与数据挖掘国际会议论文集,1135-44。旧金山,加利福尼亚:ACM, 2016。

    R2020bで導入