モデルの作成と評価

特徴選択,モデル選択,ハイパーパラメーターの最適化,交差検証,残差診断,プロット

高品質の回帰モデルを構築するには,正しい特徴量(予測子)の選択,ハイパーパラメーター(データへのあてはめを行わないモデルパラメーター)の調整,残差診断によるモデル仮定の評価を行うことが重要です。

ハイパーパラメーターの値の選択とモデルの交差検証を繰り返すことにより,ハイパーパラメーターを調整できます。このプロセスでは複数のモデルが生成されますが,推定された汎化誤差が最小になるものが最適なモデルであると考えることができます。たとえば,SVMモデルを調整するには,一連のボックス制約およびカーネルスケールを選択し,値の各ペアについてモデルを交差検証して,10分割交差検証の平均二乗誤差の推定値を比較します。

统计和机器学习工具箱™の一部のノンパラメトリック回帰関数では,ベイズ最適化,グリッド探索またはランダム探索による自動的なハイパーパラメーター調整が追加で提供されます。ただし,ベイズ最適化を実装するための中心的な関数であるbayesoptは,他の多くの用途にも応用が利きます。詳細は,ベイズ最適化のワークフローを参照してください。

調整されたハイパーパラメーターでモデルを自動的に選択するには,fitrautoを使用します。この関数は,回帰モデルのタイプの選択をさまざまなハイパーパラメーターの値で試し,適切に実行されることが期待される最終モデルを返します。データに最適な回帰モデルのタイプがわからない場合は,fitrautoを使用します。

回帰モデルの構築と評価を対話的に行うには,回帰学習器アプリを使用します。

回帰モデルを解釈するために,石灰、沙普利およびplotPartialDependenceを使用できます。

アプリ

回帰学習器

教師あり機械学習を使用して,データを予測するように回帰モデルに学習をさせる

関数

すべて展開する

特徴選択

`fsrftest`	F検定を使用した回帰のための一変量の特徴量ランク付け
`fsrnca`	回帰に近傍成分分析を使用する特徴選択
`oobPermutedPredictorImportance`	回帰木のランダムフォレストに対するout-of-bag予測子の並べ替えによる予測子の重要度の推定
`partialDependence`	部分従属の計算
`plotPartialDependence`	部分依存プロット(PDP)および個別条件付き期待値(ICE)プロットの作成
`predictorImportance`	回帰木の予測子の重要度の推定
`predictorImportance`	回帰アンサンブルの予測子の重要度の推定
`relieff`	ReliefFまたはRReliefFアルゴリズムを使用した予測子の重要度のランク付け
`sequentialfs`	カスタム基準を使用した逐次特徴選択
`stepwiselm`	ステップワイズ回帰の実行
`stepwiseglm`	ステップワイズ回帰による一般化線形回帰モデルの作成

自動モデル選択

fitrauto 最適化されたハイパーパラメーターをもつ回帰モデルの自動選択

ハイパーパラメーターの最適化

`bayesopt`	ベイズ最適化を使用した最適な機械学習のハイパーパラメーターの選択
`hyperparameters`	近似関数を最適化するための変数の説明
`optimizableVariable`	`bayesopt`またはその他のオプティマイザーの変数の説明

交差検証

`crossval`	交差検証を使用した損失の推定
`cvpartition`	交差検証用のデータの分割
`重新分区`	交差検証のための再分割データ
`测试`	交差検証用の検定インデックス
`培训`	交差検証用の学習インデックス

モデルの解釈

本地可解释模型不可知解释(LIME)

`石灰`	本地可解释模型不可知解释(LIME)
`适合`	本地可Model-agnostic解释(石灰)の単純モデルのあてはめ
`情节`	本地可Model-agnostic解释(石灰)の結果のプロット

シャープレイ値

`沙普利`	シャープレイ値
`适合`	クエリ点のシャープレイ値の計算
`情节`	シャープレイ値のプロット

部分従属

`partialDependence`	部分従属の計算
`plotPartialDependence`	部分依存プロット(PDP)および個別条件付き期待値(ICE)プロットの作成

線形モデルの診断

`coefCI`	線形回帰モデルの係数推定値の信頼区間
`coefTest`	線形回帰モデルの係数に対する線形仮説検定
`dwt`	線形回帰モデルオブジェクトによるダービン・ワトソン検定
`情节`	線形回帰モデルの散布図または追加変数プロット
`plotAdded`	線形回帰モデルの追加変数プロット
`plotAdjustedResponse`	線形回帰モデルの調整応答プロット
`plotDiagnostics`	線形回帰モデルの観測値の診断情報をプロット
`plotEffects`	線形回帰モデルの予測子の主効果をプロット
`plotInteraction`	線形回帰モデルの2つの予測子の交互作用効果のプロット
`plotResiduals`	線形回帰モデルの残差プロット
`plotSlice`	近似線形回帰面を通るスライスのプロット

一般化線形モデルの診断

`coefCI`	一般化線形回帰モデルの係数推定の信頼区間
`coefTest`	一般化線形回帰モデルの係数に対する線形仮説検定
`devianceTest`	一般化線形回帰モデルの逸脱度の分析
`plotDiagnostics`	一般化線形回帰モデルの観測値の診断情報のプロット
`plotResiduals`	一般化線形回帰モデルの残差プロット
`plotSlice`	近似された一般化線形回帰面を通るスライスのプロット

非線形モデルの診断

`coefCI`	非線形回帰モデルの係数推定の信頼区間
`coefTest`	非線形回帰モデルの係数に対する線形仮説検定
`plotDiagnostics`	非線形回帰モデルの診断プロット
`plotResiduals`	非線形回帰モデルの残差プロット
`plotSlice`	近似非線形回帰面を通るスライスのプロット