回归树クラス

スーパークラス:CompactRegressionTree

回帰木

説明

バイナリ分割により回帰を行う決定木。クラス回归树のオブジェクトは、预测メソッドを使用して、新しいデータに対する応答を予測できます。オブジェクトには、学習に使用したデータが格納されているため、再代入予測を計算できます。

構築

回归树オブジェクトの作成には菲特里を使用します。

プロパティ

`边沿`	数値予測子のビンのエッジ。p個の数値ベクトルが含まれている cell 配列を指定します。p は予測子の個数です。各ベクトルには、数値予測子のビンのエッジを含めます。カテゴリカル予測子はビン化されないので、カテゴリカル予測子の場合は、この cell 配列の要素を空にします。数値予測子がビン化されるのは,木学習器を使用してモデルに学習をさせるときに名前と値の引数`“麻木”`として正の整数スカラーを指定した場合だけです。`“麻木”`の値が空 (既定) である場合、`边沿`プロパティは空になります。学習済みモデル`mdl`の`边沿`プロパティを使用することにより,ビン化された予測子データ`Xbinned`を再現できます。 X=mdl.X；%Predictor data Xbinned=zero（size（X））；edges=mdl.BinEdges；%Find binned预测器的索引。idxNumeric=Find（~cellfun（@isempty，edges））；if iscolumn（idxNumeric）idxNumeric=idxNumeric'；end for j=idxNumeric X=X（：，j）；%X转换为数组，如果X是表。if istable（X）X=table2array（X）；使用`离散化`function.xbinned=discretize（x，[-inf；边{j}；inf]）；xbinned（：，j）=xbinned；end 数値予測子の場合、1.からビンの個数までの範囲にあるビンのインデックスが`Xbinned`に格納されます。カテゴリカル予測子の場合、`Xbinned`の値は 0になります。`X`に`南`が含まれている場合,対応する`Xbinned`の値は`南`になります。
`分类预测因子`	カテゴリカル予測子のインデックス。正の整数のベクトルを指定します。`分类预测因子`には,カテゴリカル予測子が含まれている予測子データの列に対応するインデックス値を格納します。どの予測子もカテゴリカルではない場合,このプロパティは空(`[]`)になります。
`CategoricalSplits`	N行 2.列の单间牢房配列。ここで`n`は,`树`内のカテゴリカル分割の数です。`CategoricalSplits`の各行は,カテゴリカル分割用の左と右の値になります。カテゴリカル予測子変数`z`に基づくカテゴリカル分割をもつ各枝ノード`j`において、`z`が`CategoricalSplits (j, 1)`にあれば左の子を選択し,`z`が`分类拆分（j，2）`にあれば右の子を選択します。分割はツリーのノードと同じ順序で行われます。これらの分割用のノードは、`剪型`を実行し`“绝对的”`カットを上から下に選択すれば見つかります。
`孩子们`	`树`の各ノードの子ノードの数を含むn行2列の配列。ここでnはノードの数です。葉ノードは子ノード`0`をもちます。
`CutCategories`	`树`の分岐で使用されたカテゴリを表すn行2列の细胞配列。nはノード数です。カテゴリカル予測子変数`x`に基づく各枝ノード`我`に対して,`x`が`CutCategories{1},我`内のカテゴリである場合は左側の子が選択され,`x`が`CutCategories{2},我`内のカテゴリである場合は右側の子が選択されます。連続予測子に基づく枝ノードと葉ノードに対する`CutCategories`の列は両方とも空です。 `切点`には`“连续”`切り取りの切り取り点が含まれ,`CutCategories`にはカテゴリセットが含まれます。
`切点`	`树`の切り取り点として使用される値を表す要素数 Nのベクトル。ここで、Nはノード数です。連続予測子変数`x`に基づく各枝ノード`我`において、`x <割点(我)`の場合は左側の子が選択され,`x > =割点(我)`の場合は右側の子が選択されます。カテゴリカル予測子に基づく枝ノードと葉ノードに対する`切点`は`南`です。
`剪型`	`树`の各ノードの切り取りのタイプを示す要素数 Nの单间牢房配列。ここで、Nはノード数です。各ノード`我`に対して`CutType{我}`は次のいずれかです。 `“连续”`— 変数`x`と切り取り点`v`に対して、切り取りが`x形式で定義されている場合。` `“绝对的”— 変数xがカテゴリセット内の値を受け取るかどうかによって切り取りが定義されている場合。 ”- - - - - -我が葉ノードの場合。` `切点には“连续”切り取りの切り取り点が含まれ,CutCategoriesにはカテゴリセットが含まれます。`
`CutPredictor`	`树`の各ノードの分岐に使用された変数名を示す要素细胞数nの配列。nはノード数です。これらの変数は,“切り取り変数”と呼ばれることもあります。葉ノードの場合,`CutPredictor`には空の文字ベクトルが格納されます。 `切点`には`“连续”`切り取りの切り取り点が含まれ,`CutCategories`にはカテゴリセットが含まれます。
`切割预测指数`	`树`の各ノードで分岐に使用される変数を対象とした,数値インデックスのn要素配列。nはノード数です。詳細は,`CutPredictor`を参照してください。
`扩展预测器名称`	展開された予測子名。文字ベクトルの单间牢房配列として格納されます。モデルがカテゴリカル変数用のエンコーディングを使用している場合,`扩展预测器名称`には展開された変数を表す名前が格納されます。それ以外の場合、`扩展预测器名称`は`预测器名称`と同じです。
`HyperparameterOptimizationResults`	ハイパーパラメーターの交差検証最適化の説明。`BayesianOptimization`オブジェクト,またはハイパーパラメーターおよび関連する値が含まれているテーブルとして格納されます。作成時に名前と値のペア`优化超参数`が空ではない場合,これは空ではありません。値は,作成時の名前と値のペア`HyperparameterOptimizationOptions`の設定によって決まります。 `“bayesopt”`(既定)`BayesianOptimization`クラスのオブジェクト `“gridsearch”`または`“随机搜索”`——使用したハイパーパラメーター,観測された目的関数の値(交差検証損失),および最低(最良)から最高(最悪)までの観測値の順位が格納されているテーブル
`IsBranchNode`	N要素の必然的ベクトル`ib`であり,`树`の各枝ノードの場合は`真正的`、各葉ノードの場合は`假`になります。
`ModelParameters`	`树`のパラメーターを保持しているオブジェクト。
`NumObservations`	学習データの観測値の数を表す数値スカラー。入力データ`X`または応答`Y`に欠損値がある場合、`NumObservations`は`X`の行数より少なくなる場合があります。
`NodeError`	`树`に含まれるノードの誤差の N要素のベクトル`e`。ここでnはノード数です。`e(我)`は,ノード`我`の平均二乗誤差です。
`诺德米安`	`树`の各ノードの平均値をもつn要素の数値配列。ここでnはツリーのノード数を示します。`诺德米安`の配列のすべての要素は,ノードのすべての観測値に対する真の`Y`値を平均です。
`节点可能性`	`树`に含まれるノードの確率の N要素のベクトル`p`。ここでnはノード数です。ノードの確率は,ノードの条件を満たす元のデータから,観測の比率として計算されます。
`诺德里克`	ツリーに含まれるノードのリスクを表す N要素のベクトル。ここで、Nはノード数です。各ノードのリスクは、ノード確率によって重み付けされたノード誤差です。
`节点化`	`树`に含まれるノードのサイズの N要素のベクトル`尺寸`。ここでnはノード数です。ノードのサイズは,ノードの条件を満たすツリーを作成するために使用されるデータから,観測数として定義されます。
`NumNodes`	`树`のノード数`n`。
`父母亲`	`树`に含まれる各ノードの親ノードの数を含むn要素のベクトル`p`。ここで、Nは、ノード数です。ルートノードの親は`0`です。
`预测器名称`	予測子変数の名前の细胞配列。並びは`X`に現れる順です。
`PruneAlpha`	枝刈りレベルごとに 1.つの要素をもつ数値ベクトル。枝刈りレベルの範囲が 0～Mの場合、`PruneAlpha`には昇順に並べ替えられた M+1要素が含まれます。`PruneAlpha (1)`は枝刈りレベル 0 (枝刈りなし) を表し、`PruneAlpha (2)`は枝刈りレベル1を表すというように続いていきます。
`PruneList`	`树`の各ノードの枝刈りレベルをもつ N要素の数値ベクトル。ここで Nはノード数を示します。枝刈りレベルの範囲は 0 (枝刈りなし) から Mです。Mは最下位の葉からルートノードまでの距離です。
`ResponseName`	応答変数 (`Y`)の名前を指定する文字ベクトル。
`应答转换`	生の応答値 (平均二乗誤差) を変換するための関数ハンドル。この関数ハンドルでは、応答値の行列を受け入れて同じサイズの行列を返さなければなりません。既定の`“没有”`は`@ x (x)`,つまり変換なしを表します。ドット表記を使用して関数`应答转换`を追加または変更します。 tree.ResponseTransform=@函数
`吵闹`	あてはめに使用した元の予測子データ (`X`) の行を示す N要素の必然的ベクトル。`X`のすべての行を使用した場合,`吵闹`は空の配列(`[]`)になります。
`SurrogateCutCategories`	`树`の代理分岐に使用するカテゴリのn要素の细胞配列。ここでnは`树`のノード数です。各ノード`k`に対して,`代理类别{k}`は单间牢房配列です。`代理类别{k}`の長さは,このノードに見つかった代理予測子の数に等しくなります。`代理类别{k}`の各要素は、連続代理予測子の場合は空の文字ベクトル、カテゴリカル代理予測子の場合はカテゴリをもつ 2.要素单间牢房配列になります。2.要素单间牢房配列の最初の要素には、この代理分岐によって左の子に割り当てられたカテゴリがリストされ、この 2.要素单间牢房配列の 2.番目の要素には、この代理分岐によって右の子に割り当てられたカテゴリがリストされます。各ノードにおける代理分岐変数の順序は、`SurrogateCutPredictor`によって返される変数の順序に一致します。このノードの最適分割変数は現れません。枝ではない (葉) ノードの場合、`SurrogateCutCategories`には空のセルが含まれます。
`代理剪贴画`	`树`の代理分岐に使用する数値切り取り点のn要素の细胞配列。ここでnは`树`のノード数です。各ノード`k`に対して,`SurrogateCutFlip {k}`は数値ベクトルです。`SurrogateCutFlip {k}`の長さは,このノードに見つかった代理予測子の数に等しくなります。`SurrogateCutFlip {k}`の各要素はカテゴリカル代理予測子でゼロになるか、連続代理予測子で数値切り取り点の割り当てになります。数値切り取り点の割り当ては、-1.または +1.のいずれかになります。連続予測子変数 Zに基づく数値切り取り Cが含まれるすべての代理分岐では、Z < Cであり,その代理分岐の切り取りの割り当てが+ 1である場合,またはZ≥Cであり、その代理分岐の切り取りの割り当てが -1.である場合、左の子が選択されます。同様に、Z≥Cであり,その代理分岐の切り取り点割り当てが+ 1である場合,またはZ < Cであり、その代理分岐の切り取り点が -1.である場合、右の子が選択されます。各ノードにおける代理分岐変数の順序は、`SurrogateCutPredictor`によって返される変数の順序に一致します。このノードの最適分割変数は現れません。枝ではない (葉) ノードの場合、`代理剪贴画`には空の配列が含まれます。
`替代切点`	`树`の代理分岐に使用される数値の N要素の单间牢房配列。ここで Nは`树`のノード数です。各ノード`k`に対して,`代理断点{k}`は数値ベクトルです。`代理断点{k}`の長さは,このノードに見つかった代理予測子の数に等しくなります。`代理断点{k}`の各要素は,カテゴリカル代理予測子で`南`になるか,連続代理予測子で数値切り取り点になります。連続予測子変数Zに基づく数値切り取りCが含まれるすべての代理分岐では,Z < Cであり,その代理分岐の`代理剪贴画`が +1.である場合、またはZ≥Cであり,その代理分岐の`代理剪贴画`が -1.である場合、左の子が選択されます。同様に、Z≥Cであり,その代理分岐の`代理剪贴画`が +1.である場合、またはZ < Cであり,その代理分岐の`代理剪贴画`が1である場合,右の子が選択されます。各ノードの代理分岐変数の順序は,`手术预告器`によって返される変数の順序に一致します。このノードの最適分割変数は現れません。枝ではない (葉) ノードの場合、`替代切点`には空のセルが含まれます。
`替代剪型`	`树`の各ノードの代理分岐のタイプを示すn要素の细胞配列。ここでnは`树`のノード数です。各ノードの`k`で,`SurrogateCutType {k}`はこのノードの代理分岐変数のタイプをもつ细胞配列です。変数は,最適予測子との結びつきの予測尺度によって降順に並べ替えられており,かつ正の予測尺度をもつ変数のみが含まれています。各ノードにおける代理分岐変数の順序は,`SurrogateCutPredictor`によって返される変数の順序に一致します。このノードの最適分割変数は現れません。枝ではない (葉) ノードの場合、`替代剪型`には空のセルが含まれます。代理分岐のタイプは、変数`Z`と切り取り点`V`について`Z`<`V`という形式で切り取りが定義される場合は`“连续”`,一連のカテゴリの値を`Z`に使用するかどうかによって切り取りが定義される場合は`“绝对的”`にすることができます。
`SurrogateCutPredictor`	`树`の各ノードで代理分岐に使用する変数の名前の N要素の单间牢房配列。ここで Nは`树`のノード数です。`SurrogateCutPredictor`の各要素は,このノードの代理分岐変数の名前をもつ细胞配列です。変数は,最適予測子との結びつきの予測尺度によって降順に並べ替えられており,かつ正の予測尺度をもつ変数のみが含まれています。このノードの最適分割変数は現れません。枝ではない(葉)ノードの場合,`SurrogateCutPredictor`には空のセルが含まれます。
`SurrogatePredictorAssociation`	`树`の代理分岐に使用する関連性予測尺度のn要素の细胞配列。ここでnは`树`のノード数です。各ノード`k`に対して,`代理预测关联{k}`は数値ベクトルです。`代理预测关联{k}`の長さは,このノードに見つかった代理予測子の数に等しくなります。`代理预测关联{k}`の各要素は、最適分割とこの代理分岐間の関連性予測尺度を与えます。各ノードの代理分岐変数の順序は、`SurrogateCutPredictor`に存在する変数の順序になります。このノードの最適分割変数は現れません。枝ではない(葉)ノードの場合,`SurrogatePredictorAssociation`には空のセルが含まれます。
`W`	スケールされた`权重`,長さ`n`のベクトル、`X`の行の数。
`X`	予測子の値の行列または表。`X`の各列が1つの変数を表し,各行が1つの観測値を表します。
`Y`	`X`と同じ行数の数値列ベクトル。`Y`の各エントリは`X`の対応する行に対する応答です。

オブジェクト関数

`契约`	コンパクトな回帰木
`crossval`	交差検証を使用した決定木
`cvloss`	交差検証による回帰誤差
`石灰`	本地可解释模型不可知解释(LIME)
`丧失`	回帰誤差
`partialDependence`	部分従属の計算
`局部依赖`	部分依存プロット（PDP）および個別条件付き期待値（冰）プロットの作成
`预测`	回帰木の使用による応答の予測
`predictorImportance`	回帰木の予測子の重要度の推定
`修剪`	枝刈りによる回帰サブツリーのシーケンスの作成
`resubLoss`	再代入による回帰誤差
`resubPredict`	ツリーの再代入応答の予測
`沙普利`	シャープレイ値
`surrogateAssociation`	回帰木における代理分岐に対する関連性の平均予測尺度
`看法`	回帰木の表示

コピーのセマンティクス

値。値のクラスがコピー操作に与える影響については,オブジェクトのコピーを参照してください。

例

すべて折りたたむ

回帰木の構築

ライブスクリプトを開く

標本データを読み込みます。

负载carsmall

標本データを使用して回帰木を構築します。応答変数は、ガロンあたりの走行マイル数（百万加仑）です。

tree=FirtTree（[重量，圆柱体]），MPG，...“CategoricalPredictors”2.“MinParentSize”,20,...“PredictorNames”，{' W '，“C”})

tree = RegressionTree PredictorNames: {'W' ' 'C'} ResponseName: 'Y' CategoricalPredictors: 2 ResponseTransform: 'none' NumObservations: 94属性，方法

気筒数が 4、6 および 8.で、重さが約 1.8吨（4000吨）ポンド) の車の燃費を予測します。

MPG4Kpred =预测(树，[4000 4;4000 6;4000 8])

MPG4Kpred=3×119.2778 19.2778 14.3889

参考文献

[1] 布莱曼，L.，弗里德曼，奥尔申和斯通。分类和回归树。博卡拉顿，佛罗里达州：华润出版，1984。

拡張機能

C/C++コード生成
MATLAB®编码器™ を使用して Cおよび C++コードを生成します。

使用上の注意事項および制限事項:

関数预测および使现代化はコード生成をサポートします。
万博1manbetx^®に回帰木モデルの予測を統合するには,统计和机器学习工具箱™ライブラリにあるRegressionTree预测ブロックを使用するか、MATLAB^®函数ブロックを関数预测と共に使用します。
菲特里を使用して回帰木モデルに学習をさせる場合,以下の制限が適用されます。
- 名前と値のペアの引数“ResponseTransform”の値は“没有”(既定の設定) でなければなりません。
- 代理分岐は使用できません。つまり,名前と値のペアの引数“代理”の値は“关”でなければなりません。
- 固定小数点コードの生成およびコーダーコンフィギュアラーを使用するコード生成ではカテゴリカル予測子(逻辑、明确的、烧焦、一串、または细胞) がサポートされません。名前と値の引数“CategoricalPredictors”は使用できません。カテゴリカル予測子をモデルに含めるには、モデルをあてはめる前にdummyvarを使用してカテゴリカル予測子を前処理します。