RegressionTree类

超：CompactRegressionTree

回归树

描述

决策树与回归二元分割。类的目的RegressionTree可以预测随着新数据的反应预测方法。该对象包含用于训练的数据，因此可以计算重新替换预测。

建设

创建一个RegressionTree通过使用对象fitrtree。

属性

`BinEdges`	宾边缘为数字预测，指定为的单元阵列<Ëm class="varname">p数值向量,<Ëm class="varname">p是预测的数目。每个向量包括用于数字预测的bin边缘。因为该软件不斌分类预测单元阵列的分类预测中的元素是空的。仅当您指定数值预测器时，该软件才会存储数值预测器`'NumBins'`培训与学习树模型时的名称 - 值对参数为正整数标量。该`BinEdges`属性为空，如果`'NumBins'`值是空的（默认）。您可以复制离散化的预测数据`Xbinned`通过使用`BinEdges`训练的模型的属性`mdl`。 X = mdl.X;％预测数据Xbinned =零（大小（X））;边缘= mdl.BinEdges;％查找分级预测的指标。idxNumeric =找到（〜cellfun（@的isEmpty，边缘））;如果iscolumn（idxNumeric）idxNumeric = idxNumeric';结束对于j = idxNumeric X = X（：，J）;％x转换为数组，如果x是一个表。如果istable（X）X = table2array（X）;端％基团X到箱中，通过使用`离散化`功能。xbinned =离散化（X，[ - INF;边缘{Ĵ}; INF]）;Xbinned（：，J）= xbinned;结束 `Xbinned`包含二进制位索引，取值范围为1到箱柜的数目，对于数值预测因子。`Xbinned`值分类预测是0。如果`X`包含`为NaN`s，则相应`Xbinned`值`为NaN`年代。
`CategoricalPredictors`	直言预测指标，指定为正整数的向量。`CategoricalPredictors`包含与包含分类预测器的预测器数据列对应的索引值。如果没有谓词是范畴性的，则此属性为空(`[]`)。
`CategoricalSplits`	一个<Ëm class="varname">ñ-by-2细胞阵列，其中`ñ`分类分裂的数量是多少`树`。在每一行`CategoricalSplits`给出分类分割的左值和右值。对于每个具有分类分割的分支节点`Ĵ`根据一个分类预测变量`ž`，则选择左子元素`ž`是在`CategoricalSplits (j, 1)`选择右子元素`ž`是在`CategoricalSplits（J，2）`。劈叉都以相同的顺序作为树的节点。对这些分裂节点可通过运行发现`cuttype`和选择`“绝对”`削减从顶部到底部。
`孩子`	一个<Ëm class="varname">ñ的-乘2数组，其中包含每个节点的子节点数`树`，其中<Ëm class="varname">ñ为节点数。叶节点有子节点`0`。
`CutCategories`	一个<Ëm class="varname">ñ中的分支使用的类别的-乘2单元格数组`树`，其中<Ëm class="varname">ñ为节点数。对于每个分支节点`一世`根据一个分类预测变量`X`，则选择左子元素`X`是否在类别中列出`CutCategories{1},我`，而右孩子如果选择`X`是那些在其中列出的`CutCategories {I，2}`。的两列`CutCategories`对于基于连续预测器的分支节点和叶节点，为空。 `割点`包含了砍分`'连续'`切块，`CutCategories`包含该类别集。
`割点`	一个<Ëm class="varname">ñ-元素向量的值用作切割点`树`，其中<Ëm class="varname">ñ为节点数。对于每个分支节点`一世`基于连续预测变量`X`，则选择左子元素`x <割点(我)`选择右子元素`X> =截点（I）`。`割点`是`为NaN`基于分类预测和叶节点分支节点。
`CutType`	一个<Ëm class="varname">ñ- 元素单元阵列指示在每个节点切割类型`树`，其中<Ëm class="varname">ñ为节点数。对于每个节点`一世`，`CutType {I}`是： `'连续'`- 如果切口的形式定义`X 一个变量X和切点v。` `“绝对”- 如果切口是通过是否一个变量定义X发生在一组类别的值。 “”- 如果一世是叶节点。` `割点包含了砍分'连续'切块，CutCategories包含该类别集。`
`CutPredictor`	一个<Ëm class="varname">ñ变量的名称 - 元素单元阵列用于在每个节点的分支`树`，其中<Ëm class="varname">ñ为节点数。这些变量有时被称为减少变量。叶节点,`CutPredictor`包含一个空字符向量。 `割点`包含了砍分`'连续'`切块，`CutCategories`包含该类别集。
`CutPredictorIndex`	一个<Ëm class="varname">ñ中的每个节点中用于分支的变量的数值索引的元素数组`树`，其中<Ëm class="varname">ñ为节点数。有关更多信息，请参见`CutPredictor`。
`ExpandedPredictorNames`	扩展的预测器名称，存储为字符向量的单元格数组。如果编码分类变量，那么该模型的用途`ExpandedPredictorNames`包括描述扩展的变量名。除此以外，`ExpandedPredictorNames`等于`PredictorNames`。
`HyperparameterOptimizationResults`	超参数的交叉验证优化描述，存储为`BayesianOptimization`对象或超参数和关联值的表。非空的时`OptimizeHyperparameters`名称-值对在创建时是非空的。属性的设置`HyperparameterOptimizationOptions`创建时的名称-值对: `'bayesopt'`(默认)-类的对象`BayesianOptimization` `'gridsearch'`或`'randomsearch'`- 超参数的表所使用的，观测到的观测的目标函数值（交叉验证损失），和等级从最低（最好）至最高（最差）
`IsBranchNode`	一个<Ëm class="varname">ñ- 元素逻辑矢量`IB`那是`真正的`对于每个分支节点和`假`的每个叶节点`树`。
`ModelParameters`	的物体保持参数`树`。
`NumObservations`	训练数据中的观察数，数值标量。`NumObservations`可以小于输入数据的行数吗`X`当有遗漏值在`X`或响应`ÿ`。
`NodeError`	一个<Ëm class="varname">ñ元向量`Ë`节点的误差`树`，其中<Ëm class="varname">ñ为节点数。`的E（i）`为节点的误分类概率`一世`。
`NodeMean`	一个<Ëm class="varname">ñ-每个节点的均值的元素数值数组`树`，其中<Ëm class="varname">ñ在树的节点数目。在每一个元素`NodeMean`是平均真实的`ÿ`值相对于在节点的所有观测。
`NodeProbability`	一个<Ëm class="varname">ñ元向量`p`的概率`树`，其中<Ëm class="varname">ñ为节点数。一个节点的概率被计算为从满足该节点的条件的原始数据观测的比例。这一比例调整为分配给每个类中的任何先验概率。
`NodeRisk`	一个<Ëm class="varname">ñ节点的树，其中的风险 - 元素矢量<Ëm class="varname">ñ为节点数。每个节点的风险是由节点概率加权的节点错误。
`NodeSize`	一个<Ëm class="varname">ñ元向量`大小`中节点的大小`树`，其中<Ëm class="varname">ñ为节点数。节点的大小定义为用于创建满足该节点条件的树的数据的观察次数。
`NumNodes`	节点数`ñ`在`树`。
`亲`	一个<Ëm class="varname">ñ元向量`p`含父节点的数目中的每个节点`树`，其中<Ëm class="varname">ñ为节点数。根节点的父是`0`。
`PredictorNames`	预测变量名称的单元阵列，在该命令在它们出现在`X`。
`PruneAlpha`	数值向量与每修剪水平一种元素。如果修剪水平范围从0到<Ëm class="varname">中号，然后`PruneAlpha`有<Ëm class="varname">中号+ 1个元素按升序排序。`PruneAlpha（1）`为修剪级别0（没有修剪），`PruneAlpha（2）`用于删除级别1，以此类推。
`PruneList`	一个<Ëm class="varname">ñ具有在每个节点中的修剪水平 - 元素数值向量`树`，其中<Ëm class="varname">ñ为节点数。修剪的水平范围从0（没有修剪），以<Ëm class="varname">中号，其中<Ëm class="varname">中号最深的是叶子与根节点之间的距离。
`ResponseName`	指定响应变量的名称（A字符向量`ÿ`)。
`ResponseTransform`	用于将原始响应值（均方误差）功能的手柄。该功能句柄必须接受响应值的矩阵并返回相同大小的矩阵。默认`'没有'`手段`@ x (x)`或者没有改造。添加或更改`ResponseTransform`使用点符号功能： tree.ResponseTransform = @<Ëm class="replaceable">函数
`RowsUsed`	一个<Ëm class="varname">ñ指示 - 元素逻辑矢量其中原始预测数据的行（`X`）在拟合中使用。如果软件使用的所有行`X`，然后`RowsUsed`为空数组(`[]`)。
`SurrogateCutCategories`	一个<Ëm class="varname">ñ类别 - 元素单元阵列用于替代分裂`树`，其中<Ëm class="varname">ñ是节点的数量`树`。对于每个节点`ķ`，`SurrogateCutCategories {K}`是一个单元阵列。长度`SurrogateCutCategories {K}`等于在这个节点中找到替代预测的数量。的每一个元素`SurrogateCutCategories {K}`或者是一种用于连续替代预测一个空字符向量，或者是两元件单元阵列与类别为范畴替代预测。通过该替代拆分分配给左子这两个元素的单元阵列列表类别的第一元件，和通过该替代拆分分配给右子这两个元素的单元阵列列表类别的第二元件。替代分裂变量中的每一个节点的顺序被匹配到的变量的顺序`SurrogateCutPredictor`。这个节点上的最优分割变量没有出现。对于非分枝(叶)节点，`SurrogateCutCategories`包含一个空单元格。
`SurrogateCutFlip`	一个<Ëm class="varname">ñ中用于代理分割的数值分割赋值的单元格数组`树`，其中<Ëm class="varname">ñ是节点的数量`树`。对于每个节点`ķ`，`SurrogateCutFlip {k}`是一个数值向量。长度`SurrogateCutFlip {k}`等于在这个节点中找到替代预测的数量。的每一个元素`SurrogateCutFlip {k}`为分类替代预测器，或一个数字切割为连续的替代预测分配或者为零。该数值极限分配可以是-1或+1。对于具有数字切每个替代拆分<Ëm class="varname">C基于连续预测变量<Ëm class="varname">ž，则选择左子元素ž<<Ëm class="varname">C这个代理分割的cut分配是+1，或者ifž≥<Ëm class="varname">C而这种替代拆分切割分配为-1。同样，右孩子如果选择ž≥<Ëm class="varname">C这个代理分割的cut分配是+1，或者ifž<<Ëm class="varname">C而这种替代拆分切割分配为-1。替代分裂变量中的每一个节点的顺序被匹配到的变量的顺序`SurrogateCutPredictor`。这个节点上的最优分割变量没有出现。对于非分枝(叶)节点，`SurrogateCutFlip`包含一个空数组。
`SurrogateCutPoint`	一个<Ëm class="varname">ñ中用于代理分割的数值的单元格数组`树`，其中<Ëm class="varname">ñ是节点的数量`树`。对于每个节点`ķ`，`SurrogateCutPoint {k}`是一个数值向量。长度`SurrogateCutPoint {k}`等于在这个节点中找到替代预测的数量。的每一个元素`SurrogateCutPoint {k}`或者是`为NaN`用于分类预测的替代，或一个数字切割为连续的替代指标。对于具有数字切每个替代拆分<Ëm class="varname">C基于连续预测变量<Ëm class="varname">ž，则选择左子元素ž<<Ëm class="varname">C和`SurrogateCutFlip`这个替代拆分为+1，或者如果ž≥<Ëm class="varname">C和`SurrogateCutFlip`对于这个代理，分割为-1。同样，右孩子如果选择ž≥<Ëm class="varname">C和`SurrogateCutFlip`这个替代拆分为+1，或者如果ž<<Ëm class="varname">C和`SurrogateCutFlip`对于这个代理，分割为-1。在每个节点上的代理分割变量的顺序与`SurrCutPredictor`。这个节点上的最优分割变量没有出现。对于非分枝(叶)节点，`SurrogateCutPoint`包含一个空单元格。
`SurrogateCutType`	一个<Ëm class="varname">ñ- 元素单元阵列指示在每个节点类型替代拆分的`树`，其中<Ëm class="varname">ñ是节点的数量`树`。对于每个节点`ķ`，`SurrogateCutType {K}`是一个单元阵列与所述类型的该节点的替代拆分变量。变量按与最优预测器的关联预测测度从高到低排序，仅包含具有正预测测度的变量。替代分裂变量中的每一个节点的顺序被匹配到的变量的顺序`SurrogateCutPredictor`。这个节点上的最优分割变量没有出现。对于非分枝(叶)节点，`SurrogateCutType`包含一个空单元格。代理项分割类型可以是其中之一`'连续'`如果切面在形式中被定义`ž`<`V`一个变量`ž`和切点`V`或`“绝对”`如果切割被定义是否`ž`发生在一组类别的值。
`SurrogateCutPredictor`	一个<Ëm class="varname">ñ变量的名称 - 元素单元阵列中的每个节点用于替代拆分`树`，其中<Ëm class="varname">ñ是节点的数量`树`。的每一个元素`SurrogateCutPredictor`是包含此节点上代理分割变量名称的单元数组。变量按与最优预测器的关联预测测度从高到低排序，仅包含具有正预测测度的变量。这个节点上的最优分割变量没有出现。对于非分枝(叶)节点，`SurrogateCutPredictor`包含一个空单元格。
`SurrogatePredictorAssociation`	一个<Ëm class="varname">ñ的关联的预测措施 - 元素单元阵列用于替代分裂`树`，其中<Ëm class="varname">ñ是节点的数量`树`。对于每个节点`ķ`，`SurrogatePredictorAssociation {K}`是一个数值向量。长度`SurrogatePredictorAssociation {K}`等于在这个节点中找到替代预测的数量。的每一个元素`SurrogatePredictorAssociation {K}`给出最优分裂，这种替代拆分之间的关联的预测指标。在每个节点处的替代拆分变量的顺序是变量的顺序`SurrogateCutPredictor`。这个节点上的最优分割变量没有出现。对于非分枝(叶)节点，`SurrogatePredictorAssociation`包含一个空单元格。
`w ^`	的比例`权重`与长度的矢量`ñ`中，行中的数`X`。
`X`	预测值的矩阵或表。的每一列`X`表示一个可变的，并且每行表示一个观察。
`ÿ`	具有相同数量的行作为数字列向量`X`。在每个条目`ÿ`是的相应行中的数据的响应`X`。

方法

紧凑	紧凑型回归树
crossval	交叉验证决策树
cvloss	通过交叉验证回归错误
修剪	通过修剪产生回归子树的序列
resubLoss	通过重新替换的回归误差
resubPredict	预测树resubstitution响应

继承的方法

失利	回归错误
预测	预测采用回归树响应
predictorImportance	预测的重要性估计回归树
surrogateAssociation	在回归树替代拆分协会的预测均值衡量
视图	查看回归树

复制语义

价值。要了解值类如何影响复制操作，请参见复制对象(MATLAB)。

例子

全部折叠

构建回归树

打开生活的脚本

加载示例数据。

加载carsmall

建立基于样本数据进行回归树。响应变量是每加仑，MPG英里。

树= fitrtree（[重量，气瓶]，MPG，...'CategoricalPredictors'，2，“MinParentSize”,20岁,...'PredictorNames',{'W'，'C'}）

树= RegressionTree PredictorNames：{ 'W' 'C'} ResponseName： 'Y' CategoricalPredictors：2 ResponseTransform： '无' NumObservations：94的属性，方法

预测的4000磅的汽车的里程与4,6，和8汽缸。

MPG4Kpred =预测（树，[4000 4 4000 6 4000 8]）

MPG4Kpred =3×119.2778 19.2778 14.3889

参考

[1] Breiman，L.，J。弗里德曼，R. Olshen，和C.石。<Ëm class="citetitle">分类和回归树。佛罗里达，博卡拉顿:CRC出版社，1984年。

扩展功能

C / C ++代码生成
使用MATLAB®Coder™生成C和c++代码。

使用注意事项和限制：

该预测和更新函数支持代码生成。万博1manbetx
当您使用训练回归树模型fitrtree，适用以下限制。
- 代码生成不支持范畴谓词(万博1manbetx合乎逻辑，明确的，烧焦，串,或细胞)。如果在表中提供培训数据，则预测器必须是数字(双或单)。此外，您不能使用'CategoricalPredictors'名称 - 值对的参数。要在模型分类预测，预处理使用分类预测dummyvar前拟合模型。
- 的价值'ResponseTransform'名称 - 值对参数不能匿名函数。对于固定点代码生成，所述'ResponseTransform'值必须是'没有'。
- 不能使用替代拆分，也就是值了“代孕”名称-值对参数必须为“关”。