CompactClassificationTree

包裹：classreg.learning.classif

紧凑分类树

全部展开页面

描述

分类树（类）的精简版分类树）.精简版不包括用于训练分类树的数据。因此，您不能使用紧凑的分类树执行某些任务，例如交叉验证。使用紧凑的分类树对新数据进行预测(分类)。

建设

ctree=紧凑型(树)从完整的决策树构造紧凑的决策树。

输入参数

树

使用菲茨特里．

属性

`分类预测因子`	分类预测指标，指定为一个正整数向量。`分类预测因子`包含与包含分类预测器的预测器数据列对应的索引值。如果没有任何预测器是绝对的，则此属性为空(`［］`）.
`CategoricalSplits`	一N-by-2单元阵列，其中N分类分割的数量在吗`树`．在每一行`CategoricalSplits`为分类分割提供左值和右值。对每个分支节点进行分类分割`J`基于分类预测变量`Z`，则选择左子结点`Z`是在`CategoricalSplits (j, 1)`选择正确的子结点，如果`Z`是在`CategoricalSplits (j, 2)`．拆分的顺序与树中的节点相同。通过选择找到这些分割的节点`“分类”`从上到下切割`CutType`所有物
`儿童`	一N-by-2数组，其中包含每个节点的子节点编号`树`,在那里N为节点数。叶节点有子节点`0`．
`ClassCount`	一N-借-K中节点的类计数数组`树`,在那里N是节点数和K为类数。对于任意节点数`我`，这门课很重要`类计数（i，：）`每个类的观察计数(来自拟合树所用的数据)是否满足节点的条件`我`．
`类名`	中的元素列表`Y`删除重复的。`类名`可以是数字向量、类别变量的向量、逻辑向量、字符数组或字符向量的单元格数组。`类名`与参数中的数据具有相同的数据类型`Y`．（软件将字符串数组视为字符向量的单元数组。）如果属性的值至少有一个长度维度K然后`类名`指示元素沿该维度的顺序(例如，`费用`和`之前`）.
`ClassProbability`	一N-借-K中的节点的类概率数组`树`,在那里N是节点数和K为类数。对于任意节点数`我`，类概率`ClassProbability(我,:)`每个类对一个点的估计概率是否满足节点的条件`我`．
`费用`	方阵,`成本（i，j）`将一个点分类的成本是多少`J`如果它真正的阶级是`我`（行对应于真实类，列对应于预测类）。的行和列的顺序`费用`对应于中类的顺序`类名`．中的行数和列数`费用`是响应中唯一类的数量。此属性是只读的。
`CutCategories`	一N中分支使用的类别的单元格数组`树`,在那里N是节点数。对于每个分支节点`我`基于分类预测变量`x`，则选择左子结点`x`在哪些类别中`CutCategories{1},我`，并且如果`x`是中列出的`剖分类别{i，2}`.两栏`CutCategories`对于基于连续预测器的分支节点和叶节点为空。 `割点`包含以下对象的切点：`“连续的”`削减，以及`CutCategories`包含类别集。
`割点`	一N元素向量的值用作切入点`树`,在那里N是节点数。对于每个分支节点`我`基于连续预测变量`x`，则选择左子结点`x <割点(我)`选择正确的子结点，如果`x> =切割点（i）`．`割点`是`楠`对于基于分类预测器的分支节点和叶节点。 `割点`包含以下对象的切点：`“连续的”`削减，以及`CutCategories`包含类别集。
`CutType`	一N-元素单元数组，指示中每个节点的切割类型`树`,在那里N是节点数。对于每个节点`我`,`剪切类型{i}`是： `“连续的”`-如果在表格中定义了切割`x < v`对于一个变量`x`和切点`v`． `“分类”`—如果cut是由变量定义的`x`获取一组类别中的值。 `''`——如果`我`是一个叶节点。 `割点`包含以下对象的切点：`“连续的”`削减，以及`CutCategories`包含类别集。
`割线预测器`	一N-元素中每个节点中用于分支的变量名称的单元格数组`树`,在那里N是节点数。这些变量有时称为减少变量．叶节点,`割线预测器`包含空字符向量。 `割点`包含以下对象的切点：`“连续的”`削减，以及`CutCategories`包含类别集。
`CutPredictorIndex`	一N中的每个节点中用于分支的变量的数字索引数组`树`,在那里N为节点数。有关更多信息，请参见`割线预测器`．
`扩展预测器名称`	扩展的预测器名称，存储为字符向量的单元格数组。如果模型对分类变量使用编码，那么`扩展预测器名称`包括描述扩展变量的名称。否则,`扩展预测器名称`与`预测器名称`．
`IsBranchNode`	一N-元素逻辑向量，即`真正的`对于每个分支节点和`错误的`的每个叶节点`树`．
`NodeClass`	一N的每个节点中最有可能的类的名称`树`,在那里N为树中的节点数。这个数组的每个元素都是一个字符向量，等于中的一个类名`类名`．
`NodeError`	一N中节点误差的元素向量`树`,在那里N为节点数。`NodeError(我)`节点的误分类概率是多少`我`．
`NodeProbability`	一N中节点的概率的元素向量`树`,在那里N是节点数。节点的概率计算为原始数据中满足节点条件的观测值的比例。该比例根据分配给每个类别的任何先验概率进行调整。
`NodeRisk`	一N-树中节点风险的元素向量，其中N是节点数。每个节点的风险是由节点概率加权的该节点的杂质（基尼指数或偏差）度量。如果树按两倍增长，则每个节点的风险为零。
`节点化`	一N中的节点大小的元素向量`树`,在那里N为节点数。节点的大小定义为用于创建满足节点条件的树的数据的观察数。
`珠心`	节点的数量`树`．
`父`	一N-元素向量，其中包含每个节点的父节点数`树`,在那里N是节点数。根节点的父节点为`0`．
`预测器名称`	预测器变量名称的单元格数组，按它们出现的顺序排列`X`．
`之前`	每个类别的先验概率的数值向量。元素的顺序`之前`对应于中类的顺序`类名`．元素的数量`之前`是响应中唯一类的数量。此属性是只读的。
`PruneAlpha`	每个修剪级别具有一个元素的数值向量。如果修剪级别介于0到M然后`PruneAlpha`有M+1按升序排序的元素。`李属植物（1）`用于修剪级别0（无修剪），`李海棠（2）`用于修剪级别1，以此类推。
`修剪师`	一N的每个节点中具有修剪级别的元素数值向量`树`,在那里N是节点数。修剪级别从0（无修剪）到M,在那里M是最深叶与根节点之间的距离。
`反应胺`	描述响应变量的特征向量`Y`．
`分数变换`	用于转换分数的函数句柄，或表示内置转换函数的字符向量。`“没有”`意味着没有转换;同样,`“没有”`意味着`@ x (x)`．有关内置转换函数的列表和自定义转换函数的语法，请参见`菲茨特里`．添加或更改`分数变换`使用点表示法的函数： ctree。ScoreTransform = '函数'或ctree.ScoreTransform=@函数
`代理类别`	一N-element用于分割的代理项的单元格数组`树`,在那里N节点数在吗`树`. 对于每个节点`K`,`代理类别{k}`是单元格数组。的长度`代理类别{k}`等于在该节点上找到的代理预测器的数量。每个元素的`代理类别{k}`为连续代理预测器的空字符向量，或为类别代理预测器的两元素单元格数组。这个双元素单元格数组的第一个元素列出了由这个代理拆分分配给左子元素的类别，这个双元素单元格数组的第二个元素列出了由这个代理拆分分配给右子元素的类别。在每个节点上分割变量的代理项的顺序与中的变量的顺序相匹配`SurrogateCutVar`。此节点上未显示最佳拆分变量。对于非分支（叶）节点，`代理类别`包含一个空单元格。
`SurrogateCutFlip`	一N用于代理拆分的数字切割赋值的单元格数组`树`,在那里N节点数在吗`树`. 对于每个节点`K`,`SurrSurrogateCutFlip{k}`是一个数字向量。的长度`SurrogateCutFlip {k}`等于在该节点上找到的代理预测器的数量。每个元素的`SurrogateCutFlip {k}`对于分类代理项预测器为零，对于连续代理项预测器为数字切割赋值。数字切割赋值可以是–1或+1。对于每个使用数字切割的代理项拆分C基于连续预测变量Z，则选择左子结点Z<C这个代理分割的切割赋值是+1，或者Z≥C这个代理分割的分割赋值是-1。类似地，如果Z≥C这个代理分割的切割赋值是+1，或者Z<C此代理项拆分的切割赋值为–1。每个节点上代理项拆分变量的顺序与中变量的顺序匹配`替代预测因子`。此节点上未显示最佳拆分变量。对于非分支（叶）节点，`SurrogateCutFlip`包含空数组。
`SurrogateCutPoint`	一N用于代理的数值的单元格数组`树`,在那里N节点数在吗`树`. 对于每个节点`K`,`SurrogateCutPoint {k}`是一个数字向量。的长度`SurrogateCutPoint {k}`等于在该节点上找到的代理预测器的数量。每个元素的`SurrogateCutPoint {k}`要么`楠`对于分类替代项预测器，或对于连续替代项预测器，为数字切割。对于每个带有数字切割的代理项拆分C基于连续预测变量Z，则选择左子结点Z<C和`SurrogateCutFlip`对于此代理项，拆分为+1，或者如果Z≥C和`SurrogateCutFlip`对于此代理项，拆分为–1。同样，如果选择了正确的孩子Z≥C和`SurrogateCutFlip`对于此代理项，拆分为+1，或者如果Z<C和`SurrogateCutFlip`此代理项拆分的值为–1。每个节点上代理项拆分变量的顺序与`替代预测因子`。此节点上未显示最佳拆分变量。对于非分支（叶）节点，`SurrogateCutPoint`包含一个空单元格。
`SurrogateCutType`	一N-元素单元格数组，指示中每个节点上代理项拆分的类型`树`,在那里N节点数在吗`树`. 对于每个节点`K`,`代理剪切类型{k}`是一个单元格数组，其中包含此节点上的代理项拆分变量的类型。变量按照与最优预测器关联的预测量降序排序，只包含具有正向预测量的变量。在每个节点上分割变量的代理项的顺序与中的变量的顺序相匹配`替代预测因子`。此节点上未显示最佳拆分变量。对于非分支（叶）节点，`SurrogateCutType`包含一个空单元格。代理分割类型可以是以下两种`“连续的”`如果在表格中定义了切割`Z`<`v`对于一个变量`Z`和切点`v`或`“分类”`如果削减是由是否`Z`获取一组类别中的值。
`替代预测因子`	一N-元素中每个节点中用于代理项拆分的变量名称的单元格数组`树`,在那里N节点数在吗`树`．每个元素的`替代预测因子`是一个单元格数组，其中包含此节点上的代理项拆分变量的名称。变量按照与最优预测器关联的预测量降序排序，只包含具有正向预测量的变量。这个节点上的最优分割变量不会出现。对于非分支(叶)节点，`替代预测因子`包含一个空单元格。
`SurrogatePredictorAssociation`	一N-element单元阵列的预测关联度量为代理分裂`树`,在那里N节点数在吗`树`. 对于每个节点`K`,`SurrogatePredictorAssociation {k}`是一个数字向量。的长度`SurrogatePredictorAssociation {k}`等于在该节点上找到的代理预测器的数量。每个元素的`SurrogatePredictorAssociation {k}`给出了最佳分割和代理分割之间关联的预测度量。在每个节点上的代理分割变量的顺序是变量的顺序`替代预测因子`。此节点上未显示最佳拆分变量。对于非分支（叶）节点，`SurrogatePredictorAssociation`包含一个空单元格。

方法

边缘	分类的优势
损失	分类错误
保证金	分类边距
预测	利用分类树预测标签
预测重要性	分类树预测器重要性的估计
代孕协会	分类树中代理项分裂关联的均值预测测度
视图	视图分类树

复制语义

价值。要了解值类如何影响复制操作，请参见复制对象(MATLAB)。

例子

全部崩溃

构造一个紧凑的分类树

打开生活的脚本

为Fisher虹膜数据构造一个紧凑的分类树。

负载fisheriris树木=fitctree（meas，物种）；ctree=紧凑型（树型）；

将结果树的大小与原始树的大小进行比较。

t =谁(“树”);%t.bytes=树的大小（以字节为单位）c =谁(“ctree”);% c.bytes = ctree的大小[c。字节t.bytes]

ans=1×24929 11594

紧凑树比原始树小。

扩展功能

C / c++代码生成
使用MATLAB®Coder™生成C和c++代码。

使用注意事项及限制:

这个预测和更新函数支持代码生成。万博1manbetx
当您使用菲茨特里，适用以下限制。
- 该类标记输入参数值(Y)不能是分类数组。
- 代码生成不支持分类预测器(万博1manbetx必然的,明确的,烧焦,字符串,或单间牢房)。如果在表格中提供培训数据，则预测值必须为数字(双或单）.同样，你不能使用“分类预测因素”名称-值对参数。要在模型中包含范畴预测因子，使用杜姆瓦尔在安装模型之前。
- 价值“类名”名称-值对参数不能是分类数组。
- 价值“ScoreTransform”名称-值对参数不能是匿名函数。对于定点代码生成，“ScoreTransform”值不能“invlogit”．
- 的值不能使用代理符分隔“代孕”名称-值对参数必须为“关”．