CompactClassificationTree

包裹:classreg.learning.classif

紧凑分类树

描述

分类树(类)的精简版分类树).精简版不包括用于训练分类树的数据。因此,您不能使用紧凑的分类树执行某些任务,例如交叉验证。使用紧凑的分类树对新数据进行预测(分类)。

建设

ctree=紧凑型()从完整的决策树构造紧凑的决策树。

输入参数

使用菲茨特里

属性

分类预测因子

分类预测指标,指定为一个正整数向量。分类预测因子包含与包含分类预测器的预测器数据列对应的索引值。如果没有任何预测器是绝对的,则此属性为空([]).

CategoricalSplits

N-by-2单元阵列,其中N分类分割的数量在吗.在每一行CategoricalSplits为分类分割提供左值和右值。对每个分支节点进行分类分割J基于分类预测变量Z,则选择左子结点Z是在CategoricalSplits (j, 1)选择正确的子结点,如果Z是在CategoricalSplits (j, 2).拆分的顺序与树中的节点相同。通过选择找到这些分割的节点“分类”从上到下切割CutType所有物

儿童

N-by-2数组,其中包含每个节点的子节点编号,在那里N为节点数。叶节点有子节点0

ClassCount

N-借-K中节点的类计数数组,在那里N是节点数和K为类数。对于任意节点数,这门课很重要类计数(i,:)每个类的观察计数(来自拟合树所用的数据)是否满足节点的条件

类名

中的元素列表Y删除重复的。类名可以是数字向量、类别变量的向量、逻辑向量、字符数组或字符向量的单元格数组。类名与参数中的数据具有相同的数据类型Y(软件将字符串数组视为字符向量的单元数组。)

如果属性的值至少有一个长度维度K然后类名指示元素沿该维度的顺序(例如,费用之前).

ClassProbability

N-借-K中的节点的类概率数组,在那里N是节点数和K为类数。对于任意节点数,类概率ClassProbability(我,:)每个类对一个点的估计概率是否满足节点的条件

费用

方阵,成本(i,j)将一个点分类的成本是多少J如果它真正的阶级是(行对应于真实类,列对应于预测类)。的行和列的顺序费用对应于中类的顺序类名.中的行数和列数费用是响应中唯一类的数量。此属性是只读的。

CutCategories

N中分支使用的类别的单元格数组,在那里N是节点数。对于每个分支节点基于分类预测变量x,则选择左子结点x在哪些类别中CutCategories{1},我,并且如果x是中列出的剖分类别{i,2}.两栏CutCategories对于基于连续预测器的分支节点和叶节点为空。

割点包含以下对象的切点:“连续的”削减,以及CutCategories包含类别集。

割点

N元素向量的值用作切入点,在那里N是节点数。对于每个分支节点基于连续预测变量x,则选择左子结点x <割点(我)选择正确的子结点,如果x> =切割点(i)割点对于基于分类预测器的分支节点和叶节点。

割点包含以下对象的切点:“连续的”削减,以及CutCategories包含类别集。

CutType

N-元素单元数组,指示中每个节点的切割类型,在那里N是节点数。对于每个节点,剪切类型{i}是:

  • “连续的”-如果在表格中定义了切割x < v对于一个变量x和切点v

  • “分类”—如果cut是由变量定义的x获取一组类别中的值。

  • ''——如果是一个叶节点。

割点包含以下对象的切点:“连续的”削减,以及CutCategories包含类别集。

割线预测器

N-元素中每个节点中用于分支的变量名称的单元格数组,在那里N是节点数。这些变量有时称为减少变量.叶节点,割线预测器包含空字符向量。

割点包含以下对象的切点:“连续的”削减,以及CutCategories包含类别集。

CutPredictorIndex

N中的每个节点中用于分支的变量的数字索引数组,在那里N为节点数。有关更多信息,请参见割线预测器

扩展预测器名称

扩展的预测器名称,存储为字符向量的单元格数组。

如果模型对分类变量使用编码,那么扩展预测器名称包括描述扩展变量的名称。否则,扩展预测器名称预测器名称

IsBranchNode

N-元素逻辑向量,即真正的对于每个分支节点和错误的的每个叶节点

NodeClass

N的每个节点中最有可能的类的名称,在那里N为树中的节点数。这个数组的每个元素都是一个字符向量,等于中的一个类名类名

NodeError

N中节点误差的元素向量,在那里N为节点数。NodeError(我)节点的误分类概率是多少

NodeProbability

N中节点的概率的元素向量,在那里N是节点数。节点的概率计算为原始数据中满足节点条件的观测值的比例。该比例根据分配给每个类别的任何先验概率进行调整。

NodeRisk

N-树中节点风险的元素向量,其中N是节点数。每个节点的风险是由节点概率加权的该节点的杂质(基尼指数或偏差)度量。如果树按两倍增长,则每个节点的风险为零。

节点化

N中的节点大小的元素向量,在那里N为节点数。节点的大小定义为用于创建满足节点条件的树的数据的观察数。

珠心

节点的数量

N-元素向量,其中包含每个节点的父节点数,在那里N是节点数。根节点的父节点为0

预测器名称

预测器变量名称的单元格数组,按它们出现的顺序排列X

之前

每个类别的先验概率的数值向量。元素的顺序之前对应于中类的顺序类名.元素的数量之前是响应中唯一类的数量。此属性是只读的。

PruneAlpha

每个修剪级别具有一个元素的数值向量。如果修剪级别介于0到M然后PruneAlphaM+1按升序排序的元素。李属植物(1)用于修剪级别0(无修剪),李海棠(2)用于修剪级别1,以此类推。

修剪师

N的每个节点中具有修剪级别的元素数值向量,在那里N是节点数。修剪级别从0(无修剪)到M,在那里M是最深叶与根节点之间的距离。

反应胺

描述响应变量的特征向量Y

分数变换

用于转换分数的函数句柄,或表示内置转换函数的字符向量。“没有”意味着没有转换;同样,“没有”意味着@ x (x).有关内置转换函数的列表和自定义转换函数的语法,请参见菲茨特里

添加或更改分数变换使用点表示法的函数:

ctree。ScoreTransform = '函数'或ctree.ScoreTransform=@函数

代理类别

N-element用于分割的代理项的单元格数组,在那里N节点数在吗. 对于每个节点K,代理类别{k}是单元格数组。的长度代理类别{k}等于在该节点上找到的代理预测器的数量。每个元素的代理类别{k}为连续代理预测器的空字符向量,或为类别代理预测器的两元素单元格数组。这个双元素单元格数组的第一个元素列出了由这个代理拆分分配给左子元素的类别,这个双元素单元格数组的第二个元素列出了由这个代理拆分分配给右子元素的类别。在每个节点上分割变量的代理项的顺序与中的变量的顺序相匹配SurrogateCutVar。此节点上未显示最佳拆分变量。对于非分支(叶)节点,代理类别包含一个空单元格。

SurrogateCutFlip

N用于代理拆分的数字切割赋值的单元格数组,在那里N节点数在吗. 对于每个节点K,SurrSurrogateCutFlip{k}是一个数字向量。的长度SurrogateCutFlip {k}等于在该节点上找到的代理预测器的数量。每个元素的SurrogateCutFlip {k}对于分类代理项预测器为零,对于连续代理项预测器为数字切割赋值。数字切割赋值可以是–1或+1。对于每个使用数字切割的代理项拆分C基于连续预测变量Z,则选择左子结点Z<C这个代理分割的切割赋值是+1,或者ZC这个代理分割的分割赋值是-1。类似地,如果ZC这个代理分割的切割赋值是+1,或者Z<C此代理项拆分的切割赋值为–1。每个节点上代理项拆分变量的顺序与中变量的顺序匹配替代预测因子。此节点上未显示最佳拆分变量。对于非分支(叶)节点,SurrogateCutFlip包含空数组。

SurrogateCutPoint

N用于代理的数值的单元格数组,在那里N节点数在吗. 对于每个节点K,SurrogateCutPoint {k}是一个数字向量。的长度SurrogateCutPoint {k}等于在该节点上找到的代理预测器的数量。每个元素的SurrogateCutPoint {k}要么对于分类替代项预测器,或对于连续替代项预测器,为数字切割。对于每个带有数字切割的代理项拆分C基于连续预测变量Z,则选择左子结点Z<CSurrogateCutFlip对于此代理项,拆分为+1,或者如果ZCSurrogateCutFlip对于此代理项,拆分为–1。同样,如果选择了正确的孩子ZCSurrogateCutFlip对于此代理项,拆分为+1,或者如果Z<CSurrogateCutFlip此代理项拆分的值为–1。每个节点上代理项拆分变量的顺序与替代预测因子。此节点上未显示最佳拆分变量。对于非分支(叶)节点,SurrogateCutPoint包含一个空单元格。

SurrogateCutType

N-元素单元格数组,指示中每个节点上代理项拆分的类型,在那里N节点数在吗. 对于每个节点K,代理剪切类型{k}是一个单元格数组,其中包含此节点上的代理项拆分变量的类型。变量按照与最优预测器关联的预测量降序排序,只包含具有正向预测量的变量。在每个节点上分割变量的代理项的顺序与中的变量的顺序相匹配替代预测因子。此节点上未显示最佳拆分变量。对于非分支(叶)节点,SurrogateCutType包含一个空单元格。代理分割类型可以是以下两种“连续的”如果在表格中定义了切割Z<v对于一个变量Z和切点v“分类”如果削减是由是否Z获取一组类别中的值。

替代预测因子

N-元素中每个节点中用于代理项拆分的变量名称的单元格数组,在那里N节点数在吗.每个元素的替代预测因子是一个单元格数组,其中包含此节点上的代理项拆分变量的名称。变量按照与最优预测器关联的预测量降序排序,只包含具有正向预测量的变量。这个节点上的最优分割变量不会出现。对于非分支(叶)节点,替代预测因子包含一个空单元格。

SurrogatePredictorAssociation

N-element单元阵列的预测关联度量为代理分裂,在那里N节点数在吗. 对于每个节点K,SurrogatePredictorAssociation {k}是一个数字向量。的长度SurrogatePredictorAssociation {k}等于在该节点上找到的代理预测器的数量。每个元素的SurrogatePredictorAssociation {k}给出了最佳分割和代理分割之间关联的预测度量。在每个节点上的代理分割变量的顺序是变量的顺序替代预测因子。此节点上未显示最佳拆分变量。对于非分支(叶)节点,SurrogatePredictorAssociation包含一个空单元格。

方法

边缘 分类的优势
损失 分类错误
保证金 分类边距
预测 利用分类树预测标签
预测重要性 分类树预测器重要性的估计
代孕协会 分类树中代理项分裂关联的均值预测测度
视图 视图分类树

复制语义

价值。要了解值类如何影响复制操作,请参见复制对象(MATLAB)。

例子

全部崩溃

为Fisher虹膜数据构造一个紧凑的分类树。

负载fisheriris树木=fitctree(meas,物种);ctree=紧凑型(树型);

将结果树的大小与原始树的大小进行比较。

t =谁(“树”);%t.bytes=树的大小(以字节为单位)c =谁(“ctree”);% c.bytes = ctree的大小[c。字节t.bytes]
ans=1×24929 11594

紧凑树比原始树小。

更多关于

全部展开

扩展功能

介绍了R2011a