预测

使用分类树预测标签

展开页面中的所有内容

句法

标签=预测(Mdl, X)

标签=预测（MDL，x，名称，值）

(标签、分数、节点cnum) =预测(___）

描述

标签=预测（Mdl那X）为表或矩阵中的预测器数据返回预测类标签的向量X，基于培训，完整或紧凑的分类树Mdl．

标签=预测（Mdl那X那名称,值）使用由一个或多个指定的附加选项名称,值对参数。例如，您可以指定修剪Mdl在预测标签之前达到一个特定的水平。

[标签那分数那节点那CNUM] =预测（___）使用上一个语法中的任何输入参数，另外还返回：

分类分数的矩阵（分数）表示标签来自特定类的可能性。对于分类树，分数是后验概率。对于每次观察X，这预测类标签对应于最小值预期的误分类代价在所有类。
分类的预测节点编号的矢量（节点)．
预测类编号的矢量分类（CNUM)．

输入参数

全部展开

`Mdl`-训练有素的分类树
`ClassificationTree.`模型对象|`CompactClassificationTree`模型对象

经过训练的分类树，指定为ClassificationTree.或CompactClassificationTree模型对象。也就是说,Mdl是否返回经过训练的分类模型fitctree或袖珍的．

`X`-预测数据需要分类
数字矩阵|表格

预测数据被分类，指定为数字矩阵或表。

每一排X对应于一个观察，并且每列对应于一个变量。

对于数字矩阵：
- 构成列的变量X必须有与训练的预测变量相同的顺序吗Mdl．
- 如果你训练Mdl使用表格（例如，TBL.),然后X可以是一个数字矩阵TBL.包含所有数值预测变量。中处理数字预测器TBL.作为培训期间的分类，使用该识别分类预测因子分类预测器的名称-值对参数fitctree．如果TBL.包含异构预测变量(例如，数字和分类数据类型)和X是一个数字矩阵吗预测抛出一个错误。
对于表：
- 预测除字符向量的单元数万博1manbetx组外，不支持多列变量和单元数组。
- 如果你训练Mdl使用表格（例如，TBL.），然后所有预测器变量都在X必须具有与培训的变量名称和数据类型相同Mdl（存储在Mdl。P.redictorNames)．但是，列顺序X不需要对应于列顺序TBL.．TBL.和X可以包含额外的变量(响应变量，观察权重等)，但是预测忽略它们。
- 如果你训练Mdl使用一个数字矩阵，然后预测器名称Mdl。P.redictorNames和相应的预测变量名称X必须是一样的。要在培训期间指定预测器名称，请参阅PredictorNames的名称-值对参数fitctree．所有预测变量X必须是数字向量。X可以包含额外的变量(响应变量，观察权重等)，但是预测忽略它们。

数据类型:表格|双|单

名称-值对的观点

指定可选的逗号分离对名称,值论点。的名字是参数名称和价值是对应的值。的名字必须出现在引号内。您可以按如下顺序指定几个名称和值对参数name1，value1，...，namen，valuen．

`'子树'`-修剪水平
0.(默认)|非负整数的向量|`“所有”`

修剪水平，指定为逗号分隔对组成'子树'一个非负整数的向量按升序或“所有”．

如果指定vector，则所有元素必须至少为0.在大多数马克斯(Mdl.PruneList)．0.表示完整的、未修剪的树和马克斯(Mdl.PruneList)表示完全修剪的树(即，只是根节点)。

如果您指定“所有”，然后预测在所有子树上操作（即整个修剪序列）。本规范相当于使用0:马克斯(Mdl.PruneList)．

预测牧师Mdl每个级别所示子树，然后估计相应的输出参数。的大小子树确定一些输出参数的大小。

调用子树,属性梅尔格莱斯和PruneAlpha的Mdl必须非空的。换句话说，就是成长Mdl通过设置“删除”,“上”，或通过修剪Mdl使用修剪．

例子：“子树”,“所有”

数据类型:单|双|char|字符串

输出参数

全部展开

`标签`-预测的类标签
矢量|数组

预测类标签，以vector或数组形式返回。每个条目的标签对应于具有最小期望成本的类的相应行X．

假设子树是一个包含的数字矢量T.元素（for..“所有”，看子树),X有N行。

如果响应数据类型是char和:
- T.= 1,然后标签是一个包含的字符矩阵N行。每行包含子树生成的预测标签子树．
- T.> 1,那么标签是一个N-经过-T.单元格阵列。
否则,标签是一个N-经过-T.具有与响应相同数据类型的数组。（该软件将字符串数组视为字符向量的单元格阵列。）

在后两种情况下，列j的标签包含子树产生的预测标签向量子树（j）．

`分数`- 后概率
数字矩阵

后验概率，以大小的数字矩阵返回N-经过-K.,在那里N是否有观察数(行)X,K.是多少类(在Mdl。ClassNames)．评分(i, j)是行的后验概率一世的X的类j．

如果子树有T.元素，和X有N然后是行分数是一个N-经过-K.-经过-T.数组,并节点和CNUM是N-经过-T.矩阵。

`节点`- 节点号
数值向量

预测类的节点号，作为数字向量返回。每个条目对应于预测节点Mdl对于相应的行X．

`CNUM`- 类号码
数值向量

与预测相对应的类号标签，作为数字向量返回。每个条目的CNUM对应于对应行的预测类号X．

例子

全部展开

使用分类树预测标签

打开生活的脚本

在培训之外的数据集中检查几行的预测。

装载Fisher的Iris数据集。

加载fisheriris

将数据划分为训练集(50%)和验证集(50%)。

1) n =大小(量;rng (1)重复性的％idxTrn = false (n, 1);idxTrn (randsample (n,圆(0.5 * n))) = true;%训练集合逻辑索引idxVal = idxTrn == false;％验证集合逻辑指数

使用训练集生成分类树。

Mdl = fitctree(量(idxTrn:),物种(idxTrn));

预测验证数据的标签。计算错误分类的观测数据。

标签=预测(Mdl量(idxVal:));标签(randsample(元素个数(标签),5))％显示几个预测标签

ans =.5x1细胞{'setosa'} {'setosa'} {'setosa'} {'virginica'} {'versicolor'}

nummisclass = sum（〜strcmp（标签，物种（Idxval）））））

numMisclass = 3

该软件错误分配了三种样本的观察。

使用分类树估算类后验概率

打开生活的脚本

装载Fisher的Iris数据集。

加载fisheriris

将数据划分为训练集(50%)和验证集(50%)。

1) n =大小(量;rng (1)重复性的％idxTrn = false (n, 1);idxTrn (randsample (n,圆(0.5 * n))) = true;%训练集合逻辑索引idxVal = idxTrn == false;％验证集合逻辑指数

使用训练集生成一个分类树，然后查看它。

Mdl = fitctree(量(idxTrn:),物种(idxTrn));视图(Mdl,'模式'那“图”）

生成的树有四个级别。

使用将子树修剪到1和3级的子树估计测试集的后验概率。

[~,后]=预测(Mdl量(idxVal:)“子树”3 [1]);Mdl。ClassNames

ans =.3 x1细胞{'setosa'} {'versicolor'} {'virginica'}

后(randsample(大小(后,1),5),:,:),．..％显示几个后部概率

ANS = ANS（：，：，

的元素后面是课后概率：

行对应于验证集中的观察。
中列出的类对应列Mdl。ClassNames．
页面对应于子树。

被修剪到级别1的子树比被修剪到级别3的子树(即根节点)更确定其预测。

更多关于

全部展开

预测类标签

预测通过最小化预期的分类成本进行分类:

$\hat{y} = \underset{y = 1 那．.. 那 K.}{参数最小值} \sum_{j = 1}^{K.} \hat{P.} （ j | X ） C （ y | j ）那$

在哪里

$\hat{y}$ 是预测的分类。
K.是课程的数量。
$\hat{P.} （ j | X ）$ 是课程的后验概率j为观察X．
$C （ y | j ）$ 对观察结果进行分类的成本是y当它真正的类是j．

分数(树)

对于树木,分数叶节点的分类是该节点上分类的后验概率。节点分类的后验概率是通过分类导致该节点的训练序列的数量，除以导致该节点的训练序列的数量。

例如，考虑对预测器进行分类X作为真正的当X<0.15或X>0.95,X是假的。

生成100个随机点并对它们进行分类：

rng (0,'twister'）重复性的％X =兰德(100 1);Y = (abs(X - 0.55) > .4);树= fitctree (X, Y);视图(树,'模式'那“图”）

修剪树:

tree1 =修剪(树,“水平”，1）;查看（树1，'模式'那“图”）

修剪后的树正确地将小于0.15的观测结果分类为真正的．它还正确地将观测值从。15到。94分类为错误的．然而，它错误地将大于。94的观测结果归类为错误的．因此，观察的分数大于.15的分数应为约0.05 /.85 = .06真正的，约为.8/.85=。94年错误的．

的前10行计算预测得分X：

[~,分数]=预测(tree1 X (1:10));(分数X (1:10)):

ans =.10×3.0.9059 0.0941 0.8147 0.9059 0.0941 0.9058 0 1.0000 0.1270 0.9059 0.0941 0.9134 0.9059 0.0941 0.6324 0 1.0000 0.0975 0.9059 0.0941 0.2785 0.9059 0.0941 0.5469 0.9059 0.0941 0.9575 0.9059 0.0941 0.9649

的确，每一种价值X(最右边的列)小于0.15的关联得分(左边和中间的列)0.和1，而另一个值X有相关的分数0.91和0.09．(得分的区别0.09而不是预期的06)是由于统计上的波动:有8.观察X范围内（.95,1）而不是预期的5.观察。

真正的误分类代价

有两种与分类相关的成本:每类的真实误分类成本和每次观察的预期误分类成本。

您可以在每个类中设置真正的错误分类成本成本属性创建分类器时的名称-值对fitctree方法。成本(i, j)是对课堂分类的成本j如果它的真类是一世．默认，成本（i，j）= 1如果我〜= j,成本（i，j）= 0如果我=我．换句话说，成本是0.对于正确的分类，和1不正确的分类。

预期成本

有两种与分类相关的成本:每类的真实误分类成本和每次观察的预期误分类成本。

假设你有脑袋您要使用培训的分类器分类的观察结果。假设你有K.类。你把观察结果放到一个矩阵里Xnew每行一个观察。

预期成本矩阵ce有大小脑袋-经过-K.．每一排ce包含将观察结果分类为每个K.类。ce（n，k）是

$\sum_{一世 = 1}^{K.} \hat{P.} （一世 | X N E. W. （ N ）） C （ K. | 一世）那$

在哪里

K.是课程的数量。
$\hat{P.} （一世 | X N E. W. （ N ））$ 是课程的后验概率一世为观察Xnew（N)．
$C （ K. | 一世）$ 对观察结果进行分类的真正错误分类代价是什么K.当它真正的类是一世．

预测措施

这关联的预测测量是一个值，指示分割观察结果的决策规则之间的相似性。在所有可能的决策分割中，与最优分割(通过生长树发现)相比较的是最佳分割代理决定分手产生最大的关联预测措施。第二好的代理分裂具有第二大的关联预测指标。

假设X_j和X_K.是预测变量j和K.分别为,j≠K.．在节点T.，是最优分裂之间关联的预测度量X_j<你和替代斯普利特X_K.<V.是

${λ.}_{j K.} = \frac{最小值（ {P.}_{L.} 那 {P.}_{R.} ） - （ 1 - {P.}_{{L.}_{j} {L.}_{K.}} - {P.}_{{R.}_{j} {R.}_{K.}} ）}{最小值（ {P.}_{L.} 那 {P.}_{R.} ）} ．$

P._L.是节点中观测值的比例吗T.,这样X_j<你．下标L.表示节点的左子节点T.．
P._R.是节点中观测值的比例吗T.,这样X_j≥你．下标R.代表节点的合适子T.．
${P.}_{{L.}_{j} {L.}_{K.}}$ 是节点处观测值的比例吗T.,这样X_j<你和X_K.<V.．
${P.}_{{R.}_{j} {R.}_{K.}}$ 是节点处观测值的比例吗T.,这样X_j≥你和X_K.≥V.．
缺少值的观察X_j或X_K.不要有助于比例计算。

λ._jk是（ - ∞，1]的值。如果λ._jk> 0，然后X_K.<V.是一个有价值的代理人分裂X_j<你．

算法

预测的分支生成预测Mdl直到到达一个叶节点或缺失的值。如果预测到达一个叶节点，它返回该节点的分类。

如果预测到达具有预测器缺失值的节点，其行为取决于设置的代理名称 - 值对时fitctree结构体Mdl．

代理='离开'(默认)预测返回到达该节点的训练样本数量最大的标签。
代理='上'-预测在节点上使用最佳代理分割。如果所有代理分割变量为正关联的预测测量人失踪,预测返回到达该节点的训练样本数量最大的标签。有关定义，请参阅预测措施．

扩展功能

高阵列
使用比内存更多的阵列计算更多行的阵列。

此功能完全支持高阵列。万博1manbetx您可以使用此功能使用在内存内存或高数据上培训的模型。

有关更多信息，请参阅高阵列．

C / c++代码生成
使用MATLAB®Coder™生成C和c++代码。

用法说明和限制:

您可以为两者生成C / C ++代码预测和更新通过使用编码器配置器。或者，仅生成代码预测通过使用saveLearnerForCoder那loadLearnerForCoder,codegen．
- 代码生成预测和更新- 通过使用创建编码器配置程序Learnercoderconfigurer然后通过使用生成代码Generatecode.．然后，您可以在生成的代码中更新模型参数，而无需重新生成代码。
- 代码生成预测-通过使用保存一个训练好的模型saveLearnerForCoder．定义一个入口点函数，通过使用来加载保存的模型loadLearnerForCoder并致电预测函数。然后使用codegen(MATLAB编码器)为入口点函数生成代码。

您还可以为此生成单精度C / C ++代码预测．对于单精度代码生成，请指定名称-值对参数“数据类型”、“单”作为额外的输入loadLearnerForCoder函数。
您还可以生成固定点C / C ++代码预测．定点代码生成需要一个额外的步骤来定义预测所需变量的定点数据类型。类创建定点数据类型结构数据类型的函数生成的generateLearnerDataTypeFcn，并将该结构用作的输入参数loadLearnerForCoder在一个入学点函数中。生成固定点C / C ++代码需要MATLAB^®编码器™和定点设计师™。

这个表包含关于的参数的注释预测．完全支持该表不包含的参数。万博1manbetx

争论	注意和局限性
`Mdl`	有关模型对象的使用说明和限制，请参见代码生成的`CompactClassificationTree`对象。
`X`	对于一般代码生成，`X`必须是单精度或双精度矩阵或包含的表`单`或`双`预测变量。如果要指定`X`作为表格，那么必须使用表培训您的模型，您必须确保您的入学点函数进行预测：接受数据作为阵列从数据输入参数中创建表，并指定表中的变量名称将表传递给`预测` 有关此表工作流的示例，请参阅生成代码以对表中的数字数据进行分类．有关在代码生成中使用表的更多信息，请参见表的代码生成(MATLAB编码器)和代码生成的表限制(MATLAB编码器)．在编码器配置器工作流中，`X`必须是一个`单`或`双`矩阵。对于固定点代码生成，`X`必须是一个定点矩阵。中的行数或观察值`X`可以是可变大小，但列的数量`X`必须是固定的。
`标签`	如果响应数据类型是`char`和`codegen`的值无法确定`子树`那是一个标量`标签`是字符向量的单元格数组。
`'子树'`	名称-值对参数中的名称必须是编译时常量。例如，要在生成的代码中允许用户定义的修剪级别，请包括`{coder.Constant(子树),coder.typeof (0, (1, n), [0,1])}`在里面`- args.`的价值`codegen`(MATLAB编码器),在那里`N`是`马克斯(Mdl.PruneList)`．这`'子树'`编码器配置程序工作流中不支持名称值对参数。万博1manbetx 对于定点代码生成，则`'子树'`值必须是`coder.Constant(所有的)`或具有整数数据类型。

有关更多信息，请参阅代码生成简介．

也可以看看

ClassificationTree.|袖珍的|CompactClassificationTree|边缘|fitctree|损失|保证金|修剪

话题

为代码生成指定可变大小的参数

介绍了R2011a

预测

句法

描述

输入参数

`Mdl`-训练有素的分类树
`ClassificationTree.`模型对象|`CompactClassificationTree`模型对象

`X`-预测数据需要分类
数字矩阵|表格

名称-值对的观点

`'子树'`-修剪水平
0.(默认)|非负整数的向量|`“所有”`

输出参数

`标签`-预测的类标签
矢量|数组

`分数`- 后概率
数字矩阵

`节点`- 节点号
数值向量

`CNUM`- 类号码
数值向量

例子

使用分类树预测标签

使用分类树估算类后验概率

更多关于

预测类标签

分数(树)

真正的误分类代价

预期成本

预测措施

算法

扩展功能

高阵列
使用比内存更多的阵列计算更多行的阵列。

C / c++代码生成
使用MATLAB®Coder™生成C和c++代码。

也可以看看

话题

统计和机器学习工具箱文档

万博1manbetx

掌握机器学习：使用MATLAB逐步指南

预测

句法

描述

输入参数

Mdl-训练有素的分类树ClassificationTree.模型对象|CompactClassificationTree模型对象

X-预测数据需要分类数字矩阵|表格

名称-值对的观点

'子树'-修剪水平0.(默认)|非负整数的向量|“所有”

输出参数

标签-预测的类标签矢量|数组

分数- 后概率数字矩阵

节点- 节点号数值向量

CNUM- 类号码数值向量

例子

使用分类树预测标签

使用分类树估算类后验概率

更多关于

预测类标签

分数(树)

真正的误分类代价

预期成本

预测措施

算法

扩展功能

高阵列使用比内存更多的阵列计算更多行的阵列。

C / c++代码生成使用MATLAB®Coder™生成C和c++代码。

也可以看看

话题

统计和机器学习工具箱文档

万博1manbetx

掌握机器学习：使用MATLAB逐步指南

`Mdl`-训练有素的分类树
`ClassificationTree.`模型对象|`CompactClassificationTree`模型对象

`X`-预测数据需要分类
数字矩阵|表格

`'子树'`-修剪水平
0.(默认)|非负整数的向量|`“所有”`

`标签`-预测的类标签
矢量|数组

`分数`- 后概率
数字矩阵

`节点`- 节点号
数值向量

`CNUM`- 类号码
数值向量

高阵列
使用比内存更多的阵列计算更多行的阵列。

C / c++代码生成
使用MATLAB®Coder™生成C和c++代码。