ClassificationniveBayes类

超类：CompactClassificationNaiveBayes

天真的贝叶斯分类

展开所有页面

描述

ClassificationniveBayes.是A.朴素贝叶斯用于多人学习的分类器。使用Fitcnb.和训练a的训练数据ClassificationniveBayes.分类器。

训练有素ClassificationniveBayes.分类器存储培训数据，参数值，数据分发和先前概率。您可以将这些分类器用过：

估计重述预测。有关详细信息，请参阅重新预订．
预测新数据的标签或后验概率。有关详细信息，请参阅预测．

建筑

创建A.ClassificationniveBayes.通过使用Fitcnb.．

属性

展开所有

`分类预测器`-分类预测因子的指标
正整数矢量

分类预测索引指定为正整数的向量。分类预测器包含与包含分类预测器的预测器数据列对应的索引值。如果没有任何预测器是绝对的，则此属性为空([])。

数据类型：单身|双人间

`CategoricalLevels`-多变量多项级水平
数值向量的单元向量

多变量多项级水平，指定为数字向量的单元格向量。CategoricalLevels长度等于预测器的数量（尺寸（x，2）)。

的细胞CategoricalLevels对应于您指定为的预测器'mvmn'（即，在培训期间具有多变量多元分布）。不对应于多变量多变量分布的细胞是空的（[])。

如果预测器j是多元多项式吗类别物流{j}是预测器的所有不同值的列表j在样品中（南年代从唯一（x（：，j））)。

数据类型：细胞

`Classnames.`-独特的类名称
分类阵列|字符数组|逻辑矢量|数值向量|字符向量的单元格阵列

不同的类名称，指定为分类或字符阵列，逻辑或数字矢量或字符向量的单元格向量。

Classnames.是与之相同的数据类型y，并有K.字符数组的元素或行。（该软件将字符串数组视为字符向量的单元格阵列。）

数据类型：分类|char|逻辑|单身|双人间|细胞

`成本`-错误分类成本
方阵

误分类成本，指定为K.-K.方矩阵。

的价值成本(i, j)是将一个点分类为课程的成本j如果它的真实课程是我．行和列的顺序成本对应于类的顺序Classnames.．

的价值成本不影响培训。你可以重置成本训练后Mdl使用点符号，例如:mdl.cost = [0 0.5;1 0];．

数据类型：双人间|单身

`分发名称`-预测器分布
`'正常'`（默认）|`'仁'`|`“锰”`|`'mvmn'`|字符向量的单元格阵列

预测器分布Fitcnb.用于模拟预测器，指定为字符向量或字符向量阵列。

此表总结了可用的分布。

价值	描述
`'仁'`	内核平滑密度估计。
`“锰”`	多项式袋 - 令牌模型．表示所有预测器都具有这种分布。
`'mvmn'`	多变量多项式分布。
`'正常'`	正常（高斯）分布。

如果分布是一个1-by-P.字符向量的单元格数组，然后软件模型功能j使用元素中的分布j细胞阵列。

数据类型：char|细胞

`分发参数`-分布参数估计
单元阵列

分布参数估计，指定为单元阵列。分发参数是A.K.-D.细胞阵列，其中细胞（K.那D.）包含预测器的实例的分发参数估计D.在课堂上K.．行的顺序对应于属性中类的顺序Classnames.，并且预测器的顺序对应于列的顺序X.．

如果是课程K.没有对预测器的观察吗j那么分配{K.那j}是空的([])。

元素分发参数取决于预测器的分布。此表描述了值分发参数{K.那j}．

分布的预测j	价值
`内核`	A.`k`模型。使用单元索引和点表示法显示属性。例如，为了在第三类中显示预测器2的核心密度的估计带宽，使用`mdl.distributionParameters {3,2} .BandWidth`．
`锰`	表示该标记的概率的标量j出现在课堂上K.．有关详细信息，请参阅算法．
`mvmn`	一个数字向量，包含每个可能级别的预测器的概率j在课堂上K.．该软件通过所有独特的预测器的排序顺序排序概率j(存放在物业内`CategoricalLevels`)。有关更多详细信息，请参阅算法．
`正常`	一个2乘1的数字向量。第一个元素是样本均值，第二个元素是样本标准差。

数据类型：细胞

`ExpandedPredictorNames.`-扩展预测仪名称
字符向量的单元格阵列

扩展的预测器名称，存储为字符向量的单元格数组。

如果模型使用对分类变量的编码，那么ExpandedPredictorNames.包括描述扩展变量的名称。否则，ExpandedPredictorNames.是一样的预测．

数据类型：细胞

`HyperParameterOptimationResults.`-超公共比仪的交叉验证优化描述
`BayesianOptimization`对象|表格

封立参数的交叉验证优化的描述，指定为aBayesianOptimization对象或包含超参数和关联值的表。该属性是非空的'OptimizeHyperParameters'在创建模型时，名称-值对参数是非空的。的价值HyperParameterOptimationResults.取决于优化器田野HyperparameterOptimizationOptions结构，如表中所述。

价值`优化器`田野	价值`HyperParameterOptimationResults.`
`'Bayesopt'`（默认）	类的对象`BayesianOptimization`
`'gridsearch'`或`'randomsearch'`	使用的超参数表，观察到的客观函数值（交叉验证丢失），以及从最低（最佳）到最高（最差）的观测等级

`内核`-内核更平滑的类型
`'正常'`（默认）|`'盒子'`|`'Epanechnikov'`|`'三角形'`|字符向量的单元格阵列

内核更平滑的类型，指定为字符向量或字符向量的单元数组。内核长度等于预测器的数量（尺寸（x，2）)。内核{j}对应于预测器j，并包含一个字符向量，描述内核类型更平滑的类型。此表描述了支持的内核更平滑的类型。万博1manbetx让我们我{你表示指示灯函数。

价值	内核	惯例
`'盒子'`	盒子（制服）	$F. （ X. ） = 0.5 我 {\| X. \| \leq. 1}$
`'Epanechnikov'`	Epanechnikov.	$F. （ X. ） = 0.75 （ 1 - {X.}^{2} ）我 {\| X. \| \leq. 1}$
`'正常'`	高斯	$F. （ X. ） = \frac{1}{\sqrt{2 π}} exp. （ - 0.5 {X.}^{2} ）$
`'三角形'`	三角形	$F. （ X. ） = （ 1 - \| X. \| ）我 {\| X. \| \leq. 1}$

如果一个单元格为空（[])，则该软件没有将内核分布与相应的预测器匹配。

数据类型：char|细胞

`模特分析者`-用于训练的参数值
对象

用于训练分类器的参数值（例如名称值对参数值），指定为对象。此表总结了属性模特分析者．属性对应于为训练分类器而设置的名称-值对参数值。

财产	目的
`分发名称`	数据分发或分布。这与属性相同`分发名称`．
`内核`	内核更平滑的类型。这与属性相同`内核`．
`方法`	训练方法。对于天真的贝叶斯，价值是`'天真宝贝'`．
`万博1manbetx`	内核平滑密度支持。万博1manbetx这与属性相同`万博1manbetx`．
`type`	学习类型。对于分类，价值是`'分类'`．
`宽度`	内核平滑窗口宽度。这与属性相同`宽度`．

访问字段模特分析者使用点符号。例如，使用万博1manbetxmdl.modelparameters.万博1manbetxsupport.．

`numobservations.`-培训观测数量
数字标量

培训观测数量指定为数字标量。

如果X.或y那时包含缺失值numobservations.可能小于长度y．

数据类型：双人间

`预测`-预测的名字
字符向量的单元格阵列

预测名称，指定为字符向量的单元数组。元素的顺序预测对应于订单X.．

数据类型：细胞

`之前`-类的先验概率
数值向量

类前面的概率，指定为数字行向量。之前是一个1-by-K.向量，其元素的顺序对应于元素Classnames.．

Fitcnb.使用名称值对参数标准化您设置的先前概率“先前”那么总和（先前）=1．

的价值之前不会改变最佳拟合模型。因此，您可以重置之前训练后Mdl使用点符号，例如:mdl.prior = [0.2 0.8];．

数据类型：双人间|单身

`ResponseName`-响应名称
字符向量

响应名称，指定为字符向量。

数据类型：char

`scoretransform.`-分数转换功能
`“doublelogit”`|`'invlogit'`|`'ismax'`|`'logit'`|`'没有'`|功能手柄|......

分类分数转换功能，指定为字符向量或功能句柄。

将分数转换功能更改为例如，函数，使用点表示法。

对于内置功能，请输入此代码并替换函数使用表中的值。

mdl.scoretransform ='函数”;

价值	描述
`“doublelogit”`	1 /（1 +E.^-2X.）
`'invlogit'`	日志(X./（1 -X.））
`'ismax'`	将具有最大分数的类设置为1的分数，并将所有其他类的分数设置为0
`'logit'`	1 /（1 +E.^-X.）
`'没有'`或`'身份'`	X.(转换)
`'签名'`	-1 for.X.< 0 0X.= 0 1X.> 0
`'对称'`	2X.- 1
`'ymmetricismax'`	将具有最大分数为1的类设置分数，并将所有其他类的分数设置为-1
`'symmetriclogit'`	2 / (1 +E.^-X.） - 1

对于一个MATLAB^®函数或您定义的函数，输入其函数句柄。
```
Mdl。ScoreTransform = @函数;
```
函数应该接受矩阵（原始分数）并返回相同大小的矩阵（转换的分数）。

数据类型：char|function_handle.

`万博1manbetx`-核平滑密度支持万博1manbetx
细胞矢量

核平滑密度支持，指定为细胞向量。万博1manbetx万博1manbetx长度等于预测器的数量（尺寸（x，2）)。细胞代表施加核密度的区域。

此表介绍了支持的选项。万博1manbetx

价值	描述
1-by-2数字行向量	例如，`[L，U]`，在哪里`L.`和`你`是针对密度支持的有限下限和上限。万博1manbetx
`'积极'`	密度支持都是正的实值。万博1manbetx
`“无限”`	密度支持都是真实值。万博1manbetx

如果一个单元格为空（[])，则该软件没有将内核分布与相应的预测器匹配。

`W.`-观察权重
数值向量

观察权重，指定为数字矢量。

长度W.是numobservations.．

Fitcnb.将为名称-值对参数设置的值规范化'重量'使特定类别中的权重到该类的先前概率。

数据类型：双人间

`宽度`-内核更平滑的窗口宽度
数字矩阵

内核更平滑的窗口宽度，指定为数字矩阵。宽度是A.K.-P.矩阵，其中K.是数据中的类数，以及P.是预测器的数量（尺寸（x，2）)。

宽度(K.那j）是预测器的内核平滑密度的内核更平滑的窗口宽度j内部类K.．南在列j表明该软件不适合预测因素j使用核心密度。

`X.`-解体化的预测仪数据
数字矩阵

非标准化预测器数据，指定为数字矩阵。X.有numobservations.行和P.列。

每一行的X.对应于一个观察，并且每列对应于一个变量。

软件排除由于缺失值删除的行X.．

数据类型：双人间

`y`-观察到的类标签
分类阵列|字符数组|逻辑矢量|数值向量|字符向量的单元格阵列

观察到的类标签，指定为分类或字符数组，逻辑或数字矢量或字符向量的单元格数组。y与输入参数相同的数据类型y的Fitcnb.．（该软件将字符串数组视为字符向量的单元格阵列。）

每一行的y表示观察到的相应行分类X.．

该软件因来自的值缺失而排除了删除的元素y．

数据类型：分类|char|逻辑|单身|双人间|细胞

方法

紧凑	紧凑朴素贝叶斯分类器
横梁	交叉验证的天真贝叶斯分类器
重新提交	朴素贝叶斯分类器边的再替换分类
resubLoss	朴素贝叶斯分类器的再替换分类损失
重新提交	朴素贝叶斯分类器的再替换分类裕度
重新预订	预测幼稚贝叶斯分类器的重新提交标签

继承的方法

边缘	朴素贝叶斯分类器的分类边缘
logP	天真贝叶斯分类器的无条件概率密度
损失	天真贝叶斯分类器的分类错误
边缘	天真贝叶斯分类器的分类利润
预测	使用Naive Bayes分类模型预测标签

复制语义

价值。要了解值类如何影响复制操作，请参见复制对象(MATLAB)。

例子

全部折叠

训练一个天真的贝叶斯分类器

打开生活的脚本

为Fisher的Iris数据构建一个天真的贝母分类器。此外，培训后指定现有概率。

负载Fisher的虹膜数据。

加载fisheririsx = meas;y =物种;

X.是一个数字矩阵，其包含150个虹膜的四个花瓣测量。y是包含相应的IRIS物种的字符向量的单元阵列。

训练一个天真的贝叶斯分类器。

mdl = fitcnb（x，y）

mdl = classificationnaivebayes racatectename：'y'pationoricalpricictors：[] classnames：{'setosa''versicolor''virginica'} scoreTransform：'none'numobservations：150分发名称：{'正常''正常'''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''：{3x4 Cell}属性，方法

Mdl是训练有素的ClassificationniveBayes.分类器，它的一些属性显示在命令窗口中。默认情况下，软件将每个预测器视为独立的，并使用正态分布拟合它们。

访问属性Mdl，使用点表示法。

Mdl。Classnames.

ans =3 x1细胞{'setosa'} {'versicolor'} {'virginica'}

Mdl。P.rior

ans =1×30.3333 0.3333 0.3333

Mdl。P.rior包含类先验概率，可以使用名称-值对参数设置“先前”在Fitcnb.．课程的顺序对应于类中的顺序Mdl。Classnames.．默认情况下，先前概率是数据中类的相应相对频率。

您还可以在训练后重新设置先验概率。例如，将先验概率分别设置为0.5、0.2和0.3。

mdl.prior = [0.5 0.2 0.3];

你可以通过Mdl到例如预测标记新测量，或横梁交叉验证分类器。

算法

如果您指定“DistributionNames”、“锰”训练时Mdl使用Fitcnb.，然后软件使用的是使用多项分布袋 - 令牌模型．该软件存储令牌的概率j出现在课堂上K.在物业中分发参数{K.那j}．使用添加剂平滑[2]，估计的概率是

$P. （令牌 j | 班级 K. ） = \frac{1 + {C.}_{j | K.}}{P. + {C.}_{K.}} 那$

在哪里：
- ${C.}_{j | K.} = N_{K.} \frac{{σ.}_{我： y_{我} \in 班级 K.}^{} {X.}_{我 j} {W.}_{我}^{}}{{σ.}_{我： y_{我} \in 班级 K.}^{} {W.}_{我}};$ 令牌的加权出现次数是多少j在课堂上K.．
- N_K.是课堂上的观察数K.．
- ${W.}_{我}^{}$ 是观察的重量我．该软件在类中将权重标准化，使得它们总和到该类的先前概率。
- ${C.}_{K.} = {σ.}_{j = 1}^{P.} {C.}_{j | K.};$ 这是课堂上所有令牌的总重量次数K.．
如果您指定'分发名称'，'mvmn'训练时Mdl使用Fitcnb.然后：
1. 对于每个预测器，软件会收集一个独特关卡的列表，并将排序后的列表存储在其中CategoricalLevels，并将每一层视为一个容器。每个预测器/类组合是一个独立的，独立的多项随机变量。
2. 为预测j在课堂上K.，软件使用存储在中的列表计算每个分类级别的实例类别物流{j}．
3. 该软件存储预测器的概率j，在课堂上K.，有水平L.在物业中分发参数{K.那j}，为所有层次类别物流{j}．使用添加剂平滑[2]，估计的概率是
  
  $P. （预测指标 j = L. | 班级 K. ） = \frac{1 + m_{j | K.} （ L. ）}{m_{j} + m_{K.}} 那$
  
  在哪里：
  - $m_{j | K.} （ L. ） = N_{K.} \frac{{σ.}_{我： y_{我} \in 班级 K.}^{} 我 {{X.}_{我 j} = L.} {W.}_{我}^{}}{{σ.}_{我： y_{我} \in 班级 K.}^{} {W.}_{我}^{}};$ 这是预测器的重量观察数j=L.在课堂上K.．
  - N_K.是课堂上的观察数K.．
  - $我 {{X.}_{我 j} = L.} = 1$ 如果X._ij=L.，否则为0。
  - ${W.}_{我}^{}$ 是观察的重量我．该软件在类中将权重标准化，使得它们总和到该类的先前概率。
  - m_j是预测器中的不同水平的数量j．
  - m_K.是课堂上的重量的观察数K.．

参考资料

[1] Hastie，T.，R. Tibshirani和J. Friedman。统计学习的要素,第二版。纽约:施普林格,2008年。

[2] Manning, c.d.， P. Raghavan, M. Schütze。信息检索介绍，纽约:剑桥大学出版社，2008。

扩展能力

C / C ++代码生成
使用MATLAB®Coder™生成C和c++代码。

使用说明和限制：

当预测功能支持代码生成。万博1manbetx
当你用Fitcnb.，以下限制适用。
- 类标签输入参数值（y）不能是一个分类的数组。
- 代码生成不支持分类预测器（万博1manbetx逻辑那分类那char那串或者细胞)。如果在表中提供培训数据，则预测器必须是数字的(双人间或单身)。此外，你不能使用'pationoricalpricictors'名称值对参数。
- 价值'分布names'名称值对参数不能包含“锰”或'mvmn'．
- 价值'classnames'名称 - 值对参数不能是一个分类数组。
- 价值“ScoreTransform”名称 - 值对参数不能是匿名函数。

有关更多信息，请参阅代码生成简介．

另请参阅

CompactClassificationNaiveBayes|compareHoldout|Fitcnb.|损失|预测

ClassificationniveBayes类

描述

建筑

属性

分类预测器-分类预测因子的指标正整数矢量

CategoricalLevels-多变量多项级水平数值向量的单元向量

Classnames.-独特的类名称分类阵列|字符数组|逻辑矢量|数值向量|字符向量的单元格阵列

成本-错误分类成本方阵

分发名称-预测器分布'正常'（默认）|'仁'|“锰”|'mvmn'|字符向量的单元格阵列

分发参数-分布参数估计单元阵列

ExpandedPredictorNames.-扩展预测仪名称字符向量的单元格阵列

HyperParameterOptimationResults.-超公共比仪的交叉验证优化描述BayesianOptimization对象|表格

内核-内核更平滑的类型'正常'（默认）|'盒子'|'Epanechnikov'|'三角形'|字符向量的单元格阵列

模特分析者-用于训练的参数值对象

numobservations.-培训观测数量数字标量

预测-预测的名字字符向量的单元格阵列

之前-类的先验概率数值向量

ResponseName-响应名称字符向量

scoretransform.-分数转换功能“doublelogit”|'invlogit'|'ismax'|'logit'|'没有'|功能手柄|......

万博1manbetx-核平滑密度支持万博1manbetx细胞矢量

W.-观察权重数值向量

宽度-内核更平滑的窗口宽度数字矩阵

X.-解体化的预测仪数据数字矩阵

y-观察到的类标签分类阵列|字符数组|逻辑矢量|数值向量|字符向量的单元格阵列

方法

继承的方法

复制语义

例子

训练一个天真的贝叶斯分类器

更多关于

袋 - 令牌模型

朴素贝叶斯

算法

参考资料

扩展能力

C / C ++代码生成使用MATLAB®Coder™生成C和c++代码。

另请参阅

主题

统计和机器学习工具箱文档

万博1manbetx

掌握机器学习：使用MATLAB逐步指南

`分类预测器`-分类预测因子的指标
正整数矢量

`CategoricalLevels`-多变量多项级水平
数值向量的单元向量

`Classnames.`-独特的类名称
分类阵列|字符数组|逻辑矢量|数值向量|字符向量的单元格阵列

`成本`-错误分类成本
方阵

`分发名称`-预测器分布
`'正常'`（默认）|`'仁'`|`“锰”`|`'mvmn'`|字符向量的单元格阵列

`分发参数`-分布参数估计
单元阵列

`ExpandedPredictorNames.`-扩展预测仪名称
字符向量的单元格阵列

`HyperParameterOptimationResults.`-超公共比仪的交叉验证优化描述
`BayesianOptimization`对象|表格

`内核`-内核更平滑的类型
`'正常'`（默认）|`'盒子'`|`'Epanechnikov'`|`'三角形'`|字符向量的单元格阵列

`模特分析者`-用于训练的参数值
对象

`numobservations.`-培训观测数量
数字标量

`预测`-预测的名字
字符向量的单元格阵列

`之前`-类的先验概率
数值向量

`ResponseName`-响应名称
字符向量

`scoretransform.`-分数转换功能
`“doublelogit”`|`'invlogit'`|`'ismax'`|`'logit'`|`'没有'`|功能手柄|......

`万博1manbetx`-核平滑密度支持万博1manbetx
细胞矢量

`W.`-观察权重
数值向量

`宽度`-内核更平滑的窗口宽度
数字矩阵

`X.`-解体化的预测仪数据
数字矩阵

`y`-观察到的类标签
分类阵列|字符数组|逻辑矢量|数值向量|字符向量的单元格阵列

C / C ++代码生成
使用MATLAB®Coder™生成C和c++代码。