文档帮助中心
朴素贝叶斯分类器的再替换分类边
e = resubEdge (Mdl)
例子
e= resubEdge (Mdl)返回resubstitution分类的优势(e)的朴素贝叶斯分类器Mdl使用存储在Mdl。X和相应的类标签存储在Mdl。Y.
e= resubEdge (Mdl)
e
Mdl
Mdl。X
Mdl。Y
分类边是一个标量值,代表的加权平均值分类的利润率.
全部折叠
估计朴素贝叶斯分类器的再替换边(样本内平均分类边)。
加载fisheriris数据集。创建X作为一个数字矩阵,包含四个花瓣测量150鸢尾。创建Y作为字符向量的细胞阵列,包含相应的虹膜种类。
fisheriris
X
Y
负载fisheririsX =量;Y =物种;rng (“默认”)%的再现性
使用预测器训练朴素贝叶斯分类器X和类标签Y.推荐的做法是指定类名。fitcnb假设每个预测器都是有条件的正态分布。
fitcnb
Mdl = fitcnb (X, Y,“类名”, {“setosa”,“多色的”,“virginica”})
Mdl = ClassificationNaiveBayes ResponseName: 'Y' CategoricalPredictors: [] ClassNames: {'setosa' 'versicolor' 'virginica'} ScoreTransform: 'none' NumObservations: 150 DistributionNames: {'normal' ' 'normal' ' 'normal'} DistributionParameters: {3x4 cell}属性,方法
Mdl是一个培训ClassificationNaiveBayes分类器。
ClassificationNaiveBayes
估计再替换边。
e = 0.8944
训练样本边缘的平均值近似为0.89.这一结果表明分类器对样本内观察值的标记具有较高的置信度。
0.89
分类器边缘测量分类器边缘的平均值。进行特征选择的一种方法是比较来自多个模型的训练样本边缘。仅根据这个准则,具有最高边的分类器就是最好的分类器。
加载电离层数据集。删除前两个预测稳定性的指标。
电离层
负载电离层X = X(:, 3:结束);
定义这两个数据集:
fullX包含所有预测。
fullX
partX包含10个最重要的预测因素。
partX
fullX = X;idx = fscmrmr (X, Y);partX = X (:, idx (1:10));
为每个预测器集训练朴素贝叶斯分类器。
FullMdl = fitcnb (fullX Y);PartMdl = fitcnb (partX Y);
FullMdl和PartMdl被训练ClassificationNaiveBayes分类器。
FullMdl
PartMdl
估计每个分类器的训练样本边缘。
fullEdge = resubEdge (FullMdl)
fullEdge = 0.6554
partEdge = resubEdge (PartMdl)
partEdge = 0.7796
在10个最重要的预测器上训练的分类器的边缘更大。这一结果表明,仅使用这些预测器训练的分类器具有更好的样本内拟合。
完整的、训练有素的朴素贝叶斯分类器,指定为ClassificationNaiveBayes模型的训练,fitcnb.
的分类的优势为分类边界的加权平均值。
如果您提供权重,那么软件将其归一化,使其与各自类别的先验概率相加。该软件使用归一化的权重来计算加权平均值。
当在多个分类器中选择要执行的任务,如特征部分,选择产生最高边缘的分类器。
的分类保证金每次观察的结果是真实班级的分数与错误班级的最高分数之间的差值。边际提供了一种分类置信度测度;在多个分类器中,那些产生较大利润(在同一规模上)的分类器更好。
的后验概率是在给定数据的情况下,某一观察结果属于某一类的概率。
对于朴素贝叶斯,分类的后验概率k对于给定的观测(x1、……xP)是
P ^ ( Y = k | x 1 , .. , x P ) = P ( X 1 , ... , X P | y = k ) π ( Y = k ) P ( X 1 , ... , X P ) ,
地点:
P ( X 1 , ... , X P | y = k ) 在课堂上给出预测器的条件关节密度吗k.Mdl。DistributionNames存储预测器的分布名称。
Mdl。DistributionNames
π(Y=k)为类先验概率分布。Mdl。Prior存储先验分布。
Mdl。Prior
P ( X 1 , .. , X P ) 为预测者的联合密度。这些类是离散的,所以 P ( X 1 , ... , X P ) = ∑ k = 1 K P ( X 1 , ... , X P | y = k ) π ( Y = k ) .
的先验概率某一类的相对频率是该一类观察结果在总体中出现的相对频率。
天真的贝叶斯分数为给定观测值的类别后验概率。
ClassificationNaiveBayes|CompactClassificationNaiveBayes|边缘|fitcnb|损失|保证金|预测|resubEdge|resubLoss|resubLoss|resubMargin
CompactClassificationNaiveBayes
边缘
损失
保证金
预测
resubEdge
resubLoss
resubMargin
在您的系统中存在这个示例的修改版本。你想打开这个版本吗?
你点击一个链接对应于这个MATLAB命令:
通过在MATLAB命令窗口中输入命令来运行命令。Web浏览器不支持MATLAB命令。万博1manbetx
选择一个网站,在那里获得翻译的内容,并看到当地的活动和优惠。根据您的位置,我们建议您选择:.
你也可以从以下列表中选择一个网站:
选择中国网站(中文或英文)以获得最佳网站性能。其他MathWorks国家站点没有针对您所在位置的访问进行优化。
与当地办事处联系