包:classreg.learning.classif
紧凑型朴素贝叶斯分类器
CompactClassificationNaiveBayes
是一个紧凑朴素贝叶斯分类。
紧凑的分类不包括用于训练朴素贝叶斯分类器的数据。因此,你不能执行任务,如交叉验证,采用紧凑的分类。
使用紧凑朴素贝叶斯分类器来标记新的数据(即,预测的新数据的标记物),更有效地。
返回一个简洁朴素贝叶斯分类器(CMDL
=紧凑(MDL
)CMDL
)从一个完整的,训练有素的朴素贝叶斯分类器(MDL
)。
值。要了解值类如何影响复制操作,请参阅复制对象(MATLAB)。
如果您指定'DistributionNames', '百万'
当训练MDL
运用fitcnb
,那么软件配合使用多项分布一袋令牌模型。软件存储该令牌的概率j
出现在课堂上k
在属性DistributionParameters {
。使用添加剂平滑[2],估计概率为k
,j
}
地点:
这是令牌出现的加权数j在课堂上k。
nk课堂观察的次数是多少k。
是用于观察的重量我。该软件归一个类中的权重,使得它们之和为该类的先验概率。
哪个是类中所有令牌出现的加权总数k。
如果您指定“DistributionNames”、“mvmn”
当训练MDL
运用fitcnb
,那么:
对于每一个预测,该软件收集了独特级别的列表,存储在排序列表CategoricalLevels
,并认为每级的Bin。每个预测器/类的组合是分离的,独立多项随机变量。
对于预测j
在课堂上k,该软件使用存储的列表计算每个分类级别的实例CategoricalLevels {
。j
}
该软件存储该预测的概率j
, 在班上k
,有水平l在属性DistributionParameters {
,在各级k
,j
}CategoricalLevels {
。使用添加剂平滑[2],估计概率为j
}
地点:
这是观测的加权数,其为预测j等于l在课堂上k。
nk课堂观察的次数是多少k。
如果xij=l,否则为0。
是用于观察的重量我。该软件归一个类中的权重,使得它们之和为该类的先验概率。
米j不同水平的数量是预测器吗j。
米k是在类观测的加权数k。
[1] Hastie的,T.,R. Tibshirani,和J.弗里德曼。统计学习的要素, 第二版。纽约:施普林格,2008年。
C. Manning, P. Raghavan和M. Schutze。信息检索导论,纽约:剑桥大学出版社,2008年。