朴素贝叶斯分类器模板
如果预测变量j
有条件正态分布(见DistributionNames
名称-值参数),该软件通过计算类特定的加权平均值和加权标准差的无偏估计来拟合数据的分布。为每一个类k:
预测器的加权平均数j是
在哪里w我重量是用于观察的吗我.该软件将一个类中的权重标准化,这样它们的总和就等于该类的先验概率。
预测器加权标准差的无偏估计量j是
在哪里z1 |k是类内权重的总和吗k和z2 |k平方和是否在类内k.
如果所有预测变量组成一个条件多项分布(您指定“DistributionNames”、“锰”
),该软件适合使用bag-of-tokens模型.软件存储该令牌的概率j
出现在课堂上k
在房地产DistributionParameters {
.使用添加剂平滑[2],估计的概率是k
,j
}
地点:
令牌的加权出现次数是多少j在课堂上k.
nk课堂上观察的次数是多少k.
重量是用于观察的吗我.该软件将一个类中的权重标准化,这样它们的总和就等于该类的先验概率。
哪个是类中所有令牌出现的加权总数k.
如果预测变量j
具有条件多元多项分布:
该软件收集了一个独特的关卡列表,并将排序后的列表存储在其中CategoricalLevels
,并将每一层视为一个容器。每个预测器/类组合是一个独立的,独立的多项随机变量。
为每一个类k
,该软件使用存储的列表计算每个类别级别的实例CategoricalLevels {
.j
}
软件储存预测的概率j
在课堂上,k
,水平l在房地产DistributionParameters {
,为所有层次k
,j
}CategoricalLevels {
.使用添加剂平滑[2],估计的概率是j
}
地点:
哪个预测器的加权观测数是多少j=l在课堂上k.
nk课堂上观察的次数是多少k.
如果xij=l,否则为0。
重量是用于观察的吗我.该软件将一个类中的权重标准化,这样它们的总和就等于该类的先验概率。
米j预测器中不同水平的数量j.
米k是课堂上的加权观察数吗k.
Hastie, T., R. Tibshirani, J. Friedman。统计学习的要素,第二版。纽约:施普林格,2008年。