创建判别分析模型
判别分析的模型是:
每个班级(
y
)生成数据(X
)使用多元正态分布。换句话说,模型假设X
具有高斯混合物分布(gmdistribution
)。对于线性判别分析,该模型具有相同的协方差矩阵。只有手段有所不同。
对于二次判别分析,每个类别的平均值和协方差都不同。
在此建模假设下,fitcdiscr
渗透每个类的平均值和协方差参数。
对于线性判别分析,它计算每个类的样本平均值。然后,它通过首先从该类别的观测值中减去每个类别的样品平均值来计算样品协方差,并取出结果的经验协方差矩阵。
对于二次判别分析,它计算每个类的样本平均值。然后,它通过首先从该类别的观测值中减去每个类别的样本平均值来计算样品协方差,并取下每个类别的经验协方差矩阵。
这合身
方法不使用先前的概率或成本进行安装。
加权观察
fitcdiscr
使用以下方案构建加权分类器。认为m是一个n-经过-k班级会员矩阵:
mNK= 1如果观察n来自课堂k
mNK= 0否则。
对未加权数据的班级平均值的估计是
对于具有正权重的加权数据wn,自然概括是
对未加权数据的合并中协方差矩阵的无偏估计是
对于二次判别分析,fitcdiscr
用途k= 1。
对于加权数据,假设权重总和为1,则汇总协方差矩阵的无偏估计为
在哪里
是班级的权重的总和k。
是每个班级平方的总和。