主要内容

集群

从高斯混合分布构造聚类

描述

例子

idx=集群(通用汽车X将数据分区为Xkk中的高斯混合分量通用汽车.的价值idx(我)是观察的聚类指标吗表示在观测条件下后验概率最大的分量

idxnlogL= cluster(通用汽车X也返回高斯混合模型的负对数似然通用汽车根据数据X

idxnlogLP= cluster(通用汽车X也返回每个高斯混合成分的后验概率通用汽车给出的每个观察结果X

idxnlogLPlogpdf= cluster(通用汽车X中每个观测值的估计概率密度函数(pdf)的对数X

idxnlogLPlogpdfd2= cluster(通用汽车X也返回每个观察结果的马氏距离的平方X中的每个高斯混合分量通用汽车

例子

全部折叠

方法生成遵循两个二元高斯分布混合物的随机变量mvnrnd函数。对生成的数据拟合高斯混合模型(GMM)fitgmdist函数。然后,使用集群函数将数据划分为由拟合的GMM组件确定的两个簇。

定义两个二元高斯混合分量的分布参数(均值和协方差)。

Mu1 = [2 2];%第一个分量的均值Sigma1 = [2 0;0 1];第一个分量的协方差Mu2 = [-2 -1];%第二分量的均值Sigma2 = [1 0;0 1];%第二分量的协方差

从每个组件中生成相同数量的随机变量,并将两组随机变量组合起来。

rng (“默认”%用于重现性R1 = mvnrnd(mu1,sigma1,1000);R2 = mvnrnd(mu2,sigma2,1000);X = [r1;r2);

综合数据集X包含随机变量,遵循两个二元高斯分布的混合。

拟合双分量GMMX

gm = fitgmdist(X,2);

情节X通过使用散射.可视化拟合模型通用汽车通过使用pdf而且fcontour

图散射(X(: 1),(:, 2), 10日“。”点大小为10的散点图持有gmPDF = @ (x, y) arrayfun (@ (x0, y0) pdf(通用、(x0 y0)), x, y);fcontour(gmPDF,[-6 8 -4 6])

图中包含一个axes对象。axis对象包含两个类型为scatter、functionalcontour的对象。

通过将拟合的GMM和数据传递到,将数据划分为集群集群

idx = cluster(gm,X);

使用gscatter创建一个散点图idx

图;gscatter (X (: 1) X (:, 2), idx);传奇(“集群1”《集群2》“位置”“最佳”);

图中包含一个axes对象。坐标轴对象包含两个line类型的对象。这些对象表示集群1、集群2。

输入参数

全部折叠

高斯混合分布,又称高斯混合模型(GMM),具体为gmdistribution对象。

您可以创建gmdistribution对象使用gmdistributionfitgmdist.使用gmdistribution函数来创建gmdistribution对象,通过指定分布参数。使用fitgmdist函数拟合gmdistribution对给定固定数量的组件的数据进行建模。

数据,用n——- - - - - -数值矩阵,n观察的次数和是每次观察中变量的数量。

为了提供有意义的聚类结果,X必须来自与用于创建的数据相同的人群通用汽车

如果一排X包含nan,然后集群从计算中排除行。中的对应值idxPlogpdf,d2

数据类型:|

输出参数

全部折叠

集群索引,作为n-by-1正整数向量,其中n观察的数量在吗X

idx(我)是观察的聚类指标吗表示在观测条件下后验概率最大的高斯混合分量

高斯混合模型的负对数似然值通用汽车根据数据X,作为数值返回。

中每个高斯混合分量的后验概率通用汽车给出的每个观察结果X,作为n——- - - - - -k数字向量,其中n观察的数量在吗X而且k混合组分的数量在吗通用汽车

P (i, j)的后验概率是j高斯混合分量概率(组件j|观察).

对估计pdf的对数,在每一次观测中求值X,作为n-by-1数字向量,其中n观察的数量在吗X

logpdf(我)是观察时估计PDF的对数吗.的集群函数通过使用给定每个观测值和每个分量概率的每个分量的似然性计算估计的PDF。

logpdf 日志 j 1 k l C j | O P C j

在哪里lCj|Oj是分量的可能性吗j鉴于观察,PCj分量的概率是多少j.的集群函数利用的多元正态PDF计算似然项j高斯混合分量在观察时的评估.组分概率是混合物组分的混合比例,即ComponentProportion的属性通用汽车

中每个观测值马氏距离的平方X中的每个高斯混合分量通用汽车,作为n——- - - - - -k数值矩阵,n观察的数量在吗X而且k混合组分的数量在吗通用汽车

d2 (i, j)是观察距离的平方吗j高斯混合分量。

版本历史

在R2007b中引入