主要内容

集群

从高斯混合分布构造簇

描述

例子

idx=集群(通用汽车X将数据划分为Xkk中高斯混合分量通用汽车.的价值idx(我)是观测的聚类指数吗表示给定观测值后验概率最大的分量

idxnlogL] =集群(通用汽车X也返回高斯混合模型的负对数似然通用汽车考虑到数据X

idxnlogLP] =集群(通用汽车X也返回每个高斯混合分量的后验概率通用汽车根据在X

idxnlogLPlogpdf] =集群(通用汽车X也返回估计的概率密度函数(pdf)的对数在每个观察X

idxnlogLPlogpdfd2] =集群(通用汽车X还返回每个观测点的马氏距离的平方X的每个高斯混合分量通用汽车

例子

全部折叠

方法生成遵循两个二元高斯分布的混合物的随机变量mvnrnd函数。对生成的数据进行高斯混合模型(GMM)拟合fitgmdist函数。然后,使用集群函数将数据划分为两个簇,由拟合的GMM组件确定。

定义两个二元高斯混合分量的分布参数(均值和协方差)。

Mu1 = [2 2];%第1个分量的平均值Sigma1 = [2 0;0 1];第1个分量的协方差Mu2 = [-2 -1];%第二组分的平均值Sigma2 = [1 0;0 1];第二分量的协方差

从每个分量中生成相等数量的随机变量,并合并两组随机变量。

rng (“默认”%的再现性r1 = mvnrnd (mu1 sigma1 1000);r2 = mvnrnd (mu2 sigma2 1000);X = [r1;r2);

合并数据集X包含两个二元高斯分布的混合物的随机变量。

安装一个双组件GMMX

通用= fitgmdist (X, 2);

情节X通过使用散射.可视化拟合模型通用汽车通过使用pdffcontour

图散射(X(: 1),(:, 2), 10日“。”%散点图的大小为10持有gmPDF = @ (x, y) arrayfun (@ (x0, y0) pdf(通用、(x0 y0)), x, y);gmPDF,[-6 8 -4 6]

图中包含一个轴。坐标轴包含散点型、函数轮廓型2个对象。

通过传递拟合的GMM和数据到集群

idx =集群(通用,X);

使用gscatter创建分组的散点图idx

图;gscatter (X (: 1) X (:, 2), idx);传奇(“集群1”《集群2》“位置”“最佳”);

图中包含一个轴。坐标轴包含两个line类型的对象。这些对象代表集群1和集群2。

输入参数

全部折叠

高斯混合分布,又称高斯混合模型(GMM),指定为一gmdistribution对象。

你可以创建一个gmdistribution对象使用gmdistributionfitgmdist.使用gmdistribution函数创建gmdistribution对象,通过指定分布参数。使用fitgmdist函数拟合gmdistribution模型给数据给定一个固定数量的组件。

指定为n——- - - - - -数字矩阵,n观察的次数是多少是每次观察中的变量数。

为了提供有意义的聚类结果,X必须来自与用于创建的数据相同的人口通用汽车

如果一行X包含nan,然后集群将行从计算中排除。中对应的值idxPlogpdf,d2

数据类型:|

输出参数

全部折叠

类型返回的群集索引n-乘1的正整数向量,其中n观察的次数是多少X

idx(我)是观测的聚类指数吗表示给定观测值后验概率最大的高斯混合分量

高斯混合模型的负对数似然值通用汽车考虑到数据X,以数值形式返回。

中各高斯混合分量的后验概率通用汽车根据在X,返回为n——- - - - - -k数字矢量,n观察的次数是多少Xk混合组分的数量在吗通用汽车

P (i, j)的后验概率是j给定的高斯混合分量概率(组件j|观察).

估计的pdf的对数,在每次观察中评估X,返回为n-乘1的数字向量,其中n观察的次数是多少X

logpdf(我)是观测时估计的PDF的对数吗.的集群函数通过使用给定每个观测的每个分量的可能性和分量概率来计算估计的PDF。

logpdf 日志 j 1 k l C j | O P C j

在哪里lCj|Oj是组成部分的可能性j鉴于观察,PCj是分量的概率吗j.的集群函数通过使用的多元正态PDF计算似然项j第1个高斯混合分量在观测值.组分概率是混合组分的混合比例,即ComponentProportion的属性通用汽车

每个观测点马氏距离的平方X的每个高斯混合分量通用汽车,返回为n——- - - - - -k数字矩阵,n观察的次数是多少Xk混合组分的数量在吗通用汽车

d2 (i, j)是观测距离的平方吗j第s高斯混合分量。

介绍了R2007b