集群

从高斯混合分布构造聚类

在页面中全部折叠

语法

idx = cluster(gm,X)

[idx,nlogL] = cluster(gm,X)

[idx,nlogL,P] = cluster(gm,X)

[idx,nlogL,P,logpdf] = cluster(gm,X)

[idx,nlogL,P,logpdf,d2] = cluster(gm,X)

描述

例子

idx=集群(通用汽车，X）将数据分区为X成k由k中的高斯混合分量通用汽车．的价值idx(我)是观察的聚类指标吗我表示在观测条件下后验概率最大的分量我．

［idx，nlogL= cluster(通用汽车，X）也返回高斯混合模型的负对数似然通用汽车根据数据X．

［idx，nlogL，P= cluster(通用汽车，X）也返回每个高斯混合成分的后验概率通用汽车给出的每个观察结果X．

［idx，nlogL，P，logpdf= cluster(通用汽车，X）中每个观测值的估计概率密度函数(pdf)的对数X．

［idx，nlogL，P，logpdf，d2= cluster(通用汽车，X）也返回每个观察结果的马氏距离的平方X中的每个高斯混合分量通用汽车．

例子

全部折叠

集群的数据

打开实时脚本

方法生成遵循两个二元高斯分布混合物的随机变量mvnrnd函数。对生成的数据拟合高斯混合模型(GMM)fitgmdist函数。然后，使用集群函数将数据划分为由拟合的GMM组件确定的两个簇。

定义两个二元高斯混合分量的分布参数(均值和协方差)。

Mu1 = [2 2];%第一个分量的均值Sigma1 = [2 0;0 1];第一个分量的协方差Mu2 = [-2 -1];%第二分量的均值Sigma2 = [1 0;0 1];%第二分量的协方差

从每个组件中生成相同数量的随机变量，并将两组随机变量组合起来。

rng (“默认”）%用于重现性R1 = mvnrnd(mu1,sigma1,1000);R2 = mvnrnd(mu2,sigma2,1000);X = [r1;r2);

综合数据集X包含随机变量，遵循两个二元高斯分布的混合。

拟合双分量GMMX．

gm = fitgmdist(X,2);

情节X通过使用散射．可视化拟合模型通用汽车通过使用pdf而且fcontour．

图散射(X(: 1),(:, 2), 10日“。”）点大小为10的散点图持有在gmPDF = @ (x, y) arrayfun (@ (x0, y0) pdf(通用、(x0 y0)), x, y);fcontour(gmPDF，[-6 8 -4 6])

图中包含一个axes对象。axis对象包含两个类型为scatter、functionalcontour的对象。

通过将拟合的GMM和数据传递到，将数据划分为集群集群．

idx = cluster(gm,X);

使用gscatter创建一个散点图idx．

图;gscatter (X (: 1) X (:, 2), idx);传奇(“集群1”，《集群2》，“位置”，“最佳”）;

图中包含一个axes对象。坐标轴对象包含两个line类型的对象。这些对象表示集群1、集群2。

输入参数

全部折叠

`通用汽车`- - - - - -高斯混合分布
`gmdistribution`对象

高斯混合分布，又称高斯混合模型(GMM)，具体为gmdistribution对象。

您可以创建gmdistribution对象使用gmdistribution或fitgmdist．使用gmdistribution函数来创建gmdistribution对象，通过指定分布参数。使用fitgmdist函数拟合gmdistribution对给定固定数量的组件的数据进行建模。

`X`- - - - - -数据
n——- - - - - -米数字矩阵

数据，用n——- - - - - -米数值矩阵，n观察的次数和米是每次观察中变量的数量。

为了提供有意义的聚类结果，X必须来自与用于创建的数据相同的人群通用汽车．

如果一排X包含nan,然后集群从计算中排除行。中的对应值idx，P，logpdf,d2是南．

数据类型:单|双

输出参数

全部折叠

`idx`—集群索引
n-by-1正整数向量

集群索引，作为n-by-1正整数向量，其中n观察的数量在吗X．

idx(我)是观察的聚类指标吗我表示在观测条件下后验概率最大的高斯混合分量我．

`nlogL`-负对数似然
数值

高斯混合模型的负对数似然值通用汽车根据数据X，作为数值返回。

`P`-后验概率
n——- - - - - -k数值向量

中每个高斯混合分量的后验概率通用汽车给出的每个观察结果X，作为n——- - - - - -k数字向量，其中n观察的数量在吗X而且k混合组分的数量在吗通用汽车．

P (i, j)的后验概率是j高斯混合分量我概率(组件j|观察我）.

`logpdf`-估计pdf的对数
n-by-1数字向量

对估计pdf的对数，在每一次观测中求值X，作为n-by-1数字向量，其中n观察的数量在吗X．

logpdf(我)是观察时估计PDF的对数吗我．的集群函数通过使用给定每个观测值和每个分量概率的每个分量的似然性计算估计的PDF。

$logpdf （我）＝日志 \sum_{j ＝ 1}^{k} l （ C_{j} | O_{我} ） P （ C_{j} ），$

在哪里l（C_j|O_j）是分量的可能性吗j鉴于观察我,P（C_j）分量的概率是多少j．的集群函数利用的多元正态PDF计算似然项j高斯混合分量在观察时的评估我．组分概率是混合物组分的混合比例，即ComponentProportion的属性通用汽车．

`d2`-马氏距离的平方
n——- - - - - -k数字矩阵

中每个观测值马氏距离的平方X中的每个高斯混合分量通用汽车，作为n——- - - - - -k数值矩阵，n观察的数量在吗X而且k混合组分的数量在吗通用汽车．

d2 (i, j)是观察距离的平方吗我到j高斯混合分量。

版本历史

在R2007b中引入

另请参阅

fitgmdist|gmdistribution|泰姬陵|后

集群

语法

描述

例子

集群的数据

输入参数

通用汽车- - - - - -高斯混合分布gmdistribution对象

X- - - - - -数据n——- - - - - -米数字矩阵

输出参数

idx—集群索引n-by-1正整数向量

nlogL-负对数似然数值

P-后验概率n——- - - - - -k数值向量

logpdf-估计pdf的对数n-by-1数字向量

d2-马氏距离的平方n——- - - - - -k数字矩阵

版本历史

另请参阅

主题

`通用汽车`- - - - - -高斯混合分布
`gmdistribution`对象

`X`- - - - - -数据
n——- - - - - -米数字矩阵

`idx`—集群索引
n-by-1正整数向量

`nlogL`-负对数似然
数值

`P`-后验概率
n——- - - - - -k数值向量

`logpdf`-估计pdf的对数
n-by-1数字向量

`d2`-马氏距离的平方
n——- - - - - -k数字矩阵