聚类分析和聚类算法- MATLAB和Simulink万博1manbetx - 万博1manbetx,s manbetx 845,万博尤文图斯

查找并可视化数据中的自然分组和模式

聚类分析涉及应用聚类算法，目标是在数据集中发现隐藏的模式或分组。因此，它经常用于探索性数据分析，但也用于异常检测和预处理的监督学习。

聚类算法以这样一种方式形成分组，即一组(或一簇)中的数据比任何其他簇中的数据具有更高的相似性度量。可以使用各种相似度量，包括欧几里得、概率、余弦距离和相关性。大多数无监督学习方法是聚类分析的一种形式。

聚类算法分为两大类:

K-means clustering，它用质心来表示组——每个成员的平均值，如图中的星星所示。

高斯混合模型，该模型赋予了聚类的隶属概率，表示了与不同聚类的关联强度。

聚类分析用于多种领域和应用，以识别模式和序列:

在半监督学习中，聚类技术还用于建立标记数据和未标记数据之间的相似性，其中初始模型使用最小的标记数据建立，并用于给原始未标记数据分配标签。相比之下，半监督聚类将有关聚类的可用信息合并到聚类过程中，例如，如果一些观察结果已知属于同一聚类，或一些聚类与特定的结果变量相关联。

MATLAB^®万博1manbetx支持许多流行的聚类分析算法:

使用imsegkmeans命令(使用k-means算法)，MATLAB将三个聚类分配给原始图像(组织用血氧毒素和伊红染色)，将组织分割为三个类别(表示为白色、黑色和灰色)。自己尝试一下，以及相关的细分方法这段代码示例．