聚类分析根据数据点之间的相似性将数据组织到组中。有时数据包含表示适当聚类数的自然分段。有时,数据不包含自然分段,或自然分段未知。在这种情况下,您可以确定要进行聚类的最佳聚类数对数据进行分组。
要确定数据与特定数量的聚类的匹配程度,请使用不同的评估标准(如间距或轮廓)计算索引值。通过创建树状图来可视化聚类,以显示分层二叉聚类树。优化叶序以最大化相邻叶间的相似性总和。例如:分组数据,每组有多个测量值,根据使用多元方差分析(MANOVA)计算的组平均值创建树状图。
卡林斯基哈拉巴斯酒店 |
Calinski-Harabasz准则聚类评价对象 |
戴维斯波尔迪内瓦酒店 |
Davies-Bouldin准则聚类评价对象 |
GapEvaluation |
差距准则聚类评价对象 |
轮廓评价 |
轮廓准则聚类评价对象 |
此示例演示如何使用评估聚类
.