主要内容

聚类可视化与评价

绘制数据簇并评估最佳簇数

聚类分析根据数据点之间的相似性将数据组织到组中。有时数据包含表示适当聚类数的自然分段。有时,数据不包含自然分段,或自然分段未知。在这种情况下,您可以确定要进行聚类的最佳聚类数对数据进行分组。

要确定数据与特定数量的聚类的匹配程度,请使用不同的评估标准(如间距或轮廓)计算索引值。通过创建树状图来可视化聚类,以显示分层二叉聚类树。优化叶序以最大化相邻叶间的相似性总和。例如:分组数据,每组有多个测量值,根据使用多元方差分析(MANOVA)计算的组平均值创建树状图。

功能

全部展开

树状图 树状图
最佳叶序 层次聚类的最优叶序
manovacluster MANOVA后群体平均聚类的树状图
轮廓 轮廓图
评估聚类 评估群集解决方案万博 尤文图斯
阿达克 评估额外的集群数量
契约 紧凑聚类评价对象
增加b 增加参考数据集
情节 图聚类评价对象标准值

班级

卡林斯基哈拉巴斯酒店 Calinski-Harabasz准则聚类评价对象
戴维斯波尔迪内瓦酒店 Davies-Bouldin准则聚类评价对象
GapEvaluation 差距准则聚类评价对象
轮廓评价 轮廓准则聚类评价对象

话题

聚类评价

此示例演示如何使用评估聚类.