主要内容

集群可视化和评价

情节集群的数据和评估最优数量的集群

聚类分析数据组织到组织基于数据点之间的相似性。有时,数据包含天然分歧表明适当数量的集群。其他时候,数据不包含自然分裂,或自然的分歧是未知的。在这种情况下,您确定最优数量的集群组织您的数据。

了解数据符合特定数量的集群,计算索引值使用不同的评估标准,如差距或轮廓。可视化集群通过创建一个集群系统树图图来显示层次二进制树。优化叶以最大化的和相邻叶片之间的相似之处。与多个测量每组,分组数据创建一个系统树图绘制基于组意味着用多元方差分析计算(MANOVA)。

功能

全部展开

系统树图 系统树图绘制
optimalleaforder 最佳叶片排序为层次聚类
manovacluster 系统树图组意味着集群MANOVA之后
轮廓 轮廓图
evalclusters 评估的集群解决方案万博 尤文图斯
addK 评估额外数量的集群
紧凑的 紧凑的聚类评价对象
increaseB 增加引用数据集
情节 图聚类评价对象标准的价值观

对象

CalinskiHarabaszEvaluation Calinski-Harabasz标准聚类评价对象
DaviesBouldinEvaluation Davies-Bouldin标准聚类评价对象
GapEvaluation 差距标准聚类评价对象
SilhouetteEvaluation 轮廓标准聚类评价对象

主题

  • 集群评价

    这个例子展示了如何识别集群通过使用evalclusters