k - means性能评价的“sumd”
7视图(30天)
显示旧的评论
你好,
给一个简单的例子:
我有4个数据点p1, p2, p3, p4(在蓝点)。我和k = 2 k - means两次执行,策划的输出质心两个集群C1和C2(绿点)。
的两个迭代kmeans如下所示(左和右)。注意到在第二个迭代(右),C2和p2在同一个位置。
比较性能的k - means两次迭代,或者找出这两种情况下是一个更好的聚类,我只看“sumd”这是每一个点的距离的总和的重心在集群?
在这种情况下,sumd左[0.5000,0.5000]虽然sumd是正确的(1.3333,0)。
为了比较两种情况下,
我只是总和的sumd离开' 1 ',并和“sumd”的“1.3333”,并采取较小的数量是' 1 '和索赔集群更好?
我这样做正确吗?