主要内容

-Medios集群K.

en Este Tema Se Proporciona UnaInstaInciónALAGRUPACIONNNCLUNSTES-MEANS Y UN EJETROO QUE USA LaFunciónAlaBuscarla MejorSolucióndeAgrupaciónnclústerespara联合国Conjunto de Datos。K.统计和机器学习工具箱™kmeans

Introducción a -表示聚类K.

- eans聚类esunmétodode prictionamiento。K.LaFunciónIgmigiona洛杉矶Mutuamente Exclusivos Y DevuelveElíndiceDelClústerAl Que Asigna CadaIngectionAciónTrata CadaIngeceAciónNENLOSDatos Como Un Objeto Que Tiene UnaUbicaciónNELEspacio。kmeansK.kmeansfunción busca una partición在卡的对象clúster están lo más cerca可能在中间sí y lo más lejos可能在otros的对象clústeres。你可以在función上为你的朋友们加油打气。MétradedistanciakmeansAl igual que muchos métodos de agrupación en clústeres,意思是群集需要特别的número de clústeres antes de la agrupación en clústeres。K.K.

A Diferencia de LaAgrupaciónJerárquica, - 梅尔斯聚集池en Enapmenciones Reales En Lugar de la Diferencia Entre Cada Par de MapdingAciones en Los Datos。K.Además, -表示聚集在一起único nivel de clústeres,在lugar de una jerarquía multitinivel de clústeres。K.Por lo tanto的意思是聚集在一起más adecuado和agrupación jerárquica在datos的大悬臂中。K.

CADAClústerdeNEAinitarión-means consta de Objetos Miembro Y Un Centroide(O Centro)。K.在clúster,最小的距离在质心和与之相对应的是clúster。计算为clústeres不同形式的中心在métricas的距离被承认。kmeanskmeans请咨询más información。“距离”

可以控制minimización的详细内容利用可分解数的参数;在我们的研究中,我们特别关注的是星点分布的数值为clúster或número máximo的迭代算法。kmeans形式预先决定,效用kmeans——+ + algoritmoK.它的中心点为clúster和métrica欧几里得距离为确定的距离。

Al Realizar LaAgrupaciónNClústeres-梅斯,西格萨斯塔斯普拉克西省Recomendadas:K.

  • 在agrupación和clústeres中,在决定因素中,在número óptimo中,在clústeres中,在datos中,有不同的意义。K.K.

  • evalúelas soluciones deAgrupaciónnnclústeresexaminandodo lasgráficasde silueta y los valores de silueta。TambiénPuedeuterizar LaFunciónAveguarSoluciones deAgrupaciónnenClústeresComciónDeCriteriosComoValoresdeSeconación,Valores de Silueta,ValoresdeíndiceDavies-Bouldin Y ValoresdeíndiceCalinski-Harabasz。evalclusters

  • 复制agrupación在clústeres的不同的中心选择的时间的范围内转移到solución在整个范围内más的距离之间的réplicas。

比较-显著的可溶性去聚类K.

在这里我们探索agrupación在clústeres在一个共同的维度上的数据。K.在这份工作中cómo决定的número更正为clústeres为中间数据的结合而写的以及与之相联系的资料和silueta的数据和分析结果的不同的结果是agrupación和clústeres为中间数据。K.在ejemplo también这是muestra cómo效用的论证,以勇气为标准的可能是número,具体来说,soluciones可能会转移到整个过程中más距离。'复制'

Conjunto de Datos de Carga

我的朋友们。kmeansdata

rng (“默认”可重现性负载('kmeansdata.mat')大小(X)
ans =1×2560年4

所有这些维度都是一致的,而且都是可视的fácilmente。如果不允许,我们可以在这个国家的机构中进行调查。kmeans

Crear clústeres y examinar la separación

分词el conjunto de datos en tres clústeres mediante la agrupación en clústeres -意思。K.especifiquelamétricade distancia de bloque de ciudad y利用伊尔algoritmo -means ++ predeterminado para la laillializacióndel centro declúster。K.利用伊丽志Argumento Par Nombre-Valor Para Imprimir La Suma Final De Discias Para LaSolución。“显示”

[idx3 C sumdist3] = kmeans (X, 3,“距离”'城市街区'“显示”“最后一次”);
重复1,7次,总距离= 2459.98。最佳距离总和= 2459.98

contene índices de clúster它的意思是asignación de clúster它的意思是。idx3XPara Ver Si LosClústeres埃斯特拉恩·贝伦Separados,Puede Crear联合国Trazado de Silueta。

它的名字是está它的名字是clúster它的名字是clústeres vecinos。它的中间位置为1(指示为están的远距离的los clústeres vecinos) y 0(指示为没有están的claramente en un clúster u otro) a -1(指示为clúster不正确的指示)。我们在这条路上走得很顺利。轮廓

我们要把它放在一起。idx3especifique para quelamétricade distancia Indique que laAgrupaciónnclústeres-means se basa en la Suma de las diferencias absolutas。'城市街区'K.

[silh3 h] =轮廓(X, idx3'城市街区');Xlabel('剪影值') ylabel (“集群”

El trazado de silueta muestra是mayoría的los puntos del segundo clúster是大silueta的勇气(市长0,6),它的意思是clúster está为los的分隔clústeres vecinos。禁运时,三分之一clúster在silueta bajos的基础上有很多相同的地方,还有初级的地方有相同的地方clúster三分之一的地方,没有相同的地方,然后又有不同的地方clústeres没有están也可以分开。

当我们遇到一个大的agrupación在洛斯达斯,它将是número在clústeres一个cuatro。kmeans鼓励información冷静的方式iteración中间的论点,以以勇气。“显示”

idx4 = kmeans(x,4,“距离”'城市街区'“显示”“通路”);
iter phase num sum 1 1 560 1792.72 2 1 6 1771.1最佳总距离之和= 1771.1

Creefer Trazado de Silueta para los cuatroclústeres。

[silh4,h] =剪影(x,idx4,'城市街区');Xlabel('剪影值') ylabel (“集群”

gráfica在前面的silueta indica是属于我们的clústeres están主要的分隔是clústeres在前面的solución。我们将采取一种新的方式más在比较的基础上,将soluciones的计算方法与我们的生活方式相比较。

Gramular Los Valores Medios de Silueta。

cluster3 =意味着(silh3)
Cluster3 = 0.5352.
cluster4 =平均值(silh4)
cluster4 = 0.6400

洛斯卢埃塔的英勇事迹clústeres是洛斯卢埃塔的英勇事迹的市长clústeres。Estos valores apoyan la conclusión代表gráficas的silueta。

我的名字是último,我的名字是clústeres。我们会把它的名字记下来,然后计算它的价值,然后再计算它的价值clústeres。

idx5 = kmeans (X 5“距离”'城市街区'“显示”“最后一次”);
复制1,7次迭代,总距离和= 1647.26。最佳距离总和= 1647.26
[silh5 h] =轮廓(X, idx5'城市街区');Xlabel('剪影值') ylabel (“集群”

意思(silh5)
ans = 0.5721

lagráficade silueta inda que cinco probablemente no es elnúmerofreterodeclústeres,Porque dosclústerescontienen puntos convalores de silueta en suMayoríabajos,y el quintoclústercontiene algunos puntos con vales negitivos。Además,El Valor Medio de la Silueta de LosCincoClústereses underioralvalor de los cuatroclústeres。Sin SaberCuántosClústeresHayen en Los Datos,ES Una Buena Idem Explimentar Con Un Rango de Valores Para,ElNúmerodeClústeres。K.

我们本来想在很远的地方找到它它的名字是número, clústeres。在我们的生活中,我们从很远的地方出发在número或者clústeres的范围内从3到4到5。2459.981771.11647.26Por Lo Tanto,La Suma de Distanias没有ESTil Para Meternar ElNúmeroóptimodeClústeres。

避免当地最小值

在预先的形式下,agrupación在clústeres的过程中,同时选择了与之相一致的,在其上的中心点。kmeansEl算法可能收敛一个solución有一个mínimo局部(没有全局);在这个时候,我想和你分享我在联合国的生活方式clúster不同的是,我的生活是完全不同的。kmeanskmeans因此,在最小化的过程中有很多其他的事情可以做numéricas,那么solución这个问题取决于你的想法。kmeansPor Lo Tanto,Pueden Histir Otras Soluciones(Mínimo本地)Que Tienen Sumas总数MásBajasde Distanias Para Los Datos。Puede USAR ARIGHTOO DE PAR Nombre-Valor Para Pularar Diferentes Soluciones。'复制'Cuando SeEspecificaMásdeNafaRéparica,Se Repite El Proceso deAgrupaciónnnclústeresa partir de diferentes entroides seleccionados aleatoriamente para cadaréplicaydeleurevelasolucióncosumatotalmásbaja de discanias entre todas lasréplicas。kmeans

Busque cuatroclústeresen los datos y replique laAgrupaciónnenclústerescinco veces。Además,especificiquelamétricade distancia de Bloque de Ciudad Y利用伊丽莎Arighto de Par Nombre-valor Para Imprimir La Suma Final De Distancas Para CadaSolución。“显示”

[idx4, cent4 sumdist] = kmeans (X 4“距离”'城市街区'......“显示”,“最后一次”,“复制”,5);
重复1,2次,总距离和= 1771.1。重复2、3次,总距离和= 1771.1。重复3次,3次迭代,总距离和= 1771.1。复制4,6次迭代,总距离之和= 2300.23。重复5次,迭代2次,总距离和= 1771.1。最佳总距离= 1771.1

en LaRéplica4,Encuentra UnMínimo本地。kmeans它的网址是réplica,它的网址是mínimo当地的。kmeans因此,solución最后的结果是所有的结果más在前面的距离中réplicas。kmeans

Busque El Total de Las Sumas Dentro delClústerdeTiscaniasPuntoA Centroide Para LaSolución最终Devuelta Por。kmeans

总和(Sumdist)
ans = 1.7711 e + 03

Consulte也

|

特马relacionados