en Este Tema Se Proporciona UnaInstaInciónALAGRUPACIONNNCLUNSTES-MEANS Y UN EJETROO QUE USA LaFunciónAlaBuscarla MejorSolucióndeAgrupaciónnclústerespara联合国Conjunto de Datos。K.统计和机器学习工具箱™kmeans
- eans聚类esunmétodode prictionamiento。K.LaFunciónIgmigiona洛杉矶Mutuamente Exclusivos Y DevuelveElíndiceDelClústerAl Que Asigna CadaIngectionAciónTrata CadaIngeceAciónNENLOSDatos Como Un Objeto Que Tiene UnaUbicaciónNELEspacio。kmeans
K.kmeans
función busca una partición在卡的对象clúster están lo más cerca可能在中间sí y lo más lejos可能在otros的对象clústeres。你可以在función上为你的朋友们加油打气。Métradedistanciakmeans
Al igual que muchos métodos de agrupación en clústeres,意思是群集需要特别的número de clústeres antes de la agrupación en clústeres。K.K.
A Diferencia de LaAgrupaciónJerárquica, - 梅尔斯聚集池en Enapmenciones Reales En Lugar de la Diferencia Entre Cada Par de MapdingAciones en Los Datos。K.Además, -表示聚集在一起único nivel de clústeres,在lugar de una jerarquía multitinivel de clústeres。K.Por lo tanto的意思是聚集在一起más adecuado和agrupación jerárquica在datos的大悬臂中。K.
CADAClústerdeNEAinitarión-means consta de Objetos Miembro Y Un Centroide(O Centro)。K.在clúster,最小的距离在质心和与之相对应的是clúster。计算为clústeres不同形式的中心在métricas的距离被承认。kmeans
kmeans
请咨询más información。“距离”
可以控制minimización的详细内容利用可分解数的参数;在我们的研究中,我们特别关注的是星点分布的数值为clúster或número máximo的迭代算法。kmeans
形式预先决定,效用kmeans
——+ + algoritmoK.它的中心点为clúster和métrica欧几里得距离为确定的距离。
Al Realizar LaAgrupaciónNClústeres-梅斯,西格萨斯塔斯普拉克西省Recomendadas:K.
在agrupación和clústeres中,在决定因素中,在número óptimo中,在clústeres中,在datos中,有不同的意义。K.K.
evalúelas soluciones deAgrupaciónnnclústeresexaminandodo lasgráficasde silueta y los valores de silueta。TambiénPuedeuterizar LaFunciónAveguarSoluciones deAgrupaciónnenClústeresComciónDeCriteriosComoValoresdeSeconación,Valores de Silueta,ValoresdeíndiceDavies-Bouldin Y ValoresdeíndiceCalinski-Harabasz。evalclusters
复制agrupación在clústeres的不同的中心选择的时间的范围内转移到solución在整个范围内más的距离之间的réplicas。
在这里我们探索agrupación在clústeres在一个共同的维度上的数据。K.在这份工作中cómo决定的número更正为clústeres为中间数据的结合而写的以及与之相联系的资料和silueta的数据和分析结果的不同的结果是agrupación和clústeres为中间数据。K.在ejemplo también这是muestra cómo效用的论证,以勇气为标准的可能是número,具体来说,soluciones可能会转移到整个过程中más距离。'复制'
Conjunto de Datos de Carga
我的朋友们。kmeansdata
rng (“默认”)可重现性负载('kmeansdata.mat')大小(X)
ans =1×2560年4
所有这些维度都是一致的,而且都是可视的fácilmente。如果不允许,我们可以在这个国家的机构中进行调查。kmeans
Crear clústeres y examinar la separación
分词el conjunto de datos en tres clústeres mediante la agrupación en clústeres -意思。K.especifiquelamétricade distancia de bloque de ciudad y利用伊尔algoritmo -means ++ predeterminado para la laillializacióndel centro declúster。K.利用伊丽志Argumento Par Nombre-Valor Para Imprimir La Suma Final De Discias Para LaSolución。“显示”
[idx3 C sumdist3] = kmeans (X, 3,“距离”那'城市街区'那“显示”那“最后一次”);
重复1,7次,总距离= 2459.98。最佳距离总和= 2459.98
contene índices de clúster它的意思是asignación de clúster它的意思是。idx3
X
Para Ver Si LosClústeres埃斯特拉恩·贝伦Separados,Puede Crear联合国Trazado de Silueta。
它的名字是está它的名字是clúster它的名字是clústeres vecinos。它的中间位置为1(指示为están的远距离的los clústeres vecinos) y 0(指示为没有están的claramente en un clúster u otro) a -1(指示为clúster不正确的指示)。我们在这条路上走得很顺利。轮廓
我们要把它放在一起。idx3
especifique para quelamétricade distancia Indique que laAgrupaciónnclústeres-means se basa en la Suma de las diferencias absolutas。'城市街区'
K.
[silh3 h] =轮廓(X, idx3'城市街区');Xlabel('剪影值') ylabel (“集群”)
El trazado de silueta muestra是mayoría的los puntos del segundo clúster是大silueta的勇气(市长0,6),它的意思是clúster está为los的分隔clústeres vecinos。禁运时,三分之一clúster在silueta bajos的基础上有很多相同的地方,还有初级的地方有相同的地方clúster三分之一的地方,没有相同的地方,然后又有不同的地方clústeres没有están也可以分开。
当我们遇到一个大的agrupación在洛斯达斯,它将是número在clústeres一个cuatro。kmeans
鼓励información冷静的方式iteración中间的论点,以以勇气。“显示”
idx4 = kmeans(x,4,“距离”那'城市街区'那“显示”那“通路”);
iter phase num sum 1 1 560 1792.72 2 1 6 1771.1最佳总距离之和= 1771.1
Creefer Trazado de Silueta para los cuatroclústeres。
[silh4,h] =剪影(x,idx4,'城市街区');Xlabel('剪影值') ylabel (“集群”)
gráfica在前面的silueta indica是属于我们的clústeres están主要的分隔是clústeres在前面的solución。我们将采取一种新的方式más在比较的基础上,将soluciones的计算方法与我们的生活方式相比较。
Gramular Los Valores Medios de Silueta。
cluster3 =意味着(silh3)
Cluster3 = 0.5352.
cluster4 =平均值(silh4)
cluster4 = 0.6400
洛斯卢埃塔的英勇事迹clústeres是洛斯卢埃塔的英勇事迹的市长clústeres。Estos valores apoyan la conclusión代表gráficas的silueta。
我的名字是último,我的名字是clústeres。我们会把它的名字记下来,然后计算它的价值,然后再计算它的价值clústeres。
idx5 = kmeans (X 5“距离”那'城市街区'那“显示”那“最后一次”);
复制1,7次迭代,总距离和= 1647.26。最佳距离总和= 1647.26
[silh5 h] =轮廓(X, idx5'城市街区');Xlabel('剪影值') ylabel (“集群”)
意思(silh5)
ans = 0.5721
lagráficade silueta inda que cinco probablemente no es elnúmerofreterodeclústeres,Porque dosclústerescontienen puntos convalores de silueta en suMayoríabajos,y el quintoclústercontiene algunos puntos con vales negitivos。Además,El Valor Medio de la Silueta de LosCincoClústereses underioralvalor de los cuatroclústeres。Sin SaberCuántosClústeresHayen en Los Datos,ES Una Buena Idem Explimentar Con Un Rango de Valores Para,ElNúmerodeClústeres。K.
我们本来想在很远的地方找到它它的名字是número, clústeres。在我们的生活中,我们从很远的地方出发在número或者clústeres的范围内从3到4到5。2459.98
1771.1
1647.26
Por Lo Tanto,La Suma de Distanias没有ESTil Para Meternar ElNúmeroóptimodeClústeres。
避免当地最小值
在预先的形式下,agrupación在clústeres的过程中,同时选择了与之相一致的,在其上的中心点。kmeans
El算法可能收敛一个solución有一个mínimo局部(没有全局);在这个时候,我想和你分享我在联合国的生活方式clúster不同的是,我的生活是完全不同的。kmeans
kmeans
因此,在最小化的过程中有很多其他的事情可以做numéricas,那么solución这个问题取决于你的想法。kmeans
Por Lo Tanto,Pueden Histir Otras Soluciones(Mínimo本地)Que Tienen Sumas总数MásBajasde Distanias Para Los Datos。Puede USAR ARIGHTOO DE PAR Nombre-Valor Para Pularar Diferentes Soluciones。'复制'
Cuando SeEspecificaMásdeNafaRéparica,Se Repite El Proceso deAgrupaciónnnclústeresa partir de diferentes entroides seleccionados aleatoriamente para cadaréplicaydeleurevelasolucióncosumatotalmásbaja de discanias entre todas lasréplicas。kmeans
Busque cuatroclústeresen los datos y replique laAgrupaciónnenclústerescinco veces。Además,especificiquelamétricade distancia de Bloque de Ciudad Y利用伊丽莎Arighto de Par Nombre-valor Para Imprimir La Suma Final De Distancas Para CadaSolución。“显示”
[idx4, cent4 sumdist] = kmeans (X 4“距离”那'城市街区'那......“显示”,“最后一次”,“复制”,5);
重复1,2次,总距离和= 1771.1。重复2、3次,总距离和= 1771.1。重复3次,3次迭代,总距离和= 1771.1。复制4,6次迭代,总距离之和= 2300.23。重复5次,迭代2次,总距离和= 1771.1。最佳总距离= 1771.1
en LaRéplica4,Encuentra UnMínimo本地。kmeans
它的网址是réplica,它的网址是mínimo当地的。kmeans
因此,solución最后的结果是所有的结果más在前面的距离中réplicas。kmeans
Busque El Total de Las Sumas Dentro delClústerdeTiscaniasPuntoA Centroide Para LaSolución最终Devuelta Por。kmeans
总和(Sumdist)
ans = 1.7711 e + 03