这是一种新的版本。Puede版本LA版MÁSreciente德ESTApágina恩英格尔斯。

k均值

-significaagrupación恩clústeresķ

Descripción

ejemplo

idx= k均值(XķRealiza-significaagrupación恩clústeresķ在簇的矩阵中有一个矩阵矩阵,有一个向量乘1()构成簇的连续指数。ñpXķñidx拉斯维加斯filas德corresponden一个puntosŸcolumnas corresponden一个变量。X

这是一种形式的先行词,用在离体的欧几里得矩阵中k均值-means ++ algoritmoķ对拉inicialización德尔炫酷德集群。

ejemplo

idx= k均值(Xķ名称,值devuelve洛杉矶指标德集群CON opciones adicionales especificadas POR UNOØMÁSargumentos德相提并论。名称,值

POR ejemplo,especifique拉DISTANCIA德尔coseno,ELNÚMERO德veces阙本身repetirá拉agrupación连接clústeresutilizando的Nuevos VALORES iniciales O参数utilizar拉INFORMÁTICAparalela。

ejemplo

[idxC] = k均值(___devubicaciones中心体在矩阵中。ķķpC

ejemplo

[idxCsumd] = k均值(___devuelve las sumas dentro del cluster de distancias punto a centroide en el vector -by-1。ķsumd

ejemplo

[idxCsumdd] = k均值(___devuelve distancias德CADA PUNTO一个CADA centroide EN LA matriz -by-。ñķd

Ejemplos

contraer待办事项

洛杉矶DATOS德尔集群mediante拉agrupación连接clústeres-means Y,Acontinuación,trazan拉斯维加斯regiones德尔集群。ķ

Cargue el conjunto de datos de iris de Fisher。使用经度和anchuras de los petalos como谓词。

加载fisheririsX=MEAS(:,3:4);数字;积(X(:,1),X(:,2),'K *'“MarkerSize”5);标题“费舍尔”的虹膜数据”;xlabel“花瓣长度(厘米)”;ylabel“花瓣宽度(厘米)”;

萨尔瓦多集群MÁS大parece dividirse连接乌纳区德varianza逊色Ÿ乌纳区德varianzaMÁS阿尔塔。埃斯托podríaindicar阙埃尔集群MÁS重创ES DOSclústeressuperpuestos。

Encluster洛拿督。Especifique 3集群。ķ

RNG(1);%的再现性[IDX,C] = k均值(X,3);

意思是中间的中间的+ 1 + 1 + 1 + 1 + 1 + 1 + 1 + 1 + 1 + 1 + 1 + 1 + 1 + 1 + 1 + 1 + 1 + 1 + 1 + 1 + 1 + 1 + 1 + 1 + 1 + 1 + 1 + 1 + 1 + 1 + 1 + 1 + 1k均值ķ硒recomienda buscar MINIMOS语言环境MÁSBajos酒店estableciendo EL argumento去比肩农布雷 - 勇气。“复制”

ES联合国矢量去索引德集群espredichos correspondientes一个拉斯维加斯observaciones恩。ES UNA matriz DE 3 POR 2阙contiene拉斯ubicaciones centroides的终曲。idxXC

硒utiliza对calcular拉DISTANCIA desde CADA centroide一个puntos德UNAcuadrícula。k均值帕拉ELLO,PASE洛斯centroides()Y洛斯puntos德UNAcuadrículaA,E implemente UNAiteración德尔algoritmo。Ck均值

x1 = min (X(: 1)): 0.01:马克斯(X (: 1));x2 = min (X(:, 2)): 0.01:马克斯(X (:, 2));[x1G, x2G] = meshgrid (x1, x2);XGrid = [x1G (:), x2G (:));%定义在图上idx2Region细网格= k均值(XGRID,3, 'MAXITER',1, '开始',C);
警告:没有收敛在1次迭代。
%将网格中的每个节点分配给最近的形心

muestra UNA advertencia阙阙籼稻EL algoritmo没有convergió,老阙德贝esperar,雅阙埃尔软件独奏implementóUNAiteración。k均值

Trazar拉斯regiones德尔集群。

数字;gscatter(XGRID(:,1),XGRID(:,2),idx2Region,[0,0.75,0.75; 0.75,0,0.75; 0.75,0.75,0], '..');坚持,稍等;积(X(:,1),X(:,2), 'K *', 'MarkerSize',5);标题“费舍尔”的虹膜数据“;xlabel '花瓣长度(厘米)';ylabel '花瓣宽度(厘米)';图例( '区1', '区域2', '区3', '数据', '位置', '东南亚');拖延;

Genere aleatoriamente洛杉矶DATOS德ejemplo。

RNG默认的;X = [randn(100,2)*0.75+ones(100,2);randn(100,2)* 0.5酮(100,2)];数字;积(X(:,1),X(: '',2),);标题“随机产生的数据”;

所有的数据都集中在一起。

Particione洛杉矶DATOS带DOSclústeresŸelija LA MEJORdisposición德辛科inicializaciones。Visualice LA萨利达决赛。

OPTS = statset('显示''最后');[idx C] = kmeans (X, 2,“距离”“cityblock”'重复测试',5, '选项',OPTS);
复制1,3次迭代,距离= 201.533的总和。复制2,5次迭代,距离= 201.533的总和。复制3,3迭代中,距离= 201.533的总和。复制4,3次迭代,距离= 201.533的总和。复制5,2次迭代,距离= 201.533的总和。距离= 201.533的最好的总和

这是一款软件,它的功能是复制和利用++。ķ

Trazar洛杉矶clústeres和Los centroides德尔集群。

数字;积(X(IDX == 1,1),X(IDX == 1,2),'R'。“MarkerSize”12)保持积(X(IDX == 2,1),X(IDX == 2,2), 'B', 'MarkerSize',12)图(C(:,1),C(:,2), 'KX','MarkerSize',15, '线宽',3)说明( '群集1', '群集2', '质心',... '位置', 'NW')标题 '集群分配和质心' 保持关闭

Puede determinarqué时谭边están洛杉矶clústerespasando一个。idx轮廓

每一个人都有自己的一份工作,尤其是在美国的实际工作中(已确定的形式)。如果我们获得了并行计算工具箱的许可证,就可以在并行计算的基础上建立一个信息辅助数据库。k均值Y,SI> 1时,entonces LAcomputaciónparalela disminuye时代报一拉convergencia。复制

Genere aleatoriamente联合国CONJUNTO德DATOS大一个partir德联合国莫德洛德mezcla gaussiana。

亩= bsxfun(@倍,酮(20,30),(1:20)');%高斯混合平均rn30 = randn(30,30);西格玛= rn30' * rn30;%对称和正定协方差MDL = gmdistribution(亩,Sigma公司);%定义的高斯混合分布RNG(1);%的再现性X =随机(MDL,10000);

这是一个包含20个组成部分的30维模型。从某种程度上说,10000个数据中有30个是我们自己的。MDLgmdistributionXMDL

Especifique拉斯opciones对拉INFORMÁTICAparalela。

流= RandStream (“mlfg6331_64”);%随机数流选项= statset( 'UseParallel',1 'UseSubstreams',1,... '流',流);

萨尔瓦多argumento德ENTRADA德especifica utilizar EL algoritmo德generador德斐波那契数日retraso multiplicativo。ES UNA matriz德estructura CON德坎波斯阙especifican opciones对controlar拉estimación。“mlfg6331_64”RandStream选项

Agrupe洛杉矶DATOS mediante拉agrupaciónENclústeres-means。ķEspecifique阙干草20个clústeres连接洛杉矶DATOSŸaumente ELNÚMERO德iteraciones。ķNormalmente,拉funciónobjetivo contiene MINIMOS语言环境。Especifique 10副本对ayudar一个encontrar联合国MINIMO当地MÁS巴霍。

抽动;%开始秒表计时[IDX,C,sumd,d] = k均值(X,20, '选项',选择 'MAXITER',10000,... '显示', '最终', '重复测试',10);
开始使用“本地”的个人资料...连接到6名工人并行池(parpool)。复制5,72次迭代,距离= 7.73161e + 06的总和。复制1,64次迭代,距离= 7.72988e + 06的总和。复制3,68次迭代,距离= 7.72576e + 06的总和。复制4,84次迭代,距离= 7.72696e + 06的总和。复制6,82次迭代,距离= 7.73006e + 06的总和。复制7,40次迭代,距离= 7.73451e + 06的总和。复制2,194次迭代,距离= 7.72953e + 06的总和。复制9,105次迭代,距离= 7.72064e + 06的总和。复制10,125次迭代,距离= 7.72816e + 06的总和。 Replicate 8, 70 iterations, total sum of distances = 7.73188e+06. Best total sum of distances = 7.72064e+06
TOC%终止秒表计时
经过的时间是61.915955秒。

拉本塔纳德comandos籼阙干草SEIS disponibles总工会。萨尔瓦多NÚMERO德puede总工会EN variar EL SISTEMA。拉本塔纳德comandos muestra ELNÚMERO德iteracionesŸEL勇气德拉función德objetivo德终端对CADA复制品。洛杉矶argumentos德萨利达contienen洛杉矶resultados德拉副本9 porque tiene LA SUMA总MÁS巴哈德distancias。

realiza -means集群对particionar DATOS恩clústeres。k均值ķķ在一个集群中,您可以创建一个新的数据集群,其中包括您存在的数据和新的数据。k均值从C/C++到C/C++,从C/C++到C/C++,从C/C++到C/C++,从C/C++到C/C++ +,从C/C++到C/C++ +k均值恩埃斯特flujo德特拉瓦霍,德贝巴刹玉野相当洛杉矶DATOS德entrenamiento,阙pueden SER德UN。帕拉ahorrar MEMORIA EN EL dispositivo,puede separar EL entrenamiento和La预测mediante Y,respectivamente。k均值pdist2

在MATLAB中有一个类簇,在这个类簇的编码中有一个类簇。k均值pdist2根据法典的规定,有一个函数在每一处都有一个中心点在每一处都有一个中心点在每一处都有一个中心点在每一处都有一个中心点在每一处都有一个中心点在每一处都有一个中心点在每一处都有一个中心点在每一处都有一个中心点在每一处都有一个中心点在每一处都有一个中心点在每一处都有一个中心点在每一处都有一个中心点在每一处都有一个中心点。这是一个连续的,第一个阶段,第一个阶段。

香格里拉generación德códigoC / C ++ requiereMATLAB®编码器™。

Realizar -Mediaclusteringķ

Genere联合国CONJUNTO德DATOS德entrenamiento mediante特雷斯DISTRIBUCIONES。

RNG('默认'X = [randn(100,2)*0.75+ones(100,2);randn(100 2) * 0.5的(100 2);randn (100 2) * 0.75);

Particione洛杉矶DATOS德entrenamiento连接特雷斯clústeresmediante。k均值

[IDX,C] = k均值(X,3);

Trazar洛杉矶clústeres和Los centroides德尔集群。

数字gscatter(X(:,1),X(:,2),IDX, 'BGM')保持图(C(:,1),C(:,2), 'KX')图例( '群集1', '群集2', '3群集', '聚类形心')

Asignar的Nuevos DATOS一个clústeresexistentes

Generar联合国CONJUNTO德DATOS德prueba。

Xtest = [randn(10, 2) * 0.75 +的(10,2);randn(10, 2) * 0.5的(10,2);randn (10, 2) * 0.75);

Clasificar EL CONJUNTO德DATOS德prueba mediante洛杉矶clústeresexistentes。Busque EL centroideMÁScercano德CADA PUNTO德DATOS德prueba utilizando。pdist2

[~,idx_test] = pdist2 (C Xtest“欧几里德”“最小”,1);

Trazar洛杉矶DATOS德pruebaŸetiquetar洛杉矶DATOS德prueba mediante。idx_testgscatter

gscatter(XTEST(:,1),XTEST(:,2),idx_test,'BGM'“哦”)传说(“集群1”《集群2》“集群3”聚类质心的“数据分类为分类1”,“数据分类为分类2”,...“数据归类到群集3”)

Generar脏污

Generecódigoç阙asigne的Nuevos DATOS洛clústeresexistentes。疼啊恩CUENTA阙拉generación德códigoC / C ++ requiereMATLAB®编码器™。

这是一个关于贸易的函数它有一个中心点和一个新的数据点,一个连续的,密集的中间点。findNearestCentroidpdist2

Agregue拉directiva德尔compilador(O编译)一拉función德PUNTO德ENTRADAdespués德拉FIRMA德拉función对indicar阙tiene拉intención德generarcódigo第下午algoritmo MATLAB。% # codegen铝agregar ESTA directiva,SE籼稻人analizador德códigos日MATLAB阙乐ayude一个diagnosticarŸcorregir infracciones阙provocaríanerrores杜兰特拉generación德código。

类型findNearestCentroid显示findNearestCentroid.m的内容
功能IDX = findNearestCentroid(C,X)%#代码生成[〜,IDX] = pdist2(C,X, '欧几里德', '最小',1);%查找最近重心

硅脑水肿CLIC连接埃尔波顿situado EN LAsección优越derecha德ESTApáginaŸABRE埃斯特ejemplo ENMATLAB®,MATLAB®ABRE洛杉矶carpeta德ejemplo。诺塔:埃斯塔carpeta incluye EL档案馆德función德PUNTO德ENTRADA。

Generarcódigomediante。codegen这个C和C++之间的关系,决定了编译过程中的变量。对于数据和矩阵之间的关系,我们可以用MATLAB来表示数据和矩阵之间的关系。findNearestCentroid-args我们向您咨询信息。为代码生成指定可变大小的参数

codegenfindNearestCentroid-args{C, Xtest}

                    

这类函数的扩展依赖于平台函数。codegenfindNearestCentroid_mex

Compruebe ELcódigogenerado。

myIndx = findNearestCentroid (C, Xtest);myIndex_mex = findNearestCentroid_mex (C, Xtest);verifyMEX = isequal (idx_test myIndx myIndex_mex)
verifyMEX =合乎逻辑1

devuelve LOGICO 1(),LO阙标志意义阙托达拉斯入住日期儿子iguales。是平等的真正香格里拉comparación的Confirma阙拉función,拉función和LafunciónMEX devuelven EL MISMO指数之。pdist2findNearestCentroid

Tambiénpuede generarcódigooptimizadoCUDA®GPU mediante编码器™。

CFG = coder.gpuConfig('MEX');codegen配置CFGfindNearestCentroid-args{C, Xtest}

帕拉obtener更多资料自我LAgeneración德código,consulte。通用代码生成流程对于图形处理器的数据收集,我们将提供更多的信息。开始与GPU编码器(GPU编码器)万博1manbetx支持的功能(GPU编码器)

Argumentos de entrada

contraer待办事项

DATOS,especificados科莫UNA matriz NUMERICA。拉斯维加斯filas德corresponden一个observacionesŸlas Columnas酒店corresponden一个变量。X

硅上课未矢量numérico,LO trata como的UNA matriz去DATOS -by-1,independientemente德苏方向报。Xk均值ñ

埃尔软件trata小号带科莫DATOS阙faltanŸelimina cualquier菲拉德阙contiene人menos UNO。为NaNXX为NaN香格里拉eliminación德filas日减少EL玉野德拉muestra。X埃尔k均值在萨利达的争论中,英勇的对应。为NaNidx

Tipos德DATOS:|

数据的数量,尤其是最近的数据。

Tipos德DATOS:|

Argumentos去比肩农布雷,勇气

Especifique价格调整汇率opcionales separados POR昏迷德argumentos。ES EL农布雷德尔argumentoŸES EL勇气correspondiente。德夯aparecer恩特雷里奥斯科米利亚斯。名称,值的名字的名字你可以用不同的方式来论证你的英勇程度。名1,值1,...,NameN,值N

Ejemplo:especifica拉DISTANCIA德尔coseno,副本clústeresEN diferentes VALORES inicialesŸSE utiliza LAINFORMÁTICAparalela。'距离', '余弦', '重复测试',10, '选项',statset( 'UseParallel',1)10

NIVEL德萨利达阙本身mostrará带拉本塔纳去comandos,especificado科莫EL面值separado POR昏迷阙CONSTA德ŸUNA德拉斯siguientes opciones:'显示'

  • - Muestra洛杉矶resultados德拉iteración决赛'最后'

  • - Muestra洛杉矶resultados德CADAiteración'ITER'

  • - 无muestra滩“关”

Ejemplo:“显示”,“最终”

Métrica德DISTANCIA,恩报非裔维,utilizada对拉minimización,especificada科莫EL面值separado POR昏迷阙CONSTA德Y,,,,邻。p“距离”'sqeuclidean'“cityblock”“余弦”“相关性”“汉明”

结石集中在离体的中心,离体的大小不同。k均值埃斯塔塔布拉简历拉斯métricas德DISTANCIA disponibles。恩拉斯式中,ES UNA观察(ES decir,UNA菲拉德)y的上课未centroide(未矢量德菲拉)。XXC

Métrica德DISTANCIA Descripción
'sqeuclidean'

Distancia euclidiana cuadrada(前决定论)。中心点是这些星系团的媒体。

d X C = X C X C

“cityblock”

苏马德diferencias absolutas,ES decir,LA DISTANCIA 1。大号CADA centroide ES LA mediana德COMPONENTES德洛斯puntos德ESE集群。

d X C = Ĵ = 1 p | X Ĵ C Ĵ |

“余弦”

欧诺menos EL coseno德尔安古洛incluido恩特雷里奥斯puntos(tratados科莫vectores)。CADA centroide上课啦媒体德洛斯puntos德ESEcúmulo,después德normalizar ESOS puntos对unir拉longitud euclidiana。

d X C = 1 X C X X C C

“相关性”

欧诺menos拉correlación德拉muestra恩特雷里奥斯puntos(tratados科莫secuencias德VALORES)。CADA centroide ES LA媒体去componente德洛斯puntos德ESE集群,después德centrarŸnormalizar ESOS puntos一个CERO媒体ŸDISTANCIAestándar德团结报。

d X C = 1 X X ¯ C C ¯ X X ¯ X X ¯ C C ¯ C C ¯

在哪里

  • X ¯ = 1 p Ĵ = 1 p X Ĵ 1 p

  • C ¯ = 1 p Ĵ = 1 p C Ĵ 1 p

  • 1 p ES联合国载体德FILA德UNOS。p

“汉明”

埃斯塔métrica独奏上课adecuada对DATOS binarios。

居拉proporción代位阙difieren。CADA centroide ES LA mediana德puntos连接cuanto一个COMPONENTES德ESE集群。

d X ÿ = 1 p Ĵ = 1 p 一世 { X Ĵ ÿ Ĵ }

你的名字是donde esta la funcion del indicador。一世

Ejemplo:'距离', 'cityblock'

行动组织一个realizar SI非集群pierde托达SUS observaciones德miembro,especificadas科莫EL面值separado POR昏迷阙CONSTA德ŸUNA德拉斯siguientes opciones。'EmptyAction'

勇气 Descripción
'错误'

TRATAR未集群vacío科莫联合国错误。

'下降'

这些都是我们所知道的。公司与客户建立联系。k均值Cd为NaN

“单身”

克里联合国NUEVO集群阙consista EN EL PUNTOMÁSalejado日苏centroide(predeterminado)。

Ejemplo:'EmptyAction', '错误'

NÚMERO被Máximo德iteraciones,especificado科莫EL面值separado POR昏迷阙CONSTA德Ÿ联合国肠POSITIVO。'MAXITER'

Ejemplo:'MAXITER',1000

Tipos德DATOS:|

马卡报德actualizaciónEN拉利内阿,especificada科莫EL面值separado POR昏迷阙CONSTA DE Y 2 O 3。'OnlinePhase'“关”'上'

硅ES,realiza UNA FASE德actualización连接拉利内阿además日乌纳FASE德actualizaciónPOR嘉泽端子工业股份有限公司。OnlinePhasek均值每一个地方都有一个最小的地方标准。在otras palabras, el软件中有一个关于数据的分词,在这个分词中,移动的数据在这个分词中,移动的数据在这个分词中,移动的数据在这个分词中,移动的数据在这个分词中,移动的数据在这个分词中,移动的数据在这个分词中,移动的数据在这个分词中,移动的数据在这个分词中,移动的数据在这个分词中,移动的数据在这个分词中。

Ejemplo:'关于' OnlinePhase',

Opciones对controlar EL algoritmo iterativo对minimizar洛杉矶criterios德ajuste,especificados科莫EL面值separado POR昏迷阙CONSTA德ŸUNA matriz德estructura devuelta POR。“选项”statset在结构上,特别是在结构控制上,有一个特殊的要求。

这支手鼓是我的简历。Tenga en cuenta que los campos admitidos需要并行计算工具箱™

坎波 Descripción
“流”

联合国objetoØmatriz德celdas德dichos objetos。RandStream硅无especifica,utiliza拉secuenciaØsecuencias predeterminadas。k均值如果特别地,使用一个单独的objeto,除了它存在于你的siguientes:

  • Tiene联合国GRUPO paralelo abierto。

  • ES。UseParallel真正

  • ES。UseSubstreams

在过去的一段时间里,我一直在为我的球队打比赛。如果你有一份工作,那么你的每一份工作都可以安排得很好。

'UseParallel'
  • 的Si Y> 1,implementa EL algoritmo -means烯CADA复制品烯paralelo。真正复制k均值ķ

  • 如果没有计算机,就不会有计算机。并行计算工具箱El valor predeterminado es , que indica el cálculo en serie.

“UseSubstreams” Establézalo对calcular连接paralelo去备考重复性。真正萨尔瓦多勇气predeterminado ES。帕拉calcular去备考重复性,establezca EN联合国TIPO阙permita子:○。“mlfg6331_64”“mrg32k3a”

结果孩子们比以前更早去世,所以我经常看望他们的父母。parpoolk均值'选项',statset( 'UseParallel',1)

Ejemplo:'选项',statset( 'UseParallel',1)

Tipos德DATOS:结构

NÚMERO德veces阙本身repite拉agrupación连接clústeresutilizando NUEVAS posiciones centroide德集群iniciales,especificadas科莫EL面值separado POR昏迷阙CONSTA德UN肠。devuelve拉soluciónCON EL勇气MÁS洼地。“复制”k均值sumd

在此基础上,建立了一套较为合理的数学模型。“复制”'开始'

Ejemplo:'重复测试',5

Tipos德DATOS:|

方法方法对elegir拉斯posiciones centroides德簇iniciales(○),especificado como的EL帕separado POR昏迷阙CONSTA德Y,,,,UNA matriz NUMERICAöUNA matriz NUMERICA。Semillas'开始''簇''加''样品'“统一”恩ESTA塔布拉SE会谈摘要拉斯opciones disponibles对elegir semillas。

勇气 Descripción
'簇'

Realice UNA FASE德agrupación连接clústerespreliminar EN UNA submuestra aleatoria德尔10%德宽多报NÚMERO德observaciones带拉submuestra海市长阙。Xķ埃斯塔FASE preliminar本身inicializa utilizando。'样品'

硅ELNÚMERO德observaciones带拉submuestra aleatoria德尔10%ES梅纳阙,entonces EL软件selecciona observaciones人阿扎尔。ķķX

(predeterminado)'加' Seleccione semillas implementando埃尔ķ-means ++ algoritmoķ对拉inicialización德尔炫酷德集群。
'样品' Seleccione observaciones人阿扎尔。ķX
“统一” 选一篇文章作为制服。ķX无ES VALIDO CON LA DISTANCIA海明。
matriz NUMERICA -por- matriz德ubicaciones德INICIO centroide。ķp拉斯菲拉斯与半人马通信。开始软件推导出了基本的尺寸,我们可以根据它来推断。ķ开始[]ķ
matriz NUMERICA -by- -by- matriz德ubicaciones德INICIO centroide。ķp[R拉斯维加斯filas德CADApáginacorresponden一个semillas。香格里拉t​​ercera尺寸invoca拉replicación德拉若缇娜去agrupación恩clústeres。第contiene EL CONJUNTO德semillas对replicar。ĴĴEl软件推导出El数字的副本(特别是por El argumento de par nombrei -valor) del tamano de la tercera维数。“复制”

Ejemplo:“开始”、“样本”

Tipos德DATOS:烧焦|字符串||

Argumentos德公司salida

contraer待办事项

洛杉矶指标德群,devueltos科莫矢量德columnanumérico。tiene tantas filas科莫,Y CADA FILA籼稻拉asignación德集群德拉观察correspondiente。idxX

中心体的Ubicaciones在群集中,在第一个矩阵中。这是一个矩阵,在这一行中间有一个簇。CķpĴĴ

SUMAS迪登特鲁德尔集群德distancias PUNTO一个centroide,devueltas科莫联合国载体德columnanumérico。ES未矢量-by-1,东德元件ES LA SUMA德distancias PUNTO一个centroide迪登特鲁德尔集群。sumdķĴĴ

Distancias desde CADA PUNTO一个CADA centroide,devuelto科莫UNA matriz NUMERICA。ES UNA matriz -por-,东德EL ELEMENTO(,)ES LA DISTANCIA desde LA观察闪现EL centroide。dñķĴĴ

MAS acerca德

contraer待办事项

-Medios集群ķ

,邻algoritmo德劳埃德,ES联合国algoritmo iterativo德partición德DATOS阙asigna observaciones一个exactamente UNO德洛斯clústeresdefinidos POR洛杉矶centroides,东德本身elige底注德阙本身inicie EL algoritmo。k均值聚类[2]ñķķ

El algoritmo规程de la siguiente manera:

  1. Elija洛杉矶centros德集群iniciales()。ķCentroidePOR ejemplo,elija observaciones人黑热病(mediante)O utilice埃尔ķ“开始”、“样本”-significa algoritmo ++ķ簇中心的初始化(值的预先决定)。

  2. Calcular distancias蓬群集centroide德托达拉斯observaciones一个CADA centroide。

  3. 干草DOS FORMAS德proceder(especificadas POR):OnlinePhase

    • ActualizaciónPOR LOTES:asigne CADA观察人群集CON EL centroideMÁScercano。

    • ActualizaciónEN拉利内阿:asigne observaciones individualmente联合国centroide diferente SI拉reasignacióndisminuye拉SUMA德拉斯distancias恩特雷里奥斯clústeresŸ德SUMA德cuadrados PUNTO群集centroide。

    我们向您咨询信息。Algoritmos

  4. Calcular EL promedio德拉斯observaciones EN CADA集群对obtener NUEVAS ubicaciones centroides。ķ

  5. Repita洛杉矶pasos德尔2人4闪现阙拉斯asignaciones德群没有cambienØSE alcance ELNÚMERO被Máximo德iteraciones。

-means ++ Algoritmoķ

利用对偶半中心体对偶的启发方法聚类。ķ-means ++ algoritmoķ托里奥拉亚瑟ŸVassilvitskii,-means ++ mejora时代报德ejecución德尔algoritmo日劳埃德和La CALIDAD德拉solución决赛。[1]ķ

萨尔瓦多algoritmo -means ++ elige拉斯semillas德拉siguiente MANERA,suponiendo阙埃尔NÚMERO德clústeres大海。ķķ

  1. Seleccione UNA观察uniformemente人黑热病德尔CONJUNTO德DATOS。X秀丽隐杆线虫的引物是一种引物C1

  2. Calcular distancias desde CADA观察闪现C1。Denotar拉DISTANCIA恩特雷里奥斯CĴ和La观察科莫 d X C Ĵ

  3. Seleccione EL siguiente centroide,C2人黑热病德CON probabilidadX

    d 2 X C 1 Ĵ = 1 ñ d 2 X Ĵ C 1

  4. 帕拉elegir埃尔森特罗:Ĵ

    1. 在中心点处有一个计算机,在中心点处有一个计算机。

    2. 第一段,…1,y,……,– 1, seleccione centroide al azar con probabilidadñpĴĴX

      d 2 X C p { H ; X H · C p } d 2 X H C p

      在哪里Cp从现在到将来,我们会一直关注这个中心CpÿXpertenece一Cp

      ES decir,seleccione CADA炫酷后CON UNA probabilidad proporcional一拉DISTANCIA desde对MISMO闪现埃尔森特罗MÁScercano阙雅哈亚elegido。

  5. Repita埃尔帕索4个闪现阙本身elijan洛杉矶centroides。ķ

亚瑟ŸVassilvitskii demuestran,utilizando联合国ESTUDIO去模拟对varias orientaciones德群,阙-means ++ logra UNA convergenciaMÁS必达一个UNA梅纳SUMA德distancias恩特雷里奥斯clústeresŸSUMA德cuadrados PUNTO群集centroide阙埃尔algoritmo德劳埃德。[1]ķ

Algoritmos

  • 利用这个方法,我们可以尽可能少地使用那些离我们很远的中心体,我们可以在我们的集群中使用它们。k均值ķ

    1. 埃斯塔西甲FASE utiliza,东德CADAiteraciónconsiste连接reasignar puntos一肃centroide德集群MÁScercano,待办事项一拉VEZ,seguido德UN NUEVOcálculo德洛斯centroides德集群。actualizaciones POR嘉泽端子工业股份有限公司埃斯塔FASE ocasionalmente没有收敛一个UNAsolución阙ES联合国MINIMO地方。ES decir,UNApartición洛斯DATOS东德动机cualquier PUNTO一个未集群diferente aumenta LA SUMA总去distancias。埃斯托ESMÁS可能对conjuntos德DATOSpequeños。香格里拉FASE POR LOTES ES必达,佩罗potencialmente独奏SE aproxima一个UNAsolución科莫PUNTO德partida对拉乙级FASE。

    2. 埃斯塔乙级FASE utiliza,东德洛斯puntos本身reasignan individualmente SI人hacerlo本身减少拉德SUMA distancias和Los centroides去簇本身vuelven一个calculardespués德CADAreasignación。actualizaciones恩拉利内阿CADAiteración杜兰特ESTA FASE CONSTA DE UNA pasada一个través去待办事项洛杉矶puntos。埃斯塔FASE收敛联合国MINIMO地方,aunque puede哈伯OTROS MINIMOS语言环境CON梅纳SUMA总去distancias。恩一般,encontrar EL MINIMO全球SE resuelve mediante UNA Selecci贸exhaustiva德puntos德partida,佩罗EL USO德varias副本CON puntos德partida aleatorios normalmente达科莫resultado UNAsolución阙ES联合国全球MINIMO。

  • 如果第1个数字是(值的预先决定),那么软件选择就可能与第1个数字是不同的复制[R开始[R-means ++ algoritmoķ

  • 硅habilita LAopción烯Y> 1,CADA trabajador selecciona semillasýclústeres烯paralelo。UseParallel选项复制

Referencias

[1]亚瑟,大卫和塞吉·瓦西尔维茨基。“k -意味着++:谨慎播种的好处。”SODA '07:离散算法十八届ACM-SIAM研讨会论文集。2007年,页1027 - 1035。

[2]劳埃德,司徒P.“最小二乘量化在PCM”。IEEE信息理论汇刊。第28卷,1982年,第129-137页。

[3] Seber,G. A. F.多变量的观察。新泽西州霍博肯:约翰威利父子公司,1984年。

[4] SPATH,H.集群解剖和分析:理论,FORTRAN程序,实例。由J. Goldschmidt的平移。纽约:霍尔斯特德出版社,1985年。

Capacidades ampliadas

Introducido底注德R2006a