主要内容

subclust

使用减法聚类发现集群中心

描述

例子

中心= subclust (数据,clusterInfluenceRange)集群使用减法聚类与指定的输入数据集群的影响范围,并返回计算集群中心。的减法聚类算法估计集群的数量输入数据。

例子

中心= subclust (数据,clusterInfluenceRange,名称,值)使用算法选项指定一个或多个集群数据名称,值参数。

例子

(中心,σ)= subclust (___)返回的σ值指定的范围影响集群中心的每个数据维度。

例子

全部折叠

加载数据集。

负载clusterDemo.dat

发现集群中心使用相同的所有维度的影响范围。

C = subclust (clusterDemo, 0.6);

每一行的C包含一个集群中心。

C
C =3×30.5779 0.2355 0.5133 0.7797 0.8191 0.1801 0.1959 0.6228 0.8363

加载数据集。

负载clusterDemo.dat

为每个数据维度定义最小和最大归一化范围。使用相同的范围为每个维度。

dataScale = [-0.2 -0.2 -0.2;1.2 1.2 1.2);

发现集群中心。

C = subclust (clusterDemo, 0.5,“DataScale”,dataScale);

加载数据集。

负载clusterDemo.dat

指定以下集群选项:

  • 南瓜的因素2.0——只有找到集群相互远离。

  • 接受率0.8——只接受数据点与一个强大的潜力被集群中心。

  • 拒绝的比例0.7——拒绝数据点如果他们没有强大的潜力被集群中心。

  • 冗长的旗帜0——不进步信息打印到命令窗口。

选择= (2.0 0.8 0.7 0);

发现集群中心,使用不同的每个维度的影响范围和指定的选项。

C = subclust (clusterDemo (0.5 0.25 0.3),“选项”、选择);

加载数据集。

负载clusterDemo.dat

集群的数据,返回集群σ值,年代

[C, S] = subclust (clusterDemo, 0.5);

集群σ值表示的范围的影响在每个数据维数计算集群中心。

输入参数

全部折叠

数据集群,指定为一个——- - - - - -N数组,数据点的数量和吗N是数据的数量维度。

一系列影响集群的每个输入和输出假设数据中心hyperbox落在一个单位,指定为以下之一:

  • 标量值的范围(01)——使用相同的影响范围为所有输入和输出。

  • 向量,使用不同的影响范围为每个输入和输出。

指定一个较小范围的影响通常创造了更多和更小的数据集群,生产更多的模糊规则。

名称-值参数

指定可选的双参数作为Name1 = Value1,…,以=家,在那里的名字参数名称和吗价值相应的价值。名称-值参数必须出现在其他参数,但对的顺序无关紧要。

R2021a之前,用逗号来分隔每一个名称和值,并附上的名字在报价。

例子:中心= subclust(数据、0.5 DataScale = 10)

R2021a之前,用逗号来分隔每一个名称和值,并附上的名字在报价。

例子:中心= subclust(数据,0.5,“DataScale”, 10)

数据规模因素正常化hyperbox输入和输出数据到一个单位,指定为2×-N数组,N是总数量的输入和输出。每一列的DataScale第一行指定最小值和最大值在第二行相应的输入或输出数据集。

DataScale“汽车”,subclust函数使用实际的最小值和最大值的集群数据。

集群选项,指定为一个包含以下元素的向量。

南瓜因素扩展集群中心的影响的范围,指定为一个积极的标量。一个小南瓜因素减少潜在的偏远点被认为是集群的一部分,通常创建更小的数据集群。

接受率,定义为第一个集群中心的潜力的一小部分,上面另一个数据点被接受为一个集群中心指定为一个标量值的范围(0,1]。接受率必须大于废品率。

衰减率,定义为第一个集群中心的潜力的一小部分,低于另一个数据点被拒绝作为集群中心指定为一个标量值的范围(0,1]。衰减率必须小于接受率。

信息显示在集群标志指示是否显示进度信息,指定为以下之一:

  • - - - - - -不显示进度信息。

  • 真正的——显示进度信息。

输出参数

全部折叠

集群中心,作为一个返回J——- - - - - -N数组,J集群的数量和吗N是数据的数量维度。

集群中心为每个数据维度的影响范围,作为一个返回N有效行向量。所有集群中心有相同的组σ值。

提示

  • 使用减法聚类生成一个模糊推理系统,使用genfis命令。例如,假设你集群数据使用下面的语法:

    C = subclust(数据、clusterInfluenceRange“DataScale”dataScale,“选项”、选择);

    第一个数据对应于输入变量,其余列对应输出变量。

    你可以生成一个模糊系统使用相同的训练数据和减去集群配置。这样做:

    1. 配置集群选项。

      选择= genfisOptions (“SubtractiveClustering”);opt.ClusterInfluenceRange = clusterInfluenceRange;opt.DataScale = dataScale;opt.SquashFactor =选项(1);opt.AcceptRatio =选项(2);opt.RejectRatio =选项(3);opt.Verbose =选项(4);
    2. 提取数据的输入和输出变量。

      inputData =数据(:,1:M);outputData =数据(:,M + 1:结束);
    3. 生成FIS结构。

      fis = genfis (inputData outputData,选择);

    模糊系统,金融中间人,包含一个模糊规则为每个集群,每个输入和输出变量有一个每个集群成员函数。你可以只生成Sugeno利用减法聚类模糊系统。有关更多信息,请参见genfisgenfisOptions

算法

减法聚类假设每个数据点是一个潜在的集群中心。算法如下:

  1. 计算每个数据点的可能性将定义一个集群中心,基于周围的数据点的密度。

  2. 选择最高的数据点可能是第一个集群中心。

  3. 删除所有数据点附近的第一个集群中心。附近使用决定clusterInfluenceRange

  4. 选择剩余潜力最高的点作为下一个集群中心。

  5. 重复步骤3和4,直到所有集群的影响范围内的数据中心。

减法聚类方法是一个扩展的聚类方法[2]

引用

[1]赵,斯蒂芬·l·“模糊模型识别基于集群的估计。”智能和模糊系统杂志》上2,没有。3 (1994):267 - 78。https://doi.org/10.3233/ifs - 1994 - 2306

[2]狙击兵,罗纳德·R。,和Dimitar P. Filev. “Generation of Fuzzy Rules by Mountain Clustering.”智能和模糊系统杂志》上2,没有。3(1994):209 - 19所示。https://doi.org/10.3233/ifs - 1994 - 2301

版本历史

之前介绍过的R2006a

全部展开