主要内容

subclust

使用减法聚类查找聚类中心

描述

例子

中心= subclust (数据,群集影响范围使用具有指定群集影响范围的减法群集对输入数据进行群集,并返回计算的群集中心减法聚类算法估计输入数据中的集群数量。

例子

中心= subclust (数据,群集影响范围,名称、值使用一个或多个指定的算法选项对数据进行聚类名称、值配对参数。

例子

中心,σ]=子集群(___返回指定集群中心在每个数据维中的影响范围的西格玛值。

例子

全部崩溃

加载数据集。

负载clusterdemo.dat

查找对所有维度使用相同影响范围的集群中心。

C=子集群(clusterdemo,0.6);

每行C包含一个集群中心。

C
C=3×30.5779 0.2355 0.5133 0.7797 0.8191 0.1801 0.1959 0.6228 0.8363

加载数据集。

负载clusterdemo.dat

定义每个数据维的最小和最大标准化界限。对每个维度使用相同的边界。

数据量表=[-0.2-0.2-0.2;1.21.21.2];

查找群集中心。

C = subclust (clusterdemo, 0.5,“数据量表”,数据量表);

加载数据集。

负载clusterdemo.dat

指定以下群集选项:

  • 挤压系数2-仅查找彼此距离较远的群集。

  • 接受率0.8-只接受具有强大潜力的数据点作为集群中心。

  • 拒绝的比例0.7-如果数据点不具备成为集群中心的强大潜力,则拒绝它们。

  • 冗长的旗帜0—不打印进度信息到命令窗口。

Options = [2.0 0.8 0.7 0];

查找簇中心,对每个维度和指定选项使用不同的影响范围。

C=子集群(clusterdemo,[0.5 0.25 0.3],“选项”,选项);

加载数据集。

负载clusterdemo.dat

集群数据,返回集群sigma值,年代

[C,S]=子集群(clusterdemo,0.5);

聚类西格玛值表明计算出的聚类中心在每个数据维中的影响范围。

输入参数

全部崩溃

要群集的数据,指定为-借-N数组,是数据点的数量和N是数据维的数量。

集群中心对每个输入和输出的影响范围,假设数据属于一个单元超框,指定为由逗号分隔的对组成“ClusterInfluenceRange”以下其中一项:

  • 范围内的标量值[01-对所有输入和输出使用相同的影响范围。

  • 向量-对每个输入和输出使用不同的影响范围。

指定较小的影响范围通常会创建更多更小的数据集群,从而产生更多模糊规则。

名称-值参数

指定可选的逗号分隔的对名称、值论据。的名字参数名和价值是对应的值。的名字必须出现在引号内。您可以按任意顺序指定多个名称和值对参数,如下所示:名称1,值1,…,名称,值

例子:“数据量表”、“自动”使用要聚类的数据集中的最小值和最大值设置输入和输出信号的归一化因子。

用于将输入和输出数据规范化为单位超盒的数据比例因子,指定为逗号分隔对,由“数据量表”还有一张双人票-N数组,N为输入和输出的总数。每一列的DataScale为相应的输入或输出数据集指定第一行中的最小值和第二行中的最大值。

什么时候DataScale“汽车”,根菲斯命令使用要聚集的数据中的实际最小值和最大值。

群集选项,指定为逗号分隔对,由“选项”和一个具有以下元素的向量:

压缩因子,用于缩放群集中心的影响范围,指定为正标量。较小的压缩因子可降低将边远点视为群集一部分的可能性,这通常会创建更多和更小的数据群集。

接受比,定义为第一个聚类中心潜力的一小部分,超过该潜力的另一个数据点被接受为聚类中心,指定为范围内的标量值[0,1].合格率必须大于废品率。

拒绝率,定义为第一个群集中心电位的一部分,低于该值,另一个数据点被拒绝为群集中心,指定为范围内的标量值[0,1].不合格率必须小于合格率。

信息显示标志,指示在群集期间是否显示进度信息,指定为以下选项之一:

  • -不显示进度信息。

  • 真的-显示进度信息。

输出参数

全部崩溃

集群中心,返回为J-借-N数组,J簇数是和吗N是数据维的数量。

群集中心对每个数据维度的影响范围,以N有效行向量。所有集群中心都有一组相同的σ值。

提示

  • 要使用减法聚类生成模糊推理系统,请使用根菲斯例如,假设您使用以下语法对数据进行集群:

    C=子群集(数据、群集影响范围、,“数据量表”,数据量表,“选项”,选项);

    第一个在哪里数据对应于输入变量,其余列对应于输出变量。

    您可以使用相同的训练数据和减法聚类配置生成模糊系统。为此:

    1. 配置集群选项。

      opt=genfis选项(“SubtractiveClustering”);opt.ClusterInfluenceRange=ClusterInfluenceRange;opt.DataScale=DataScale;opt.SquashFactor=options(1);opt.AcceptRatio=options(2);opt.RejectRatio=options(3);opt.Verbose=options(4);
    2. 提取输入和输出变量数据。

      输入数据=数据(:,1:M);输出数据=数据(:,M+1:end);
    3. 生成FIS结构。

      fis=genfis(输入数据、输出数据、opt);

    模糊系统,,金融中间人,每个聚类包含一个模糊规则,每个输入和输出变量每个聚类有一个隶属函数。使用减法聚类只能生成Sugeno模糊系统。有关更多信息,请参见根菲斯genfisOptions

算法

减法聚类假设每个数据点都是一个潜在的聚类中心。算法执行如下操作:

  1. 根据周围数据点的密度,计算每个数据点定义群集中心的可能性。

  2. 选择潜力最大的数据点作为第一个集群中心。

  3. 删除第一个群集中心附近的所有数据点。使用群集影响范围

  4. 选择潜力最大的剩余点作为下一个集群中心。

  5. 重复步骤3和步骤4,直到所有数据都在集群中心的影响范围内。

减法聚类方法是对中提出的山地聚类方法的扩展[2]

参考文献

[1] Chiu,S.,“基于聚类估计的模糊模型识别,”智能与模糊系统学报,第2卷第3期,1994年9月。

[2] Yager, R.和D. Filev,“基于山聚类的模糊规则生成”,智能与模糊系统学报,第2卷,第3期,第209-219页,1994年。

在R2006a之前引入