subclust

使用减法聚类发现集群中心

所有的页面崩溃

语法

中心= subclust(数据、clusterInfluenceRange)

中心= subclust(数据、clusterInfluenceRange名称、值)

(中心、σ)= subclust (___)

描述

例子

中心= subclust (数据,clusterInfluenceRange)集群使用减法聚类与指定的输入数据集群的影响范围,并返回计算集群中心。的减法聚类算法估计集群的数量输入数据。

例子

中心= subclust (数据,clusterInfluenceRange,名称,值)使用算法选项指定一个或多个集群数据名称,值参数。

例子

(中心,σ)= subclust (___)返回的σ值指定的范围影响集群中心的每个数据维度。

例子

全部折叠

使用减法聚类发现集群中心

打开生活的脚本

加载数据集。

负载clusterDemo.dat

发现集群中心使用相同的所有维度的影响范围。

C = subclust (clusterDemo, 0.6);

每一行的C包含一个集群中心。

C =3×30.5779 0.2355 0.5133 0.7797 0.8191 0.1801 0.1959 0.6228 0.8363

为减法聚类指定范围

打开生活的脚本

加载数据集。

负载clusterDemo.dat

为每个数据维度定义最小和最大归一化范围。使用相同的范围为每个维度。

dataScale = [-0.2 -0.2 -0.2;1.2 1.2 1.2);

发现集群中心。

C = subclust (clusterDemo, 0.5,“DataScale”,dataScale);

为减法聚类指定选项

打开生活的脚本

加载数据集。

负载clusterDemo.dat

指定以下集群选项:

南瓜的因素2.0——只有找到集群相互远离。
接受率0.8——只接受数据点与一个强大的潜力被集群中心。
拒绝的比例0.7——拒绝数据点如果他们没有强大的潜力被集群中心。
冗长的旗帜0——不进步信息打印到命令窗口。

选择= (2.0 0.8 0.7 0);

发现集群中心,使用不同的每个维度的影响范围和指定的选项。

C = subclust (clusterDemo (0.5 0.25 0.3),“选项”、选择);

获取集群影响范围为每个数据维度

打开生活的脚本

加载数据集。

负载clusterDemo.dat

集群的数据,返回集群σ值,年代。

[C, S] = subclust (clusterDemo, 0.5);

集群σ值表示的范围的影响在每个数据维数计算集群中心。

输入参数

全部折叠

`数据`- - - - - -集群的数据集
米——- - - - - -N数组

数据集群,指定为一个米——- - - - - -N数组,米数据点的数量和吗N是数据的数量维度。

`clusterInfluenceRange`- - - - - -的影响范围集群中心
标量值的范围(`0`,`1`]|向量

一系列影响集群的每个输入和输出假设数据中心hyperbox落在一个单位,指定为以下之一:

标量值的范围(01)——使用相同的影响范围为所有输入和输出。
向量,使用不同的影响范围为每个输入和输出。

指定一个较小范围的影响通常创造了更多和更小的数据集群,生产更多的模糊规则。

名称-值参数

指定可选的双参数作为Name1 = Value1,…,以=家,在那里的名字参数名称和吗价值相应的价值。名称-值参数必须出现在其他参数,但对的顺序无关紧要。

R2021a之前,用逗号来分隔每一个名称和值,并附上的名字在报价。

例子:中心= subclust(数据、0.5 DataScale = 10)

R2021a之前,用逗号来分隔每一个名称和值,并附上的名字在报价。

例子:中心= subclust(数据,0.5,“DataScale”, 10)

`DataScale`- - - - - -数据规模因素
`“汽车”`(默认)|2 -N数组

数据规模因素正常化hyperbox输入和输出数据到一个单位,指定为2×-N数组,N是总数量的输入和输出。每一列的DataScale第一行指定最小值和最大值在第二行相应的输入或输出数据集。

当DataScale是“汽车”,subclust函数使用实际的最小值和最大值的集群数据。

`选项`- - - - - -集群选项
向量

集群选项,指定为一个包含以下元素的向量。

`选项(1)`——南瓜因素
`1.25`(默认)|积极的标量

南瓜因素扩展集群中心的影响的范围,指定为一个积极的标量。一个小南瓜因素减少潜在的偏远点被认为是集群的一部分,通常创建更小的数据集群。

`选择(2)`——接受率
`0.5`(默认)|标量值的范围(`0`,`1`]

接受率,定义为第一个集群中心的潜力的一小部分,上面另一个数据点被接受为一个集群中心指定为一个标量值的范围(0,1]。接受率必须大于废品率。

`选项(3)`——抑制比
`0.15`(默认)|标量值的范围(`0`,`1`]

衰减率,定义为第一个集群中心的潜力的一小部分,低于另一个数据点被拒绝作为集群中心指定为一个标量值的范围(0,1]。衰减率必须小于接受率。

`选项(4)`——信息显示国旗
`假`(默认)|`真正的`

信息显示在集群标志指示是否显示进度信息,指定为以下之一:

假- - - - - -不显示进度信息。
真正的——显示进度信息。

输出参数

全部折叠

`中心`——集群中心
J——- - - - - -N数组

集群中心,作为一个返回J——- - - - - -N数组,J集群的数量和吗N是数据的数量维度。

`σ`——集群中心的影响范围
N有效行向量

集群中心为每个数据维度的影响范围,作为一个返回N有效行向量。所有集群中心有相同的组σ值。

提示

使用减法聚类生成一个模糊推理系统,使用genfis命令。例如,假设你集群数据使用下面的语法:
```
C = subclust(数据、clusterInfluenceRange“DataScale”dataScale,“选项”、选择);
```
第一个米列数据对应于输入变量,其余列对应输出变量。
你可以生成一个模糊系统使用相同的训练数据和减去集群配置。这样做:
1. 配置集群选项。
  选择= genfisOptions (“SubtractiveClustering”);opt.ClusterInfluenceRange = clusterInfluenceRange;opt.DataScale = dataScale;opt.SquashFactor =选项(1);opt.AcceptRatio =选项(2);opt.RejectRatio =选项(3);opt.Verbose =选项(4);
2. 提取数据的输入和输出变量。
  inputData =数据(:,1:M);outputData =数据(:,M + 1:结束);
3. 生成FIS结构。
  fis = genfis (inputData outputData,选择);
模糊系统,金融中间人,包含一个模糊规则为每个集群,每个输入和输出变量有一个每个集群成员函数。你可以只生成Sugeno利用减法聚类模糊系统。有关更多信息,请参见genfis和genfisOptions。

算法

减法聚类假设每个数据点是一个潜在的集群中心。算法如下:

计算每个数据点的可能性将定义一个集群中心,基于周围的数据点的密度。
选择最高的数据点可能是第一个集群中心。
删除所有数据点附近的第一个集群中心。附近使用决定clusterInfluenceRange。
选择剩余潜力最高的点作为下一个集群中心。
重复步骤3和4,直到所有集群的影响范围内的数据中心。

减法聚类方法是一个扩展的聚类方法[2]。

引用

[1]赵,斯蒂芬·l·“模糊模型识别基于集群的估计。”智能和模糊系统杂志》上2,没有。3 (1994):267 - 78。https://doi.org/10.3233/ifs - 1994 - 2306。

[2]狙击兵,罗纳德·R。,和Dimitar P. Filev. “Generation of Fuzzy Rules by Mountain Clustering.”智能和模糊系统杂志》上2,没有。3(1994):209 - 19所示。https://doi.org/10.3233/ifs - 1994 - 2301。

版本历史

之前介绍过的R2006a

全部展开

R2017a:使用名称-值对指定选项参数

为减去指定选项,您现在使用名称-值对参数。你没有指定的名称-值对参数保持默认值。

以前,你指定的选项使用可选的输入参数xBounds和选项。

fisOut = subclust (fisIn半径、xBounds选项);

从R2017a、修改代码使用一个或多个名称-值对参数。例如,指定集群选项。

fisOut = subclust (fisIn半径,“选项”、选择);

下面的表显示了旧的输入参数的映射到新的名称-值对参数。

老`subclust`输入参数	新的名称-值参数
`xBounds`	`“DataScale”`
`选项`	`“选项”`

另请参阅

genfis

subclust

语法

描述

例子

使用减法聚类发现集群中心

为减法聚类指定范围

为减法聚类指定选项

获取集群影响范围为每个数据维度

输入参数

数据- - - - - -集群的数据集米——- - - - - -N数组

clusterInfluenceRange- - - - - -的影响范围集群中心标量值的范围(0,1]|向量

名称-值参数

DataScale- - - - - -数据规模因素“汽车”(默认)|2 -N数组

选项- - - - - -集群选项向量

选项(1)——南瓜因素1.25(默认)|积极的标量

选择(2)——接受率0.5(默认)|标量值的范围(0,1]

选项(3)——抑制比0.15(默认)|标量值的范围(0,1]

选项(4)——信息显示国旗假(默认)|真正的

输出参数

中心——集群中心J——- - - - - -N数组

σ——集群中心的影响范围N有效行向量

提示

算法

引用

版本历史

R2017a:使用名称-值对指定选项参数

另请参阅

主题

`数据`- - - - - -集群的数据集
米——- - - - - -N数组

`clusterInfluenceRange`- - - - - -的影响范围集群中心
标量值的范围(`0`,`1`]|向量

`DataScale`- - - - - -数据规模因素
`“汽车”`(默认)|2 -N数组

`选项`- - - - - -集群选项
向量

`选项(1)`——南瓜因素
`1.25`(默认)|积极的标量

`选择(2)`——接受率
`0.5`(默认)|标量值的范围(`0`,`1`]

`选项(3)`——抑制比
`0.15`(默认)|标量值的范围(`0`,`1`]

`选项(4)`——信息显示国旗
`假`(默认)|`真正的`

`中心`——集群中心
J——- - - - - -N数组

`σ`——集群中心的影响范围
N有效行向量