主要内容

集群的数据

集群的数据使用k则算法在现场编辑器

自从R2021b

描述

集群的数据住编辑器使您能够交互式地执行任务k——集群。任务生成MATLAB®脚本代码为您的生活并返回产生的集群指数和聚类质心位置的MATLAB工作区。

您可以:

  • 确定数据的最优数量的集群自动手动选择集群的数量或通过指定标准如间隙值,轮廓值,Davies-Bouldin索引值,Calinski-Harabasz索引值。

  • 自定义参数聚类数据,包括距离度量和复制的数量。

  • 自动可视化集群数据。

有关生活的一般信息编辑任务,明白了交互式任务添加到脚本

打开任务

添加集群的数据任务脚本:

  • 住编辑器选项卡上,选择任务>集群的数据

  • 在一个代码块住脚本,输入相关的关键字,例如聚类kmeans。选择集群的数据从建议命令完成。

例子

全部展开

这个例子展示了如何使用集群的数据交互式地执行任务k聚类则为指定数量的集群。

加载示例数据。数据包含的萼片和花瓣长度和宽度测量三种虹膜花。

负载fisheriris

打开集群的数据的任务。打开任务,开始输入关键字聚类在一个代码块和选择集群的数据从建议命令完成。

下拉列表中显示建议的命令完成。第三个建议列表中是集群数据的任务,和被选中。

集群的数据分成两个集群。

  • 选择变量作为输入数据。

  • 设置集群的数量2

  • 住编辑器选项卡,按运行按钮来运行的任务。

MATLAB显示集群数据和集群意味着在一个散点图。

集群任务的数据显示所选参数和结果散点图与样本数据分为两个集群。

增加集群的数量3并重新运行任务。MATLAB显示更新后的集群数据和集群意味着在一个散点图。

集群任务的数据显示所选参数和结果散点图与样本数据分为三个集群。

任务脚本生成的代码在你的生活。生成的代码反映了参数和选项,你选择,和包括代码生成散点图。生成的代码,单击向下的箭头底部的任务参数区域。扩展的任务来显示生成的代码。

生成的代码的集群数据的任务。代码使用kmeans函数集群数据和散射函数来显示结果。

默认情况下,生成的代码使用clusterIndices重心作为输出变量的名称返回到MATLAB工作区。的clusterIndices向量是一个数字列向量包含集群指数。在每一行clusterIndices显示集群分配相应的观察。的重心矩阵是一个数字矩阵包含集群的质心位置。指定一个不同的输出变量名,在摘要中输入一个新的名字线顶部的任务。例如,改变两个变量名c_indicesc_locations

第一行数据集群的任务和重命名输出c_indices c_locations用红笔圈出来的。

当任务运行时,生成的代码更新以反映新的变量名。新变量c_indicesc_locations出现在MATLAB工作区。

这个例子展示了如何使用集群的数据任务交互评估集群解决方案的基础上选定的标准。万博 尤文图斯

加载示例数据。数据包含的萼片和花瓣长度和宽度测量三种虹膜花。

负载fisheriris

打开集群的数据的任务。打开任务,开始输入关键字聚类在一个代码块和选择集群的数据从建议命令完成。

下拉列表中显示建议的命令完成。第三个建议列表中是集群数据的任务,和被选中。

评估最优数量的集群。

  • 选择变量作为输入数据。

  • 设置集群的数量选择方法最优

  • 设置最小和最大范围26

  • 住编辑器选项卡,按运行按钮来运行的任务。

MATLAB与评价结果显示一个条形图,表明,基于Calinski-Harabasz标准,最优数量的集群是3。散点图显示了集群数据和使用最优数量的集群,集群意味着3。你的结果可能有所不同。

集群数据任务显示所选参数和两个图表。图表是一个条形图显示评价结果为每个集群数量和第二个图是一个散点图与样本数据分为三个集群。

相关的例子

参数

全部展开

指定数据集群通过选择一个变量从可用的工作空间变量。变量必须是一个数字矩阵出现在列表中。

指定的方法确定最优簇数的数据。

  • 手册——指定集群的数量组你手动数据输入。

  • 最优——使用evalclusters函数找到最优数量的集群基于标准差距等价值观,轮廓值,Davies-Bouldin索引值,Calinski-Harabasz索引值。

指定数量的集群列表中评估的范围包括一个最小值和最大价值。例如,如果您指定一个最小值2和最大的价值6,任务评估集群的数量2,3,4,5,6,以确定最优数量。

显示集群数据,选择可用的选项:

  • 选择二维散点图(PCA)显示原理组件集群数据的二维散点图。的集群的数据任务使用gscatter函数创建散点图。

  • 选择矩阵散点图显示集群数据的散点图矩阵。当您选择矩阵散点图,一个列表右边的复选框。列表中的每个条目表示一个列中指定的输入数据。按下Ctrl键并选择最多4个输入数据列的列表。的集群的数据任务使用主成分分析gplotmatrix函数创建矩阵散点图从选中的列。

    的散点图矩阵比较选定的输入数据列在集群指数。矩阵的对角块直方图显示所选列的分布为每个集群指数。

提示

  • 默认情况下,集群的数据任务不会自动运行时修改参数。任务后自动运行任何改变,选择自动运行右上角按钮的任务。如果您的数据集很大,不启用该选项。

版本历史

介绍了R2021b