聚类分析
无监督学习技术,发现数据中的自然分组和模式
聚类分析,也称为分割分析或分类学分析,将样本数据划分为组,或集群.聚类的形成是这样的:同一聚类中的对象是相似的,而不同聚类中的对象是不同的。统计和机器学习工具箱™提供了几种聚类技术和相似性度量(也称为距离度量),以创建集群。此外,集群评价使用不同的评估标准确定数据的最佳聚类数量。集群可视化选项包括树状图和剪影图。工具箱还提供了一些异常检测用于识别异常值和新奇性的特性。
聚类分析基础
类别
- 分层聚类
生成嵌套的集群集 - k-Means和k-Medoids聚类
通过最小化平均距离或中位数距离进行聚类,并计算马氏距离 - 带有噪声的基于密度的空间聚类应用
使用DBSCAN算法查找集群和异常值 - 谱聚类
利用基于图的算法查找聚类 - 高斯混合模型
基于高斯混合模型的聚类,使用期望-最大化算法 - 最近的邻居
使用穷尽搜索或找到最近的邻居Kd-tree搜索 - 隐马尔可夫模型
用于数据生成的马尔可夫模型 - 异常检测
发现异常点和新奇点 - 聚类可视化与评价
绘制数据簇并评估最佳簇数