聚类分析
无监督的学习技术以查找数据中的自然组和模式
聚类分析,也称为细分分析或分类分析,将样本数据分为组或集群。形成簇使同一群集中的对象相似,并且不同簇中的对象是不同的。统计和机器学习工具箱™提供了几种聚类技术和相似性的度量(也称为距离指标)创建簇。此外,集群评估使用不同的评估标准确定数据的最佳簇数。聚类可视化选项包括树状图和轮廓图。该工具箱还提供了几个异常检测识别异常值和新颖性的功能。
聚类分析基础知识
类别
- 分层聚类
产生嵌套的集群 - K-均值和K-米类聚集
通过最小化平均距离或MEDOID距离来聚集,并计算Mahalanobis距离 - 具有噪声的应用的基于密度的空间聚类
通过使用DBSCAN算法查找簇和离群值 - 光谱聚类
通过使用基于图的算法查找簇 - 高斯混合模型
基于高斯混合模型的群集使用预期最大化算法 - 最近的邻居
使用详尽的搜索或kD-Tree搜索 - 隐藏的马尔可夫模型
马尔可夫数据生成模型 - 异常检测
检测异常值和新颖性 - 聚类可视化和评估
绘制数据簇并评估最佳簇数