无人监督的学习

查找数据中的隐藏模式或内部结构

无监督的学习是一种机器学习算法,用于借鉴数据集的推论,而没有人为干预,相反,监督学习与数据一起提供标签。

最常见的无监督学习方法是聚类分析,应用群集方法来探索数据并查找数据中的隐藏模式或分组。

使用MATLAB,您可以应用许多流行的聚类算法:

  • 分层群集:通过创建群集树构建多级层次结构
  • k均值K-medoids聚类:将数据分区为K.基于距离的不同簇。
  • 高斯混合模型:模型簇作为多变量正常密度分量的混合
  • 基于密度的空间聚类(DBSCAN):在高密度的区域彼此接近的群体点,在低密度区域中跟踪异常值
  • 自组织地图:使用学习数据拓扑和分发的神经网络
  • 光谱聚类:基于图形的群集,可以处理任意非凸形形状

应用无监督学习的其他方法包括半监督学习和无监督的特征排名。半监督学习减少了对监督学习中标记数据的需求。应用于整个数据集的聚类在标记和未标记的数据之间建立了相似性,并且标签传播到以前未标记的和类似的集群成员。

无监督的特征排名为没有给定预测目标或响应的特征分配分数。马铃薯®统计和机器学习工具箱™万博1manbetx支持使用拉普拉斯分数的无监督排名。

关键点

  • 无监督的学习通常在监督学习之前应用,以确定探索性数据分析中的功能,并根据分组建立类。
  • K-means和分层群集仍然受欢迎。只有某些聚类方法可以处理任意非凸面形状,包括MATLAB中支持的非凸面形状:DBSCAN,分层和光谱群集。万博1manbetx
  • 无监督的学习(聚类)也可用于压缩数据。
  • 无监督的特征排名可用于更有效地应用于大数据集的基于距离的聚类。

也可以看看:统计和机器学习工具箱用matlab学习图像处理工具箱