主成分分析(PCA)

一个多变量统计所固有的困难是可视化有许多变量数据的问题。在MATLAB®功能情节显示两个变量之间的关系的曲线图。该plot3冲浪命令显示不同的三维视图。但是,当有超过三个变量,更很难想象他们之间的关系。

幸运的是,在数据集的许多变量,变量组经常一起移动。这其中的一个原因是,不止一个变量可能被测量该制度的行为相同的驱动原理。在许多系统中有只有几个这样的驱动力。但是仪器的丰富可以测量几十个系统变量。发生这种情况时,你可以利用这个信息冗余的优势。你可以通过一个单一的新的变量替换一组变量简化问题。

主成分分析是用于实现这种简化一个定量严格的方法。该方法生成一组新的变量,称为主成分。每个主成分是原始变量的线性组合。所有的主要成分是互相正交的,所以不存在冗余信息。主要部件作为一个整体形式的数据的空间的正交基。

有很多方法来构造正交基础数据的多个列的无限数量。有什么特别之处主要成分的基础?

第一主成分是在空间中的单个轴线。当你的项目在该轴上每个观察,得到的值形成一个新的变量。和该变量的方差是所述第一轴的所有可能的选择中的最大值。

第二主成分是在空间的另一轴,垂直于第一。突出于该轴线的意见生成另一新的变量。这个变量的方差是该第二轴的所有可能的选择中的最大值。

全套主要成分是大的原设定的变量。但它是总和司空见惯的前几个主成分的方差超过原始数据的总方差的80%。通过检查这几个新变量的地块中,研究人员经常开发出生成的原始数据的驱动力更深入的了解。

您可以使用该功能PCA发现的主要构成。要使用PCA,你需要有你想要分析的实际测量数据。但是,如果你缺乏实际数据,但有样本协方差或相关矩阵的数据,你仍然可以使用的功能pcacov进行主成分分析。请参阅参考页pcacov为它的输入和输出的描述。

也可以看看

|||

相关话题