降维和特征提取

主成分分析、因子分析、特征选择、特征提取等

功能转换技术通过将数据转换成新的特征来降低数据中的维数。特征选择当变量变换不可能时，例如，当数据中有分类变量时，技术是更好的。有关特别适合于最小二乘拟合的特征选择技术，请参阅逐步回归．

功能

特征选择

`fscchi2`	单变量特征排序分类使用卡方检验
`fscmrmr`	使用最小冗余最大相关性(MRMR)算法对等级特征进行分类
`fscnca`	特征选择使用邻域成分分析进行分类
`fsrftest`	单变量特征排序的回归使用F测试
`fsrnca`	特征选择使用邻域成分分析回归
`fsulaplacian`	使用拉普拉斯分数的无监督学习的排名特征
`partialDependence`	计算部分依赖
`plotPartialDependence`	创建部分依赖图(PDP)和个人条件期望图(ICE)
`oobPermutedPredictorImportance`	分类树的随机森林的预测重要度由袋外预测观察的排列估计
`oobPermutedPredictorImportance`	通过对回归树随机森林的包外预测器观察的排列来估计预测器的重要性
`predictorImportance`	分类树中预测因子重要性的估计
`predictorImportance`	决策树分类集成中预测器重要性的估计
`predictorImportance`	对回归树预测因子重要性的估计
`predictorImportance`	回归集合中预测因子重要性的估计
`relieff`	使用ReliefF或RReliefF算法对预测因子的重要性进行排序
`sequentialfs`	使用自定义标准的顺序特征选择
`stepwiselm`	进行逐步回归
`stepwiseglm`	通过逐步回归建立广义线性回归模型

特征提取

`黎加`	基于重构ICA的特征提取
`sparsefilt`	利用稀疏滤波进行特征提取
`变换`	将预测器转换为提取的特征

t-SNE多维可视化

tsne t分布随机邻居嵌入

主成分分析与典型相关

`巴特`	巴特利特的测试
`canoncorr`	典型相关
`主成分分析`	原始数据的主成分分析
`pcacov`	协方差矩阵的主成分分析
`pcares`	主成分分析的残差
`车牌提取`	概率主成分分析

因子分析

`factoran`	因子分析
`rotatefactors`	旋转因子载荷

非负矩阵分解

nnmf 非负矩阵分解

多维标度

`cmdscale`	经典多维标度
`泰姬陵`	Mahalanobis距离
`mdscale`	模多维标度
`pdist`	成对观察值之间的成对距离
`squareform`	格式的距离矩阵

普罗克汝斯忒斯分析

普罗克汝斯忒斯 普罗克汝斯忒斯分析

对象

全部展开

特征选择

`FeatureSelectionNCAClassification`	基于邻域分量分析(NCA)的分类特征选择
`FeatureSelectionNCARegression`	基于邻域成分分析(NCA)的回归特征选择

特征提取

`ReconstructionICA`	基于重构ICA的特征提取
`SparseFiltering`	基于稀疏滤波的特征提取

主题

特征选择

特征选择简介

了解特征选择算法并探索特征选择可用的功能。

连续的特征选择

本主题介绍了顺序特性选择，并提供了一个使用自定义标准和sequentialfs函数。

邻域成分分析(NCA)特征选择

邻域分量分析(NCA)是一种非参数的特征选择方法，其目标是最大限度地提高回归和分类算法的预测精度。

正则化判别分析分类器

在不影响模型预测能力的情况下，通过删除预测器来建立一个更健壮、更简单的模型。

选择随机森林的预测器

使用交互测试算法选择随机森林的分裂预测器。

特征提取

特征提取

特征提取是一套从数据中提取高级特征的方法。

特征提取工作流程

这个例子展示了从图像数据中提取特征的完整工作流。

提取混合信号

这个例子展示了如何使用黎加解开混合的音频信号。

t-SNE多维可视化

t-SNE

t-SNE是一种将高维数据非线性约简为二维或三维，同时保留原始数据某些特征的可视化方法。

使用t-SNE可视化高维数据

这个例子展示了t-SNE如何为高维数据创建一个有用的低维嵌入。

tsne设置

这个例子展示了各种tsne设置。

t-SNE输出函数

t-SNE的输出函数描述和示例。

主成分分析与典型相关

主成分分析(PCA)

主成分分析通过将几个相关变量替换为一组新的变量，这些变量是原始变量的线性组合，从而降低了数据的维数。

使用PCA分析美国城市的生活质量

进行加权主成分分析并解释结果。

因子分析

因子分析

因子分析是一种将模型拟合到多元数据的方法，以估计测量变量对较少数量的未观测(潜在)因素的相互依赖性。

运用因素分析分析股票价格

使用因素分析来调查同一行业内的公司是否经历了类似的每周股票价格的变化。

对考试成绩进行因素分析

这个例子展示了如何使用Statistics和Machine Learning Toolbox™执行因子分析。

非负矩阵分解

非负矩阵分解

非负矩阵分解（NMF)是一种基于特征空间低秩近似的降维技术。

执行非负矩阵分解

使用乘法和交替最小二乘算法执行非负矩阵分解。

多维标度

多维标度

多维尺度允许您可视化各种距离或不同度量的点之间的距离，并可以在少量维中生成数据的表示。

经典多维标度

使用cmdscale执行经典(度量)多维尺度，也称为主坐标分析。

应用于非空间距离的经典多维尺度

方法执行经典的多维缩放cmdscale函数的统计和机器学习工具箱™。

模多维标度

这个示例展示了如何使用非经典的多维尺度(MDS)形式可视化不同的数据。

非经典和非度量多维尺度

使用执行非经典的多维缩放mdscale．

普罗克汝斯忒斯分析

普罗克汝斯忒斯分析

Procrustes分析使用最好的保持形状的欧几里得变换将比较的地标数据之间的位置差异最小化。

使用Procrustes分析比较手写形状

使用Procrustes分析来比较两个手写数字。

特色的例子

选择特征对高维数据进行分类

选择用于分类高维数据的特征。更具体地说，它展示了如何进行序列特征选择，这是目前最流行的特征选择算法之一。它还展示了如何使用抵制和交叉验证来评估所选特性的性能。

打开生活的脚本

偏最小二乘回归和主成分回归

应用偏最小二乘回归(PLSR)和主成分回归(PCR)，讨论了两种方法的有效性。PLSR和PCR都是在有大量预测变量时建模响应变量的方法，这些预测变量高度相关甚至共线。这两种方法都构建新的预测变量，称为分量，作为原始预测变量的线性组合，但它们构建这些分量的方式不同。PCR创造了解释预测变量中观察到的变异性的成分，而完全不考虑响应变量。另一方面，PLSR确实考虑了响应变量，因此往往导致模型能够用更少的组件来拟合响应变量。就其实际应用而言，这最终是否会转化为一种更节俭的模式，取决于环境。

打开脚本

用主成分分析拟合正交回归

使用主成分分析(PCA)拟合线性回归。PCA最小化了数据到拟合模型的垂直距离。这就是所谓的正交回归或总最小二乘的线性情况，当预测器和响应变量之间没有自然区别，或所有变量都有误差时，这是合适的。这与通常的回归假设相反，即预测变量是精确测量的，只有响应变量有误差成分。

打开生活的脚本

降维和特征提取

功能

特征选择

特征提取

t-SNE多维可视化

主成分分析与典型相关

因子分析

非负矩阵分解

多维标度

普罗克汝斯忒斯分析

对象

特征选择

特征提取

主题

特征选择

特征提取

t-SNE多维可视化

主成分分析与典型相关

因子分析

非负矩阵分解

多维标度

普罗克汝斯忒斯分析

特色的例子

选择特征对高维数据进行分类

偏最小二乘回归和主成分回归

用主成分分析拟合正交回归

统计和机器学习工具箱文档

万博1manbetx

掌握机器学习:一步一步的指导与MATLAB