帮助中心帮助中心

降维与特征提取

主成分分析，因子分析，特征选择，特征提取等

功能转换技术通过将数据转换为新的特征来降低数据的维数。特征选择当变量的转换是不可能的，例如，当数据中有分类变量时，技术是可取的。有关特别适用于最小二乘拟合的特征选择技术，请参见逐步回归．

实时编辑任务

降低维数	在实时编辑器中使用主成分分析(PCA)降低维数

功能

特征选择

`fscchi2`	使用卡方检验进行单变量特征排序分类
`fscmrmr`	采用最小冗余最大相关性(MRMR)算法对特征进行分类排序
`fscnca`	使用邻域成分分析进行特征选择分类
`fsrftest`	用于回归的单变量特征排序F测试
`fsrmrmr`	采用最小冗余最大相关性(MRMR)算法对特征进行秩回归
`fsrnca`	使用邻域成分分析进行回归的特征选择
`fsulaplacian`	使用拉普拉斯分数对无监督学习进行排序
`partialDependence`	计算部分依赖关系
`plotPartialDependence`	创建部分依赖图(PDP)和个别条件期望图(ICE)
`oobPermutedPredictorImportance`	通过对随机森林分类树的袋外预测器观测的排列估计预测器重要性
`oobPermutedPredictorImportance`	通过对随机森林的回归树的袋外预测器观测的排列估计预测器重要性
`predictorImportance`	分类树预测因子重要性的估计
`predictorImportance`	决策树分类集合中预测因子重要性的估计
`predictorImportance`	回归树预测因子重要性的估计
`predictorImportance`	回归集合预测因子重要性的估计
`relieff`	使用ReliefF或RReliefF算法对预测因子的重要性进行排序
`sequentialfs`	使用自定义标准的顺序特征选择
`stepwiselm`	执行逐步回归
`stepwiseglm`	通过逐步回归建立广义线性回归模型

特征提取

`黎加`	基于重构ICA的特征提取
`sparsefilt`	基于稀疏滤波的特征提取
`变换`	将预测器转换为提取的特征

t-SNE多维可视化

tsne t分布随机邻居嵌入

主成分分析与典型相关

`巴特`	巴特利特的测试
`canoncorr`	典型相关
`主成分分析`	原始数据的主成分分析
`pcacov`	协方差矩阵的主成分分析
`pcares`	主成分分析的残差
`车牌提取`	概率主成分分析

因子分析

`factoran`	因子分析
`rotatefactors`	旋转因子负荷

非负矩阵分解

nnmf 非负矩阵分解

多维标度

`cmdscale`	经典多维标度
`泰姬陵`	与参考样本的马氏距离
`mdscale`	非经典多维尺度
`pdist`	成对观测值之间的距离
`squareform`	格式距离矩阵

普罗克汝斯忒斯分析

普罗克汝斯忒斯 普罗克汝斯忒斯分析

对象

特征选择

`FeatureSelectionNCAClassification`	基于邻域成分分析(NCA)的分类特征选择
`FeatureSelectionNCARegression`	使用邻域成分分析(NCA)进行回归的特征选择

特征提取

`ReconstructionICA`	基于重构ICA的特征提取
`SparseFiltering`	稀疏滤波特征提取

主题

特征选择

特征选择简介
了解特征选择算法，并探索可用于特征选择的功能。
顺序特征选择
本主题介绍了顺序特征选择，并提供了使用自定义标准和顺序选择特征的示例sequentialfs函数。
邻域成分分析(NCA)特征选择
邻域成分分析(NCA)是一种以最大化回归和分类算法预测精度为目标的特征选择的非参数方法。
- 使用NCA进行回归的鲁棒特征选择
- 调整正则化参数，使用NCA进行分类
正则化判别分析分类器
在不影响模型预测能力的情况下，通过删除预测器来创建更健壮、更简单的模型。
选择随机森林的预测器
利用交互测试算法选择随机森林的分裂预测因子。

特征提取

特征提取
特征提取是从数据中提取高级特征的一套方法。
特征提取流程
这个例子展示了从图像数据中提取特征的完整工作流。
提取混合信号
这个例子展示了如何使用黎加解杂音频信号。

t-SNE多维可视化

t-SNE
t-SNE是一种通过非线性降维到二维或三维，同时保留原始数据的一些特征来可视化高维数据的方法。
使用t-SNE可视化高维数据
这个例子展示了t-SNE如何为高维数据创建有用的低维嵌入。
tsne设置
这个例子展示了各种tsne设置。
t-SNE输出函数
t-SNE的输出函数描述和示例。

主成分分析与典型相关

主成分分析(PCA)
主成分分析通过用一组新的变量替换几个相关变量来降低数据的维数，这些新变量是原始变量的线性组合。
使用PCA分析美国城市的生活质量
执行加权主成分分析并解释结果。

因子分析

因子分析
因子分析是一种将模型与多变量数据拟合的方法，以估计测量变量在较少数量的未观察(潜在)因素上的相互依赖性。
使用因子分析分析股票价格
使用因素分析来调查同一行业内的公司是否经历类似的每周股价变化。
对考试成绩进行因素分析
这个例子展示了如何使用统计和机器学习工具箱™执行因素分析。

非负矩阵分解

非负矩阵分解
非负矩阵分解（NMF)是一种基于特征空间低秩逼近的降维技术。
执行非负矩阵分解
使用乘法和交替最小二乘算法执行非负矩阵分解。

多维标度

多维标度
多维缩放允许您可视化对于多种距离或不同度量，点之间的距离有多近，并可以生成少量维度的数据表示。
经典多维尺度
使用cmdscale执行经典(度量)多维缩放，也称为主坐标分析。
经典多维尺度在非空间距离中的应用
属性来执行经典的多维缩放cmdscale统计和机器学习工具箱™功能。
非经典多维尺度
这个例子展示了如何使用非经典形式的多维缩放(MDS)来可视化不同数据。
非经典和非度量多维尺度
执行非经典多维缩放使用mdscale．

普罗克汝斯忒斯分析

使用Procrustes分析比较手写形状
使用Procrustes分析比较两个手写数字。

特色的例子

选择分类高维数据的特征

选择分类高维数据的特征

选择用于分类高维数据的特征。更具体地说，它展示了如何执行序列特征选择，这是最流行的特征选择算法之一。它还展示了如何使用保留和交叉验证来评估所选特征的性能。

打开实时脚本

偏最小二乘回归与主成分回归

偏最小二乘回归与主成分回归

应用偏最小二乘回归(PLSR)和主成分回归(PCR)，探讨两种方法的有效性。

打开实时脚本

用主成分分析拟合正交回归

用主成分分析拟合正交回归

使用主成分分析(PCA)拟合线性回归。PCA使数据与拟合模型之间的垂直距离最小化。这是所谓的正交回归或总最小二乘的线性情况，适用于预测变量和响应变量之间没有自然区别，或当所有变量都有误差测量时。这与通常的回归假设相反，预测变量是精确测量的，只有响应变量有误差成分。

打开实时脚本