主要内容

降维和特征提取

主成分分析、因子分析、特征选择、特征提取等

功能转换技术通过将数据转换成新的特征来降低数据中的维数。特征选择当变量变换不可能时,例如,当数据中有分类变量时,技术是更好的。有关特别适合于最小二乘拟合的特征选择技术,请参阅逐步回归

功能

全部展开

fscchi2 单变量特征排序分类使用卡方检验
fscmrmr 使用最小冗余最大相关性(MRMR)算法对等级特征进行分类
fscnca 特征选择使用邻域成分分析进行分类
fsrftest 单变量特征排序的回归使用F测试
fsrnca 特征选择使用邻域成分分析回归
fsulaplacian 使用拉普拉斯分数的无监督学习的排名特征
partialDependence 计算部分依赖
plotPartialDependence 创建部分依赖图(PDP)和个人条件期望图(ICE)
oobPermutedPredictorImportance 分类树的随机森林的预测重要度由袋外预测观察的排列估计
oobPermutedPredictorImportance 通过对回归树随机森林的包外预测器观察的排列来估计预测器的重要性
predictorImportance 分类树中预测因子重要性的估计
predictorImportance 决策树分类集成中预测器重要性的估计
predictorImportance 对回归树预测因子重要性的估计
predictorImportance 回归集合中预测因子重要性的估计
relieff 使用ReliefF或RReliefF算法对预测因子的重要性进行排序
sequentialfs 使用自定义标准的顺序特征选择
stepwiselm 进行逐步回归
stepwiseglm 通过逐步回归建立广义线性回归模型
黎加 基于重构ICA的特征提取
sparsefilt 利用稀疏滤波进行特征提取
变换 将预测器转换为提取的特征
tsne t分布随机邻居嵌入
巴特 巴特利特的测试
canoncorr 典型相关
主成分分析 原始数据的主成分分析
pcacov 协方差矩阵的主成分分析
pcares 主成分分析的残差
车牌提取 概率主成分分析
factoran 因子分析
rotatefactors 旋转因子载荷
nnmf 非负矩阵分解
cmdscale 经典多维标度
泰姬陵 Mahalanobis距离
mdscale 模多维标度
pdist 成对观察值之间的成对距离
squareform 格式的距离矩阵
普罗克汝斯忒斯 普罗克汝斯忒斯分析

对象

全部展开

FeatureSelectionNCAClassification 基于邻域分量分析(NCA)的分类特征选择
FeatureSelectionNCARegression 基于邻域成分分析(NCA)的回归特征选择
ReconstructionICA 基于重构ICA的特征提取
SparseFiltering 基于稀疏滤波的特征提取

主题

特征选择

特征选择简介

了解特征选择算法并探索特征选择可用的功能。

连续的特征选择

本主题介绍了顺序特性选择,并提供了一个使用自定义标准和sequentialfs函数。

邻域成分分析(NCA)特征选择

邻域分量分析(NCA)是一种非参数的特征选择方法,其目标是最大限度地提高回归和分类算法的预测精度。

正则化判别分析分类器

在不影响模型预测能力的情况下,通过删除预测器来建立一个更健壮、更简单的模型。

选择随机森林的预测器

使用交互测试算法选择随机森林的分裂预测器。

特征提取

特征提取

特征提取是一套从数据中提取高级特征的方法。

特征提取工作流程

这个例子展示了从图像数据中提取特征的完整工作流。

提取混合信号

这个例子展示了如何使用黎加解开混合的音频信号。

t-SNE多维可视化

t-SNE

t-SNE是一种将高维数据非线性约简为二维或三维,同时保留原始数据某些特征的可视化方法。

使用t-SNE可视化高维数据

这个例子展示了t-SNE如何为高维数据创建一个有用的低维嵌入。

tsne设置

这个例子展示了各种tsne设置。

t-SNE输出函数

t-SNE的输出函数描述和示例。

主成分分析与典型相关

主成分分析(PCA)

主成分分析通过将几个相关变量替换为一组新的变量,这些变量是原始变量的线性组合,从而降低了数据的维数。

使用PCA分析美国城市的生活质量

进行加权主成分分析并解释结果。

因子分析

因子分析

因子分析是一种将模型拟合到多元数据的方法,以估计测量变量对较少数量的未观测(潜在)因素的相互依赖性。

运用因素分析分析股票价格

使用因素分析来调查同一行业内的公司是否经历了类似的每周股票价格的变化。

对考试成绩进行因素分析

这个例子展示了如何使用Statistics和Machine Learning Toolbox™执行因子分析。

非负矩阵分解

非负矩阵分解

非负矩阵分解NMF)是一种基于特征空间低秩近似的降维技术。

执行非负矩阵分解

使用乘法和交替最小二乘算法执行非负矩阵分解。

多维标度

多维标度

多维尺度允许您可视化各种距离或不同度量的点之间的距离,并可以在少量维中生成数据的表示。

经典多维标度

使用cmdscale执行经典(度量)多维尺度,也称为主坐标分析。

应用于非空间距离的经典多维尺度

方法执行经典的多维缩放cmdscale函数的统计和机器学习工具箱™。

模多维标度

这个示例展示了如何使用非经典的多维尺度(MDS)形式可视化不同的数据。

非经典和非度量多维尺度

使用执行非经典的多维缩放mdscale

普罗克汝斯忒斯分析

普罗克汝斯忒斯分析

Procrustes分析使用最好的保持形状的欧几里得变换将比较的地标数据之间的位置差异最小化。

使用Procrustes分析比较手写形状

使用Procrustes分析来比较两个手写数字。

特色的例子