主要内容

降维与特征提取

主成分分析,因子分析,特征选择,特征提取等

功能转换技术通过将数据转换为新的特征来降低数据的维数。特征选择当变量的转换是不可能的,例如,当数据中有分类变量时,技术是可取的。有关特别适用于最小二乘拟合的特征选择技术,请参见逐步回归

功能

全部展开

fscchi2 使用卡方检验进行单变量特征排序分类
fscmrmr 采用最小冗余最大相关性(MRMR)算法对特征进行分类排序
fscnca 使用邻域成分分析进行特征选择分类
fsrftest 用于回归的单变量特征排序F测试
fsrnca 使用邻域成分分析进行回归的特征选择
fsulaplacian 使用拉普拉斯分数对无监督学习进行排序
partialDependence 计算部分依赖关系
plotPartialDependence 创建部分依赖图(PDP)和个别条件期望图(ICE)
oobPermutedPredictorImportance 通过对随机森林分类树的袋外预测器观测的排列估计预测器重要性
oobPermutedPredictorImportance 通过对随机森林的回归树的袋外预测器观测的排列估计预测器重要性
predictorImportance 分类树预测因子重要性的估计
predictorImportance 决策树分类集合中预测因子重要性的估计
predictorImportance 回归树预测因子重要性的估计
predictorImportance 回归集合预测因子重要性的估计
relieff 使用ReliefF或RReliefF算法对预测因子的重要性进行排序
sequentialfs 使用自定义标准的顺序特征选择
stepwiselm 执行逐步回归
stepwiseglm 通过逐步回归建立广义线性回归模型
黎加 基于重构ICA的特征提取
sparsefilt 基于稀疏滤波的特征提取
变换 将预测器转换为提取的特征
tsne t分布随机邻居嵌入
巴特 巴特利特的测试
canoncorr 典型相关
主成分分析 原始数据的主成分分析
pcacov 协方差矩阵的主成分分析
pcares 主成分分析的残差
车牌提取 概率主成分分析
factoran 因子分析
rotatefactors 旋转因子负荷
nnmf 非负矩阵分解
cmdscale 经典多维标度
泰姬陵 Mahalanobis距离
mdscale 非经典多维尺度
pdist 成对观测值之间的距离
squareform 格式距离矩阵
普罗克汝斯忒斯 普罗克汝斯忒斯分析

对象

全部展开

FeatureSelectionNCAClassification 基于邻域成分分析(NCA)的分类特征选择
FeatureSelectionNCARegression 使用邻域成分分析(NCA)进行回归的特征选择
ReconstructionICA 基于重构ICA的特征提取
SparseFiltering 稀疏滤波特征提取

主题

特征选择

特征选择简介

了解特征选择算法,并探索可用于特征选择的功能。

顺序特征选择

本主题介绍了顺序特征选择,并提供了使用自定义标准和顺序选择特征的示例sequentialfs函数。

邻域成分分析(NCA)特征选择

邻域成分分析(NCA)是一种以最大化回归和分类算法预测精度为目标的特征选择的非参数方法。

正则化判别分析分类器

在不影响模型预测能力的情况下,通过删除预测器来创建更健壮、更简单的模型。

选择随机森林的预测器

利用交互测试算法选择随机森林的分裂预测因子。

特征提取

特征提取

特征提取是从数据中提取高级特征的一套方法。

特征提取流程

这个例子展示了从图像数据中提取特征的完整工作流。

提取混合信号

这个例子展示了如何使用黎加解杂音频信号。

t-SNE多维可视化

t-SNE

t-SNE是一种通过非线性降维到二维或三维,同时保留原始数据的一些特征来可视化高维数据的方法。

使用t-SNE可视化高维数据

这个例子展示了t-SNE如何为高维数据创建有用的低维嵌入。

tsne设置

这个例子展示了各种tsne设置。

t-SNE输出函数

t-SNE的输出函数描述和示例。

主成分分析与典型相关

主成分分析(PCA)

主成分分析通过用一组新的变量替换几个相关变量来降低数据的维数,这些新变量是原始变量的线性组合。

使用PCA分析美国城市的生活质量

执行加权主成分分析并解释结果。

因子分析

因子分析

因子分析是一种将模型与多变量数据拟合的方法,以估计测量变量在较少数量的未观察(潜在)因素上的相互依赖性。

使用因子分析分析股票价格

使用因素分析来调查同一行业内的公司是否经历类似的每周股价变化。

对考试成绩进行因素分析

这个例子展示了如何使用统计和机器学习工具箱™执行因素分析。

非负矩阵分解

非负矩阵分解

非负矩阵分解NMF)是一种基于特征空间低秩逼近的降维技术。

执行非负矩阵分解

使用乘法和交替最小二乘算法执行非负矩阵分解。

多维标度

多维标度

多维缩放允许您可视化对于多种距离或不同度量,点之间的距离有多近,并可以生成少量维度的数据表示。

经典多维尺度

使用cmdscale执行经典(度量)多维缩放,也称为主坐标分析。

经典多维尺度在非空间距离中的应用

属性来执行经典的多维缩放cmdscale统计和机器学习工具箱™功能。

非经典多维尺度

这个例子展示了如何使用非经典形式的多维缩放(MDS)来可视化不同数据。

非经典和非度量多维尺度

执行非经典多维缩放使用mdscale

普罗克汝斯忒斯分析

普罗克汝斯忒斯分析

Procrustes分析使用最佳形状保持欧几里得变换将比较地标数据之间的位置差异最小化。

使用Procrustes分析比较手写形状

使用Procrustes分析比较两个手写数字。

特色的例子