降维与特征提取
主成分分析,因子分析,特征选择,特征提取等
功能转换技术通过将数据转换为新的特征来降低数据的维数。特征选择当变量的转换是不可能的,例如,当数据中有分类变量时,技术是可取的。有关特别适用于最小二乘拟合的特征选择技术,请参见逐步回归.
功能
特征选择
fscnca |
使用邻域成分分析进行特征选择分类 |
fsrnca |
使用邻域成分分析进行回归的特征选择 |
sequentialfs |
顺序特征选择 |
relieff |
利用ReliefF算法计算属性(预测因子)的重要性 |
特征提取
黎加 |
基于重构ICA的特征提取 |
sparsefilt |
基于稀疏滤波的特征提取 |
变换 |
将预测器转换为提取的特征 |
t-SNE多维可视化
tsne |
t分布随机邻居嵌入 |
主成分分析与典型相关
因子分析
factoran |
因子分析 |
rotatefactors |
旋转因子负荷 |
非负矩阵分解
nnmf |
非负矩阵分解 |
多维标度
cmdscale |
经典多维标度 |
泰姬陵 |
Mahalanobis距离 |
mdscale |
非经典多维尺度 |
pdist |
成对观测值之间的距离 |
squareform |
格式距离矩阵 |
普罗克汝斯忒斯分析
普罗克汝斯忒斯 |
普罗克汝斯忒斯分析 |
类
FeatureSelectionNCAClassification |
基于邻域成分分析(NCA)的分类特征选择 |
FeatureSelectionNCARegression |
使用邻域成分分析(NCA)进行回归的特征选择 |
使用对象
ReconstructionICA |
基于重构ICA的特征提取 |
SparseFiltering |
稀疏滤波特征提取 |
主题
特征选择
在NCA中使用自定义鲁棒损失函数执行对异常值鲁棒的特征选择。
邻域成分分析(NCA)是一种非参数的嵌入式特征选择方法,目的是最大限度地提高回归和分类算法的预测精度。
t-SNE多维可视化
这个例子展示了t-SNE如何为高维数据创建有用的低维嵌入。
这个例子展示了各种tsne
设置。
t-SNE是一种通过非线性降维到二维或三维,同时保留原始数据的一些特征来可视化高维数据的方法。
t-SNE的输出函数描述和示例。
主成分分析与典型相关
执行加权主成分分析并解释结果。
本例说明了如何应用偏最小二乘回归(PLSR)和主成分回归(PCR),并讨论了这两种方法的有效性。
主成分分析通过用一组新的变量替换几个相关变量来降低数据的维数,这些新变量是原始变量的线性组合。
因子分析
使用因素分析来调查同一行业内的公司是否经历类似的每周股价变化。
因子分析是一种将模型与多变量数据拟合的方法,以估计测量变量在较少数量的未观察(潜在)因素上的相互依赖性。
多维标度
使用cmdscale
执行经典(度量)多维缩放,也称为主坐标分析。
多维缩放允许您可视化对于多种距离或不同度量,点之间的距离有多近,并可以生成少量维度的数据表示。
执行非经典多维缩放使用mdscale
.
普罗克汝斯忒斯分析
使用Procrustes分析比较两个手写数字。
Procrustes分析使用最佳形状保持欧几里得变换将比较地标数据之间的位置差异最小化
这个话题有用吗?