降维与特征提取
主成分分析,因子分析,特征选择,特征提取等
功能转换技术通过将数据转换为新的特征来降低数据的维数。特征选择当变量的转换是不可能的,例如,当数据中有分类变量时,技术是可取的。有关特别适用于最小二乘拟合的特征选择技术,请参见逐步回归.
实时编辑任务
降低维数 | 在实时编辑器中使用主成分分析(PCA)降低维数 |
功能
对象
主题
特征选择
- 特征选择简介
了解特征选择算法,并探索可用于特征选择的功能。 - 顺序特征选择
本主题介绍了顺序特征选择,并提供了使用自定义标准和顺序选择特征的示例sequentialfs
函数。 - 邻域成分分析(NCA)特征选择
邻域成分分析(NCA)是一种以最大化回归和分类算法预测精度为目标的特征选择的非参数方法。
- 正则化判别分析分类器
在不影响模型预测能力的情况下,通过删除预测器来创建更健壮、更简单的模型。 - 选择随机森林的预测器
利用交互测试算法选择随机森林的分裂预测因子。
t-SNE多维可视化
- t-SNE
t-SNE是一种通过非线性降维到二维或三维,同时保留原始数据的一些特征来可视化高维数据的方法。 - 使用t-SNE可视化高维数据
这个例子展示了t-SNE如何为高维数据创建有用的低维嵌入。 - tsne设置
这个例子展示了各种tsne
设置。 - t-SNE输出函数
t-SNE的输出函数描述和示例。
主成分分析与典型相关
- 主成分分析(PCA)
主成分分析通过用一组新的变量替换几个相关变量来降低数据的维数,这些新变量是原始变量的线性组合。 - 使用PCA分析美国城市的生活质量
执行加权主成分分析并解释结果。
因子分析
- 因子分析
因子分析是一种将模型与多变量数据拟合的方法,以估计测量变量在较少数量的未观察(潜在)因素上的相互依赖性。 - 使用因子分析分析股票价格
使用因素分析来调查同一行业内的公司是否经历类似的每周股价变化。 - 对考试成绩进行因素分析
这个例子展示了如何使用统计和机器学习工具箱™执行因素分析。
多维标度
- 多维标度
多维缩放允许您可视化对于多种距离或不同度量,点之间的距离有多近,并可以生成少量维度的数据表示。 - 经典多维尺度
使用cmdscale
执行经典(度量)多维缩放,也称为主坐标分析。 - 经典多维尺度在非空间距离中的应用
属性来执行经典的多维缩放cmdscale
统计和机器学习工具箱™功能。 - 非经典多维尺度
这个例子展示了如何使用非经典形式的多维缩放(MDS)来可视化不同数据。 - 非经典和非度量多维尺度
执行非经典多维缩放使用mdscale
.
普罗克汝斯忒斯分析
- 使用Procrustes分析比较手写形状
使用Procrustes分析比较两个手写数字。