功能转换技术通过将数据转换为新的特征来降低数据的维数。特征选择当变量的转换是不可能的,例如,当数据中有分类变量时,技术是可取的。有关特别适用于最小二乘拟合的特征选择技术,请参见逐步回归.
了解特征选择算法,并探索可用于特征选择的功能。
本主题介绍了顺序特征选择,并提供了使用自定义标准和顺序选择特征的示例sequentialfs
函数。
邻域成分分析(NCA)是一种以最大化回归和分类算法预测精度为目标的特征选择的非参数方法。
在不影响模型预测能力的情况下,通过删除预测器来创建更健壮、更简单的模型。
利用交互测试算法选择随机森林的分裂预测因子。
t-SNE是一种通过非线性降维到二维或三维,同时保留原始数据的一些特征来可视化高维数据的方法。
这个例子展示了t-SNE如何为高维数据创建有用的低维嵌入。
这个例子展示了各种tsne
设置。
t-SNE的输出函数描述和示例。
主成分分析通过用一组新的变量替换几个相关变量来降低数据的维数,这些新变量是原始变量的线性组合。
执行加权主成分分析并解释结果。
因子分析是一种将模型与多变量数据拟合的方法,以估计测量变量在较少数量的未观察(潜在)因素上的相互依赖性。
使用因素分析来调查同一行业内的公司是否经历类似的每周股价变化。
这个例子展示了如何使用统计和机器学习工具箱™执行因素分析。
多维缩放允许您可视化对于多种距离或不同度量,点之间的距离有多近,并可以生成少量维度的数据表示。
使用cmdscale
执行经典(度量)多维缩放,也称为主坐标分析。
属性来执行经典的多维缩放cmdscale
统计和机器学习工具箱™功能。
这个例子展示了如何使用非经典形式的多维缩放(MDS)来可视化不同数据。
执行非经典多维缩放使用mdscale
.
Procrustes分析使用最佳形状保持欧几里得变换将比较地标数据之间的位置差异最小化。
使用Procrustes分析比较两个手写数字。