功能转换技术通过将数据转换成新的特征来降低数据中的维数。特征选择当变量变换不可能时,例如,当数据中有分类变量时,技术是更好的。有关特别适合于最小二乘拟合的特征选择技术,请参阅逐步回归.
了解特征选择算法并探索特征选择可用的功能。
本主题介绍了顺序特性选择,并提供了一个使用自定义标准和sequentialfs
函数。
邻域分量分析(NCA)是一种非参数的特征选择方法,其目标是最大限度地提高回归和分类算法的预测精度。
在不影响模型预测能力的情况下,通过删除预测器来建立一个更健壮、更简单的模型。
使用交互测试算法选择随机森林的分裂预测器。
t-SNE是一种将高维数据非线性约简为二维或三维,同时保留原始数据某些特征的可视化方法。
这个例子展示了t-SNE如何为高维数据创建一个有用的低维嵌入。
这个例子展示了各种tsne
设置。
t-SNE的输出函数描述和示例。
主成分分析通过将几个相关变量替换为一组新的变量,这些变量是原始变量的线性组合,从而降低了数据的维数。
进行加权主成分分析并解释结果。
因子分析是一种将模型拟合到多元数据的方法,以估计测量变量对较少数量的未观测(潜在)因素的相互依赖性。
使用因素分析来调查同一行业内的公司是否经历了类似的每周股票价格的变化。
这个例子展示了如何使用Statistics和Machine Learning Toolbox™执行因子分析。
多维尺度允许您可视化各种距离或不同度量的点之间的距离,并可以在少量维中生成数据的表示。
使用cmdscale
执行经典(度量)多维尺度,也称为主坐标分析。
方法执行经典的多维缩放cmdscale
函数的统计和机器学习工具箱™。
这个示例展示了如何使用非经典的多维尺度(MDS)形式可视化不同的数据。
使用执行非经典的多维缩放mdscale
.
Procrustes分析使用最好的保持形状的欧几里得变换将比较的地标数据之间的位置差异最小化。
使用Procrustes分析来比较两个手写数字。