功能转换技术通过将数据转变成新的功能降低数据的维度。特征选择当不可能对变量进行转换时,例如当数据中存在分类变量时,技术是可取的。有关特别适合于最小二乘拟合的特征选择技术,请参阅逐步回归。
学习特征选择算法,并探索可用于特征选择的函数。
本主题介绍了顺序特性选择,并提供了一个使用自定义条件和sequentialfs
函数。
邻里成分分析(NCA)是用于最大化的回归和分类算法的预测精度的目标选择特征的非参数方法。
通过删除预测因子而不损害模型的预测能力,从而使模型更健壮、更简单。
选择拆分,预测使用交互测试算法随机森林。
t-SNE是一种将高维数据非线性约简为二维或三维,同时保留原始数据某些特征的可视化方法。
这个例子展示了t-SNE如何创建一个有用的高维数据的低维嵌入。
这个例子展示了各种方法的效果tsne
设置。
输出功能的说明和示例对叔SNE。
因子分析是,以适应模型的多变量数据来估算的未观测到的(潜)的因素较少数量的测量变量的相互依赖性的方法。
采用因子分析,以调查是否在股票价格同行业经验相似一周到一周内的变化的公司。
这个例子说明如何进行使用统计和机器学习工具箱™因素分析。
多维尺度,您可以直观近点如何彼此对多种距离或差异性指标,可以在小维数产生的数据的表示。
用cmdscale
执行经典(公制)多维标度,也被称为主坐标分析。
这个例子说明如何使用执行经典多维尺度cmdscale
在统计和机器学习工具箱功能™。
此示例示出了如何使用多维标度(MDS)的非经典形式的可视化不相似性数据。
执行使用非经典多维尺度mdscale
。
Procrustes分析使用最优的保形欧几里得变换将地标数据之间的位置差异最小化。
使用Procrustes分析来比较两个手写数字。