功能转换技术通过将数据转换成新的特征来降低数据中的维数。特征选择当变量变换不可能时,例如,当数据中有分类变量时,技术是更好的。有关特别适合于最小二乘拟合的特征选择技术,请参阅逐步回归.
FeatureSelectionNCAClassification |
基于邻域分量分析(NCA)的分类特征选择 |
FeatureSelectionNCARegression |
基于邻域成分分析(NCA)的回归特征选择 |
ReconstructionICA |
基于重构ICA的特征提取 |
SparseFiltering |
基于稀疏滤波的特征提取 |
在NCA中使用自定义鲁棒损失函数进行对离群值鲁棒的特征选择。
邻域分量分析(NCA)是一种非参数和嵌入的特征选择方法,其目标是最大限度地提高回归和分类算法的预测精度。
了解特征选择算法,如序列特征选择。
这个例子展示了t-SNE如何为高维数据创建一个有用的低维嵌入。
这个例子展示了各种tsne
设置。
t-SNE是一种将高维数据非线性约简为二维或三维,同时保留原始数据某些特征的可视化方法。
t-SNE的输出函数描述和示例。
进行加权主成分分析并解释结果。
通过实例说明了如何应用偏最小二乘回归(Partial Least Squares Regression, PLSR)和主成分回归(Principal Components Regression, PCR),并讨论了这两种方法的有效性。
主成分分析通过将几个相关变量替换为一组新的变量,这些变量是原始变量的线性组合,从而降低了数据的维数。
使用因素分析来调查同一行业内的公司是否经历了类似的每周股票价格的变化。
因子分析是一种将模型拟合到多元数据的方法,以估计测量变量对较少数量的未观测(潜在)因素的相互依赖性。
使用cmdscale
执行经典(度量)多维尺度,也称为主坐标分析。
多维尺度允许您可视化各种距离或不同度量的点之间的距离,并可以在少量维中生成数据的表示。
使用执行非经典的多维缩放mdscale
.
使用Procrustes分析来比较两个手写数字。
Procrustes分析使用最佳形状保持的欧几里得变换将比较的地标数据之间的位置差异最小化