特征选择是一个维数降低技术,其仅选择的测量的特征(预测变量),在对数据建模提供最佳的预测能力的子集。具有非常高维数据处理或全部功能建模时是不可取的,当它是非常有用的。
特征选择可以用来:
- 提高精度机器学习算法
- 提高在非常高维数据的表现
- 提高模型解释性
- 防止过度拟合
有以特征选择几种常见的方法:
另一个降维的方法是与描述性较差特征丢弃使用特征提取或特征的转化技术,其中将现有特征到新特征(预测变量)。
途径特征变换包括:
有关特征选择的更多信息,包括机器学习,回归和改造,见统计和机器学习工具箱™与使用MATLAB®。