FeatureSelectionNCAClassification类

基于邻域成分分析(NCA)的分类特征选择

描述

功能选择NCA分类对象中包含的数据拟合信息,特征权重,以及邻域成分分析(NCA)模型的其他参数。fscnca公司使用NCA的对角线自适应学习特征权重,并返回功能选择NCA分类对象。该函数通过正则化特征权重来实现特征选择。

建筑

创建功能选择NCA分类对象使用fscnca公司.

属性

展开全部

在训练数据的观测数(是的)移除后天道酬勤值,存储为标量。

数据类型:

用于训练模型,存储为结构模型参数。

您可以访问的领域模型参数使用点符号。

例如,对于名为MDL,您可以访问LossFunction使用值mdl.ModelParameters.LossFunction.

数据类型:结构

用于训练此模型的正则化参数,存储为标量。为了n个观察,最好的兰姆达使NCA模型的泛化误差最小化的值预计为1的倍数/n个.

数据类型:

用于拟合此模型的拟合方法的名称,存储为以下之一:

  • '精确'- 执行使用所有数据的拟合。

  • '无'- 无配件。使用此选项使用在调用中提供的初始特征权评估NCA模型的泛化误差fscnca公司.

  • '平均'-将数据划分为分区(子集),使用精确方法,并返回特征权重的平均值。您可以使用数量名称-值对参数。

用于适应此模型的解算器的名称,存储为以下之一:

  • 'lbfgs'- 有限的存储器的Broyden-弗莱彻-戈德法布-Shanno无(LBFGS)算法

  • '上士'-随机梯度下降算法

  • 'minibatch-lbfgs'- 施加到微型批次,LBFGS算法随机梯度下降

在为渐变规范相对收敛容差'lbfgs''minibatch-lbfgs'解算器,存储为正标量的值。

数据类型:

迭代优化的最大数量,存储为正整数值。

数据类型:

最大通过次数'上士''minibatch-lbfgs'求解。每个传送过程中的所有数据的观察。

数据类型:

初始学习速率为'上士''minibatch-lbfgs'求解器,存储为正实标量。从指定的值开始,学习速率随着迭代而衰减InitialLearningRate.

使用数字输入TuningSubsetSize用于控制调用中初始学习率的自动调整的名称-值对参数fscnca公司.

数据类型:

详细级别指示器,存储为非负整数。可能值为:

  • 0 - 没有收敛汇总

  • 1 - 收敛摘要,包括梯度的范数和目标函数值

  • >更多的收敛信息,取决于拟合算法。当你使用'minibatch-lbfgs'解算器和详细级别>1时,收敛信息包括来自中间小批量LBFGS fits的迭代日志。

数据类型:

初始特征权重,存储为第页-正实标量的by-1向量,其中第页是中的预测数.

数据类型:

特征权重,存储为第页×1实标量,其中的矢量第页是中的预测数.

如果使用fitmethod'平均',然后FeatureWeights是一个第页-通过-矩阵。是通过'NumPartitions'调用中的名称-值对参数fscnca公司.

绝对值FeatureWeights(k)的是对预测者重要性的衡量。一个FeatureWeights(k)的值,该值接近0表示预测不影响是的.

数据类型:

拟合信息,存储为具有以下字段的结构。

字段名称 含义
迭代 迭代索引
目的 为最小化正则目标函数
非单体 最小化的非正规目标函数
梯度 为最小化正则目标函数的梯度
  • 对于分类,非单体表示训练数据上NCA分类器的漏掉一个精度的负值。

  • 对于回归,非单体表示使用NCA回归模型时,真实响应和预测响应之间的漏掉一个损失。

  • 对于'lbfgs'求解器,梯度是最后的梯度。对于'上士''minibatch-lbfgs'解算器,梯度是最后的小批量梯度。

  • 如果使用fitmethod'平均',然后菲蒂诺是一个×1结构阵列,其中是通过'NumPartitions'名称-值对参数。

您可以访问的领域菲蒂诺使用点符号。例如,对于一个名为FeatureSelectionNCAClassificationobjectMDL,您可以访问目的现场使用mdl.FitInfo.Objective.

数据类型:结构

预测手段,存储为第页×1向量标准化训练数据。在这种情况下,预测方法预测中心矩阵通过减去从每一列。

如果在培训期间数据没有标准化,则是空的。

数据类型:

预测标准偏差,存储为第页×1向量标准化训练数据。在这种情况下,预测方法尺度预测矩阵将每列除以西格玛使用定心后的数据.

如果在培训期间数据没有标准化,则西格玛是空的。

数据类型:

用于训练此模型的预测值,存储为n个-通过-第页矩阵。n个是观测值的数量和第页是训练数据中的预测变量数。

数据类型:

用于训练此模型的响应值,存储为大小的数字向量n个,其中n是观察数。

数据类型:

观察权重来训练该模型中,存储为尺寸的数值向量n个.观察权重的总和n个.

数据类型:

方法

失利 基于测试数据的学习特征权重精度评估
预测 预测使用邻里成分分析的响应(NCA)分类
重新装配 改装邻里成分分析(NCA)模型进行分类

例子

全部收缩

加载样本数据。

负载电离层

该数据集具有34个连续预测。响应变量是雷达回波,标记为B(差)或g(好)。

飞度邻里成分分析(NCA)模型进行分类检测的相关特征。

mdl=fscnca(X,Y);

返回NCA模型,MDL,是功能选择NCA分类反对。此对象存储有关训练数据、模型和优化的信息。可以使用点表示法访问对象属性,例如要素权重。

画出要素权重。

figure()绘图(mdl特性重量,“滚”)包含('功能索引')ylabel(“特征加权”)网格

的不相关特征的权重都为零。这个“详细”,1调用中的选项fscnca公司在命令行上显示优化信息。您还可以通过绘制目标函数与迭代次数之间的关系来可视化优化过程。

图形绘图(mdl.FitInfo.Iteration迭代,mdl.FitInfo.Objective目标,“滚装”)网格xlabel('迭代编号')ylabel(“目标”)

这个模型参数属性是结构包含有关模型的更多信息。您可以访问使用点符号此属性的领域。例如,查看数据是否被标准化与否。

mdl.ModelParameters.Standardize
ANS =符合逻辑的0个

0个该数据没有被拟合NCA模型之前标准化手段。当他们在使用非常不同的尺度可以规范预测'标准化',1调用中的名称-值对参数fscnca公司.

复制语义

值。要了解值类如何影响复制操作,请参阅复制对象(MATLAB)。

另见

|||

话题

引入R2016b