主要内容

PeazereElteligctionNcaclassification类

使用邻域分量分析的分类功能选择(NCA)

描述

FeatureSelectionNCAClassification对象包含邻域分量分析(NCA)模型的数据,拟合信息,特征权重和其他参数。FSCNCA使用NCA的对角自适应学习特征权值,并返回a的实例FeatureSelectionNCAClassification对象。该函数通过正则化特征权重来实现特征选择。

建设

创建一个FeatureSelectionNCAClassification物体使用FSCNCA

属性

全部展开

训练数据中的观测次数(Xy)除去后Inf值,存储为标量。

数据类型:

用于训练模型的模型参数,存储为结构。

您可以访问字段模特分析者使用点符号。

例如,对于命名的特征密集录制对象mdl,你可以访问LossFunction价值使用mdl.ModelParameters.LossFunction

数据类型:塑造

用于训练此模型的正则化参数,存储为标量。为了N观察,最好的lambda.将NCA模型的概化误差最小化的值预期为1/的倍数N

数据类型:

用于拟合该模型的拟合方法名称,存储为:

  • “准确”-使用所有数据进行拟合。

  • '没有任何'——不合适。使用此选项,可以使用调用中提供的初始特征权重来评估NCA模型的泛化误差FSCNCA

  • '平均数'- 将数据划分为分区(子集),使用每个分区使用确切的方法,并返回特征权重的平均值。您可以使用该分区指定分区数numpartitions.名称值对参数。

用于适合此模型的求解器的名称,存储为以下之一:

  • “lbfgs”- 有限的记忆泡沫 - 弗莱彻 - 戈尔科 - 桑诺(LBFGS)算法

  • 'SGD'- 随机梯度下降(SGD)算法

  • “minibatch-lbfgs”-基于LBFGS算法的随机梯度下降法在小批量生产中的应用

梯度范数的相对收敛容限“lbfgs”“minibatch-lbfgs”解算器,存储为正标量值。

数据类型:

优化的最大迭代次数,存储为正整数值。

数据类型:

最大通行证数'SGD'“minibatch-lbfgs”求解器。每个传递处理数据中的所有观察。

数据类型:

初始学习率为'SGD'“minibatch-lbfgs”解算器,存储为正实标量。学习速率从指定的initialLearningrate.

使用NumTuningIterations调整子集在调用中控制初始学习率的自动调优的名称-值对参数FSCNCA

数据类型:

详细程度级别指示符,存储为非负整数。可能的值是:

  • 0 - 没有收敛摘要

  • 1 -收敛总结,包括梯度范数和目标函数值

  • >1 -更多的收敛信息,取决于拟合算法。当你使用“minibatch-lbfgs”求解器和冗长级别> 1,收敛信息包括来自中间小贴士LBFGS的迭代日志。

数据类型:

初始特征权重,存储为aP.-by-1阳性真正的标量向量,在哪里P.预测器的数量在吗X

数据类型:

要素权重,存储为aP.-1-1的真正标量向量,在哪里P.预测器的数量在吗X

如果菲特法'平均数', 然后特征重量是一个P.——- - - - - -m矩阵。m分区的数量是否通过“NumPartitions”的调用中的名称-值对参数FSCNCA

绝对值功能重量(k)是对预测者重要性的衡量吗K..一种功能重量(k)接近0的值表示预测器K.不会影响反应y

数据类型:

Fit信息,存储为具有以下字段的结构。

字段名 意义
迭代 迭代索引
客观的 正则化的最小化目标函数
UnregularizedObjective 非正则化最小化目标函数
梯度 最小化正则化目标函数的梯度
  • 对于分类,UnregularizedObjective表示NCA分类器对训练数据的漏一准确率的负数。

  • 回归,UnregularizedObjective表示使用NCA回归模型时真实响应与预测响应之间的漏一损失。

  • “lbfgs”求解器,梯度是最后的梯度。为'SGD'“minibatch-lbfgs”求解器,梯度为最终的小批量梯度。

  • 如果菲特法'平均数', 然后FitInfo.是一个m-by-1结构数组m分区的数量是否通过“NumPartitions”名称值对参数。

您可以访问字段FitInfo.使用点表示法。例如,对于名为mdl,你可以访问客观的现场使用mdl.FitInfo.Objective

数据类型:塑造

预测器的意思,存储为P.-by-1向量用于标准化训练数据。在这种情况下预测方法中心预测矩阵X通过减去各个元素μ从每一列。

如果在培训期间数据没有标准化,那么μ是空的。

数据类型:

预测标准偏差,存储为P.-by-1向量用于标准化训练数据。在这种情况下预测方法尺度预测矩阵X通过各自的元素划分每个列σ对中后数据使用μ

如果在培训期间数据没有标准化,那么σ是空的。

数据类型:

用于培训此模型的预测值值,存储为N——- - - - - -P.矩阵。N观察的次数是多少P.是培训数据中的预测器变量的数量。

数据类型:

用于训练此模型的响应值,存储为大小的数字矢量N,其中n为观测次数。

数据类型:

用于训练此模型的观测权重,存储为大小的数值向量N.观测权之和为N

数据类型:

方法

损失 评估测试数据学习功能权重的准确性
预测 使用邻域成分分析(NCA)分类器预测响应
改装 改进邻域分量分析(NCA)模型进行分类

例子

全部收缩

加载示例数据。

加载电离层

该数据集有34个连续预测因子。响应变量是雷达返回值,标记为b(坏)或g(好)。

适合邻域分量分析(NCA)模型,用于分类以检测相关功能。

mdl = fscnca(x,y);

返回的NCA模型,mdl,是一个FeatureSelectionNCAClassification对象。该对象存储有关培训数据,模型和优化的信息。您可以使用点表示法访问对象属性,例如要素权重。

绘制特征权重。

图()图(mdl。FeatureWeights,'ro')包含('特征索引') ylabel (“功能重量”网格)

图包含轴对象。轴对象包含类型线的对象。

无关特征的权值为零。这“详细”,1呼叫中的选项FSCNCA在命令行上显示优化信息。您还可以通过绘制目标函数与迭代号来可视化优化过程。

图绘制(mdl.FitInfo.Iteration mdl.FitInfo.Objective,“ro - - - - - -”网格)xlabel(的迭代次数) ylabel ('客观的'

图包含轴对象。轴对象包含类型线的对象。

模特分析者物业是A.塑造其中包含有关模型的更多信息。您可以使用点表示法访问此属性的字段。例如,请参阅数据是否标准化。

mdl.modelparameters.standardize.
ans =.逻辑0.

0.说明在拟合NCA模型前数据未标准化。你可以标准化预测当它们在非常不同的尺度上使用“标准化”,1的调用中的名称-值对参数FSCNCA

复制语义

价值。要了解值类如何影响复制操作,请参阅复制对象

也可以看看

|||

介绍在R2016B.