主要内容

resubEdge

Resubstitution分类边缘

    描述

    例子

    e= resubEdge (MDL.返回加权再替换分类的优势e)对于训练有素的分类模型MDL.使用存储在Mdl。X,存储在相应的真实类标签Mdl。Y和存储在的观察权重Mdl。W

    例子

    e= resubEdge (MDL.,'incorment interaction',includeInteractions指定是否在计算中包含交互项。此语法仅适用于广义可加模型。

    例子

    全部收缩

    加载电离层数据集。该数据集有34个预测器和351个雷达返回的二进制响应,或坏(“b”)或好('G')。

    负载电离层

    列车支持向量机(万博1manbetxSVM)分类器。标准化数据并指定该数据'G'是积极类。

    SVMModel = fitcsvm (X, Y,'标准化',真的,'classnames',{“b”'G'});

    svmmodel.是一个培训分类VM.分类器。

    估计重新提交边缘,这是训练样本边缘的平均值。

    E = ResubEdge(SVMMODEL)
    E = 5.0999.

    分类器边缘测量分类器边距的平均值。执行特征选择的一种方法是将培训来自多个模型的培训采样边缘进行比较。仅基于此标准,具有最高边缘的分类器是最佳分类器。

    加载电离层数据集。删除前两个预测因子以稳定。

    负载电离层X = X(:, 3:结束);

    定义这两个数据集:

    • fullX包含所有预测器。

    • partX包含10个最重要的预测因素。

    fullX = X;idx = fscmrmr (X, Y);partX = X (:, idx (1:10));

    为每个预测仪设置训练一个天真的贝母分类器。

    FullMdl = fitcnb (fullX Y);PartMdl = fitcnb (partX Y);

    FullMdlpartmdl.被训练ClassificationNaiveBayes分类器。

    为每个分类器估算训练样本边缘。

    FullEdge = ResubEdge(FullMDL)
    FullEdge = 0.6554.
    PartEdge = Resubege(Partmdl)
    伙计德架= 0.7796.

    在10个最重要的预测器上训练的分类器的边缘更大。这一结果表明,仅使用这些预测器训练的分类器具有更好的样本内拟合。

    将广义添加剂模型(GAM)与线性术语与线性和交互条款进行了线性术语,通过检查训练样本边缘和边缘来进行线性和交互条款。仅基于此比较,具有最高边缘和边缘的分类器是最好的模型。

    载入储存于census1994.mat.数据集包括来自美国人口普查局的人口统计数据,以预测个人每年赚超过50,000美元。分类任务是符合赋予其年龄,工人阶级,教育水平,婚姻状况,种族等人员薪酬类别的模型。

    负载census1994

    census1994包含训练数据集AdultData.和测试数据集成年人.为了减少本示例的运行时间,将从AdultData.通过使用datasample函数。

    RNG('默认'重复性的%numsamples = 5e2;AdultData = DataMple(AdultData,NumSamples,'代替'、假);

    训练一个包含预测因子线性和交互项的GAM。指定包含所有可用的交互术语p-Values不大于0.05。

    Mdl = fitcgam (adultdata,'薪水'“互动”'全部'“MaxPValue”, 0.05)
    Mdl = classificationongam PredictorNames: {1x14 cell} ResponseName: 'salary' CategoricalPredictors: [2 4 6 7 8 9 10 14] ClassNames: [<=50K >50K] ScoreTransform: 'logit' Intercept: -32.0842 Interactions: [82x2 double] NumObservations: 500属性,方法

    MDL.是一个Classificationgam.模型对象。MDL.包含82个相互作用项。

    的训练样本边缘和边缘的估计MDL.

    m = Resubmargin(MDL);e = ResubEdge(MDL)
    E = 1.0000

    的训练样本边缘和边缘的估计MDL.没有包括互动条款。

    m_nointactions = ResubMargin(MDL,'internalideraction'、假);E_nointeractions = resubEdge (Mdl,'internalideraction',错误的)
    E_Nointactions = 0.9516.

    使用箱形图显示边缘的分布。

    boxplot([m m_nointactions],'标签',{'线性和互动条款'“线性条件仅”}) 标题('训练样品边缘的盒子图'

    图中包含一个坐标轴。标题为“训练样本边距的方框图”的轴包含14个类型为line的对象。

    当在计算中包含交互项时,所有的重新替换裕度值MDL.是1,重新提交边缘值(边缘的平均值)是1.当您不包括交互条款时,边距和边缘减少MDL.

    输入参数

    全部收缩

    分类机器学习模型,指定为完整分类模型对象,如下表所支持的模型所给出的。万博1manbetx

    模型 分类模型对象
    广义添加剂模型 Classificationgam.
    k最近的邻居模型 ClassificationKNN
    天真的贝叶斯模型 ClassificationNaiveBayes
    神经网络模型 ClassificationneuralKetwork.
    万博1manbetx支持向量机的一类和二值分类 分类VM.

    标志要包括模型的交互条款,指定为真的或者.此参数仅适用于广义添加剂模型(GAM)。也就是说,只有在何时指定此参数MDL.Classificationgam.

    默认值是真的如果MDL.包含交互方面。该值必须为如果模型不包含交互术语。

    数据类型:逻辑

    更多关于

    全部收缩

    分类的优势

    分类的优势为分类边界的加权平均值。

    多个分类器中选择一种方法,例如要执行特征选择,是选择产生最大边缘的分类器。

    分类保证金

    分类保证金对于二进制分类,对于每个观察,真正类别的分类分数与虚假类的分类分数之间的差异。的分类保证金多类分类是真实类的分类值与错误类的最大分类值之间的差值。

    如果边界在相同的尺度上(即,得分值基于相同的得分转换),那么它们将作为分类置信度度量。在众多分类公司中,那些利润率更高的公司表现更好。

    算法

    resubEdge根据对应的分类边计算分类边边缘对象的功能(MDL.)。有关特定于模型的描述,请参见边缘函数参考页下表。

    模型 分类模型对象(MDL. 边缘对象功能
    广义添加剂模型 Classificationgam. 边缘
    k最近的邻居模型 ClassificationKNN 边缘
    天真的贝叶斯模型 ClassificationNaiveBayes 边缘
    神经网络模型 ClassificationneuralKetwork. 边缘
    万博1manbetx支持向量机的一类和二值分类 分类VM. 边缘

    扩展功能

    在R2012A介绍