主要内容

kfoldEdge

分类边缘旨在内核分类模型

描述

例子

边缘= kfoldEdge (CVMdl)返回分类的优势旨在获得的,二进制内核模型(ClassificationPartitionedKernel)CVMdl。对于每一个褶皱,kfoldEdge计算分类边缘validation-fold观察使用一个模型训练training-fold观测。

边缘= kfoldEdge (CVMdl,名称,值)返回指定的一个或多个分类边缘额外的选项名称-值对参数。例如,指定数量的折叠或聚合的水平。

例子

全部折叠

加载电离层数据集。这个数据集有34个预测因子和351二进制响应雷达的回报,这也贴上坏(“b”)或好(‘g’)。

负载电离层

旨在一个二进制内核使用的数据分类模型。

CVMdl = fitckernel (X, Y,“Crossval”,“上”)
CVMdl = ClassificationPartitionedKernel CrossValidatedModel:“内核”ResponseName:“Y”NumObservations: 351 KFold: 10个分区:[1 x1 cvpartition]类名:{b ' g '} ScoreTransform:“没有一个”属性,方法

CVMdl是一个ClassificationPartitionedKernel模型。默认情况下,软件实现了10倍交叉验证。指定一个不同的折叠,使用“KFold”名称-值对参数代替“Crossval”

估计旨在分类边缘。

边缘= kfoldEdge (CVMdl)
边缘= 1.5585

或者,您可以获得per-fold边缘通过指定名称-值对“模式”,“个人”kfoldEdge

执行特征选择进行比较k倍边缘从多个模型。仅仅根据这一标准,分类器的最大优势是最好的分类器。

加载电离层数据集。这个数据集有34个预测因子和351二进制响应雷达的回报,这也贴上坏(“b”)或好(‘g’)。

负载电离层

随机选择一半的预测变量。

rng (1);%的再现性p =大小(X, 2);%的预测数量idxPart = randsample (p,装天花板(0.5 * p));

旨在两个二进制内核分类模型:一个使用所有的预测,以及使用预测的一半。

CVMdl = fitckernel (X, Y,“CrossVal”,“上”);PCVMdl = fitckernel (X (:, idxPart), Y,“CrossVal”,“上”);

CVMdlPCVMdlClassificationPartitionedKernel模型。默认情况下,软件实现了10倍交叉验证。指定一个不同的折叠,使用“KFold”名称-值对参数代替“Crossval”

估计k为每个分类器倍边缘。

fullEdge = kfoldEdge (CVMdl)
fullEdge = 1.5142
partEdge = kfoldEdge (PCVMdl)
partEdge = 1.8910

基于k倍边缘,使用的分类器预测的一半是更好的模型。

输入参数

全部折叠

旨在,二进制内核分类模型,指定为一个ClassificationPartitionedKernel模型对象。您可以创建一个ClassificationPartitionedKernel模型通过使用fitckernel并指定任何一个交叉验证的名称-值对参数。

获得的估计,kfoldEdge应用旨在内核使用的相同的数据分类模型(XY)。

名称-值参数

指定可选的双参数作为Name1 = Value1,…,以=家,在那里的名字参数名称和吗价值相应的价值。名称-值参数必须出现在其他参数,但对的顺序无关紧要。

R2021a之前,用逗号来分隔每一个名称和值,并附上的名字在报价。

例子:kfoldEdge (CVMdl“模式”,“个人”)返回分类为每个折边。

褶皱指数预测,指定为逗号分隔组成的“折叠”和正整数的数值向量。的元素折叠一定范围内1CVMdl.KFold

在指定的软件只使用折叠折叠为预测。

例子:“折叠”,[1 4 10]

数据类型:|

聚合级别为输出,指定为逗号分隔组成的“模式”“平均”“个人”

此表描述了值。

价值 描述
“平均” 输出是一个标量平均折叠。
“个人” 的输出是一个向量的长度k包含一个值/褶皱,k是折叠的数量。

例子:“模式”,“个人”

输出参数

全部折叠

分类的优势,作为一个数字返回标量或数字列向量。

如果模式“平均”,然后边缘是所有折叠的平均分类优势。否则,边缘是一个k1数字列向量包含分类为每个褶皱边缘,在那里k是折叠的数量。

更多关于

全部折叠

分类的优势

分类的优势是分类的加权平均数的利润率。

选择在多个分类器的一种方式,例如进行特征选择,是选择收益最大的边缘的分类器。

分类保证金

分类保证金二进制分类,对每个观察,真正的类的分类得分之间的差异和分类评分错误类。

软件定义了二进制分类的分类边界

= 2 y f ( x )

x是一个观察。如果真正的标签x是积极的类,然后呢y是1,否则和1。f(x)是观察positive-class分类评分x。分类通常被定义为:=yf(x)

如果利润相同的规模,那么他们作为分类信心措施。在多个分类器,那些产生更大的利润更好。

分类分

内核的分类模型,原始分类分分类的观察x一个行向量,到积极的类定义

f ( x ) = T ( x ) β + b

  • T ( · ) 是一个转换的观察特性的扩张。

  • β是估计的列向量的系数。

  • b估计是标量的偏见。

原始的分类分分类x负类f(x)。软件将观察分为类产生一个积极的分数。

如果内核分类模型由逻辑回归的学习者,那么软件应用分对数的分数转换原始分类得分(见ScoreTransform)。

版本历史

介绍了R2018b

全部展开