包:classreg.learning.partition
交叉验证分类模型
ClassificationPartitionedModel
是一组在交叉验证折叠上训练的分类模型。使用一种或多种“kfold”方法通过交叉验证评估分类质量:kfoldPredict
,kfoldLoss
,kfoldMargin
,kfoldEdge
,kfoldfun
.
每个“kfold”方法都使用在折叠内观测上训练的模型来预测折叠外观测的响应。例如,假设使用五次折叠进行交叉验证。在这种情况下,软件将每个观察结果随机分为五个大小大致相同的组。的培训褶皱包含四组(即大约4/5的数据)和测试褶皱包含另一组(即,大约1/5的数据)。在这种情况下,交叉验证的过程如下:
软件训练第一个模型(存储在CVMdl。训练有素的{1}
)使用后四组的观测值,并保留第一组的观测值进行验证。
软件训练第二个模型(存储在CVMdl。训练有素的{2}
)使用第一组和后三组的观测值,保留第二组的观测值进行验证。
软件以类似的方式处理第三到第五个模型。
如果通过调用验证kfoldPredict
,它使用第一个模型计算第1组观测值的预测,使用第二个模型计算第2组观测值的预测,依此类推。简而言之,该软件使用在没有该观察的情况下训练的模型来估计每个观察的响应。
从分类模型创建交叉验证的分类模型(CVMdl
= crossval (Mdl
)Mdl
).
另外:
CVDiscrMdl = fitcdiscr(X,Y,Name,Value)
CVKNNMdl = fitcknn(X,Y,名称,值)
CVNBMdl = fitcnb(X,Y,名称,值)
CVSVMMdl = fitcsvm(X,Y,名称,值)
CVTreeMdl = fitctree(X,Y,名称,值)
创建一个交叉验证的模型的名字
要么是“CrossVal”
,“KFold”
,“坚持”
,“Leaveout”
,或“CVPartition”
.有关语法的详细信息,请参见fitcdiscr
,fitcknn
,fitcnb
,fitcsvm
,fitctree
.
|
分类模型。 |
|
的单元格数组指定的数值预测器的Bin边p数字向量,其中p是预测因子的数量。每个向量都包含数值预测器的bin边。类别预测器的单元格数组中的元素为空,因为软件不收纳类别预测器。 类型时,软件才会对数值预测器进行分类 您可以重新生成已归档的预测器数据 X = mdl.X;%预测数据Xbinned = 0(大小(X));edges = mdl.BinEdges;查找已分类预测符的索引。idxNumeric = find(~cellfun(@isempty,edges));if iscolumn(idxNumeric) idxNumeric = idxNumeric';end for j = idxNumeric x = x (:,j);如果x是一个表,则将x转换为数组。If stable(x) x = table2array(x);将x分组到箱子中
Xbinned 包含数值预测器的容器索引,范围从1到容器数。Xbinned 类别预测器的值为0。如果X 包含南 S,然后是对应的Xbinned 值是南 年代。 |
||||||||||||||||||||
|
分类预测指标,指定为正整数向量。 如果 |
||||||||||||||||||||
|
训练模型时使用的唯一类标签,指定为类别或字符数组、逻辑或数字向量或字符向量的单元格数组。 |
||||||||||||||||||||
|
方阵,其中 如果 CVModel。成本= CostMatrix; |
||||||||||||||||||||
|
交叉验证模型的名称,它是一个字符向量。 |
||||||||||||||||||||
|
交叉验证模型使用的折叠数,为正整数。 |
||||||||||||||||||||
|
的对象保持参数 |
||||||||||||||||||||
|
类的划分 |
||||||||||||||||||||
|
预测器变量名,指定为字符向量的单元格数组。元素的顺序 |
||||||||||||||||||||
|
每个类的先验概率的数字向量。元素的顺序 如果 CVModel。之前= priorVector; |
||||||||||||||||||||
|
响应变量名,指定为字符向量。 |
||||||||||||||||||||
|
分数转换,指定为字符向量或函数句柄。 将分数转换函数更改为
|
||||||||||||||||||||
|
训练的学习者,这是一个紧凑的分类模型单元阵列。 |
||||||||||||||||||||
|
的比例 |
||||||||||||||||||||
|
预测值的矩阵或表格。的每一列 |
||||||||||||||||||||
|
类别或字符数组、逻辑或数字向量或字符向量的单元格数组,为每个观察值指定类标签。 |
kfoldEdge | 未用于训练的观测数据的分类边缘 |
kfoldLoss | 未用于训练的观测数据的分类损失 |
kfoldMargin | 未用于训练的观测值的分类裕度 |
kfoldPredict | 预测不用于训练的观察结果的反应 |
kfoldfun | 交叉验证函数 |
价值。要了解值类如何影响复制操作,请参见复制对象(MATLAB)。
要估计经过训练、交叉验证的SVM分类器的后验概率,请使用fitSVMPosterior
.