ClassificationDiscriminant类

超:CompactClassificationDiscriminant

判别分析分类

描述

一个ClassificationDiscriminant对象封装判别分析分类器,其是用于数据生成一高斯混合模型。一个ClassificationDiscriminant对象可以预测对新数据的响应预测方法。该对象包含用于训练数据,因此可以计算resubstitution预测。

施工

创建一个ClassificationDiscriminant对象的使用fitcdiscr

属性

BetweenSigma

p——- - - - - -p矩阵,类间协方差,其中p是预测的数目。

CategoricalPredictors

分类预测指标,这始终是空的([])。

类名

在训练数据元素的列表ÿ与重复删除。类名可以是类别数组、字符向量的单元数组、字符数组、逻辑向量或数字向量。类名数据类型与参数中的数据相同ÿ(该软件把字符串数组作为字符向量的单元阵列。)

多项式系数

ķ——- - - - - -ķ系数矩阵的结构,其中ķ是的类的数量。Coeffs(I,J)包含线性的系数或类之间边界二次一世Ĵ。字段Coeffs(I,J)

  • DiscrimType

  • 1类-类名(我)

  • 等级2-类名(j)

  • 常量- 一个标量

  • 线性-一个向量p组件,其中p是列在数X

  • 二次-p——- - - - - -p矩阵,存在对二次DiscrimType

阶级之间边界的方程一世和类Ĵ

常量+线性*X+X'*二次*X=0

哪里X是长度的列向量p

如果fitcdiscrFillCoeffs名称-值对设置为“关闭”构建分类时,多项式系数是空的 ([])。

成本

方阵,其中,成本(I,J)是分类的点到类的费用Ĵ如果它的真类是一世(即,行对应于真类和列对应于所预测的类)。行和列的顺序成本对应于类的顺序类名。中的行数和列数成本为响应中唯一类的数量。

变化的成本点符号矩阵:obj.Cost = costMatrix

三角洲

增量阈值的线性判别模型,一个非负的标量的值。如果系数OBJ有幅度小于三角洲OBJ设置该系数0,所以可以消除从模型对应的预测。组三角洲到一个更高的值,以消除更多的预测。

三角洲一定是0对于二次判别模型。

改变三角洲使用点符号:obj.Delta = newDelta

DeltaPredictor

长度的行矢量等于预测的在数OBJ。如果DeltaPredictor(ⅰ)<德尔塔然后系数一世模型是0

如果OBJ是一个二次判别模型,所有的元素DeltaPredictor0

DiscrimType

指定鉴别类型的字符向量。之一:

  • “线性”

  • “二次”

  • “diagLinear”

  • 'diagQuadratic'

  • “伪线性”

  • 'pseudoQuadratic'

改变DiscrimType使用点符号:obj.DiscrimType = newDiscrimType

你可以线性类型之间改变,或二次类型之间,但线性和二次类型之间不能改变。

γ

值的伽马正则化参数,标量从01。改变γ使用点符号:obj。γ= newGamma

  • 如果设置1对于线性判别器,判别器将其类型设置为“diagLinear”

  • 如果您设置之间的值。MinGamma1对于线性判别器,判别器将其类型设置为“线性”

  • 属性的值之下不能设置值MinGamma属性。

  • 对于二次判别,你可以设定0(DiscrimType“二次”) 要么1(DiscrimType'diagQuadratic')。

HyperparameterOptimizationResults

超参数的交叉验证优化的说明中,存储为BayesianOptimization对象或超参数和相关联的值的表。非空当OptimizeHyperparameters名称 - 值对是在创建非空。值取决于的设置HyperparameterOptimizationOptions在创建名称 - 值对:

  • 'bayesopt'(默认) - 类对象BayesianOptimization

  • 'gridsearch'要么“randomsearch”- 超参数的表所使用的,观测到的观测的目标函数值(交叉验证损失),和等级从最低(最好)至最高(最差)

LogDetSigma

类内协方差矩阵的行列式的对数。该类型的LogDetSigma取决于判别类型:

  • 标量为线性判别分析

  • 长的矢量ķ为二次判别分析,其中ķ是类数

MinGamma

非负标量,参数的最小值,使相关矩阵可逆。如果相关矩阵不是奇异的,MinGamma0

ModelParameters

在训练中使用的参数OBJ

类装置,指定为ķ——- - - - - -p矩阵的大小的标量值类的装置。ķ是类的数量,和p是预测的数目。每行表示对应类的多元正态分布的均值。类索引在类名属性。

NumObservations

观察在训练数据数量,数字标。NumObservations可以小于输入数据的行数X中缺少值时X或响应ÿ

PredictorNames

预测变量名称的单元阵列,在该命令在它们出现在训练数据中X

用于每个类别的先验概率的数值向量。的元素的顺序对应于类的顺序类名

添加或更改向量使用点符号:obj.Prior = priorVector

ResponseName

描述响应变量的特征向量ÿ

ScoreTransform

代表一个内置的转换功能,或用于转换分数的函数处理字符向量。'没有'意味着没有变;等价地,'没有'意味着@(X)X。对于列表内置的转换功能和自定义转换函数的语法,请参阅fitcdiscr

实施点符号添加或更改ScoreTransform函数使用下列之一:

  • cobj.ScoreTransform ='功能

  • cobj.ScoreTransform = @功能

σ

类内协方差矩阵或矩阵。尺寸取决于DiscrimType

  • “线性”(默认) - 大小的矩阵p——- - - - - -p,在那里p预测者的数量是多少

  • “二次”- 大小的数组p——- - - - - -p——- - - - - -ķ,在那里ķ是类数

  • “diagLinear”- 长度的行向量p

  • 'diagQuadratic'- 大小的数组1——- - - - - -p——- - - - - -ķ

  • “伪线性”- 大小的矩阵p——- - - - - -p

  • 'pseudoQuadratic'- 大小的数组p——- - - - - -p——- - - - - -ķ

w ^

按比例缩小的权重,一个具有长度的向量ñ的行数X

X

预测值矩阵。每一列的X代表一个预测值(变量),而每行代表一个观察。

Xcentered

X与类装置中的数据中减去。如果义)是类的Ĵ

Xcentered(I,:)=X(I,:)-穆(J,:)

哪里是类均值性质。

ÿ

甲分类阵列,字符向量的单元阵列中,字符数组,逻辑向量,或者与相同的行数为数值矢量X。每行ÿ表示的对应行的分类X

方法

紧凑的 紧凑型判别分析分类
crossval 交叉验证判别分析分类
cvshrink 线性判别的交叉验证正规化
resubEdge 通过resubstitution分级刃
resubLoss 通过resubstitution分类错误
resubMargin 分类利润率由resubstitution
resubPredict 预测判别分析分类模型resubstitution标签

继承的方法

边缘 分级刃
的logP 记录判别分析分类器的无条件概率密度
损失 分类错误
泰姬陵 马氏距离意味着
余量 分类的利润率
nLinearCoeffs 非零线性系数的数目
预测 使用判别分析分类模型预测标签

复制语义

值。要了解值类如何影响复制操作,请参阅复制对象(MATLAB)。

例子

全部收缩

加载费舍尔的虹膜数据集。

加载fisheriris

使用整个数据集火车判别分析模型。

MDL = fitcdiscr(MEAS,物种)
MDL = ClassificationDiscriminant ResponseName: 'Y' CategoricalPredictors:[]类名:{ 'setosa' '云芝' '锦葵'} ScoreTransform: '无' NumObservations:150 DiscrimType: '线性' 穆:[3x4的双] Coeffs:[3×3结构]属性,方法

MDL是一个ClassificationDiscriminant模型。要访问它的属性,使用点记号。例如,显示每个预测器的组的装置。

Mdl.Mu
ANS =3×45.0060 3.4280 1.4620 0.2460 5.9360 2.7700 4.2600 1.3260 6.5880 2.9740 5.5520 2.0260

预测新的观察标签,合格MDL和预测数据预测

更多关于

全部展开

参考文献

[1]过,Y.,T.黑斯蒂和R. Tibshirani。正则化线性判别分析及其在微阵列应用。生物统计学,卷。8,第1期,第86-100,2007年。

扩展功能

介绍了在R2011b