主要内容

ClassificationDiscriminant类

超类:CompactClassificationDiscriminant

判别分析分类

描述

一个ClassificationDiscriminant对象封装了一个判别分析分类器,这是一个为数据生成高斯混合模型。一个ClassificationDiscriminant对象可以预测新数据使用的反应预测方法。对象包含数据用于训练,所以可以计算resubstitution预测。

建设

创建一个ClassificationDiscriminant对象的使用fitcdiscr

属性

BetweenSigma

p——- - - - - -p类间的协方差矩阵,p预测的数量。

CategoricalPredictors

分类预测指标,这始终是空的([])。

一会

训练数据中的元素的列表Y删除重复的。一会可以是一个绝对数组,单元阵列的特征向量,字符数组,逻辑向量,或一个数值向量。一会具有相同的数据类型作为数据的论点吗Y(软件对字符串数组作为细胞阵列特征向量)。

多项式系数

k——- - - - - -k系数矩阵的结构,k类的数量。多项式系数(i, j)包含系数的线性或二次类之间的界限j。字段多项式系数(i, j):

  • DiscrimType

  • Class1- - - - - -一会(我)

  • 类别2- - - - - -一会(j)

  • 常量——一个标量

  • 线性——一个向量p组件,p列的数量吗X

  • 二次- - - - - -p——- - - - - -p矩阵,存在二次DiscrimType

类之间的边界方程和类j

常量+线性*x+x '*二次*x=0,

在哪里x是一个列向量的长度p

如果fitcdiscrFillCoeffs名称-值对将“关闭”当构建分类器,多项式系数是空的([])。

成本

方阵,成本(i, j)是一个指向类分类的成本j如果它真正的类(即。,the rows correspond to the true class and the columns correspond to the predicted class). The order of the rows and columns of成本对应于类的顺序一会。行和列的数量成本在响应中是独特的类的数量。

改变一个成本使用点符号矩阵:obj。成本=成本Matrix

δ

δ值阈值线性判别模型,一个负的标量。如果一个系数obj有大小小于δ,obj这个系数设置为0,所以你可以消除相应的预测模型。集δ消除更多的预测更高的价值。

δ必须0对二次判别模型。

改变δ使用点符号:obj。Delta = newDelta

DeltaPredictor

行向量的长度等于预测的数量obj。如果DeltaPredictor (i) <三角洲然后系数的模型是0

如果obj是一个二次判别模型,所有元素的DeltaPredictor0

DiscrimType

特征向量指定判别类型。之一:

  • “线性”

  • “二次”

  • “diagLinear”

  • “diagQuadratic”

  • “pseudoLinear”

  • “pseudoQuadratic”

改变DiscrimType使用点符号:obj。D我scrimType = newDiscrimType

你可以改变线性类型之间,或二次类型之间,但不能改变之间的线性和二次类型。

γ

伽马值正则化参数,一个标量01。改变γ使用点符号:obj。γ= newGamma

  • 如果你设置1线性判别,判别其类型“diagLinear”

  • 如果你设置一个值MinGamma1线性判别,判别其类型“线性”

  • 你不能设置值的值以下MinGamma财产。

  • 对于二次判别,可以设置0(DiscrimType“二次”)或1(DiscrimType“diagQuadratic”)。

HyperparameterOptimizationResults

描述hyperparameters交叉验证优化的存储为一个BayesianOptimization对象或一个表hyperparameters和相关联的值。非空的时OptimizeHyperparameters名称-值对非空的创造。价值取决于的设置HyperparameterOptimizationOptions名称-值对在创建:

  • “bayesopt”(默认)——对象的类BayesianOptimization

  • “gridsearch”“randomsearch”——hyperparameters表使用,观察目标函数值(交叉验证损失)和从最低(最好的)最高等级的观察(坏的)

LogDetSigma

在类协方差矩阵的行列式的对数。的类型LogDetSigma取决于判别类型:

  • 标量线性判别分析

  • 向量的长度K二次判别分析,K类的数量吗

MinGamma

负的标量,γ参数的最小值,以便相关矩阵是可逆的。如果相关矩阵不是单一的,MinGamma0

ModelParameters

在培训中使用的参数obj

μ

类方法,指定为一个K——- - - - - -p标量值类的矩阵大小的方法。K类的数量,p预测的数量。每一行的μ多元正态分布的均值代表相应的类。类指标的一会属性。

NumObservations

在训练数据的观察,一个数字标量。NumObservations可以小于输入数据的行数X当有缺失值X或响应Y

PredictorNames

单元阵列为预测变量的名称,在他们的顺序出现在训练数据X

之前

每个类的先验概率数值向量。元素的顺序之前对应于类的顺序一会

添加或更改之前使用点符号向量:obj。Prior = priorVector

ResponseName

特征向量描述变量的响应Y

ScoreTransform

特征向量代表一个内置的转换函数,或一个函数处理转变分数。“没有”意味着没有转换;同样,“没有”意味着@ x (x)。的内置转换函数和自定义的语法转换函数,看看fitcdiscr

实现点符号添加或更改ScoreTransform使用下列功能:

  • cobj。ScoreTransform = '函数

  • cobj。ScoreTransform = @函数

σ

在类的协方差矩阵或矩阵。尺寸取决于DiscrimType:

  • “线性”(默认)-矩阵的大小p——- - - - - -p,在那里p预测的数量吗

  • “二次”——数组的大小p——- - - - - -p——- - - - - -K,在那里K类的数量吗

  • “diagLinear”行向量的长度p

  • “diagQuadratic”——数组的大小1——- - - - - -p——- - - - - -K

  • “pseudoLinear”矩阵的大小p——- - - - - -p

  • “pseudoQuadratic”——数组的大小p——- - - - - -p——- - - - - -K

W

按比例缩小的权重,一个向量的长度n的行数X

X

矩阵的预测价值。每一列的X代表一个预测指标(变量),每一行代表一个观察。

Xcentered

X数据与类意味着减去。如果Y(我)的类j,

Xcentered(我,:)=X(我,:)- - - - - -μ(j,:),

在哪里μ是指财产的类。

Y

一系列直言,单元阵列的特征向量,字符数组,逻辑向量,或一个数值向量具有相同的行数X。每一行的Y代表的分类对应的行X

对象的功能

紧凑的 紧凑的判别分析分类器
compareHoldout 比较两种分类模型使用新数据的精度
crossval 旨在判别分析分类器
cvshrink 旨在线性判别的正规化
边缘 分类的优势
石灰 本地可model-agnostic解释(石灰)
logp 为判别分析分类器日志无条件概率密度
损失 分类错误
泰姬陵 而距离类判别分析分类器的手段
保证金 分类的利润率
nLinearCoeffs 数量的非零线性系数
partialDependence 计算部分依赖
plotPartialDependence 创建部分依赖图(PDP)和个人条件期望(ICE)情节
预测 预测标签使用判别分析分类模型
resubEdge 分类边缘resubstitution
resubLoss 由resubstitution分类错误
resubMargin 分类利润resubstitution
resubPredict 判别分析分类模型的预测resubstitution标签
沙普利 沙普利值
testckfold 比较两种分类模型的精度重复交叉验证

复制语义

价值。学习如何价值类影响复制操作,明白了复制对象

例子

全部折叠

加载费雪的虹膜数据集。

负载fisheriris

火车判别分析模型使用整个数据集。

Mdl = fitcdiscr(量、物种)
Mdl = ClassificationDiscriminant ResponseName:‘Y’CategoricalPredictors:[]类名:{“setosa”“杂色的”“virginica”} ScoreTransform:“没有一个”NumObservations: 150 DiscrimType:“线性”μ:[3 x4双]多项式系数:[3 x3 struct]属性,方法

Mdl是一个ClassificationDiscriminant模型。访问其属性,使用点符号。例如,显示组为每个预测手段。

Mdl.Mu
ans =3×45.0060 3.4280 1.4620 0.2460 5.9360 2.7700 4.2600 1.3260 6.5880 2.9740 5.5520 2.0260

预测新观察标签,通过Mdl和预测数据预测

更多关于

全部展开

引用

[1]郭,Y。,T。Hastie, and R. Tibshirani. "Regularized linear discriminant analysis and its application in microarrays."生物统计学,8卷,1号,第100 - 86页,2007年。

扩展功能

版本历史

介绍了R2011b