序列响应的多项式模型- MATLAB和Simulink万博1manbetx - 万博1manbetx,s manbetx 845,万博尤文图斯

序列响应的多项模型

响应变量的结果可能是一个受限的可能值集。如果只有两种可能的结果，如性别上的男性和女性，这些反应被称为二元反应。如果有多个结果，那么它们被称为多分支反应。多分枝反应的一些例子包括疾病的级别(轻微、中等、严重)、城市中最喜欢居住的地区、特定花卉类型的种类，等等。有时响应类别之间可能有一个自然的顺序。这些反应被称为顺序反应．

排序可能是在类别选择中固有的，例如个人对在线客户服务不满意、满意或非常满意。还可以通过对潜在(连续)变量的分类来引入排序，例如，基于定量医疗测量(如血压)，个人处于某一疾病的低风险、中风险或高风险组。

您可以指定一个多项式回归模型，该模型使用响应类别之间的自然排序。该顺序模型描述了类别的累积概率与预测变量之间的关系。

不同的链接函数可以描述这种关系，其中logit和probit是最常用的。

分对数:缺省link功能mnrfit用于序数类别的是the分对数链接功能。这个模型日志累积概率．的“链接”、“分对数的名称-值对在mnrfit．对数累积概率是一个响应属于一个值小于或等于一个类别的类别的概率比率的对数j, P (y≤c_j)，以及响应属于某个值大于该值的类别的概率j, P (y>c_j）.
排序模型通常基于这样的假设，即预测变量在对数尺度上对所有类别的影响是相同的。也就是说，模型在不同类别之间截距不同，但斜率(系数)相同。这个模型叫做平行的回归或者是成比例的几率模型。它是顺序响应的默认值，并且“互动”、“关闭”中的名称-值对指定此模型mnrfit．
比例赔率模型是

$\begin{array}{l} \ln （ \frac{P （ y \leq c_{1} ）}{P （ y > c_{1} ）} ）＝ \ln （ \frac{π_{1}}{π_{2} + \dots + π_{k}} ）＝ α_{1} + β_{1} X_{1} + β_{2} X_{2} + \dots + β_{p} X_{p} ， \\ \ln （ \frac{P （ y \leq c_{2} ）}{P （ y > c_{2} ）} ）＝ \ln （ \frac{π_{1} + π_{2}}{π_{3.} + \dots + π_{k}} ）＝ α_{2} + β_{1} X_{1} + β_{2} X_{2} + \dots + β_{p} X_{p} ， \\ ⋮ \\ \ln （ \frac{P （ y \leq c_{k - 1} ）}{P （ y > c_{k - 1} ）} ）＝ \ln （ \frac{π_{1} + π_{2} + \dots + π_{k - 1}}{π_{k}} ）＝ α_{k - 1} + β_{1} X_{1} + β_{2} X_{2} + \dots + β_{p} X_{p} ， \end{array}$

在哪里π_j，j= 1, 2，…k，为类别概率。
例如，对于三个类别的响应变量，有3 - 1 = 2的方程如下:

$\begin{array}{l} \ln （ \frac{π {}_{1}}{π {}_{2}+ π {}_{3.}} ）＝ α_{1} + β_{1} X_{1} + β_{2} X_{2} + \dots + β_{p} X_{p} ， \\ \ln （ \frac{π {}_{1}+ π {}_{2}}{π {}_{3.}} ）＝ α_{2} + β_{1} X_{1} + β_{2} X_{2} + \dots + β_{p} X_{p} ． \end{array}$

在比例胜率假设下，预测变量的部分影响X对响应变量类别的选择是不变的，j．例如，如果有三个类别，那么系数表示预测变量对响应值在类别1与类别2或类别3，或在类别1或类别2与类别3之间的相对风险或对数几率的影响。
因此，一个单位变量的变化X₂将意味着响应值在类别1与类别2或类别3之间，或类别1或类别2与类别3之间的累计赔率的变化(exp(β₂)，前提是其他条件相同。
您也可以选择在类别中使用具有不同截距和斜率的模型“互动”,“上”名称-值对的论点。然而，当等斜率模型为真时，对顺序模型使用此选项会导致效率的损失(您将失去估计较少参数的优势)。
概率单位:的“链接”、“概率单位”名称-值对参数使用probit基于正态分布潜在变量假设的链接函数。对于顺序响应变量，这也称为an命令probit模型。考虑描述潜在变量关系的回归模型y*的有序过程和预测变量的向量，X，

$y^{＊} ＝ β X + ε ，$

其中误差项ε有一个标准正态分布。假设潜变量之间有以下关系y*和观测变量y：

$\begin{array}{l} y ＝ c_{1} 我 f α_{0} < y^{＊} \leq α_{1} ， \\ y ＝ c_{2} 我 f α_{1} < y^{＊} \leq α_{2} ， \\ ⋮ ⋮ \\ y ＝ c_{k} 我 f α_{k - 1} < y^{＊} \leq α_{k} ， \end{array}$

在哪里α₀= -∞和α_k=∞。的累积概率y在类别j或较早的类别之一，P(y≤c_j)，等于

$P （ y \leq c_{j} ）＝ P （ y^{＊} < α_{j} ）＝ P （ β X + ε < α_{j} ）＝ P （ ε < α_{j} - β X ）＝ Φ （ α_{j} - β X ），$

式中Φ为标准正态累积分布函数。因此,

$Φ^{- 1} （ P （ y \leq c_{j} ））＝ α_{j} - β X ，$

在哪里α_j对应回归模型中潜变量的切点和截距。这只在正常潜变量和平行回归的假设下成立。更一般地说，对于响应变量k类别和多个预测器，有序概率模型是

$\begin{array}{l} Φ^{- 1} （ P （ y \leq c_{1} ））＝ α_{1} + β_{1} X_{1} + \dots + β_{p} X_{p} ， \\ Φ^{- 1} （ P （ y \leq c_{2} ））＝ α_{2} + β_{1} X_{1} + \dots + β_{p} X_{p} ， \\ ⋮ ⋮ \\ Φ^{- 1} （ P （ y \leq c_{k - 1} ））＝ α_{k - 1} + β_{1} X_{1} + \dots + β_{p} X_{p} ， \end{array}$

在P (y≤c_j) =π₁+π₂+……+π_j．
系数表明预测变量的单位变化对状态可能性的影响。一个积极的系数,β₁，表示潜在变量随相应预测变量的增加而增加，X₁．因此，它导致P(y≤c₁)及P(y≤c_k）.

通过对模型系数的估计mnrfit，您可以使用以下方法估计每个类别中的累积概率或累积数mnrval与“类型”、“累积”名称-值对的选择。mnrval接受系数估计和模型统计mnrfit返回并估计分类概率或每个类别中的数字及其置信区间。属性的值可以指定要估计的类别或条件概率或数字“类型”名称-值对的论点。

参考文献

P. McCullagh和J. A. Nelder。广义线性模型．纽约:查普曼与霍尔出版社，1990。

j·S·朗分类和有限因变量的回归模型．圣人出版物,1997。

[3] Dobson, A. J.和A. G. Barnett。广义线性模型导论．查普曼和大厅/ CRC。Taylor & Francis Group, 2008。

另请参阅

fitglm|mnrfit|mnrval|glmfit|glmval

序列响应的多项模型

参考文献

另请参阅

相关的话题

统计和机器学习工具箱文档

万博1manbetx

掌握机器学习:一步一步的指导与MATLAB