主要内容

设置多变量回归问题

响应矩阵

使用多变量线性回归模型使用mvregress.,您必须以特定方式设置响应矩阵和设计矩阵。给定适当格式化的输入,mvregress.可以处理各种多元回归问题。

mvregress.期待N观察可能相关的D.- 在一个中的决定反应N-经过-D.矩阵,命名y, 例如。也就是说,设置您的响应,以便依赖结构在观察中相同.如果您指定y作为长度的矢量N(无论是行还是列向量),那么mvregress.假设D.= 1,并将元素视为N独立观察。它确实如此不是模型矢量作为一个相关系列的一个实现(例如时间序列)。

为了说明如何设置响应矩阵,假设您的多变量响应是在多个时间点的对象上进行的重复测量,如下图所示。

假设主题内的观察结果相关。

在这种情况下,设置响应矩阵y这样,每行对应于对象,并且每列对应于时间点。

然后,假设在同一时间同时对受试者进行的观察结果(并发相关)。

在这种情况下,设置响应矩阵y这样,每行对应于时间点,并且每个列对应于对象。

设计矩阵

在多变量线性回归模型中,每个D.- 二维响应具有相应的设计矩阵。根据模型,设计矩阵可能由外源性预测变量,虚拟变量,滞后的响应或这些和其他协变量的组合组成。

  • 如果D.> 1和所有D.尺寸具有相同的设计矩阵,然后指定一个N-经过-P.设计矩阵,在哪里P.是预测变量的数量。要确定每个维度的截距,请向设计矩阵添加一列。在这种情况下,mvregress.将设计矩阵应用于所有D.方面。

  • 如果D.> 1和所有D.尺寸没有相同的设计矩阵,然后使用长度指定设计矩阵 -N细胞阵列D.-经过-K.阵列,命名X, 例如。K.是模型中的回归系数总数。请注意阵列的行X对应于响应矩阵的列,y

    我摔倒N观察有相同的设计矩阵,可以指定包含一个的单元数组D.-经过-K.设计矩阵。在这种情况下,mvregress.将设计矩阵应用于所有N观察。例如,如果预测器是时间的函数,则可能出现这种情况,并且在同一时间点测量所有观察。

  • 在特殊情况下D.= 1,您可以指定一个N-经过-K.设计矩阵(不是单元阵列)。但是,你应该考虑使用Fitlm.将回归模型适合单变量,连续响应。

以下部分说明了如何建立一些常见的多变量回归问题进行估计mvregress.

常见的多变量回归问题

多变量一般线性模型

多变量一般线性模型是表单

y N × D. = X N × P. + 1 B. P. + 1 × D. + E. N × D.

以扩展形式,

[ y 11. y 12. y 1 D. y 21. y 22. y 2 D. y N 1 y N 2 y N D. ] = [ 1 X 11. X 12. X 1 P. 1 X 21. X 22. X 2 P. 1 X N 1 X N 2 X N P. ] [ β 01. β 02. β 0. D. β 11. β 12. β 1 D. β P. 1 β P. 2 β P. D. ] + [ ε. 11. ε. 12. ε. 1 D. ε. 21. ε. 22. ε. 2 D. ε. N 1 ε. N 2 ε. N D. ]

也就是说,每个D.- 实证响应有拦截和P.预测变量,每个维度都有自己的回归系数。在这种形式中,最小二乘解b = x \ y.估计此模型的使用mvregress., 使用N-经过-D.响应矩阵,如上所述。

我摔倒D.尺寸具有相同的设计矩阵,使用N-经过-(P.+1)设计矩阵,如上所述。向其中添加一列P.预测变量计算每个维度的截距。

我摔倒D.尺寸没有相同的设计矩阵,重新格式化N-经过-(P.+ 1)设计矩阵到长度 -N细胞阵列D.-经过-K.矩阵。这里,K.=(P.+ 1)D.对于每个维度的拦截和斜坡。

例如,假设N= 4,D.= 3,和P.= 2(除截距之外的两个预测器术语)。这个数字显示如何格式化一世细胞阵列中的元素。

如果您愿意,您可以重塑K.- 1-1个系数向量返回A(P.+ 1)--by-D.估计后的矩阵。

要在模型参数上放置约束,请相应地调整设计矩阵。例如,假设前面示例中的三个维度具有共同的斜率。那是, β 11. = β 12. = β 13. = β 1 β 21. = β 22. = β 23. = β 2 在这种情况下,每个设计矩阵为3乘5,如下图所示。

纵向分析

在纵向分析中,您可能会衡量答案N主题D.时间点,在同一主题上的观察结果之间的相关性。例如,假设您测量响应yIJ.有时T.IJ.一世= 1,......,Nj= 1,......,D..此外,假设每个受试者是由指示变量指定的两组(例如男性或女性)中的一个G一世.你可以模型yIJ.作为一个函数G一世T.IJ.,具体群体截取和斜坡,如下:

y 一世 j = β 0. + β 1 G 一世 + β 2 T. 一世 j + β 3. G 一世 × T. 一世 j + ε. 一世 j 一世 = 1 ...... N ; j = 1 ...... D.

在哪里

ε. 一世 = ε. 一世 1 ...... ε. 一世 D. ' m V. N 0. σ.

大多数纵向模型包括作为明确预测器的时间。

使用此模型使用mvregress.,安排答案N-经过-D.矩阵,其中N是受试者的数量和D.是时间点的数量。指定设计矩阵N- 长块阵列D.-经过-K.矩阵,在这里K.= 4对于四个回归系数。

例如,假设D.= 5(每个受试者的五次观察)。这一世对于指定模型的TH设计矩阵和相应的参数向量如下图所示。

面板分析

在面板分析中,您可以衡量响应和协调因子D.受试者(如个人或国家)N时间点。例如,假设您测量响应yTJ.和协变量XTJ.关于科目j= 1,......,D.有时T.= 1,......,N.一个固定效应面板模型,包含特定主题的固定效应和并发相关性,可能看起来像:

y T. j = α. j + β X T. j + ε. T. j

在哪里

ε. T. = ε. T. 1 ...... ε. T. D. ' m V. N 0. σ.

与纵向模型相反,面板分析模型通常包括在每个时间点测量的协调因子,而不是使用时间作为显式预测器。

使用此模型使用mvregress.,安排答案N-经过-D.矩阵,使得每列对应于对象。指定设计矩阵N- 长块阵列D.-经过-K.矩阵,在这里K.=D.+ 1为D.截取和斜率术语。

例如,假设D.= 4(四个科目)。这T.图中示出了设计矩阵和相应的参数向量。

看似无关的回归

在一个看似无关的回归(sur),你的模型D.单独的回归,每个回归有其自己的拦截和斜率,而是一个常见的错误方差 - 协方差矩阵。例如,假设您测量响应yIJ.和协变量XIJ.对于回归模型j= 1,......,D., 和一世= 1,......,N观察,以适应每个回归。SUR模型可能看起来像:

y 一世 j = β 0. j + β j X 一世 j + ε. 一世 j

在哪里

ε. 一世 = ε. 一世 1 ...... ε. 一世 D. ' m V. N 0. σ.

该模型与多变量一般线性模型非常相似,除了它对每个维度具有不同的协变量。

使用此模型使用mvregress.,安排答案N-经过-D.矩阵,使得每列具有数据jTH回归模型。指定设计矩阵N- 长块阵列D.-经过-K.矩阵,在这里K.= 2D.为了D.拦截和D.连续下坡。

例如,假设D.= 3(三个回归)。这一世图中示出了设计矩阵和相应的参数向量。

矢量自动评级模型

var(P.)传染媒介自回归模型表达D.- 作为线性函数的实时序列响应P.落后D.- 从前一次的响应。例如,假设您测量响应yTJ.时间序列j= 1,......,D.有时T.= 1,......,N.var(P.)模型可能看起来像:

[ y T. 1 y T. 2 y T. D. ] = [ C 1 C 2 C D. ] + [ φ. 11. 1 φ. 12. 1 φ. 1 D. 1 φ. D. 1 1 φ. D. 2 1 φ. D. D. 1 ] [ y T. - 1 1 y T. - 1 2 y T. - 1 D. ] + + [ φ. 11. P. φ. 12. P. φ. 1 D. P. φ. D. 1 P. φ. D. 2 P. φ. D. D. P. ] [ y T. - P. 1 y T. - P. 2 y T. - P. D. ] + [ ε. T. 1 ε. T. 2 ε. T. D. ]

在哪里

ε. T. = ε. T. 1 ...... ε. T. D. ' m V. N 0. σ.

估计向量自回归模型时,通常需要使用第一个P.观察到启动模型,或提供一些其他预先响应值。

使用此模型使用mvregress.,安排答案N-经过-D.矩阵,使得每列对应于时间序列。指定设计矩阵N- 长块阵列D.-经过-K.矩阵,在这里K.=D.+PD.2

例如,假设D.= 2(两次序列)和P.= 1(一个滞后)。这T.图中示出了设计矩阵和相应的参数向量。

或者,OuthoMetrics Toolbox™具有拟合和预测var的功能(P.)模型,包括指定外源预测变量的选项。

也可以看看

|

相关例子

更多关于