主要内容

多变量一般线性模型

此示例显示如何设置多变量通用线性模型以进行估计mvregress.

加载样本数据。

此数据包含在1985年的205个自动导入样本上的测量值。

在这里,模拟城市和高速公路MPG(第14栏和15栏)的二元响应。

对于预测器,使用轮基(柱3),遏制重量(柱7)和燃料型(柱18)。前两个预测器是连续的,对于该示例,以居中和缩放。燃料类型是一个分类变量,两个类别(11.20.),所以回归需要一个伪指示器变量。

加载('进口-85')y = x(:,14:15);[n,d] =尺寸(y);x1 = zscore(x(:,3));x2 = zscore(x(:,7));x3 = x(:,18)== 20;XMAT = [(n,1)x1 x2 x3];

变量X3编码为具有值1对于燃料型20和值0.除此以外。

为方便起见,将三个预测器(轮基,遏制重量和燃料型指示器)组合成一个设计矩阵,增加了截距术语。

设置设计矩阵。

鉴于这些预测因子,用于双变量MPG响应的多变量一般线性模型是

[ y 1 1 y 1 2 y 2 1 y 2 2 y N 1 y N 2 ] = [ 1 X 1 1 X 1 2 X 1 3. 1 X 2 1 X 2 2 X 2 3. 1 X N 1 X N 2 X N 3. ] [ β 0. 1 β 0. 2 β 1 1 β 1 2 β 2 1 β 2 2 β 3. 1 β 3. 2 ] + [ ε. 1 1 ε. 1 2 ε. 2 1 ε. 2 2 ε. N 1 ε. N 2 ]

在哪里 ε. 一世 = ε. 一世 1 ε. 一世 2 ' - m V. N 0. σ. 。有 K. = 8. 总共回归系数。

创造一个长度 N = 2 0. 5. 用于2×8(D-BY-K)矩阵的单元阵列用于使用mvregress.。单元阵列中的第i矩阵是

X 一世 = [ 1 0. X 一世 1 0. X 一世 2 0. X 一世 3. 0. 0. 1 0. X 一世 1 0. X 一世 2 0. X 一世 3. ]

Xcell = cell(1,n);为了i = 1:n xcell {i} = [kron([xmat(i,i :)],眼睛(d))];结尾

鉴于设计矩阵的本说明书,相应的参数向量是

β = [ β 0. 1 β 0. 2 β 1 1 β 1 2 β 2 1 β 2 2 β 3. 1 β 3. 2 ]

估计回归系数。

使用最大似然估计拟合模型。

β,sigma,e,v] = mvregress(xcell,y);bet
β=8×133.5476 38.5720 0.9723 0.9723 0.3950 -6.3064 -6.3584 -9.2284 -8.6663

这些系数估计显示:

  • 预期的城市和高速公路MPG为平均轮基,遏制重量和燃料类型11是汽车33.538.6, 分别。对于燃料类型20,预期的城市和高速公路MPG都是33.5476 - 9.2284 = 24.319238.5720 - 8.6663 = 29.9057

  • 凝结重量的一个标准偏差的增加几乎对预期的城市和高速公路MPG具有几乎相同的效果。鉴于别的等于,预期的MPG逐渐减少6.3对于城市和高速公路MPG,每个标准偏差都会增加遏制重量。

  • 对于轮基的每个标准偏差增加,预期城市MPG增加0.972,虽然预期的高速公路MPG仅增加0.395,给予所有其他相同。

计算标准错误。

回归系数的标准误差是方差协方差矩阵对角线的平方根,V.

se = sqrt(diag(v))
se =8×10.7365 0.7599 0.3589 0.3702 0.3497 0.3608 0.7790 0.8037

重塑系数矩阵。

您可以轻松地将回归系数重新塑造到原始的4×2矩阵中。

b =重塑(beta,2,4)'
B =4×233.5476 38.5720 0.9723 0.9723 0.3950 -6.3064 -6.3584 -9.2284 -8.6663

检查模型假设。

在模型假设下, Z. = E. σ. - 1 / 2 应该是独立的,具有双方标准正态分布。在此2-D情况下,您可以使用散点图评估本假设的有效性。

z = e / chol(sigma);图()绘图(z(:,1),z(:,2),'。') 标题('标准化残差') 抓住%覆盖标准正常轮廓z1 = linspace(-5,5);z2 = linspace(-5,5);[zx,zy] = meshgrid(z1,z2);zgrid = [重塑(zx,100 ^ 2,1),重塑(zy,100 ^ 2,1)];Zn = REPAPE(MVNPDF(ZGRID),100,100);[C,H] =轮廓(ZX,ZY,Zn);扣(C,H)

图包含轴。具有标题标准化残留的轴包含2个类型的线,轮廓。

几个残差大于预期,但总体而言,几乎没有针对多变量正常假设的证据。

也可以看看

|

相关例子

更多关于