此示例显示如何设置多变量通用线性模型以进行估计mvregress.
。
此数据包含在1985年的205个自动导入样本上的测量值。
在这里,模拟城市和高速公路MPG(第14栏和15栏)的二元响应。
对于预测器,使用轮基(柱3),遏制重量(柱7)和燃料型(柱18)。前两个预测器是连续的,对于该示例,以居中和缩放。燃料类型是一个分类变量,两个类别(11.
和20.
),所以回归需要一个伪指示器变量。
加载('进口-85')y = x(:,14:15);[n,d] =尺寸(y);x1 = zscore(x(:,3));x2 = zscore(x(:,7));x3 = x(:,18)== 20;XMAT = [(n,1)x1 x2 x3];
变量X3
编码为具有值1
对于燃料型20和值0.
除此以外。
为方便起见,将三个预测器(轮基,遏制重量和燃料型指示器)组合成一个设计矩阵,增加了截距术语。
鉴于这些预测因子,用于双变量MPG响应的多变量一般线性模型是
在哪里 。有 总共回归系数。
创造一个长度
用于2×8(D-BY-K)矩阵的单元阵列用于使用mvregress.
。单元阵列中的第i矩阵是
Xcell = cell(1,n);为了i = 1:n xcell {i} = [kron([xmat(i,i :)],眼睛(d))];结尾
鉴于设计矩阵的本说明书,相应的参数向量是
使用最大似然估计拟合模型。
β,sigma,e,v] = mvregress(xcell,y);bet
β=8×133.5476 38.5720 0.9723 0.9723 0.3950 -6.3064 -6.3584 -9.2284 -8.6663
这些系数估计显示:
预期的城市和高速公路MPG为平均轮基,遏制重量和燃料类型11是汽车33.5
和38.6
, 分别。对于燃料类型20,预期的城市和高速公路MPG都是33.5476 - 9.2284 = 24.3192
和38.5720 - 8.6663 = 29.9057
。
凝结重量的一个标准偏差的增加几乎对预期的城市和高速公路MPG具有几乎相同的效果。鉴于别的等于,预期的MPG逐渐减少6.3
对于城市和高速公路MPG,每个标准偏差都会增加遏制重量。
对于轮基的每个标准偏差增加,预期城市MPG增加0.972
,虽然预期的高速公路MPG仅增加0.395
,给予所有其他相同。
回归系数的标准误差是方差协方差矩阵对角线的平方根,V.
。
se = sqrt(diag(v))
se =8×10.7365 0.7599 0.3589 0.3702 0.3497 0.3608 0.7790 0.8037
您可以轻松地将回归系数重新塑造到原始的4×2矩阵中。
b =重塑(beta,2,4)'
B =4×233.5476 38.5720 0.9723 0.9723 0.3950 -6.3064 -6.3584 -9.2284 -8.6663
在模型假设下, 应该是独立的,具有双方标准正态分布。在此2-D情况下,您可以使用散点图评估本假设的有效性。
z = e / chol(sigma);图()绘图(z(:,1),z(:,2),'。') 标题('标准化残差') 抓住上%覆盖标准正常轮廓z1 = linspace(-5,5);z2 = linspace(-5,5);[zx,zy] = meshgrid(z1,z2);zgrid = [重塑(zx,100 ^ 2,1),重塑(zy,100 ^ 2,1)];Zn = REPAPE(MVNPDF(ZGRID),100,100);[C,H] =轮廓(ZX,ZY,Zn);扣(C,H)
几个残差大于预期,但总体而言,几乎没有针对多变量正常假设的证据。