主要内容

线性混合效应模型中的参数估计

线性混合效应模型的形式

Y = X β F x E D + Z B R A. N D o M + ε E R R o R ,

哪里

  • YN-by-1响应向量,以及N为观察次数。

  • X是一个N——- - - - - -P固定效果设计矩阵。

  • β是一个P1固定后果向量。

  • Z是一个N——- - - - - -Q随机设计矩阵。

  • B是一个Q-by-1随机效应向量。

  • εN-by-1观测误差向量。

随机效应向量,B,以及误差向量,ε,假设具有以下独立的先验分布:

B ~ N ( 0 , σ 2. D ( θ ) ) , ε ~ N ( 0 , σ 2. ) ,

哪里D一个对称的正半定矩阵,由方差分量向量参数化吗θ,是一个N——- - - - - -N单位矩阵,以及σ2.是误差方差。

在这个模型中,估计的参数是固定效应系数β,以及方差分量θσ2..线性混合效应模型中最常用的两种参数估计方法是最大似然法和限制最大似然法。

最大似然(ML)

最大似然估计包括回归系数和方差分量,即似然函数中的固定效应项和随机效应项。

对于上面定义的线性混合效应模型,响应变量的条件响应Y鉴于β,B,θ2.

Y | B , β , θ , σ 2. ~ N ( X β + Z B , σ 2. N )

可能性Y鉴于β,θ2.

P ( Y | β , θ , σ 2. ) = P ( Y | B , β , θ , σ 2. ) P ( B | θ , σ 2. ) D B ,

哪里

P ( B | θ , σ 2. ) = 1. ( 2. π σ 2. ) Q 2. 1. | D ( θ ) | 1. 2. 经验 { 1. 2. σ 2. B T D 1. B } P ( Y | B , β , θ , σ 2. ) = 1. ( 2. π σ 2. ) N 2. 经验 { 1. 2. σ 2. ( Y X β Z B ) T ( Y X β Z B ) }

假设Λ(θ)是的下三角Cholesky因子D(θ)和Δ(θ)是∧的倒数(θ).然后,

D ( θ ) 1. = Δ ( θ ) T Δ ( θ )

定义

R 2. ( β , B , θ ) = B T Δ ( θ ) T Δ ( θ ) B + ( Y X β Z B ) T ( Y X β Z B ) ,

假设B*价值是多少B满足

R 2. ( β , B , θ ) B | B * = 0

对于给定βθ.则似然函数为

P ( Y | β , θ , σ 2. ) = ( 2. π σ 2. ) N 2. | D ( θ ) | 1. 2. 经验 { 1. 2. σ 2. R 2. ( β , B * ( β ) , θ ) } 1. | Δ T Δ + Z T Z | 1. 2.

P(y)|β,θ2.)首先是关于β和σ2.对于一个给定的θ.因此,优化的解决方案万博 尤文图斯 β ^ ( θ ) σ ^ 2. ( θ ) 作为的函数获得θ.将这些解代入似然函数产生万博 尤文图斯 P ( Y | β ^ ( θ ) , θ , σ ^ 2. ( θ ) ) .此表达式称为轮廓似然,其中β和σ2.我们已经做了简要介绍。 P ( Y | β ^ ( θ ) , θ , σ ^ 2. ( θ ) ) 是的函数θ,然后算法对其进行优化θ.一旦它找到最优估计θ的估计β和σ2. β ^ ( θ ) σ ^ 2. ( θ )

ML方法处理β当估计方差分量时,作为固定但未知的量,但不考虑通过估计固定效应而损失的自由度。这导致ML估计偏差较小。然而,ML优于REML的一个优点是,可以比较两个模型的固定和随机性-效果项。另一方面,如果使用REML估计参数,则只能比较嵌套在随机效果项中的两个模型与相同的固定效果设计。

限制最大似然(REML)

受限最大似然估计仅包括方差分量,即线性混合效应模型中参数化随机效应项的参数。β是在第二步估计的。假设有一致反常的先验分布β和积分似然P(Y|β,θ2.关于β结果在限制似然P(Y|θ2.).就是,

P ( Y | θ , σ 2. ) = P ( Y | β , θ , σ 2. ) P ( β ) D β = P ( Y | β , θ , σ 2. ) D β

该算法首先提取出轮廓 σ ^ R 2. 最大化剩下的目标函数θ找到 θ ^ R . 然后,限制可能性相对于σ最大化2.找到 σ ^ R 2. .然后,它估计β通过求其相对于后验分布的期望值

P ( β | Y , θ ^ R , σ ^ R 2. )

REML解释了通过估计固定效应而损失的自由度,并对随机效应方差进行了较少偏差的估计θ和σ2.对的值是不变的β与ML估计值相比,对数据中的异常值不太敏感。但是,如果使用REML估计参数,则只能比较具有相同固定效果设计矩阵且嵌套在其随机效果项中的两个模型。

参考文献

Pinherio J. C.和D. M. Bates。S和S-PLUS中的混合效应模型.统计与计算系列,施普林格,2004。

[2] 哈里哈兰,S.和J.H.罗杰斯,“分层线性模型的估计程序。”教育数据的多级建模(康奈尔、麦教练编)。信息时代出版公司,2008。

[3] 劳登布什,S.W.和A.S.Bryk。分层线性模型:应用和数据分析方法,第2版。加州千橡树:Sage出版物,2002。

[4] Hox, J。多层次分析、技术与应用劳伦斯·厄尔鲍姆联合公司,2002年。

[5] 斯奈杰斯、T.和R.博斯克。多层次分析.加利福尼亚州千橡市:Sage出版社,1999年。

[6] McCulloch,C.E.,R.S.Shayle和J.M.Neuhaus。广义、线性和混合模型.威利,2008年。

另见

||

相关的话题