主要内容

线性混合效应模型中的估计参数

线性混合效应模型是形式

y = X β F 一世 X e d + z b r 一个 n d o m + ε e r r o r ,,,,

在哪里

  • y是个n-1响应向量,以及n是观察的数量。

  • X是一个n-经过-p固定效应设计矩阵。

  • β是一个p-1 By-1固定效应向量。

  • z是一个n-经过-随机效应设计矩阵。

  • b是一个-1 by-1随机效应矢量。

  • ε是个n-1观察误差向量。

随机效应向量,b,以及错误向量,ε,假定具有以下独立的先验分布:

b n (( 0 ,,,, σ 2 d (( θ ,,,, ε n (( 0 ,,,, σ 2 ,,,,

在哪里d是一种对称和正的半芬矿基质,由方差组件矢量参数化θ,,,,是一个n-经过-n身份矩阵,σ2是误差差异。

在此模型中,要估计的参数是固定效应系数β,以及差异组件θσ2。线性混合效应模型中参数估计的两种最常用的方法是最大似然和受限的最大似然方法。

最大似然(ML)

最大似然估计既包括回归系数和方差成分,也就是说,即固定效应和随机效应项中的可能性函数。

对于上面定义的线性混合效应模型,响应变量的条件响应y给出β,,,,b,,,,θ和σ2

y | b ,,,, β ,,,, θ ,,,, σ 2 n (( X β + z b ,,,, σ 2 n

可能的可能性y给出β,,,,θ和σ2

p (( y | β ,,,, θ ,,,, σ 2 = p (( y | b ,,,, β ,,,, θ ,,,, σ 2 p (( b | θ ,,,, σ 2 d b ,,,,

在哪里

p (( b | θ ,,,, σ 2 = 1 (( 2 π σ 2 2 1 | d (( θ | 1 2 经验 { - 1 2 σ 2 b t d - 1 b } p (( y | b ,,,, β ,,,, θ ,,,, σ 2 = 1 (( 2 π σ 2 n 2 经验 { - 1 2 σ 2 (( y - X β - z b t (( y - X β - z b }

假设λ(θ)是下部三角形的cholesky因子d((θ)和δ(θ)是λ的逆(θ)。然后,

d (( θ - 1 = δ (( θ t δ (( θ

定义

r 2 (( β ,,,, b ,,,, θ = b t δ (( θ t δ (( θ b + (( y - X β - z b t (( y - X β - z b ,,,,

并假设b*是价值b满足

r 2 (( β ,,,, b ,,,, θ b | b * = 0

给定βθ。然后,可能性功能是

p (( y | β ,,,, θ ,,,, σ 2 = (( 2 π σ 2 - n 2 | d (( θ | - 1 2 经验 { - 1 2 σ 2 r 2 (( β ,,,, b * (( β ,,,, θ } 1 | δ t δ + z t z | 1 2

p(y |β,,,,θ,σ2)首先对β和σ2给定θ。因此优化的解决方案万博 尤文图斯 β ^ (( θ σ ^ 2 (( θ 作为作为功能θ。将这些解决方案替换为可能性函数万博 尤文图斯 p (( y | β ^ (( θ ,,,, θ ,,,, σ ^ 2 (( θ 。这种表达称为特征的可能性β和σ2已被介绍了。 p (( y | β ^ (( θ ,,,, θ ,,,, σ ^ 2 (( θ θ,然后算法相对于θ。一旦找到了最佳估计θ,估计β和σ2 β ^ (( θ σ ^ 2 (( θ

ML方法治疗β当估计方差成分时,固定但未知数量,但没有考虑到通过估计固定效应而丢失的自由度。这会导致ML估计值较小。但是,ML比REML的优点是,可以根据其固定效果和随机效应项比较两个模型。另一方面,如果使用REML估算参数,则只能比较两个模型,它们以随机效应术语嵌套,以及相同的固定效果设计。

限制最大似然(REML)

受限的最大似然估计仅包括方差成分,即在线性混合效应模型中参数化随机效应项的参数。β在第二步中进行估计。假设统一的不正确的先验分布β并整合可能性p(y|β,,,,θ,σ2) 关于β导致限制的可能性p(y|θ,σ2)。那是,

p (( y | θ ,,,, σ 2 = p (( y | β ,,,, θ ,,,, σ 2 p (( β d β = p (( y | β ,,,, θ ,,,, σ 2 d β

算法首先配置 σ ^ r 2 并最大化其剩余的客观功能相对于θ找到 θ ^ r 。然后,相对于σ最大化受限的可能性2找到 σ ^ r 2 。然后,它估计β通过找到其相对于后验分布的期望值

p (( β | y ,,,, θ ^ r ,,,, σ ^ r 2

REML通过估计固定效应来解释损失的自由度,并使随机效应方差的偏见较小。估计值θ和σ2是不变的价值β与ML估计值相比,数据中对数据的敏感性较小。但是,如果您使用REML估算参数,则只能比较两个具有相同固定效果设计矩阵并以随机效应项嵌套的模型。

参考

[1] Pinherio,J。C.和D. M. Bates。S和S-Plus中的混合效应模型。统计与计算系列,Springer,2004年。

[2] Hariharan,S。和J. H. Rogers。“分层线性模型的估计程序。”教育数据的多级建模(A. A. Connell和D. B. McCoach编辑)。北卡罗来纳州夏洛特:信息时代出版公司,2008年。

[3] Raudenbush,S。W。和A. S. Bryk。分层线性模型:应用和数据分析方法,第二版。加利福尼亚州千橡市:Sage出版物,2002年。

[4] Hox,J。多级分析,技术和应用。Lawrence Erlbaum Associates,Inc,2002年。

[5] Snidjers,T。和R. Bosker。多级分析。加利福尼亚州千橡市:Sage出版物,1999年。

[6] McCulloch,C.E.,R。S。Shayle和J. M. Neuhaus。广义,线性和混合模型。威利,2008年。

也可以看看

||

相关话题