线性混合效应模型的参数估计-MATLAB和Simulink-MathWorks-Benelux万博1manbetx

线性混合效应模型的参数估计

线性混合效应模型的形式为

$是的 = \underset{f型我十 e类丁}{\underset{︸}{十 β}} + \underset{右一 n个丁 o型米}{\underset{︸}{Z轴乙}} + \underset{e类右右 o型右}{\underset{︸}{ε}},$

哪里

是的是个n个-by-1响应向量，以及n个是观察的次数。
十是一个n个-通过-第页固定效果设计矩阵。
β是一个第页×1固定效应向量。
Z轴是一个n个-通过-问随机效应设计矩阵。
乙是一个问-by-1随机效应向量。
ε是个n个-by-1观测误差矢量。

随机效应向量，乙，以及错误向量，ε，被假定为具有如下独立先验分布：

$\begin{array}{l} 乙 ~ N个 (0个, σ^{2个} 丁 (θ)), \\ ε ~ N个 (0个, σ {}^{2个}我), \end{array}$

哪里丁是对称和半正定矩阵，通过方差分量向量参数θ,我是一个n个-通过-n个身份矩阵，以及σ^2个是误差方差。

在这个模型中，参数以估计是固定效应系数β，以及方差分量θ和σ^2个.两种最常用的方法的参数估计在线性混合效应模型的最大似然，并限制最大似然方法。

最大似然（ML）

最大似然估计包括回归系数和方差分量，即似然函数中的固定效应项和随机效应项。

对于上面定义的线性混合效应模型，响应变量的条件响应是的鉴于β,乙,θ，和σ^2个是

$是的 | 乙, β, θ, σ^{2个} ~ N个 (十 β + Z轴乙, σ^{2个} 我_{n个}) .$

可能性是的鉴于β,θ，和σ^2个是

$第页 (是的 | β, θ, σ^{2个}) = \int 第页 (是的 | 乙, β, θ, σ^{2个}) 第页 (乙 | θ, σ^{2个}) 丁乙,$

哪里

$\begin{array}{l} 第页 (乙 | θ, σ^{2个}) = \frac{1个}{{(2个 π σ^{2个})}^{\frac{问}{2个}}} \frac{1个}{{| 丁 (θ) |}^{\frac{1个}{2个}}} 经验 {- \frac{1个}{2个 σ^{2个}} 乙^{T型} 丁^{- 1个} 乙} 和 \\ 第页 (是的 | 乙, β, θ, σ^{2个}) = \frac{1个}{{(2个 π σ^{2个})}^{\frac{n个}{2个}}} 经验 {- \frac{1个}{2个 σ^{2个}} {(是的 - 十 β - Z轴乙)}^{T型} (是的 - 十 β - Z轴乙)} . \end{array}$

假设Λ（θ)是下三角的Cholesky因子丁(θ)和Δ(θ)是∧的倒数(θ). 那么，

$丁 {(θ)}^{- 1个} = Δ {(θ)}^{T型} Δ (θ) .$

定义

$右^{2个} (β, 乙, θ) = 乙^{T型} Δ {(θ)}^{T型} Δ (θ) 乙 + {(是的 - 十 β - Z轴乙)}^{T型} (是的 - 十 β - Z轴乙),$

假设乙^*是乙满足

${\frac{\partial 右^{2个} (β, 乙, θ)}{\partial 乙} |}_{乙^{*}} = 0个$

对于给定的β和θ.然后，似然函数是

$第页 (是的 | β, θ, σ^{2个}) = {(2个 π σ^{2个})}^{- \frac{n个}{2个}} {| 丁 (θ) |}^{- \frac{1个}{2个}} 经验 {- \frac{1个}{2个 σ^{2个}} 右^{2个} (β, 乙^{*} (β), θ)} \frac{1个}{{| Δ^{T型} Δ + {Z轴}^{T型} Z轴 |}^{\frac{1个}{2个}}} .$

年|β,θ,σ^2个)首先最大化β和σ^2个对于给定的θ. 因此，优化的解决方案万博尤文图斯 $\hat{β} (θ)$ 和 ${\hat{σ}}^{2个} (θ)$ 作为θ. 将这些解代入似然函数产生万博尤文图斯 $第页 (是的 | \hat{β} (θ), θ, {\hat{σ}}^{2个} (θ))$ . 此表达式称为剖面似然，其中β和σ^2个已经被分析出来了。 $第页 (是的 | \hat{β} (θ), θ, {\hat{σ}}^{2个} (θ))$ 是θ，并且该算法然后相对于优化它θ.一旦它找到的最优估计θ，的估计β和σ^2个由给出 $\hat{β} (θ)$ 和 ${\hat{σ}}^{2个} (θ)$ .

ML法治疗β当方差分量被估计时，作为固定但未知的量，但不考虑通过估计固定效应而损失的自由度。这导致ML估计值带有较小方差的偏差。然而，与REML相比，ML的一个优点是可以比较两个模型的固定和随机效应项。另一方面，如果使用REML估计参数，则只能比较两个嵌套在其随机效果项中的模型，它们具有相同的固定效果设计。

限制最大似然（REML）

限制极大似然估计只包括方差分量，即线性混合效应模型中参数化随机效应项的参数。β估计在第二步骤。假定为均匀的不当先验分布β积分似然P(是的|β,θ,σ^2个）关于β结果限制似然P(是的|θ,σ^2个). 也就是说，

$第页 (是的 | θ, σ^{2个}) = \int 第页 (是的 | β, θ, σ^{2个}) 第页 (β) 丁 β = \int 第页 (是的 | β, θ, σ^{2个}) 丁 β .$

算法首先分析出来 ${\hat{σ}}_{右}^{2个}$ 并最大限度地提高剩余的目标函数相对于θ找到 ${\hat{θ}}_{右}$ . 然后，限制似然相对于σ最大化^2个找到 ${\hat{σ}}_{右}^{2个}$ .然后，估计β通过相对于寻找其预期值的后验分布

$第页 (β | 是的, {\hat{θ}}_{右}, {\hat{σ}}_{右}^{2个}) .$

REML通过估计固定效应来解释自由度的损失，并对随机效应方差进行较少的有偏估计。估计θ和σ^2个对于β与ML估计相比，对数据中的异常值不太敏感。但是，如果使用REML估计参数，则只能比较具有相同固定效果设计矩阵且嵌套在其随机效果项中的两个模型。

参考

[1] Pinherio，J.C.，和D. M.贝茨。S和S-PLUS中的混合效应模型.统计与计算系列，施普林格，2004年。

[2] 哈里哈兰，S.和J.H.罗杰斯。“分层线性模型的估计过程。”教育数据的多层次建模（A. A.康奈尔和D. B. McCoach编）。北卡罗来纳州夏洛特：信息时代出版公司，2008。

[3] 劳登布什，S.W.和A.S.Bryk。层次线性模型：应用与数据分析方法，第2版。千橡，CA：Sage出版社，2002年。

[4]的Hox，J.多层次分析、技术与应用. 劳伦斯·厄尔鲍姆联合公司，2002年。

[5] 狙击手，T.和R.博斯克。多层次分析.千橡，CA：Sage出版社，1999年。

[6] McCulloch，C.E.，R.S.Shayle和J.M.Neuhaus。广义，线性和混合模型.Wiley出版社，2008年。

另见

线性模型|菲特尔梅|菲特矩阵