主要内容

线性混合效果模型工作流程

此示例显示如何适应和分析线性混合效果模型(LME)。

加载样本数据。

负载流感

流感数据集数组有一个日期变量,以及包含估计流感发病率的10个变量(在9个不同地区,通过Google®搜索估计,再加上CDC的全国性估计)。

重新组织并绘制数据。

为了适应线性混合效应模型,您的数据必须是一个正确格式的数据集阵列。为了适应与流感率作为响应的线性混合效应模型,结合对应的区域中的九列到一个数组。新的数据集阵列,flu2,必须具有响应变量泛滥,标称可变地区显示每个估计的哪个区域来自全国范围的估计wtdili.,以及分组变量日期

flu2=堆叠(flu,2:10,'newdatavarname''泛骨'......“因德瓦名”“区域”);flu2.Date =额定(flu2.Date);

定义flu2作为一个桌子

flu2 = dataset2table(flu2);

绘制流感发病率与全国估计值的对比图。

地块(flu2.WtdILI、flu2.FluRate、,'ro')Xlabel('WtdILI')ylabel('流感率'

您可以看到区域中的流感率与全国范围内的估计有直接的关系。

拟合LME模型并解释结果。

拟合线性混合效应模型,以全国估计值作为预测变量,随机截距随时间变化日期

lme=fitlme(flu2,'FluRate〜1 + WtdILI +(1 |日期)'
lme=线性混合效应模型通过ML模型拟合信息:观测次数468固定效应系数2随机效应系数52协方差参数2公式:FluRate~1+WtdILI+(1 |日期)模型拟合统计:AIC BIC对数似然偏差286.24 302.83-139.12 278.24固定效应系数(95%CI):名称估计SE tStat DF pValue{(截距)}0.16385 0.057525 2.8484 466 0.0045885{WtdILI}0.7236 0.032219 22.459 466 3.0502e-76下上0.050813 0.27689 0.66028 0.78691随机效应协方差参数(95%CIs):组:日期(52个级别)名称2类型估计值{(截距)}下上0.17146下0.13227 0.2226组:错误名称估计下限上限{'Res Std'}0.30201 0.28217 0.32324

$p$的0.0045885和3.0502e-76 - 值表明,这两个截距和全国估计是显著。此外,对于随机效应项的标准偏差的置信区间,$ \ sigma_ {B} $,不包括0(0.13227,0.22226),这表明随机效应项是显著的。

绘制原始残差与拟合值的对比图。

图();绘图仪残差(lme,“合适的”

残留物的方差随着拟合响应值的增加而增加,称为异源性。

查找出现像离群右上角的两点意见。

查找(残差(lme)>1.5)
ans = 98 107

通过移除这些意见重新装模型。

lme=fitlme(flu2,'FluRate〜1 + WtdILI +(1 |日期)''排除',[98,107]);

改进模型。

确定是否包括全国范围内估计的独立随机术语日期改善模型。

altlme = fitlme(flu2,“FluRate~1+WtdILI+(1 |日期)+(WtdILI-1 |日期)”......'排除',[98,107])
Altlme =线性混合效果模型适合ML型号信息:观测数量466固定效果系数2随机效果系数104协方差参数3公式:脆性〜1 + Wtdili +(1 |日期)+(WTDILI |日期)模型拟合统计:AIC BIC Loglikelihie偏差179.39 200.11 -84.694 169.39固定效果系数(95%CIS):名称估计SE TSTAT DF pvalue {'(拦截)'} 0.17837 0.054585 3.2676 464 0.12836 0.030594 23.153 464 2.1230-79下较高0.0711 0.28563 0.64824 0.64824 0.76849随机效应协方差参数(95%CIS):组:日期(52级)Name1 Name2 eStims {'(拦截)'} {'(拦截)'} {'std'} 0.16631下较高0.129770.21313组:日期(52级)Name1 Name2类型估计{'Wtdili'} {'Wtdili'} {'Wtdili'} {'STD'} 4.6672E-08 NaN上NAN:误差名估计下上部{'res std'} 0.26691 0.249340.28572

的估计标准偏差wtdili.长期接近0和置信区间无法计算。这是该模型overparameterized的指示和(WTDILI-1 |日期)这个术语并不重要。您可以使用相比方法如下:比较(lme,altlme,'checknesting',true)

将按区域分组的截距的随机效果项添加到初始模型中伦敦金属交易所

lme2=fitlme(flu2,'脆〜1 + wtdili +(1 |日期)+(1 |地区)'......'排除',[98,107]);

比较模型伦敦金属交易所lme2

比较(LME,LME2,“检查嵌套”,真的)
ANS =理论似然比检验模型DF AIC BIC LogLik LRStat deltaDF p值LME 4 177.39 193.97 -84.694 lme2 5 62.265 82.986 -26.133 117.12 1 0

$p$-值为0表示lme2是一个更好的适合比伦敦金属交易所

现在,检查为截距和全国平均值添加一个潜在相关的随机效应项是否可以改进模型lme2

lme3=fitlme(flu2,'脆性〜1 + wtdili +(1 |日期)+(1 + wtdili |地区)'......'排除',[98,107])
lme3=线性混合效应模型拟合ML模型信息:观测次数466固定效应系数2随机效应系数70协方差参数5公式:FluRate~1+WtdILI+(1 |日期)+(1+WtdILI |区域)模型拟合统计:AIC BIC对数似然偏差13.338 42.348 0.33076-0.66153固定效应系数(95%CI):名称估计值SE tStat DF pValue{(截距)}0.1795 0.054953.2665 464 0.0011697{WtdILI}0.70719 0.04252 16.632 464 4.6451e-49上下0.071514 0.28749 0.62363 0.79074随机效应协方差参数(95%CI):组:日期(52级)名称类型估计值{(截距){(截距)}std0.17634上下0.14093 0.22064组:区域(9级)名称1名称2类型估计{(截距){(截距)}{(截距)}0.0077038{WtdILI}{(截距)}{(截距)}-0.059604{WtdILI}{(截距)}0.088069上下3.2016e-16 1.8537e+11-0.99995 0.051694 0.15004组:错误名称估计上下std0.20976 0.19568 0.22486

按区域分组的随机效应项的标准偏差的估计为0.0077037,其置信区间非常大并且包括零。这表明由区域分组的截距的随机效应是微不足道的。随机效应与拦截与截取的相关性wtdili.为-0.059604。它的置信区间也很大,包括零。这表明相关性不显著。

通过消除模型中的截距来重新安装模型(1 + WTDILI |地区)随机效应项。

lme3=fitlme(flu2,'FluRate〜1 + WtdILI +(1 |日期)+(WtdILI  -  1 |地区)'......'排除',[98,107])
+(WtdILI |区域)模型拟合统计| FluRate〜1 + WtdILI +(时间1):通过ML模型信息LME3 =线性混合效应模型拟合:观察466固定效应系数2个随机效应系数61个协方差参数3式数:AIC BIC对数似然越轨9.3395 30.06 0.33023 -0.66046固定效应系数(95%CI)的:姓名估计SE TSTAT DF p值{ '(截距)'} 0.1795 0.054892 3.2702 464 0.0011549 { 'WtdILI'} 0.70718 0.042486 16.645 464 4.0496e-49下限上限0.071637 0.28737 0.62369 0.79067随机效应协方差参数(95%CI)的:组:日期(52个级别)名1名2型估计{ '(截距)'} { '(截距)'} { 'STD'} 0.17633下限上限0.140920.22062组:区(9个级别)名1名2型估量较低{ 'WtdILI'} { 'WtdILI'} { 'STD'} 0.087925 0.054474上0.14192组:错误名称估计下限上限{ 'RES标准'} 0.20979 0.19585 0.22473

新模型中的所有术语lme3有显著。

比较lme2lme3

比较(LME2,LME3,“检查嵌套”,真的,“NSim”,100)
ANS =模拟似然比测试:NSIM = 100,alpha = 0.05型号DF AIC BIC LOGLIK LRSTAT PVALUE LME2 5 62.265 82.986 -26.133 LME3 5 9.3395 30.06 0.33023 52.926 0.009901下高0.00025064 0.053932

$p$- 0.009901的值表示lme3是一个更好的适合比lme2

为模型添加二次固定效果术语lme3

lme4 = fitlme(flu2,'脆性〜1 + wtdili ^ 2 +(1 |日期)+(Wtdili  -  1 |地区)'......'排除',[98,107])
lme4 =线性混合效应由ML模型信息的模型拟合:若干意见466固定效应系数3个随机效应系数61个协方差参数3式:FluRate〜1 + WtdILI + WtdILI ^ 2 +(1个|日期)+(WtdILI |地区)模型拟合统计:AIC BIC对数似然越轨6.7234 31.588 2.6383 -5.2766固定效应系数(95%CI)的:姓名估计SE TSTAT DF p值{ '(截距)'} -0.063406 0.12236 -0.51821 463 0.60456 { 'WtdILI'} 1.0594 0.165546.3996 463 3.8232e-10 { 'WtdILI ^ 2'} -0.096919 0.0441 -2.1977 463 0.028463下限上限-0.30385 0.17704 0.73406 1.3847 -0.18358 -0.010259随机效应协方差参数(95%CI)的:组:日期(52个级别)名1名称2型估计{ '(截距)'} { '(截距)'} { 'STD'} 0.16732下限上限0.13326 0.21009组:区(9个级别)名1名2型估量较低{ 'WtdILI'} { 'WtdILI'} {”STD '} 0.087865 0.054443上0.1418组:错误名称估量较低上限{' RES标准'} 0.20979 0.19585 0.22473

$p$- 0.028463的值表明二次术语的系数wtdili ^ 2是显著。

绘制拟合反应与观察到的响应和残差。

f =安装(LME4);r =响应(lme4);数字();绘图(r,f,“rx”)Xlabel('回复')ylabel(“合身”

拟合与观察到的响应值形成近45度的角度,表示良好的合适。

绘制残差与拟合值。

数字();plotresidss(lme4,“合适的”

虽然它有所改进,但您仍然可以在模型中看到一些异方差。这可能是由于数据集中不存在另一个预测器,因此不在模型中。

查找区域ENCentral,日期2005年11月6日的拟合流感率值。

F(flu2.0)区域=='笼罩'&flu2.date ==.'11/6/2005'
ANS = 1.4860

随机生成响应值。

随机生成的1.625的全国估计,区域MidAtl和日期2006年4月23日响应值。首先,定义新表。由于日期与地区都在原表标称,你必须在新表中同样定义。

tblnew.date =名义('4/23/2006'); tblnew.WtdILI=1.625;tblnew.区域=标称('MidAtl');tblnew = struct2table(tblnew);

现在,生成响应值。

随机(lme4,tblnew)
ANS = 1.2679