主要内容

方差分析

类:GeneralizedLinearMixedModel

广义线性混合效应模型的方差分析

描述

例子

统计数据=方差分析(glme返回一个表,统计数据,包含的结果F-测试,以确定所有系数是否代表广义线性混合效应模型中的每个固定效应项glme等于0。

统计数据=方差分析(glme名称,值返回一个表,统计数据,使用一个或多个指定的其他选项名称,值对参数。例如,您可以指定用于计算近似分母自由度的方法F测试。

输入参数

全部展开

广义线性混合效应模型,指定为aGeneralizedLinearMixedModel对象。有关此对象的属性和方法,请参见GeneralizedLinearMixedModel

名称-值对的观点

指定可选的逗号分隔对名称,值参数。的名字参数名和价值是对应的值。的名字必须出现在引号内。您可以按如下顺序指定几个名称和值对参数Name1, Value1,…,的家

计算近似分母自由度的方法,用于F-test,指定为逗号分隔的对,由“DFMethod”下面是其中之一。

价值 描述
“残留” 假定自由度是恒定的和相等的n- - - - - -p,在那里n观察的次数是多少p是固定效果的数量。
“没有” 所有的自由度都设为无穷大。

分母的自由度F-statistic对应列DF2.在输出结构中统计数据

例子:“DFMethod”、“没有”

输出参数

全部展开

的结果F-测试固定效果术语,作为一个表返回,其中的每个固定效果术语都有一行glme下面这几列。

列名 描述
术语 固定效应项的名称
函数 F-statistic for the term
DF1. 分子自由度F统计
DF2. 分母的自由度F统计
pValue p-value for the term

每个固定效应项是一个连续变量,一个分组变量,或两个或多个连续或分组变量之间的相互作用。对于每个固定效应期,方差分析执行一个F-检验(边际检验),以确定是否代表固定效应项的所有系数都等于0。

在拟合广义线性混合效应模型时,对第三类假设进行检验fitglme,必须使用“影响”形成鲜明对比的“DummyVarCoding”名称-值对的论点。

例子

全部展开

加载样例数据。

负载MFR.

这些模拟数据来自一家制造公司,该公司在世界各地运营着50家工厂,每家工厂都运行批处理流程来创建成品。该公司想要减少每批产品的缺陷数量,所以它开发了一种新的制造工艺。为了测试新工艺的有效性,公司随机选择20家工厂参加实验:10家工厂执行新工艺,另外10家工厂继续运行旧工艺。在这20家工厂中,公司分别运行了5批(共100批),并记录了以下数据:

  • 指示批处理是否使用新流程的标志(newprocess

  • 每批处理所需时间(小时)(时间

  • 批次的温度(摄氏度)(临时

  • 指明供应商的类别变数(一个B,或C)所使用的化学物质(供应商

  • 批次内的缺陷数目(缺陷

数据还包括time_devtemp_dev,分别表示时间和温度与工艺标准在20摄氏度下3小时的绝对偏差。

拟合一个广义线性混合效应模型使用newprocesstime_devtemp_dev,供应商固定后果预测。包含一个随机效应术语,用于分组的截距工厂,以解释因工厂特定差异而可能存在的质量差异。响应变量缺陷具有泊松分发,此模型的适当链接功能是日志。使用拉普拉斯匹配方法来估计系数。指定编码的虚拟变量“影响”,所以虚拟变量系数和为0。

缺陷的数量可以用泊松分布来建模

缺陷 j 泊松 μ j

这对应于广义线性混合效应模型

日志 μ j β 0 + β 1 newprocess j + β 2 时间 _ dev j + β 3. 临时 _ dev j + β 4 供应商 _ C j + β 5 供应商 _ B j + b

在哪里

  • 缺陷 j 工厂生产的批次中发现的缺陷数量是多少 在批处理 j

  • μ j 缺陷的平均数量是否与工厂相对应 ( 1 2 2 0 在批处理) j ( j 1 2 5 ).

  • newprocess j 时间 _ dev j , 临时 _ dev j 是否每个变量的测量值都对应于工厂 在批处理 j .例如, newprocess j 是否为工厂生产的批次 在批处理 j 使用了新工艺。

  • 供应商 _ C j 供应商 _ B j 虚拟变量是否使用效应(从和到零)编码来表示是否为公司C或者B,分别为工厂生产的批次提供工艺化学品 在批处理 j

  • b N 0 σ b 2 是随机效应截取每个工厂 这就解释了工厂特有的质量差异。

glme = fitglme(生产商,'缺陷~ 1 + newprocess + time_dev + temp_dev + supplier + (1|factory)'...“分布”“泊松”“链接”“日志”“FitMethod”“拉普拉斯”“DummyVarCoding”“影响”
glme =广义线性mixed-effects模型适合毫升模型信息:观察100固定效应系数6 20协方差参数随机效应系数1泊松分布链接日志FitMethod拉普拉斯公式:缺陷~ 1 + newprocess + time_dev + temp_dev +供应商+(1 |工厂)模型适合统计:AIC BIC LogLikelihood Deviance 416.35 434.58 -201.17 402.35名称估算SE tStat DF pValue {'(Intercept)'} 1.4689 0.15988 9.1875 94 9.8194e-15 {'newprocess'} -0.36766 0.17755 -2.0708 94 0.041122 {'time_dev'} -0.094521 0.82849 -0.11409 94 0.90941 {'temp_dev'} -0.28317 0.9617 -0.29444 94 0.76907 {'supplier_C'} -0.071868 0.078024 -0.9211 94 0.35936 {'supplier_B'} 0.071072 0.07739 0.91836 94 0.36078下上1.1515 1.7864 -0.72019 -0.015134 -1.7395 -2.1926 1.6263 -0.22679 0.083051 -0.082588 0.22473随机效应协方差参数:组:工厂(20个等级)Name1 Name2类型估计{'(截距)'}{'(截距)'}{'std'} 0.31381组:误差名称估计{'sqrt(分散度)'}1

执行一个 F -test来确定所有固定效应系数是否等于0。

统计=方差分析(glme)
DFMethod = '残差' Term FStat DF1 DF2 pValue {'(Intercept)'} 84.41 194 9.8194e-15 {'newprocess'} 4.2881 194 0.041122 {'time_dev'} 0.013016 194 0.90941 {'temp_dev'} 0.086696 194 0.76907 {'supplier'} 0.59212 2 94 0.5552

p -值为截距,newprocesstime_dev,temp_dev和系数表中的一样吗glme显示。小 p -值用于截距和newprocess表明这些是在5%显著性水平上的显著预测因子。大 p 值为time_devtemp_dev表明这些水平的预测因子不是重要的预测因子。

p -value为0.5552供应商测量代表分类变量的两个系数的联合显著性供应商.这包括虚拟变量supplier_Csupplier_B如系数表所示glme显示。大 p 值表明供应商在5%显著性水平上并不是一个显著的预测因子。

提示

  • 对于每个固定效应期,方差分析执行一个F-检验(边际检验),以确定是否代表固定效应项的所有系数都等于0。

    当拟合广义线性混合效应(GLME)模型时,使用fitglme最大似然拟合方法之一(“拉普拉斯”或者“ApproximateLaplace”):

    • 如果您指定“CovarianceMethod”名称-值对参数为“条件”,那么F-检验的条件是估计的协方差参数。

    • 如果您指定“CovarianceMethod”名称-值对的“JointHessian”,那么F-检验解释了协方差参数估计的不确定性。

    使用时使用GLME模型时fitglme其中一个伪似然拟合方法(“MPL”或者“REMPL”),方差分析使用从最后的伪似然迭代拟合的线性混合效应模型来推断固定效应。