加载示例数据。gydF4y2Ba
该模拟数据来自一家制造公司,该公司在全球运营50家工厂,每家工厂都运行一个批处理流程来生产成品。该公司希望减少每批产品中的缺陷数量,因此开发了一种新的制造流程。为了测试新流程的有效性,该公司选择了2个随机抽取0家工厂参与实验:10家工厂实施了新流程,而另外10家继续运行旧流程。在20家工厂中,公司各运行了5个批次(总共100个批次),并记录了以下数据:gydF4y2Ba
指示批处理是否使用新流程的标志(gydF4y2BanewprocessgydF4y2Ba
)gydF4y2Ba
每批处理所需时间(以小时计)(gydF4y2Ba时间gydF4y2Ba
)gydF4y2Ba
批次的温度,以摄氏度计(gydF4y2Ba临时gydF4y2Ba
)gydF4y2Ba
表示供应商的分类变量(gydF4y2BaAgydF4y2Ba
,gydF4y2BaBgydF4y2Ba
,或gydF4y2BaCgydF4y2Ba
)该批次中使用的化学品的名称(gydF4y2Ba供应商gydF4y2Ba
)gydF4y2Ba
批次中的缺陷数量(gydF4y2Ba缺陷gydF4y2Ba
)gydF4y2Ba
数据还包括gydF4y2Batime_devgydF4y2Ba
和gydF4y2Ba临时开发gydF4y2Ba
,分别表示时间和温度与20摄氏度下3小时的工艺标准的绝对偏差。gydF4y2Ba
拟合一个广义线性混合效应模型使用gydF4y2BanewprocessgydF4y2Ba
,gydF4y2Batime_devgydF4y2Ba
,gydF4y2Ba临时开发gydF4y2Ba
,gydF4y2Ba供应商gydF4y2Ba
作为固定效应预测器。包括一个随机效应项,用于按分组的截距gydF4y2Ba工厂gydF4y2Ba
,以解释由于工厂特定变化而可能存在的质量差异。响应变量gydF4y2Ba缺陷gydF4y2Ba
的泊松分布,该模型的适当链接函数是对数。用拉普拉斯拟合方法估计系数。指定虚拟变量编码为gydF4y2Ba“影响”gydF4y2Ba
,所以哑变量系数和为0。gydF4y2Ba
缺陷的数量可以用泊松分布来建模:gydF4y2Ba
这对应于广义线性混合效应模型gydF4y2Ba
哪里gydF4y2Ba
是工厂生产的批次中观察到的缺陷数量gydF4y2Ba
批处理期间gydF4y2Ba
.gydF4y2Ba
是对应于工厂的平均缺陷数gydF4y2Ba
(gydF4y2Ba
)批处理期间gydF4y2Ba
(gydF4y2Ba
).gydF4y2Ba
,gydF4y2Ba
,gydF4y2Ba
每个变量的测量值是否与工厂相对应gydF4y2Ba
批处理期间gydF4y2Ba
.例如,gydF4y2Ba
表示该批次是否由工厂生产gydF4y2Ba
批处理期间gydF4y2Ba
使用新方法gydF4y2Ba
和gydF4y2Ba
是使用效果(和为零)编码表示公司是否gydF4y2BaCgydF4y2Ba
或gydF4y2BaBgydF4y2Ba
,分别为工厂生产的批次提供工艺用化学品gydF4y2Ba
批处理期间gydF4y2Ba
.gydF4y2Ba
是每个工厂的随机效果截距gydF4y2Ba
这就解释了工厂特有的质量差异。gydF4y2Ba
使用Pearson残差创建诊断图,以测试模型假设。gydF4y2Ba
绘制直方图直观地确认皮尔逊残差的均值等于0。如果模型是正确的,我们期望皮尔逊残差的中心在0。gydF4y2Ba
直方图显示皮尔逊残差的中心在0。gydF4y2Ba
绘制Pearson残差与拟合值的对比图,以检查残差之间的非恒定方差迹象(异方差)。我们期望条件皮尔逊残差具有恒定方差。因此,条件皮尔逊残差与条件拟合值的关系图不应显示对条件拟合值的任何系统依赖性。gydF4y2Ba
该图未显示对拟合值的系统依赖性,因此残差之间没有非恒定方差的迹象。gydF4y2Ba
绘制Pearson残差与滞后残差的对比图,以检查残差之间的相关性。GLME中的条件独立性假设意味着条件Pearson残差近似不相关。gydF4y2Ba
图中没有模式,因此残差之间没有相关性的迹象。gydF4y2Ba