主要内容

预测

类:GeneralizeLmixedModel.

推广线性混合效应模型的预测响应

描述

例子

ypred=预测(glme返回响应的预测条件方法,ypred,利用原始预测值拟合广义线性混合效应模型glme

例子

ypred=预测(glmetblnew中指定的新预测器值返回预测的条件方法tblnew

如果是分组变量tblnew如果水平不在原始数据中,那么分组变量的随机效应不会对“条件”在分组变量有新水平的观测值上的预测。

ypred=预测(___名称,值使用一个或多个指定的附加选项返回响应的预测条件方法名称,值对参数。例如,可以指定置信级别、同时置信界限或仅来自固定效果的贡献。可以使用前面语法中的任何输入参数。

ypredypredCI] =预测(___也返回95%的点置信区间,ypredCI,为每个预测值。

ypredypredCIDF] =预测(___也返回自由度,DF,用于计算置信区间。

输入参数

展开全部

广义线性混合效应模型,指定为aGeneralizeLmixedModel.目的。有关此对象的属性和方法,请参阅GeneralizeLmixedModel.

新的输入数据,其中包括响应变量、预测变量和分组变量,指定为表或数据集数组。预测变量可以是连续变量,也可以是分组变量。tblnew必须与原始表或数据集数组使用相同的变量fitglme拟合广义线性混合效应模型glme

名称-值对的观点

指定可选的逗号分隔对名称,值论点。的名字参数名和价值是对应的值。的名字必须出现在引号内。您可以按如下顺序指定几个名称和值对参数name1,value1,...,namen,valuen

显著性级别,指定为逗号分隔的对,由“α”和范围内的标量值[0,1]。对于值α,置信水平为100×(1 - α)%。

例如,对于99%置信区间,可以如下所示指定置信级别。

例子:“阿尔法”,0.01

数据类型:|双倍的

条件预测的指示符,指定为逗号分隔的对,由“条件”下面是其中之一。

价值 描述
真正的 来自固定效应和随机效应(有条件的)的贡献
只有固定效果的贡献(边缘)

例子:'条件',假

计算近似自由度的方法,指定为逗号分隔的对组成“DFMethod”下面是其中之一。

价值 描述
“残留” 自由度的值被假定为常数和相等n- - - - - -p, 在哪里n观察的次数是多少p是固定效果的数量。
“没有” 自由度设为无穷大。

例子:'dfmethod','没有'

模型偏移量,指定为长度为标量值的向量, 在哪里是行数吗tblnew.该偏移量用作附加预测器,其系数值固定在1

置信界限,指定为逗号分隔的配对组成'同时'和任何一种真正的

  • 如果'同时',然后预测计算非同时置信界限。

  • 如果'同时'真正的预测返回同时的信心界限。

例子:'同时',真实

输出参数

展开全部

预测的响应,作为一个向量返回。如果“条件”名称-值对参数指定为真正的ypred包含对给定随机效应的响应的条件方法的预测。条件预测包括来自固定和随机效应的贡献。边际预测只包括来自固定效应的贡献。

计算边际预测,预测计算条件预测,但用一个零向量代替随机效应的经验贝叶斯预测器(ebp)。

用于预测值的点明智置信区间,作为双列矩阵返回。第一列ypredCI包含下限,第二列包含上限。默认,ypredCI含有预测的95%不一致的置信区间。您可以使用置信水平α名称-值对参数,并使它们同时使用同时名称-值对的论点。

拟合GLME模型时使用fitglme最大似然拟合方法之一('laplace'“ApproximateLaplace”),预测使用条件均方误差的预测(CMSEP)方法计算置信区间的条件估计协方差参数和观察响应。或者,您可以将置信区间解释为基于估计的协方差参数和观察到的响应的近似贝叶斯可信区间。

拟合GLME模型时使用fitglme和伪可能的方法之一(“MPL”'rempl'),预测基于拟合线性混合效应模型的计算,从最终的伪似然迭代。

用于计算置信区间的自由度,以向量或标量值返回。

  • 如果'同时',然后DF是一个向量。

  • 如果'同时'真正的,然后DF是标量值。

例子

展开全部

加载样例数据。

负载生产商

这些模拟数据来自一家制造公司,该公司在世界各地运营着50家工厂,每家工厂都运行批处理流程来创建成品。该公司想要减少每批产品的缺陷数量,所以它开发了一种新的制造工艺。为了测试新工艺的有效性,公司随机选择20家工厂参加实验:10家工厂执行新工艺,另外10家工厂继续运行旧工艺。在这20家工厂中,公司分别运行了5批(共100批),并记录了以下数据:

  • 指示批处理是否使用新流程的标志(newprocess

  • 每批处理所需时间(小时)(时间

  • 批次的温度(摄氏度)(临时

  • 指明供应商的类别变数(一个B,或C)所使用的化学物质(供应商

  • 批次内的缺陷数目(缺陷

数据还包括time_dev.temp_dev,分别表示时间和温度与工艺标准在20摄氏度下3小时的绝对偏差。

适合广义的线性混合效果模型newprocesstime_dev.temp_dev,供应商固定后果预测。包含一个随机效应术语,用于分组的截距工厂,以解释因工厂特定差异而可能存在的质量差异。响应变量缺陷具有泊松分发,此模型的适当链接功能是日志。使用拉普拉斯匹配方法来估计系数。指定编码的虚拟变量“影响”,所以虚拟变量系数和为0。

可以使用泊松分布建模缺陷的数量:

缺陷 j 泊松 μ. j

这对应于广义线性混合效应模型

日志 μ. j β 0 + β 1 newprocess j + β 2 时间 _ dev j + β 3. 临时 _ dev j + β 4 供应商 _ C j + β 5 供应商 _ B j + b

在哪里

  • 缺陷 j 工厂生产的批次中发现的缺陷数量是多少 在批处理 j

  • μ. j 缺陷的平均数量是否与工厂相对应 (在哪里 1 2 2 0 在批处理) j (在哪里 j 1 2 5 )。

  • newprocess j 时间 _ dev j , 临时 _ dev j 是否每个变量的测量值都对应于工厂 在批处理 j .例如, newprocess j 是否为工厂生产的批次 在批处理 j 使用了新工艺。

  • 供应商 _ C j 供应商 _ B j 虚拟变量是否使用效应(从和到零)编码来表示是否为公司CB分别为工厂生产的批量提供工艺化学品 在批处理 j

  • b N 0 σ. b 2 是随机效应截取每个工厂 这就解释了工厂特有的质量差异。

glme = fitglme(生产商,'缺陷〜1 + newprocess + time_dev + temp_dev +供应商+(1 |工厂)'“分布”'泊松'“链接”“日志”“FitMethod”'laplace'“DummyVarCoding”“影响”);

预测初始设计值下的响应值。显示前10个预测以及观察到的响应值。

Ypred =预测(glme);[ypred(1:10),mfr.defects(1:10)]
ans =10×24.9883 6.0000 5.9423 7.0000 5.1318 6.0000 5.6295 5.6295 5.3499 6.2134 5.2134 5.0000 4.6430 4.6430 4.5342 4.0000 5.3903 9.0000 4.6529 4.6529 4.0000

第1列包含原始设计值时的预测响应值。第2列包含观察到的响应值。

加载样例数据。

负载生产商

这些模拟数据来自一家制造公司,该公司在世界各地运营着50家工厂,每家工厂都运行批处理流程来创建成品。该公司想要减少每批产品的缺陷数量,所以它开发了一种新的制造工艺。为了测试新工艺的有效性,公司随机选择20家工厂参加实验:10家工厂执行新工艺,另外10家工厂继续运行旧工艺。在这20家工厂中,公司分别运行了5批(共100批),并记录了以下数据:

  • 指示批处理是否使用新流程的标志(newprocess

  • 每批处理所需时间(小时)(时间

  • 批次的温度(摄氏度)(临时

  • 指明供应商的类别变数(一个B,或C)所使用的化学物质(供应商

  • 批次内的缺陷数目(缺陷

数据还包括time_dev.temp_dev,分别表示时间和温度与工艺标准在20摄氏度下3小时的绝对偏差。

适合广义的线性混合效果模型newprocesstime_dev.temp_dev,供应商固定后果预测。包含一个随机效应术语,用于分组的截距工厂,以解释因工厂特定差异而可能存在的质量差异。响应变量缺陷具有泊松分发,此模型的适当链接功能是日志。使用拉普拉斯匹配方法来估计系数。指定编码的虚拟变量“影响”,所以虚拟变量系数和为0。

可以使用泊松分布建模缺陷的数量:

缺陷 j 泊松 μ. j

这对应于广义线性混合效应模型

日志 μ. j β 0 + β 1 newprocess j + β 2 时间 _ dev j + β 3. 临时 _ dev j + β 4 供应商 _ C j + β 5 供应商 _ B j + b

在哪里

  • 缺陷 j 工厂生产的批次中发现的缺陷数量是多少 在批处理 j

  • μ. j 缺陷的平均数量是否与工厂相对应 (在哪里 1 2 2 0 在批处理) j (在哪里 j 1 2 5 )。

  • newprocess j 时间 _ dev j , 临时 _ dev j 是否每个变量的测量值都对应于工厂 在批处理 j .例如, newprocess j 是否为工厂生产的批次 在批处理 j 使用了新工艺。

  • 供应商 _ C j 供应商 _ B j 虚拟变量是否使用效应(从和到零)编码来表示是否为公司CB分别为工厂生产的批量提供工艺化学品 在批处理 j

  • b N 0 σ. b 2 是随机效应截取每个工厂 这就解释了工厂特有的质量差异。

glme = fitglme(生产商,'缺陷〜1 + newprocess + time_dev + temp_dev +供应商+(1 |工厂)'“分布”'泊松'“链接”“日志”“FitMethod”'laplace'“DummyVarCoding”“影响”);

预测初始设计值下的响应值。

Ypred =预测(glme);

通过复制前10行来创建新表生产商tblnew

: tblnew =生产商(1:10);

前10行生产商包括工厂1和工厂2从试验1到试验5收集的数据。两家工厂在试验过程中都采用了老方法,所以newprocess = 0所有10个观察。

更改newprocess1tblnew

tblnew。newprocess = ones(height(tblnew),1);

使用。计算预测的响应值和非同时99%置信区间tblnew.显示基于的前10行预测值tblnew的预测值生产商,以及观测到的响应值。

[ypred_new, ypredCI] =预测(glme tblnew,“α”, 0.01);[ypred_new ypred (1:10), mfr.defects (1:10)]
ans =10×33.4536 4.9883 6.0000 4.1142 5.9423 7.0000 3.5530 5.1318 6.0000 3.8976 5.6295 5.0000 3.7040 5.3499 6.0000 3.6095 5.2134 5.0000 3.2146 4.6430 4.0000 3.1393 4.5342 4.0000 3.7320 5.3903 9.0000 3.2214 4.6529 4.0000

第1列包含基于数据的预测响应值tblnew, 在哪里newprocess = 1.第2列包含基于原始数据的预测响应值生产商, 在哪里newprocess = 0.中观察到的响应值生产商.基于这些结果,如果所有其他预测器保留其原始值,则使用新过程时预测的缺陷数量似乎更小。

显示与新的预测响应值对应的行1到10的99%置信区间。

ypredCI (1:10, 1:2)
ans =10×21.6983 7.0235 1.9191 8.8701 1.8735 6.7380 2.0149 7.5395 1.9034 7.2079 1.8918 6.8871 1.6776 6.1597 1.5404 6.3976 1.9574 7.1154 1.6892 6.1436

参考

[1]展位,J.G.和J.P. Hobert。“广义线性混合模型中的预测标准误差。”美国统计协会杂志,第93卷,1998年,第262-272页。