多重比较

介绍

方差分析（ANOVA）技术测试是否一组组装置（治疗效果）等于与否。拒绝零假设导致得出结论，并非所有组织意味着相同。然而，此结果不提供有关哪些组手段不同的信息。

执行一系列T.- 不建议确定哪对手段显着不同。执行多个时T.- 最低，手段显得显着的概率，并且显着的差异结果可能是由于大量的测试。这些T.- 最低使用来自同一样本的数据，因此它们不是独立的。这一事实使得量化多次测试的重要性更加困难。

假设在一个单一的时候T.- 最低，零假设的概率（h_0.例如，当它实际上是一个小的价值，说0.05。也假设您进行六个独立行为T.- 最低。如果每个测试的显着性水平为0.05，则测试正确未拒绝H的概率_0.,当H_0.为(0.95)^6.= 0.735。其中一个检验错误地拒绝零假设的概率为1 - 0.735 = 0.265，远远高于0.05。

要补偿多个测试，您可以使用多个比较程序。统计和机器学习工具箱™功能多人节目对组平均数或治疗效果进行多次两两比较。这些选项是Tukey的诚实显著差异标准(默认选项)，Bonferroni方法，Scheffe的程序，Fisher的最小显著差异(lsd)方法，以及Dunn & Sidák的方法T.以及。

要执行多种比较组手段，请提供结构统计作为输入多人节目．你可以获得统计根据以下功能之一：

有关重复措施的多个比较过程选项，请参阅多人节目（重复地段索赔)．

使用单因素方差分析进行多重比较

打开直播脚本

加载样本数据。

负载Carsmall.

英里/加仑代表每辆车每加仑行驶的英里数气缸表示每辆车，4,6或8个气缸中的圆柱体的数量。

测试不同汽缸数的汽车每加仑平均行驶里程是否不同。还要计算多次比较测试所需的统计数据。

[p，〜，stats] = Anova1（MPG，圆柱体，'离开'）;P.

P = 4.4902E-24

小P.-值约为0，强烈表明不同汽缸数的汽车每加仑汽油的平均英里数存在显著差异。

使用Bonferroni方法执行多个比较测试，以确定哪些数量的汽缸在汽车的性能下产生差异。

[结果，手段] = Multcompare（统计数据）“CType”那'bonferroni'）

结果=3×6.1.0000 2.0000 4.8605 7.9418 11.0230 0.0000 0.0000 1.0000 3.0000 12.6127 15.2337 17.8548 0.0000 2.0000 3.0000 3.8940 7.2919 10.6899 0.0000

手段=3×229.5300 0.6363 21.5882 1.0913 14.2963 0.8660

在里面结果矩阵，1,2和3分别对应于带有4,6和8个汽缸的汽车。前两列显示比较哪些组。例如，第一行将车辆与4和6个气缸进行比较。第四列显示了比较组的平均MPG差异。第三和第五列显示出95％置信区间的下限和上限，用于群体的差异。最后一列显示P.- 用于测试的值。全部P.-值为零，表示所有组的平均MPG在所有组中是不同的。

在图中，蓝栏代表带有4个气缸的汽车组。红条代表另一组。对于汽车的平均MPG的红色比较间隔都没有，这意味着对于具有4,6或8个气缸的汽车的平均MPG显着不同。

第一列意味着矩阵中有每组汽车的平均MPG估计值。第二列包含估计的标准误差。

多重比较三因素方差分析

打开直播脚本

加载样本数据。

Y = [52.7 57.5 45.9 44.5 53.0 57.0 45.9 44.0]';G1 = [1 2 1 2 1 2];g2 = {'你好';'你好';'lo';'lo';'你好';'你好';'lo';'lo'};g3 = {'可能';'可能';'可能';'可能';“6月”;“6月”;“6月”;“6月”};

y是响应矢量和G1.那G2.，和G3.是分组变量（因素）。每个因素有两个级别，每一个观察y通过因子水平的组合来识别。例如，观察y (1)与因素的级别1相关联G1.、水平'你好'因子G2.,和水平'可能'因子G3.．同样，观察y（6）与因素的第2级相关联G1.、水平'你好'因子G2.,和水平“6月”因子G3.．

测试所有因素水平的响应是否相同。还要计算多个比较测试所需的统计数据。

[〜，〜，stats] = Anovan（y，{g1 g2 g3}，'模型'那'相互作用'那......'varnames'，{g1的那“g2”那'g3'}）;

这P.-值为0.2578表示水平的平均响应'可能'和“6月”因子G3.并没有显著的不同。这P.-value为0.0347表示水平的平均响应1和2因子G1.是明显不同的。类似地,P.- 0.0048的值表明水平的平均反应'你好'和'lo'因子G2.是明显不同的。

执行多个比较测试，以了解哪些因素G1.和G2.是明显不同的。

结果= multcompare(统计,“维度”，[1 2]）

结果=6×61.0000 2.0000 -6.8604 -4.4000 -1.9396 0.0280 1.0000 3.0000 4.4896 6.9500 9.4104 0.0177 1.0000 4.0000 6.1396 8.6000 11.0604 0.0143 2.0000 3.0000 8.8896 11.3500 13.8104 0.0108 2.0000 4.0000 10.5396 13.0000 15.4604 0.0095 3.0000 4.0000 -0.8104 1.6500 4.1104 0.0745

多人节目比较两个分组变量的组(水平)的组合，G1.和G2.．在里面结果矩阵，数字1对应于级别的组合1的G1.和水平嗨的G2.，数字2对应于级别的组合2的G1.和水平嗨的G2.．类似地，数字3对应于级别的组合1的G1.和水平lo的G2.，数字4对应level的组合2的G1.和水平lo的G2.．矩阵的最后一列包含P.- 值。

例如，矩阵的第一行显示了级别的组合1的G1.和水平嗨的G2.具有与水平的组合相同的平均响应值2的G1.和水平嗨的G2.．这P.- 对应于该测试的价值是0.0280，表明平均响应显着不同。您还可以看到该图中的结果。蓝色条形显示相对于水平组合的平均响应的比较间隔1的G1.和水平嗨的G2.．红色条是其他组合的平均响应的比较间隔。没有一个红色条与蓝杆重叠，这意味着对水平组合的平均反应1的G1.和水平嗨的G2.与其他组组合的平均反应有显著差异。

您可以通过单击该组的相应比较间隔来测试其他组。您点击转向蓝色的栏。对于显着不同的群体的条形是红色的。对于没有显着不同的群体的条形是灰色的。例如，如果单击比较间隔以进行级别的组合1的G1.和水平lo的G2.，相对水平的比较间隔2的G1.和水平lo的G2.重叠，因此是灰色的。相反，其他比较间隔是红色的，表明显着差异。

多个比较程序

指定所需的多个比较过程多人节目进行使用“CType”名称-值对的论点。多人节目提供以下步骤：

Tukey的诚实差异差异
Bonferroni方法
邓恩和斯蒂瓦克的方法
最不重要的差异
Scheffe的程序

Tukey的诚实差异差异

你可以用'ctype'，'tukey-kramer'或者“CType”、“hsd”名称-值对的论点。该测试是基于研究的范围分布。拒绝H_0.：α._一世=α._j如果

$| T. | = \frac{| {\bar{y}}_{一世} - {\bar{y}}_{j} |}{\sqrt{m S. E. （ \frac{1}{N_{一世}} + \frac{1}{N_{j}} ）}} > \frac{1}{\sqrt{2}} {问：}_{α. 那 K. 那 N - K. 那}$

在哪里 ${问：}_{α. 那 K. 那 N - K.}$ 鞋面100 *（1 -α.)所研究的带参数的极差分布的第百分位K.和N-K.自由程度。K.是群体数量（治疗或边缘手段）和N是观察总数。

Tukey的诚实显著差异程序是平衡单因素方差分析和相同样本大小的类似程序的最优方法。对于不同样本量的单因素方差分析，已被证明是保守的。根据未经证实的Tukey-Kramer猜想，它对于被比较的数量是相关的问题也是准确的，如在分析带有不平衡协变量值的协方差时。

Bonferroni方法

的方法可以指定Bonferroni方法'ctype'，'bonferroni'名称值对。此方法使用学生的临界值T.- 调整后分布措施以补偿多项比较。测试拒绝H_0.：α._一世=α._j在 $α. / 2 （ \begin{array}{l} K. \\ 2 \end{array} ）$ 意义水平，在哪里K.是群组的数量

$| T. | = \frac{| {\bar{y}}_{一世} - {\bar{y}}_{j} |}{\sqrt{m S. E. （ \frac{1}{N_{一世}} + \frac{1}{N_{j}} ）}} > {T.}_{\frac{α.}{2 （ \begin{matrix} K. \\ 2 \end{matrix} ）} 那 N - K. 那}$

在哪里N是观察总数和K.为组数(边际平均值)。这种方法比较保守，但通常不如Scheffé方法保守。

邓恩和斯蒂瓦克的方法

您可以使用Dunn＆Sidák的方法使用'ctype'，'dunn-sidak'名称-值对的论点。它使用来自的临界值T.- 在调整Dunn提出的多种比较后调整后，通过Sidák准确进行了调整。此测试拒绝H_0.：α._一世=α._j如果

$| T. | = \frac{| {\bar{y}}_{一世} - {\bar{y}}_{j} |}{\sqrt{m S. E. （ \frac{1}{N_{一世}} + \frac{1}{N_{j}} ）}} > {T.}_{1 - η. / 2 那 V. 那}$

在哪里

$η. = 1 - {（ 1 - α. ）}^{^{\frac{1}{（ \begin{array}{l} K. \\ 2 \end{array} ）}}}$

和K.为组的个数。这种方法与Bonferroni方法相似，但比Bonferroni方法保守。

最不重要的差异

的方法可以指定最小显著性差异过程'ctype'，'lsd'名称-值对的论点。这个测试使用测试统计量

$T. = \frac{{\bar{y}}_{一世} - {\bar{y}}_{j}}{\sqrt{m S. E. （ \frac{1}{N_{一世}} + \frac{1}{N_{j}} ）}} ．$

它拒绝H_0.：α._一世=α._j如果

$| {\bar{y}}_{一世} - {\bar{y}}_{j} | > \underset{L. S. D.}{\underset{}}{{T.}_{\frac{α.}{2} 那 N - K.} \sqrt{m S. E. （ \frac{1}{N_{一世}} + \frac{1}{N_{j}} ）}}} ．$

Fisher仅在零假设H时执行LSD来保护对多重比较的保护_0.：α.₁=α.₂= ... =α._K.由Anova拒绝F以及。即使在这种情况下，LSD也不能否定任何个体假设。也有可能方差分析不排斥H_0.，即使在某些组之间存在差异。发生这种行为是因为其余组的相等方法可能导致F-检验统计量为不显著。在没有任何条件的情况下，LSD不能提供任何针对多重比较问题的保护。

Scheffe的程序

属性指定Scheffe过程'ctype'，'scheffe'名称-值对的论点。临界值来自于F分布。测试拒绝H_0.：α._一世=α._j如果

$\frac{| {\bar{y}}_{一世} - {\bar{y}}_{j} |}{\sqrt{m S. E. （ \frac{1}{N_{一世}} + \frac{1}{N_{j}} ）}} > \sqrt{（ K. - 1 ） F_{K. - 1 那 N - K. 那 α.}}$

该过程提供了一种同时置信水平，用于比较手段的所有线性组合。对于简单的对差异的比较是保守的。

参考

[1] Milliken G. A.和D. E. Johnson。杂乱数据分析。卷I：设计实验．Boca Raton，FL：Chapman＆Hall / CRC Press，1992。

[2]网络J.，M.H.Kutner，C.J.Nachtsheim，W.Wasserman。第四届。应用线性统计模型.Irwin出版社,1996年。

[3] Hochberg，Y.和A. C. Tamhane。多个比较程序．霍博肯，NJ：John Wiley＆Sons，1987。

也可以看看