主要内容

假设检验

假设检测是根据来自样本的统计证据绘制群体推断的常见方法。

作为一个例子,假设有人说,马萨诸塞州的某个时候,一加仑常规无铅天然气的平均价格为1.15美元。你怎么能决定声明的真相?您可以尝试在当时在州的每个加油站的价格找到价格。这种方法将是明确的,但它可能是耗时的,昂贵的,甚至不可能的。

更简单的方法是在围绕状态的少量随机选择的加油站找到价格,然后计算样本平均值。

由于选择过程中的机会可变性,样本平均值彼此不同。假设您的样本平均值为1.18美元。$ 0.03差异是随机抽样的文物或大量证据表明一加仑天然气的平均价格实际上大于1.15美元吗?假设检测是制定此类决策的统计方法。

此示例显示如何使用假设检验在两个单独的几个月内分析在马萨诸塞州的状态下测量的天然气价格。

此示例使用该文件中的天然气价格数据gas.mat。该文件在1993年,Massachusetts周围的一加仑天然气的两个随机标定。第一个样品,Price1.,在1月份的一天内包含20个国家随机观察。第二个样本,Price2.,在一个月后包含20个随机观察。

加载气体价格= [Price1 Price2];

作为第一步,您可能希望测试样本来自正常分布的假设。一个正常的概率图给出了一个快速的想法。

normplot(价格)

图包含轴。标题正常概率图的轴包含6个类型的线。

两者均散射通过样本的第一和第三个四分位数,指示近似正常分布。2月份样本(右侧)显示略微偏离较低尾部的正常情况。从1月到2月的平均转变是显而易见的。假设试验用于量化正常性的测试。由于每个样品相对较小,建议使用LILLieFors测试。

莉莉亚特(Price1)
ans = 0.
莉莉斯特(Price2)
ans = 0.

默认意义水平莉莉亚特是5%。每个测试返回的逻辑0表示失败拒绝样品通常分布的空白假设。这种失败可能反映人口中的正常性,或者由于样本量小,可能反映了缺乏对零假设的强有力的证据。

现在计算样本手段。

sample_means =均值(价格)
sample_means =.1×2115.1500 118.5000

您可能希望测试Null假设,即1月样本当天对整个国家的平均价格为1.15美元。如果您知道历史上,历史上的价格标准偏差,并且一直持续,则为0.04美元,那么Z.- 最恰当。

[H,Pvalue,CI] = ZTEST(Price1 / 100,1.15,0.04)
H = 0.
pvalue = 0.8668
ci =2×11.1340 1.1690

逻辑输出H= 0表示在默认显着性级别为5%的情况下拒绝禁止NULL假设。这是NULL假设下的高概率的结果,由此表示P.价值,观察值作为极端或更极端的价值Z.- 从样本计算的艺术性。平均值的95%置信区间[1.1340 1.1690]包括1.15美元的假设人口平均值。

后来的样品是否为2月份拒绝拒绝零假设的零证明是否定的零证?概率图中所示的偏移和计算的样本装置的差异表明了这一点。班次可能表明市场上的显着波动,提高了关于使用历史标准偏差的有效性的问题。如果不能假设已知的标准偏差,则T.- 更合适。

[H,Pvalue,CI] = TTEST(Price2 / 100,1.15)
H = 1
pvalue = 4.9517e-04
ci =2×11.1675 1.2025

逻辑输出H= 1表示以5%的默认显着性级别抑制零假设。在这种情况下,平均值的95%的置信区间不包括1.15美元的假设人口平均值。

您可能希望更密切地调查价格的转变。功能TTEST2.测试如果两个独立的样本来自具有相同但未知的标准偏差的正常分布,而且相同的平均值,则违背手段不等的替代方案。

[H,SIG,CI] = TTEST2(Price1,Price2)
H = 1
sig = 0.0083.
ci =2×1-5.7845 -0.9155

在默认5%的意义水平下拒绝零假设,并且手段差的置信区间不包括假设值为0.缺口盒绘图是可视化移位的另一种方式。

Boxplot(价格,1)H = GCA;h.xtick = [1 2];h.xticklabel = {'一月''二月'};Xlabel('月')ylabel('价格(0.01美元)'

图包含轴。轴包含14个类型的类型。

绘图显示在其中位数周围的样本的分布。计算每个盒子中的凹口的高度,使得当它们的中位数在默认5%的意义水平下不同时,并排盒具有非框架凹口。计算基于数据中的正常性的假设,但是对其他分布相比,比较是合理的鲁棒。并排图提供了一种视觉假设试验,比较中位数而不是手段。上面的曲线似乎几乎没有拒绝等中位数的零假设。

非参数Wilcoxon等级和由函数实现的Ranksum.,可用于量化相等中位数的测试。它测试了两个独立的样本是否来自与平等中位数相同的连续(不一定正常)分布,反对它们没有等于中位数的替代方案。

[p,h] = Ranksum(Price1,Price2)
p = 0.0095.
h =逻辑1

该测试拒绝在默认5%的意义水平下拒绝等级的零假设。

也可以看看

|||||

相关话题