主要内容

假设检验

假设检验是基于样本的统计证据对总体进行推断的常用方法。

举个例子,假设在马萨诸塞州某一特定时间,普通无铅汽油的平均价格是每加仑1.15美元。你怎么能确定这个声明的真实性呢?你可以试着找出当时该州每个加油站的价格。这种方法将是确定的,但它可能是耗时、昂贵的,甚至是不可能的。

一种更简单的方法是在州内随机选择一小部分加油站的价格,然后计算样本平均值。

由于选择过程中的机会变异性,样本的平均值彼此不同。假设样本均值是1.18美元。0.03美元的差异是随机抽样的结果,还是一加仑汽油的平均价格高于1.15美元的重要证据?假设检验是做出这类决定的一种统计方法。

这个例子展示了如何使用假设检验来分析马萨诸塞州两个月的汽油价格。

此示例使用文件中的天然气价格数据gas.mat.该文件包含了两份1993年马萨诸塞州附近每加仑汽油价格的随机样本。第一个样本,price1它包含了在一月的某一天,在这个州的20个随机观测结果。第二个样本,price2,包含了一个月后在该州周围的20个随机观察结果。

负载气体price = [price1 price2];

作为第一步,您可能想要测试样本来自正态分布的假设。正态概率图给出了一个快速的概念。

normplot(价格)

图中包含一个轴对象。标题为“正态概率图”的轴对象包含6个类型为line的对象。

两个散点通过样本的第一和第三个四分位数近似地沿直线分布,表明近似正态分布。2月份的样本(右边那条线)显示了下尾与正常水平的轻微偏离。从1月到2月,平均值的变化是明显的。一个假设检验被用来量化正态检验。由于每个样本相对较小,建议进行Lilliefors测试。

lillietest (price1)
ans = 0
lillietest (price2)
ans = 0

的默认显著性级别lillietest是5%。每个测试返回的逻辑0表示拒绝样本是正态分布的零假设的失败。这种失败可能反映了总体的正态性,也可能反映了由于样本量小,对零假设缺乏强有力的证据。

现在计算样本均值。

sample_means =意味着(价格)
sample_means =1×2115.1500 - 118.5000

您可能想要测试一个零假设,即1月份样本当天全州的平均价格为1.15美元。如果你知道整个州的价格标准差在历史上一直是0.04美元,那么az以及是适当的。

[h, pvalue, ci] =中兴通讯(price1/100, 1.15, 0.04)
h = 0
pvalue = 0.8668
ci =2×11.1340 - 1.1690

逻辑输出h= 0表示在默认显著性水平5%下拒绝零假设失败。这是零假设下的高概率的结果,由p值,观察一个值作为极端或更极端的z-从样本中计算的统计量。均值[1.1340 1.1690]的95%置信区间包括假设的总体均值1.15美元。

之后的样本是否提供了更有力的证据,来拒绝2月份全州平均价格为1.15美元的无效假设?概率图中显示的移位和计算样本均值的差异表明了这一点。这一变化可能表明市场出现了重大波动,从而引发了对使用历史标准偏差的有效性的质疑。如果不能假设一个已知的标准差,则at-test更合适。

(h, pvalue, ci) = tt (price2/100, 1.15)
h = 1
pvalue = 4.9517 e-04
ci =2×11.1675 - 1.2025

逻辑输出h= 1表示在默认显著性水平5%下拒绝原假设。在这种情况下,均值的95%置信区间不包括假设的总体均值1.15美元。

你可能想更仔细地研究一下价格的变化。这个函数ttest2如果两个独立的样本来自具有相等但未知的标准偏差和相同平均值的正态分布,相对于平均值不相等的另一种情况的检验。

(h,团体,ci) = ttest2 (price1 price2)
h = 1
sig = 0.0083
ci =2×1-5.7845 - -0.9155

在默认的5%显著性水平上拒绝原假设,并且均值差的置信区间不包括假设值0。有缺口的箱形图是另一种形象化移位的方法。

Boxplot (prices,1) h = gca;h.XTick = [1 2];h.XTickLabel = {“1月”“2”};包含(“月”) ylabel (的价格($ 0.01)

图中包含一个轴对象。axis对象包含14个类型为line的对象。

该图显示了样本在中位数周围的分布。计算每个方框中凹槽的高度,以便当它们的中值在默认显著性水平(5%)不同时,相邻方框具有不重叠的凹槽。计算是基于数据正态性的假设,但对其他分布的比较是相当可靠的。并排的图提供了一种视觉假设检验,比较的是中值而不是平均值。上面的图似乎几乎拒绝了等中位数的零假设。

非参数Wilcoxon秩和检验,由函数实现ranksum,可用来量化等中位数的检验。它检验两个独立的样本是否来自相同的连续分布(不一定是正态分布),具有相同的中值,相对于它们不具有相同的中值。

[p, h] = ranksum (price1 price2)
p = 0.0095
h =逻辑1

该检验拒绝在默认的5%显著性水平上的等中位数的零假设。

另请参阅

|||||

相关的话题