主要内容

假设试验术语

所有假设检验均有相同的基本术语和结构。

  • 一种零假设关于您想测试的人口的断言。它的意义上是“null”,它通常代表现状信念,例如没有特征或缺乏效果。通过断言人口参数或人口参数的组合具有一定的价值,可以正式化。在给出的例子中假设检验,零假设是国家全国的天然气价格为1.15美元。这是写的H0.μ.= 1.15。

  • 一个替代假设关于可以针对零假设测试的人口对比的声明。在给出的例子中假设检验,可能的替代假设是:

    H1μ.≠1.15 - 国家平均水平与1.15美元(双尾测试)不同

    H1μ.> 1.15 - 国家平均值大于1.15美元(右尾试验)

    H1μ.<1.15 - 州平均水平低于1.15美元(左尾试验)

  • 要进行假设试验,收集来自群体的随机样品并相关测试统计信息被计算为总结样本。这种统计数据随着测试类型而变化,但它在零假设下的分布必须已知(或假设)。

  • P值测试是在零假设下的概率,以获得测试统计值的值,例如从样本计算的值。

  • 意义程度测试是概率的阈值α.在进行测试之前同意。典型的价值α.是0.05。如果是P.测试的价值小于α.,测试拒绝零假设。如果是P.价值大于α.,没有足够的证据来拒绝零假设。请注意,缺乏拒绝零假设的证据不是接受空假设的证据。另请注意,替代方案的实质性“意义”不能从测试的统计学意义推断出来。

  • 意义程度α.可以解释为拒绝禁止零假设的概率,当实际上是真的I型错误。在空假设下测试统计的分布决定了概率α.I类型错误。即使没有拒绝NULL假设,它仍然可能是假的II型错误。在替代假设下测试统计的分布决定了概率βII型错误。II型错误通常是由于样品尺寸的小。这力量测试,1 -β,是正确拒绝假零假设的概率。

  • 假设试验的结果通常与a沟通置信区间。置信区间是估计的值范围,具有包含参数的真实群体值的指定概率。从参数的样本估计和估计器的已知(或假设的)采样分布的样本估计计算上限和下界限。典型的假设是估计将与重复的采样(如中央极限定理决定)分布。更宽的置信区间对应于差的估计(较小的样品);狭窄的间隔对应于更好的估计(更大的样本)。如果NULL假设断言人口参数的值,则当假设值在参数的计算置信区间之外,测试拒绝返回NULL假设。

相关话题