fishertest

Fisher精确检验

描述

H= fishertest (X返回费舍尔的零假设的精确测试的测试决定,有两个分类变量之间没有关联非随机X,反对存在非随机关联的观点。结果H1如果检验拒绝零假设在5%的显着性水平,或0除此以外。

[Hp统计数据] = fishertest(X也返回了显着性水平p测试和结构的统计数据含有另外的测试结果,包括比值比及其渐近置信区间。

[___] = fishertest(X名称,值返回使用由一个或多个名称值对参数中指定的附加选项的试验决定。例如,您可以更改测试的显着性水平或进行单侧检验。

例子

全部收缩

在一个小调查,研究人员询问17个人,如果他们今年收到的流感疫苗,以及他们是否得了流感这个冬天。结果显示,在9名没有接受流感疫苗注射的人中,3人感染了流感,6人没有。在接受流感疫苗注射的8人中,1人得了流感,7人没有。

创建包含调查数据一个2×2列联表。行1包含谁没有收到接种流感疫苗的个人数据,以及第2行包含谁收到了流感疫苗的个人数据。第1栏包含谁得了流感个体的数目,和2列包含谁没有个人的数量。

x =表([3,1][6、7],“VariableNames”,{'流感''NoFlu'},“RowNames”,{“NoShot”'射击'})
x =2×2表流感NoFlu ___ _____ NoShot 3 6射门1 7

使用Fisher精确检验,以确定是否有接受流感疫苗和患流感之间的非随机关联。

H = fishertest(x)的
h =合乎逻辑0

返回的测试决定H = 0表明fishertest在默认的5%的显着水平不拒绝分类变量之间没有关联非随机的零假设。因此,基于测试结果,个人谁没有注射流感疫苗没有患上流感比那些谁得到了流感疫苗的不同可能性。

在一项小型调查中,一名研究人员询问了17个人今年是否注射过流感疫苗,以及他们是否感染了流感。结果显示,在9名没有接受流感疫苗注射的人中,3人感染了流感,6人没有。在接受流感疫苗注射的8人中,1人得了流感,7人没有。

x = (3、6、1、7);

使用右尾Fisher精确检验,以确定是否患上流感的几率是谁没有收到流感疫苗相比,谁没有个人的个人高。进行测试在1%的显着性水平。

[H,P,统计] = fishertest(X,“尾巴”'对'“α”,0.01)
h =合乎逻辑0
p值= 0.3353
统计=同场的结构:比值比:3.5000可信区间:[0.1289 95.0408]

返回的测试决定H = 0表明fishertest不拒绝在1%的显着性水平的分类变量之间没有关联非随机的零假设。由于这是一个右尾假设检验,得出的结论是,个人谁不注射流感疫苗没有患上流感比那些谁得到了流感疫苗的人杰。

加载医院的数据。

加载医院

医院数据集数组包含100周医院的病人数据,包括姓名,性别,年龄,体重,吸烟状况,以及收缩期和舒张期血压测量。

若要确定吸烟状况是否与性别无关,请使用交叉表创建吸烟者和非吸烟者的2×2列联表,按性别分组。

(台chi2 p、标签)=交叉表(hospital.Sex hospital.Smoker)
台=2×240 13 26 21
χ2 = 4.5083
p值= 0.0337
标签=2×2单元{'Female'} {'0'} {'Male'} {'1'}

所得偶然性表中的行TBL对应于患者的性别,第1行包含女性的数据,第2行包含男性的数据。这些列对应于患者的吸烟状态,第1列包含非吸烟者的数据,第2列包含吸烟者的数据。返回的结果χ2 = 4.5083是卡方检验统计量独立性的卡方检验的价值。返回值p值= 0.0337是一个近似 p -基于卡方分布的值。

使用所产生的偶然性表交叉表对数据进行Fisher精确检验。

[H,P,统计] = fishertest(TBL)
h =合乎逻辑1
p值= 0.0375
统计=同场的结构:比值比:2.4852可信区间:[1.0624 5.8135]

结果H = 1表明fishertest拒绝吸烟状况和性别之间的nonassociation的在5%的显着性水平的零假设。换句话说,有性别和吸烟状况之间的关联。比值比表示该男性患者有被吸烟者比女性患者的约2.5倍大的赔率。

返回的 p -VALUE测试,p值= 0.0375,是接近,但不完全一样,所获得的结果交叉表。这是因为fishertest计算准确的 p -使用示例数据的值,而交叉表用卡方近似来计算 p -值。

输入参数

全部收缩

列联表,指定为一个2×2矩阵或包含非负整数值的表。列联表包含样本数据中变量的频率分布。您可以使用交叉表以产生从样本数据列联表。

例:(4,0,0,4)

数据类型:|

名称 - 值对参数

指定可选的用逗号分隔的对名称,值参数。的名字是参数的名称和价值是对应的值。的名字必须出现引号内。您可以按照任何顺序指定多个名称和值对参数名1,值1,...,NameN,值N

例:'阿尔法',0.01, '尾巴', '右'指定1%显著性水平的右尾假设检验。

显著性水平的假设检验,指定为逗号分隔对组成“α”和范围内的(0,1)的标量值。

例:“阿尔法”,0.01

数据类型:|

备择假设的类型,用逗号分隔的对表示“尾巴”与下列情况之一。

'都' 双尾检验。另一种假设是这两个变量之间存在非随机关联X,和的比值比不等于1。
'对' 右尾检验。备择假设是,比值比大于1。
“左” Left-tailed测试。备择假设是优势比小于1。

例:“尾巴”,“右”

输出参数

全部收缩

假设检验结果,返回一个逻辑值。

  • 如果H1, 然后fishertest拒绝在零假设Α显着性水平。

  • 如果H0, 然后fishertest在上未能拒绝原假设Α显着性水平。

p-VALUE试验,返回作为在范围[0,1]的标量值的。p是观察检验统计量极端或比更加极端,在零假设下所观察到的值的概率。小值p在零假设的有效性产生怀疑。

测试数据,以结构形式返回,包含以下字段:

  • OddsRatio-两个变量之间关联的度量。

  • 可信区间-优势比的渐近置信区间。如果有任何一个单元频率X均为0,则fishertest不计算置信区间,而是显示(负无穷到正无穷)

更多关于

全部收缩

确切概率法

Fisher精确检验是用来测试零假设两个分类变量之间存在非随机无关联,对替代方案,存在的变量之间的非随机的关联非参数统计检验。

Fisher精确检验提供一种用于小样本,或样品中卡方检验具有非常不均匀的边缘分布的替代方案。不像卡方检验,Fisher精确测试不依赖于大样本分布的假设,而是计算精确p-基于样本数据的值。虽然费雪的精确测试对任何大小的样本都是有效的,但不推荐用于大样本,因为它需要大量的计算。如果列联表中的所有频率计数都大于或等于1E7, 然后fishertest错误。对于包含大的计数值或良好平衡,使用应急表交叉表chi2gof代替。

fishertest接受一个2×2列联表作为输入,并计算p-测试值如下:

  1. 计算每一行,列,并且在列联表观测总数的总和。

  2. 使用超几何概率函数的多元泛化,计算列和行和为零假设条件下观察列联表中准确结果的条件概率。条件概率是

    P C ü Ť Ø F F = [R 1 [R 2 C 1 C 2 ñ 一世 Ĵ ñ 一世 Ĵ

    在哪里[R1[R2是该行资金,C1C2是列总和,ñ是在应急表观测的总数量,并ñIJ在该值一世行和第Ĵ表的第i列。

  3. 找出所有符合行和列和的非负整数矩阵。对于每个矩阵,使用P隔断

  4. 使用这些值计算p-VALUE测试的基础上,感兴趣的备择假设。

    • 对于双侧检验,总结所有的条件概率小于或等于P隔断所观察到的列联表。这代表观察结果作为极端的,或超过极端,如果零假设是真实的实际结果的概率。小p-值对原假设的有效性产生怀疑,支持变量之间关联的备择假设。

    • 用于左双侧检验,总结所有用(1,1)小区频率矩阵的条件概率小于或等于ñ11

    • 对于右侧检验,将单元频率大于或等于(1,1)的所有矩阵的条件概率相加ñ11在所观察到的列联表。

比值比是

Ø [R = ñ 11 ñ 22 ñ 21 ñ 12

该比值比等于1的左侧替代等效于一个比值比小于1,和右路替代等效于一个比值比大于1的条件独立性的零假设是相当于假设。

渐近100 - 为对比值比(1α)%置信区间是

C 一世 = [ 经验值 大号 Φ 1 1 α 2 小号 Ë 经验值 大号 + Φ 1 1 α 2 小号 Ë ]

在哪里大号为对数优势比,Φ1(•)是正常的逆累积分布函数的倒数,并SE为对数优势比的标准误差。如果100(1 -α)%置信区间不包含值1,然后协会α意义层面上具有重要意义。如果四个单元频率中的任何一个为0,则fishertest不计算置信区间,而是显示(负无穷到正无穷)

fishertest只接受2×2列联表作为输入。要使用两个以上的水平测试分类变量的独立性,使用所提供的卡方检验交叉表

也可以看看

|

介绍了R2014b