Fisher精确检验是用来测试零假设两个分类变量之间存在非随机无关联,对替代方案,存在的变量之间的非随机的关联非参数统计检验。
Fisher精确检验提供一种用于小样本,或样品中卡方检验具有非常不均匀的边缘分布的替代方案。不像卡方检验,Fisher精确测试不依赖于大样本分布的假设,而是计算精确p-基于样本数据的值。虽然费雪的精确测试对任何大小的样本都是有效的,但不推荐用于大样本,因为它需要大量的计算。如果列联表中的所有频率计数都大于或等于1E7
, 然后fishertest
错误。对于包含大的计数值或良好平衡,使用应急表交叉表
或chi2gof
代替。
fishertest
接受一个2×2列联表作为输入,并计算p-测试值如下:
计算每一行,列,并且在列联表观测总数的总和。
使用超几何概率函数的多元泛化,计算列和行和为零假设条件下观察列联表中准确结果的条件概率。条件概率是
在哪里[R1和[R2是该行资金,C1和C2是列总和,ñ是在应急表观测的总数量,并ñIJ在该值一世行和第Ĵ表的第i列。
找出所有符合行和列和的非负整数矩阵。对于每个矩阵,使用P隔断。
使用这些值计算p-VALUE测试的基础上,感兴趣的备择假设。
对于双侧检验,总结所有的条件概率小于或等于P隔断所观察到的列联表。这代表观察结果作为极端的,或超过极端,如果零假设是真实的实际结果的概率。小p-值对原假设的有效性产生怀疑,支持变量之间关联的备择假设。
用于左双侧检验,总结所有用(1,1)小区频率矩阵的条件概率小于或等于ñ11。
对于右侧检验,将单元频率大于或等于(1,1)的所有矩阵的条件概率相加ñ11在所观察到的列联表。
比值比是
该比值比等于1的左侧替代等效于一个比值比小于1,和右路替代等效于一个比值比大于1的条件独立性的零假设是相当于假设。
渐近100 - 为对比值比(1α)%置信区间是
在哪里大号为对数优势比,Φ1(•)是正常的逆累积分布函数的倒数,并SE为对数优势比的标准误差。如果100(1 -α)%置信区间不包含值1,然后协会α意义层面上具有重要意义。如果四个单元频率中的任何一个为0,则fishertest
不计算置信区间,而是显示(负无穷到正无穷)
。
fishertest
只接受2×2列联表作为输入。要使用两个以上的水平测试分类变量的独立性,使用所提供的卡方检验交叉表
。