chi2gof

卡方拟合优度拟合检验

描述

H= chi2gof(X返回一个测试决定的零假设,在矢量数据X来自用均值和方差估计从一个正态分布X, 使用卡方拟合优度拟合检验。另一种假设是,数据不是来自这样的分布。结果H1如果检验拒绝在5%的显着性水平的零假设,并0除此以外。

H= chi2gof(X名称,值返回拟合优度的最卡方检验与由一个或多个名称值对参数中指定的附加选项的试验决定。例如,您可以测试非正常分布,或改变测试的显着性水平。

[Hp] = chi2gof(___也返回p-值p假设检验中,使用任何从以前的语法输入参数。

[Hp统计] = chi2gof(___也返回结构统计包含关于检验统计量的信息。

例子

全部收缩

创建标准正态分布对象。生成一个数据载体X使用从分布的随机数。

PD = makedist('正常');RNG默认;%,持续重现X =随机(PD,100,1);

检验零假设,在数据X来自同一个正态分布人口。

H = chi2gof(x)的
H = 0

返回值H = 0表明chi2gof在默认的5%的显着水平不拒绝零假设。

创建标准正态分布对象。生成一个数据载体X使用从分布的随机数。

PD = makedist('正常');RNG默认;%,持续重现X =随机(PD,100,1);

检验零假设,在数据X来自一个人群在1%的显着性水平的正态分布。

[H,P] = chi2gof(X,'Α',0.01)
H = 0
p值= 0.3775

返回值H = 0表明chi2gof不拒绝在1%的显着性水平的零假设。

装入灯泡寿命样本数据。

加载灯泡

创建来自数据矩阵的第一列,其中包含在所述灯泡的小时寿命的载体。

X =灯泡(:,1);

检验零假设,在数据X来自用威布尔分布的人口。用fitdist创建具有的概率分布对象一个从数据中估计参数。

PD = fitdist(X,“韦伯”);H = chi2gof(X,'CDF',PD)
H = 1

返回值H = 1表明chi2gof拒绝以默认的5%的显着水平的零假设。

通过5创建六个格,编号为0,用于数据池。

仓= 0:5;

创建包含每个仓中的观察到的计数的向量,并计算观测的总数。

obsCounts = [6 16 10 12 4 2];N =总和(obsCounts);

适合的泊松概率分布对象的数据和计算每个仓中的期望的计数。使用转置运算符“。改造垃圾箱obsCounts从行向量的列向量。

PD = fitdist(仓,“泊松'频率',obsCounts');expCounts = N * PDF(PD,频段);

检验零假设,在数据obsCounts来自于与一个lambda泊松分布参数等于lambdaHat

[H,P,ST] = chi2gof(箱,“点击率”,垃圾桶,...'频率',obsCounts,...'预期',expCounts,...'NParams',1)
H = 0
p值= 0.4654
ST =同场的结构:chi2stat:2.5550 DF:3个边:[-0.5000 0.5000 1.5000 2.5000 3.5000 5.5000] O:[6 16 10 12 6] E:[7.0429 13.8041 13.5280 8.8383 6.0284]

返回值H = 0表明chi2gof在默认的5%的显着水平不拒绝零假设。矢量Ë包含了零假设下每个区间的预期计数和Ø包含每个仓的观测计数。

使用概率分布函数normcdf作为拟合优度的配合在卡方检验的功能句柄(chi2gof)。

检验零假设的是,在输入向量的采样数据X来自于与参数正态分布μσ等于平均(意思)和标准偏差(STD)的采样数据,分别的。

RNG('默认'%用于重现X = normrnd(50,5,100,1);H = chi2gof(X,'CDF'{@ normcdf,平均(x)中,STD(X)})
H = 0

返回的结果H = 0表明chi2gof在默认的5%的显着水平不拒绝零假设。

输入参数

全部收缩

对于假设检验的样本数据,指定为矢量。

名称 - 值对参数

指定可选的用逗号分隔的对名称,值参数。名称是参数的名称和是对应的值。名称必须出现引号内。您可以按照任何顺序指定多个名称和值对参数名1,值1,...,NameN,值N

例:'NBins',8 '阿尔法',0.01池在1%的显着性水平的数据为八个仓和行为的假设检验。

仓编号,以用于数据池,指定为逗号分隔的一对组成的'NBins'和正整数值。如果指定的值NBins,没有指定的值点击率要么边缘

例:'NBins',8

数据类型:|

宾中心,被指定为逗号分隔的一对组成的“点击率”和中心的向量各bin的值。如果指定的值点击率,没有指定的值NBins要么边缘

例:的点击率',[1 2 3 4 5]

数据类型:|

滨边,指定为逗号分隔的一对组成的“边缘”和边缘的矢量各bin的值。如果指定的值边缘,没有指定的值NBins要么点击率

例:'边缘',[ - 2.5 -1.5 -0.5 0.5 1.5 2.5]

数据类型:|

了虚拟分发的CDF,指定为逗号分隔的一对组成的'CDF'和概率分布对象,功能句柄,或单元阵列。

  • 如果CDF是一个概率分布对象,无论你使用估计参数的自由度账户fitdist或使用指定它们makedist

  • 如果CDF是一个功能手柄,分布函数必须采取X作为其唯一参数。

  • 如果CDF是一个单元阵列,所述第一元件必须是一个函数句柄,并且剩余的元素必须是参数值,每个小区中的一个。该功能必须X作为第一个参数,并且阵列如稍后参数在其它参数。

如果指定的值CDF,没有指定的值预期

例:'CDF',pd_object

数据类型:|

预期计数每个仓,指定为逗号分隔的对'预期'和一个非负的值的矢量。如果预期取决于估计的参数,使用NParams以确保chi2gof正确计算自由度。如果指定的值预期,没有指定的值CDF

例:'预期',[19.1446 18.3789 12.3224 8.2432 4.1378]

数据类型:|

估计的参数的数目,用于​​描述的零分布,指定为逗号分隔的一对组成的'NParams'和正整数值。该值调整度基于用于计算CDF或预期计数估计的参数的数目的试验的自由度。

作为默认值NParams取决于你如何指定空分布:

  • 如果您指定CDF作为概率分布对象,NParams等于用于创建对象估计的参数的数目。

  • 如果您指定CDF作为一个函数名或手柄,默认值NParams0

  • 如果您指定CDF作为一个单元阵列,的默认值NParams是阵列中的参数的数目。

  • 如果您指定预期,默认值NParams0

例:'NParams',1

数据类型:|

最小期望每个块的数,指定为逗号分隔的一对组成的“额敏”和一个非负整数值。如果在任一尾部的最末端的bin具有期望的值小于额敏时,它与相邻的箱组合,直到在每个极端仓中的计数是至少5。如果任何内部仓有一个计数小于5,chi2gof将会显示警告,但不结合内部箱。在这种情况下,你应该使用较少二进制,或者提供斌中心或边缘,以增加所有垃圾箱预期计数。指定额敏0防止箱的结合。

例:'EMIN',0

数据类型:|

数据值的频率,指定为逗号分隔的一对组成的'频率'和非负整数值的载体,其是相同的长度作为矢量X

例:'频率',[20 16 13 10 8]

数据类型:|

假设检验的显着性水平,指定为逗号分隔的一对组成的'Α'和范围内的(0,1)的标量值。

例:'阿尔法',0.01

数据类型:|

输出参数

全部收缩

假设检验结果,返回1要么0

  • 如果H= 1,这表明在拒绝原假设Α显着性水平。

  • 如果H= 0这表示无法拒绝的零假设Α显着性水平。

p-VALUE试验,返回作为在范围[0,1]的标量值的。p是观察检验统计量极端或比更加极端,在零假设下所观察到的值的概率。小值p在零假设的有效性产生怀疑。

测试统计,返回包含以下内容的结构:

  • chi2stat- 检验统计量的值。

  • DF- 试验的自由度。

  • 边缘- 矢量池后仓的边缘。

  • Ø- 每个箱观察数的矢量。

  • Ë- 矢量每个箱预期计数。

更多关于

全部收缩

卡方拟合优度体能测试

拟合优度-卡方测试确定数据样本来自于一个特定的概率分布,从数据中估计参数。

试验组的数据转换成二进制位,计算所观察到的和预期的计数这些块,并计算卡方检验统计量

χ 2 = Σ 一世 = 1 ñ Ø 一世 - Ë 一世 2 / Ë 一世

哪里Ø一世是观察计数和Ë一世是基于虚拟分配预期的计数。检验统计量具有近似卡方分布时的计数是足够大的。

算法

chi2gof检验统计量的值进行比较以与自由度的卡方分布等于nbins- 1 -nparams,其中nbins用于数据池仓的数量和nparams是用来确定预期数估计参数的数量。如果没有足够的自由度进行测试,chi2gof返回p- 值作为为NaN

扩展功能

也可以看看

|

主题

R2006a前推出