主要内容

chi2gof

卡方拟合优度检验

描述

例子

H= chi2gof(X返回null假设的测试决定,即向量中的数据X来自正常分布,估计平均值和方差X,使用卡方拟合优度检验。替代假设是数据不来自这种分布。结果H1如果检验在5%显著性水平上拒绝了原假设,并且0.除此以外。

例子

H= chi2gof(X名称,价值使用由一个或多个名称-值对参数指定的附加选项返回卡方拟合优度测试的测试决定。例如,您可以对非正态分布进行测试,或者更改测试的显著性级别。

例子

[HP.) = chi2gof (___还返回P.价值P.假设测试,使用来自前面语法的任何输入参数。

例子

[HP.统计数据) = chi2gof (___也返回结构统计数据,包含有关测试统计信息的信息。

例子

全部收缩

创建一个标准正态概率分布对象。生成数据向量X使用分布的随机数。

pd = makedist('普通的');RNG.默认的;重复性的%x =随机(pd, 100, (1);

测试null假设,数据在X来自一个正态分布的总体。

h = chi2gof(x)
H = 0.

返回的价值H = 0.表明chi2gof在默认5%的重要性水平下,不会拒绝零假设。

创建一个标准正态概率分布对象。生成数据向量X使用分布的随机数。

pd = makedist('普通的');RNG.默认的;重复性的%x =随机(pd, 100, (1);

测试null假设,数据在X来自1%的重要性水平的正常分布的人口。

[h,p] = chi2gof(x,“α”,0.01)
H = 0.
P = 0.3775.

返回的价值H = 0.表明chi2gof在1%的重要性水平下不会拒绝零假设。

加载灯泡寿命样本数据。

加载灯泡

从数据矩阵的第一列创建矢量,其中包含灯泡数小时的生命周期。

x =灯泡(:,1);

测试null假设,数据在X来自威布尔分布的人口。用Fitdist.创建概率分布对象一种B.从数据估计的参数。

pd = fitdist (x,'weibull');h = chi2gof(x,'CDF',PD)
H = 1

返回的价值H = 1表明chi2gof在默认的5%显著性水平上拒绝零假设。

创建六个箱,编号为0到5,用于用于数据池。

垃圾箱= 0:5;

创建包含每个垃圾箱的观察计数的向量,并计算观察总数。

obsCounts = [6 16 10 12 4 2];n =总和(obsCounts);

将Poisson概率分布对象拟合到数据,并计算每个箱的预期计数。使用转置运算符”。改变垃圾箱掩盖从行向量到列向量。

pd = fitdist(垃圾箱','泊松'“频率”,掩盖');Expcounts = n * pdf(PD,箱);

测试null假设,数据在掩盖来自于泊松分布,参数为lambdaHat

(h p st) = chi2gof(垃圾箱,“点击率数据”,垃圾箱,...“频率”,掩盖,...“预期”,expcounts,...'nparams'1)
H = 0.
P = 0.4654.
圣=结构与字段:CHI2STAT:2.5550 DF:3边缘:[-0.5000 0.5000 1.5000 2.5000 3.5000 5.5000:[6 16 10 12 6] E:[7.0429 13.8041 13.5280 8.8383 6.0284]

返回的价值H = 0.表明chi2gof在默认5%的重要性水平下,不会拒绝零假设。矢量E.包含零假设下每个垃圾箱的预期计数,O.包含每个容器的观察计数。

使用概率分布函数NORMCDF.作为卡方拟合优度检验中的函数句柄(chi2gof)。

测试输入向量中的样本数据的空假设X来自参数的正常分布μ.σ.等于平均值(意思)标准偏差(性病)的样本数据。

RNG('默认'重复性的%x = normrnd (5100 1);h = chi2gof(x,'CDF', {@normcdf,意味着(x),性病(x)})
H = 0.

返回的结果H = 0.表明chi2gof在默认5%的重要性水平下,不会拒绝零假设。

输入参数

全部收缩

假设检验的样本数据,指定为向量。

名称值对参数

指定可选的逗号分离对名称,价值论点。的名字是参数名称和价值为对应值。的名字必须出现在引号内。可以以任意顺序指定多个名称和值对参数name1,value1,...,namen,valuen

例子:'nbins',8,'alpha',0.01将数据分成8个箱子,在1%显著性水平下进行假设检验。

用于数据池的箱数,指定为逗号分隔对组成'nbins'和积极的整数值。如果指定值NBins,请勿指定值点击率数据边缘

例子:'nbins',8

数据类型:|双倍的

BIN中心,指定为逗号分隔对组成“点击率数据”每个垃圾箱的中心值矢量。如果指定值点击率数据,请勿指定值NBins边缘

例子:'Ctrs',[1 2 3 4 5]

数据类型:|双倍的

Bin边缘,指定为逗号分隔的配对组成'边缘'以及每个垃圾箱的边缘值的矢量。如果指定值边缘,请勿指定值NBins点击率数据

例子:'边',[ - 2.5 -1.5 -0.5 0.5 1.5 2.5]

数据类型:|双倍的

假设分布的cdf,指定为逗号分隔对,由'CDF'概率分布对象、函数句柄或单元格数组。

  • 如果CDF.是一个概率分布对象,自由度是估计参数的估计Fitdist.或使用它们指定它们制造主义者

  • 如果CDF.是一个函数手柄,分发功能必须采取X作为它唯一的论点。

  • 如果CDF.是一个单元数组,第一元素必须是函数句柄,并且剩余元素必须是参数值,每个单元。该功能必须采取X作为其第一个参数,以及数组中的其他参数作为稍后的参数。

如果指定值CDF.,请勿指定值预期

例子:'cdf',pd_object

数据类型:|双倍的

每个垃圾箱的预期计数,指定为逗号分隔的对“预期”和一个非负值的向量。如果预期取决于估计的参数,使用nparams.以确保chi2gof正确地计算自由度。如果指定值预期,请勿指定值CDF.

例子:'预期',[19.1446 18.3789 12.3224 8.2432 4.1378]

数据类型:|双倍的

用于描述空分布的估计参数的数量,指定为包括的逗号分隔对'nparams'和积极的整数值。基于用于计算CDF或预期计数的估计参数的数量,该值调整测试的自由度。

的默认值nparams.取决于您指定空分布的方式:

  • 如果您指定CDF.作为概率分布对象,nparams.等于用于创建对象的估计参数的数量。

  • 如果您指定CDF.作为函数名称或句柄,默认值nparams.0.

  • 如果您指定CDF.作为单元阵列,默认值nparams.是数组中的参数数。

  • 如果您指定预期的默认值nparams.0.

例子:“NParams”,1

数据类型:|双倍的

每个垃圾箱的最低预期计数,指定为逗号分隔对'Emin'和一个非负整数值。如果尾部的极端的垃圾箱的预期值小于emin,它与邻近的箱组合在一起,直到每个极端箱中的计数至少为5.如果任何内部垃圾箱都有小于5,则chi2gof显示警告,但不会组合内部垃圾箱。在这种情况下,您应该使用更少的垃圾箱,或提供箱中心或边缘,以增加所有垃圾箱中的预期计数。指定emin作为0.防止垃圾箱的组合。

例子:'Emin',0

数据类型:|双倍的

数据值的频率,指定为由逗号分隔的对组成“频率”和非负整数值的矢量与矢量相同的长度X

例子:“频率”,[20 16 13 10 8]

数据类型:|双倍的

假设检验的显著性水平,指定为逗号分隔对组成“α”和范围内的标量值(0,1)。

例子:“阿尔法”,0.01

数据类型:|双倍的

输出参数

全部收缩

假设测试结果,返回10.

  • 如果H= 1,这表明拒绝零假设Α意义水平。

  • 如果H= 0.,这表明未能拒绝零假设Α意义水平。

P.- 测试的值,返回范围的标量值[0,1]。P.是观察测试统计学的概率,如零假设下观察到的值。小值P.对零假设的有效性倾诉。

测试统计数据,作为包含以下内容的结构返回:

  • Chi2stat.—测试统计值。

  • DF.-测试的自由度。

  • 边缘-池后的bin边向量。

  • O.-向量观察计数为每个箱子。

  • E.-每个箱子的预期计数向量。

更多关于

全部收缩

Chi-Square良好的测试

卡方拟合优度检验确定数据样本是否来自特定的概率分布,参数由数据估计。

测试将数据分组到bins,计算这些bins的观察计数和预期计数,并计算卡方检验统计量

χ 2 = 一世 = 1 N O. 一世 E. 一世 2 / E. 一世

在哪里O.一世是观察到的计数和E.一世是基于假设分布的期望计数。当计数足够大时,检验统计量具有近似卡方分布。

算法

chi2gof将检验统计量的值与自由度为的卡方分布进行比较nbins.- 1 -nparams., 在哪里nbins.是用于数据池的箱数和nparams.是用于确定预期计数的估计参数的数量。如果没有足够的自由度进行测试,chi2gof返回P.- 瓦斯

扩展功能

也可以看看

|

话题

之前介绍过的R2006a