sampsizepwr

样本量和检验能力

描述

sampsizepwr给定另外两个值,计算假设检验的样本量、功率或可选参数值。例如,在给定备选假设的参数值的情况下,可以计算获得假设检验的特定幂所需的样本量。

nout= sampsizepwr (testtypep0p1返回样本大小,nout所规定的类型的双边试验所必需的testtype当显著性水平(当零假设为真时拒绝零假设的概率)为0.05时,功率(当替代假设为真时拒绝零假设的概率)为0.90。p0指定零假设下的参数值。p1指定在备选假设下要测试的单个参数的值或值数组。

例子

nout= sampsizepwr (testtypep0p1压水式反应堆返回样本大小,nout,对应于指定的幂,压水式反应堆,备择假设下的参数值,p1

例子

pwrout= sampsizepwr (testtypep0p1[],n返回样本大小为时获得的功率n当true参数值为p1

例子

p1out= sampsizepwr (testtypep0[],压水式反应堆n返回可通过指定样本大小检测到的参数值,n,指定功率;压水式反应堆

例子

___= sampsizepwr (testtypep0p1压水式反应堆n名称,值使用一个或多个名称-值对参数返回前面的任何参数。例如,您可以更改检验的显著性水平,或者指定右尾或左尾检验。名称-值对可以以任何顺序出现,但必须从第六个参数位置开始。

例子

全部折叠

一家公司的生产流程是在空瓶子里装满100毫升的液体。为了监控质量,该公司随机选择了几个瓶子,并测量了里面的液体体积。

确定公司必须使用的样本量,如果它想以0.80的功率检测100 mL和102 mL之间的差异。假设先前的证据表明标准偏差为5ml。

Nout = sampsizepwr(“t”102年,100年[5],0.80)
n = 52

该公司必须测试52瓶,以检测平均体积为100毫升和102毫升之间的差异,功率为0.80。

生成功率曲线,以可视化样本量如何影响测试的功率。

Nn = 1:100;Pwrout = sampsizepwr()“t”, 102年100年[5],[],nn);图;情节(nn、pwrout“b -”, nout, 0.8,“罗”)标题(“功率vs样本量”)包含(“样本”) ylabel (“权力”

一位员工想在办公室附近买一栋房子。她决定排除那些平均早上通勤时间超过20分钟的房子。右侧检验的零假设为H0 μ = 20,备择假设为HA: μ > 20。选择显著性水平为0.05。

为了确定平均通勤时间,该员工在一周内每天早上的高峰时间从家里到办公室进行试驾,因此她的总样本量为5。她假设标准差, σ ,等于5。

该员工认为,真实的平均通勤时间为25分钟,与她设定的20分钟限制相差太大,因此,如果真实的平均通勤时间为25分钟,她想检测出明显的偏差。找出得出平均通勤时间不大于20分钟的错误结论的概率。

计算测试的功率,然后用1减去功率得到 β

功率= sampsizepwr(“t”20 [5] 25 [], 5,“尾巴”“对”);贝塔= 1 -幂
Beta = 0.4203

β 值表示员工错误地得出早晨通勤时间不超过20分钟的概率为0.4203。

员工认为这个风险太高,她希望得出错误结论的概率不超过0.01。计算该员工必须进行的试驾次数,从而得到0.99的幂。

Nout = sampsizepwr(“t”0.99 20[5], 25日,[],“尾巴”“对”
Nout = 18

结果表明,她必须从候选房屋进行18次试驾才能达到这个功率水平。

这名员工决定她只有时间试驾10次。她也接受得出错误结论的概率为0.05。计算在平均通勤时间中产生可检测差异的最小真参数值。

P1out = sampsizepwr(“t”20[5],[], 0.95, 10日“尾巴”“对”
P1out = 25.6532

考虑到员工的目标功率水平和样本量,她的测试检测到与平均通勤时间至少25.6532分钟的显著差异。

计算样本量,n,需要区分p= 0.30 fromp= 0.36,使用二项式检验,幂为0.8。

Napprox = sampsizepwr“p”, 0.30, 0.36, 0.8)
警告:N>200是近似值。将功率绘制为N的函数可以揭示具有所需功率的较低N值。
n约= 485

结果表明,0.8的功率需要485的样本量。然而,这个结果是近似的。

画个图看看有没有更小的n值提供所需的0.8功率。

Nn = 1:500;Pwrout = sampsizepwr()“p”, 0.3, 0.36, [], nn);Nexact = min(nn(pwrout>=0.8))
= 462
pwrout图绘制(神经网络,“b -”,[近似近似],[近似近似],“罗”网格)

结果表明,样本量为462也为该测试提供了0.8的幂。

一位农民想要测试两种不同类型的肥料对他的豆类作物产量的影响。他目前使用的是肥料A,但他认为肥料B可能会提高作物产量。因为肥料B比肥料A贵,农民想要在这个实验中限制他用肥料B处理的计划的数量。

农民在每个处理组中使用2:1的植物比例。他用肥料A测试了10株植株,用肥料b测试了5株植株。使用肥料A的平均产量为每株1.4公斤,标准差为0.2。施用B肥的平均单株产量为1.7公斤。检验的显著性水平为0.05。

计算测试的功率。

PWR = sampsizepwr(《终结者2》(1.4 - 0.2), 1.7, [], 5,“比”, 2)
PWR = 0.7165

农场主想把测试的功率提高到0.90。计算他必须用每种肥料处理多少株植物。

N = sampsizepwr(《终结者2》(1.4 - 0.2), 1.7, 0.9, [])
N = 11

为了将测试的功率提高到0.90,农民必须用每种肥料测试11株植物。

农民想要减少他必须用肥料B处理的植株数量,但保持试验的幂为0.90,并保持每个处理组初始的2:1的植株比例

在每个处理组中使用2:1的植物比例,计算农民必须测试多少植物才能得到0.90的幂。使用在前面测试中得到的平均值和标准差值。

[n1out,n2out] = sampsizepwr(《终结者2》, 1.4, 0.2, 1.7, 0.9, [],“比”, 2)
N1out = 8
N2out = 16

为了获得0.90的幂,农民必须用肥料a处理16株植物,用肥料B处理8株植物。

输入参数

全部折叠

测试类型,指定为下列之一。

  • “z”- - - - - -z-对标准偏差已知的正态分布数据进行检验。

  • “t”- - - - - -t-对标准差未知的正态分布数据的检验。

  • 《终结者2》-双样本池t-对标准差未知且方差相等的正态分布数据的检验。

  • “var”-正态分布数据的方差卡方检验。

  • “p”-测试p参数(成功概率)的二项分布。的“p”测试是一种离散测试,增加样本量并不总是增加功率。为n值大于200时,可能存在小于返回值的值n值,该值也产生指定的功率。

参数值,指定为标量值或标量值的双元素数组。

  • 如果testtype“z”“t”,然后p0是一个双元素数组吗[mu0, sigma0]零假设下的均值和标准差。

  • 如果testtype《终结者2》,然后p0是一个双元素数组吗[mu0, sigma0]在零假设和备择假设下,第一个样本的均值和标准差。

  • 如果testtype“var”,然后p0是零假设下的方差。

  • 如果testtype“p”,然后p0的值是p零假设下。

数据类型:|

参数值,指定为标量值或标量值数组。

  • 如果testtype“z”“t”,然后p1是备择假设下的均值。

  • 如果testtype《终结者2》,然后p1是备择假设下第二个样本的均值。

  • 如果testtype“var”,然后p1是备择假设下的方差。

  • 如果testtype“p”,然后p1的值是p在备择假设下。

如果你指定p1作为一个数组sampsizepwr的数组返回noutpwrout它的长度等于p1

要返回可选参数值,请使用p1out,指定p1使用空括号([]),如语法描述

数据类型:|

测试的功率,指定为(0,1)范围内的标量值或(0,1)范围内的标量值数组。检验的幂是在给定特定显著性水平时,当备选假设为真时拒绝原假设的概率。

如果你指定压水式反应堆作为一个数组sampsizepwr的数组返回noutp1out它的长度等于压水式反应堆

要返回一个幂值,pwrout,指定压水式反应堆使用空括号([]),如语法描述

数据类型:|

样本大小,指定为正整数值或正整数值数组。

如果testtype《终结者2》,然后sampsizepwr假设两个样本量相等。对于不相等的样本量,请指定n作为两个样本量中较小的,并使用“比”名称-值对参数,以指示样本大小比率。例如,较小的样本量为5,较大的样本量为10,则指定n作为5,和“比”名称-值对为2。

如果你指定n作为一个数组sampsizepwr的数组返回pwroutp1out它的长度等于n

数据类型:|

名称-值对参数

指定可选的逗号分隔对名称,值参数。名字是参数名和吗价值是对应的值。名字必须出现在引号内。可以以任意顺序指定多个名称和值对参数,如Name1, Value1,…,的家

例子:“阿尔法”,0.01,“尾巴”,“对”指定具有0.01显著性水平的右尾检验。

测试的显著性值,指定为由逗号分隔的对“α”在(0,1)范围内的标量值。

例子:“阿尔法”,0.01

数据类型:|

双样本的样本容量比t-test,指定为由“比”一个大于等于1的标量。的价值等于n2 / n1,在那里n2样本量越大,和n1是较小的样本量。

为了恢复力量,pwrout,或可选参数值,p1out,指定两个样本量中较小的一个n,并使用“比”表示样本量比。

例子:“比”,2

测试类型,指定为由“尾巴”以及以下其中之一:

  • “两个”-双侧测试的选择不等于p0

  • “对”-大于。的单侧检验p0

  • “左”-小于。的单侧试验p0

例子:“尾巴”,“对”

输出参数

全部折叠

样本大小,作为正整数值或正整数值数组返回。

如果testtypet2,用“比”名称-值对参数指定两个不相等样本量的比率,则nout返回两个样本大小中较小的那个。

或者,要返回两个样本大小,请将此参数指定为[n1out, n2out].在这种情况下,sampsizepwr返回较小的样本大小为n1out,样本量越大,为n2out

如果你指定压水式反应堆p1作为一个数组sampsizepwr的数组返回nout它的长度等于压水式反应堆p1

测试获得的功率,作为(0,1)范围内的标量值或作为(0,1)范围内的标量值数组返回。

如果你指定np1作为一个数组sampsizepwr的数组返回pwrout它的长度等于np1

参数值,作为标量值或标量值数组返回。

当计算p1out“p”检验,如果对于给定的零假设和显著性水平没有可拒绝的替代方案,则该函数显示警告消息并返回

在R2006b中引入