主要内容

bootci

引导置信区间

描述

例子

CI.= bootci (nbootbootfunD.计算由该函数计算的每个统计量的95%引导置信区间bootfun。这bootci功能使用nboot引导样本在其计算中,并通过从行的替换中采样来创建每个引导程序样本D.

例子

CI.= bootci (nbootbootfunD.1,......,D.ñ)通过使用Nonscalar数据参数的行中的替换采样创建每个引导样本d1,…,dN。这些非卡尔参数必须具有相同数量的行。这bootci函数通过非卡尔数据的样本和不变的标量数据参数d1,…,dNbootfun

例子

CI.= bootci (nboot,{bootfunD.},名称,价值使用一个或多个名称值参数指定选项。例如,您可以通过指定来更改置信区间类型“类型”名称值参数。

请注意,您必须通过bootfunD.争论到bootci作为单个单元阵列。

例子

CI.= bootci (nboot,{bootfunD.1,......,D.n},名称,价值使用一个或多个名称值参数指定选项。例如,您可以通过指定来改变置信区间的显着级别'Α'名称值参数。

请注意,您必须通过bootfund1,…,dN争论到bootci作为单个单元阵列。

例子

[CI.bootstat.] = bootci(___还返回为每个计算的引导统计数据nboot引导程序复制示例,使用前面语法中的任何输入参数组合。每一排bootstat.包含应用的结果bootfun一个引导样本。

例子

全部收缩

计算统计过程控制能力指标的置信区间。

从平均值1和标准偏差1生成30个随机数。

RNG('默认'重复性的%y = normrnd(1, 1, 30岁,1);

指定工艺的规格下限和上限。定义能力索引。

LSL = 3;USL = 3;= @ (x)能力(USL-LSL)。/(6 *性病(x));

使用2000 Bootstrap样本计算能力索引的95%置信区间。默认,bootci使用偏置校正和加速百分位方法来构建置信区间。

ci = bootci(2000,有能力,y)
ci =2×10.5937 0.9900

计算能力指数的学生化置信区间。

sci = bootci(2000年{能力,y},“类型”'学生'
SCI =2×10.5193 0.9930.

计算非线性回归模型系数的引导置信间隔。在该示例中使用的技术涉及引导预测器和响应值,并假设预测器变量是随机的。对于假设预测器变量的技术是固定并引导残差的技术,请参阅线性回归模型系数的引导置信区间

笔记:这个示例使用nlinfit(当您只需要非线性回归模型的系数估计或残差时,它很有用,并且您需要重复拟合模型多次,如在自动启动的情况下。如果您需要进一步调查拟合的回归模型,请通过使用创建非线性回归模型对象fitnlm.。您可以通过使用使用的系数为所得模型的系数创造置信区间COEFCI.对象函数,虽然此函数不使用自举。

从非线性回归模型中生成数据 y = B. 1 + B. 2 E. X P. - B. 3. X + ε. ,在那里 B. 1 = 1 B. 2 = 3. , 和 B. 3. = 2 是系数;预测器变量X呈指数分布,均值为2;误差项 ε. 通常以平均值0分布和标准偏差0.1。

modelfun = @(b,x)(b(1)+ b(2)* exp(-b(3)* x));RNG('默认'重复性的%b = [1; 3; 2);x = exprnd (2100 1);Y = modelfun(b,x) + normrnd(0, 0.1100,1);

为使用中初始值的非线性回归模型创建函数句柄Beta0.

beta0 = [2; 2; 2];Beta = @(预测器,响应)nlinfit(预测器,响应,modelfun,beta0)
β=function_handle具有值:@(预测器,响应)nlinfit(预测器,响应,modelfun,beta0)

计算非线性回归模型的系数的95%Bootstrap置信区间。从生成的数据创建引导样本Xy

ci = bootci(1000年,β,x, y)
ci =2×30.9821 2.9552 2.0180 1.0410 3.1623 2.2695

前两种置信区间包括真正的系数值 B. 1 = 1 B. 2 = 3. , 分别。但是,第三次置信区间不包括真正的系数值 B. 3. = 2

现在计算模型系数的99%Bootstrap置信区间。

newci = bootci(1000年,{β,x, y},'Α', 0.01)
newci =2×30.9730 2.9112 1.9562 1.0469 3.1876 2.3133

所有三个置信区间包括真正的系数值。

计算线性回归模型系数的引导置信间隔。在该示例中使用的技术涉及引导残差并假设预测器变量是固定的。对于假设预测器变量的技术是随机的,并引导预测器和响应值,请参阅非线性回归模型系数的引导置信区间

笔记:这个示例使用回归,当您只需要一个回归模型的系数估计或残差,并且您需要重复拟合一个模型多次时,这是有用的,就像在bootstrapping的情况。如果需要进一步研究拟合的回归模型,可以使用Fitlm.。您可以通过使用使用的系数为所得模型的系数创造置信区间COEFCI.对象函数,虽然此函数不使用自举。

加载样本数据。

加载hal

执行线性回归并计算残差。

x =[(大小(热)),成分);y =热量;b =回归(y、x);yfit = x * b;Resid = y - yfit;

计算线性回归模型系数的95% bootstrap置信区间。从残余物中创建bootstrap样本。通过指定,使用带有自举偏差和标准误差的正态逼近区间“类型”、“正常”。在这种情况下,不能使用默认置信区间类型。

ci = bootci(1000,{@(bootr)回归(yfit + bootr,x),star},......“类型”'普通的'
ci =2×5-47.7130 0.3916 -0.6298 -1.0697 -1.2604 172.4899 2.7202 1.6495 1.2778 0.9704

绘制估计的系数B.,省略截距术语,并显示显示系数置信区间的误差条。

斜坡= B(2:结束)';Dublubrlengths = Slopes-Ci(1,2:结束);upperbarlengths = ci(2,2:end)-slopes;errorbar(1:4,斜坡,updarbarlengs,upperbarlengths)xlim([0 5])标题(系数的置信区间的

图包含轴。具有标题系数置信度间隔的轴包含误差类型的对象。

只有第一个非截距系数与0有显著差异。

计算100个自助样本的平均值和标准偏差。找出每个统计量的95%置信区间。

从指数分布产生100个随机数,平均值5。

RNG('默认'重复性的%Y = EXPRND(5,100,1);

从向量中绘制100引导样本y。对于每个引导样本,计算平均值和标准偏差。找到均值和标准偏差的95%引导置信区间。

[ci,bootstat] = bootci(100,@(x)[均值(x)std(x)],y);

ci (: 1)包含平均置信区间的下界和上界,以及C(:,2)包含标准偏差置信区间的下限和上限。每一排bootstat.包含引导样本的平均值和标准偏差。

绘制每个自助样本的均值和标准差作为一个点。绘制均值置信区间的下界和上界为垂直线虚线,绘制标准差置信区间的下界和上界为水平线虚线。

plot(bootstat(:,1),bootstat(:,2),'o')Xline(CI(1,1),':')Xline(CI(2,1),':')Yline(CI(1,2),':')Yline(CI(2,2),':')xlabel('吝啬的')ylabel('标准偏差'

图包含轴。轴包含5个类型的类型线,恒定线。

输入参数

全部收缩

绘制的引导样本数量,指定为正整数标量。要创建每个引导样本,bootci随机选择替换N出了N中的非标量数据行D.或者d1,…,dN

例子:100.

数据类型:|

应用于每个样本的功能,指定为函数句柄。该函数可以是自定义或内置功能。您必须指定bootfun与之@象征。

例子:@吝啬的

数据类型:function_handle.

从,指定为列向量或矩阵的数据。这ND.对应观察。当您使用多个数据输入参数时d1,…,dN,您可以将一些参数指定为标量值,但所有非卡尔参数必须具有相同数量的行。

如果使用单个向量参数D.,您可以将其指定为行向量。bootci然后来自载体的元素的样品。

数据类型:|

名称值对参数

指定可选的逗号分离对名称,价值论点。的名字是参数名称和价值是相应的价值。的名字必须出现在引号内。您可以以任何顺序指定多个名称和值对参数name1,value1,...,namen,valuen

例子:Bootci(100,{@均值,1:6'},'alpha',0.1)指定从值1到6绘制100个引导样本,取自每个样本的平均值,然后计算样本均值的90%置信区间。

显著性水平,指定为0到1之间的正标量。bootci计算100 *(1-alpha)函数定义的每个统计数据的引导置信区间bootfun

例子:'alpha',0.01

数据类型:|

置信区间类型,指定为此表中的值之一。

价值 描述
'规范'或者'普通的' 正常近似间隔,带有自动绑定偏差和标准错误[1]
'每'或者'百分位数' 基本百分位方法
'COL'或者“纠正百分位” 偏差修正百分位法[2]
“bca”

偏见校正和加速百分位方法[3][4]- 涉及A.Z.0.使用小于原始样本值的引导值的比例计算的因子。当样品是块状时,可以产生合理的结果,软件计算Z.0.通过包含与原始样本值相同的引导值的一半。

'螺柱'或者'学生' 学生的置信区间[3]

例子:'类型','学生'

为学生化标准错误估计的引导样本数量指定为正整数标量。

bootci计算函数定义的统计的学生化引导置信区间bootfun,并估计使用的引导统计数据的标准错误nbootstd.引导数据样本。

笔记

使用此名称值参数,类型价值必须是'螺柱'或者'学生'。指定nbootstd.或者斯德尔,但不是两者。

例子:“NBootStd”,50岁

数据类型:|

用于计算Substualized标准错误估计的函数,指定为函数句柄。

bootci计算函数定义的统计的学生化引导置信区间bootfun,并估计通过使用该函数的引导统计数据的标准错误斯德尔。这斯德尔函数必须采取与相同的参数bootfun并返回所计算统计数据的标准错误bootfun

笔记

使用此名称值参数,类型价值必须是'螺柱'或者'学生'。指定nbootstd.或者斯德尔,但不是两者。

例子:'stderr',@ std

数据类型:function_handle.

观测权值,指定为具有至少一个正元素的非负向量。中元素的个数重量必须等于行数N在数据中D.或者d1,…,dN。要获得一个bootstrap样本,bootci随机选择替换N在......之外N使用这些权重的数据行为多项式采样概率。

数据类型:|

在Bootstrap采样期间并行计算自动启动迭代的选项,并将其设置为结构。创造选项结构statset。此表列出了选项字段及其值。

字段名称 价值 默认
使用指α. 将此值设置为真的并行计算Bootstrap迭代。 错误的
Userumstreams.

将此值设置为真的以可重复的方式运行计算并行计算。

计算可重复的,设置溪流到允许子流的类型:'mlfg6331_64'或者“mrg32k3a”

错误的
溪流 将此值指定为aRandStream这些对象的对象或小区阵列。除了何时之外,使用单个对象使用指α.价值是真的Userumstreams.价值是错误的。在这种情况下,使用具有与并行池相同大小的单元数组。 如果您未指定溪流, 然后bootci使用默认流或流。

笔记

您需要并行计算工具箱™并行运行计算。

例子:“选项”,statset (UseParallel,真的)

数据类型:塑造

输出参数

全部收缩

置信区间界限,作为矢量,矩阵或具有两行的多维数组返回。

  • 如果bootfun然后返回一个标量CI.是载体含有置信区间的下限和上限。

  • 如果bootfun返回长度的向量m, 然后CI.是大小的矩阵2-by-m,在那里CI(1,:)是下限和CI(2,:)是上限。

  • 如果bootfun返回一个多维数组,然后CI.是一个阵列,在哪里ci(1:…)是一系列下限和ci(2:…)是一个上界数组。

引导统计信息,以列向量或矩阵的形式返回nboot行。这一世Th行bootstat.对应于申请结果bootfun到了一世th bootstrap样本。如果bootfun返回矩阵或数组,然后是bootci功能首先将此输出转换为行向量,然后再存储bootstat.

参考

A. C.戴维森,D. V.欣克利。引导方法及其应用程序。剑桥大学出版社,1997年。

[2] efron,布拉德利。折刀,引导和其他重采样计划。费城:1982年工业和应用数学协会。

[3] Diciccio,Thomas J.和Bradley Efron。“引导置信区间。”统计科学11日,没有。3(1996): 189 - 228。

[4] efron,布拉德利和罗伯特J. Tibshirani。Bootstrap简介。纽约:1993年Chapman&Hall。

扩展功能

在R2006A介绍