ECDF

经验累积分布函数

描述

例子

(f,x)= ecdf (y)返回经验累积分布函数(CDF),f,在点评价x,使用向量中的数据y

在生存和可靠性分析中,这种经验cdf被称为Kaplan-Meier估计。这些数据可能对应生存或失败时间。

例子

(f,x)= ecdf (y,名称,值)返回经验函数值,f,在点评价x,与由一个或多个指定的附加选项名称,值对参数。

例如,可以指定要评估的函数类型或哪些数据需要审查。

例子

(f,x,弗洛,FUP)= ecdf (___)还返回被求值的函数值的95%上下置信范围。您可以使用前面语法中的任何输入参数。

ECDF使用。计算置信界限格林伍德公式。他们是不是同时置信区间。

例子

ecdf (___)方法绘制求值函数的阶梯图楼梯函数。指定“界限”,“上”将置信区间包含在图中。

ecdf (斧头,___)在由指定的坐标轴曲线斧头而不是当前轴(GCA)。

例子

全部折叠

计算模拟生存数据的累积分布函数的Kaplan-Meier估计值。

从参数为3和1的威布尔分布中生成生存数据。

rng (“默认”)%的再现性failuretime =随机(“wbl”1、3、1、15日);

计算生存数据的cdf的Kaplan-Meier估计。

并[f,X] = ECDF(failuretime);并[f,x]中
ans =16×20 0.0895 0.0667 0.0895 0.1333 0.1072 0.2000 0.1303 0.2667 0.1313 0.3333 0.2718 0.4000 0.2968 0.4667 0.6147 0.5333 0.6684 0.6000 1.3749⋮

绘制估计的cdf。

ECDF(failuretime)

计算和绘制模拟右删失生存数据的风险函数。

从Birnbaum-Saunders分布中生成故障时间。

rng (“默认”)%的再现性failuretime =随机('birnbaumsaunders',0.3,1100,(1);

假设研究结束的时间为0.9,生成一个逻辑数组,该逻辑数组表示大于0.9的模拟故障时间,作为经过审查的数据,并将该信息存储在一个向量中。

T = 0.9;岑= (failuretime > T);

绘制数据的经验风险函数。

ECDF(failuretime,“函数”,“累积风险”,...“审查”,经社,“界限”,“上”);

生成右删失生存数据,并与已知的CDF比较经验累积分布函数(CDF)。

从平均故障时间为15的指数分布中生成故障时间。

rng (“默认”)%的再现性y = exprnd (75,1);

从30平均无故障时间的指数分布产生辍学倍。

d = exprnd (75,1);

生成的观察失败时间。他们所发生的故障时间和辍学倍的最低水平。

T =分钟(Y,d);

创建一个逻辑数组,该数组指示生成的失败时间大于退出时间。这是真的数据被审查。

删=(Y> d);

计算经验cdf和置信限。

[f, x,弗洛,管理方]= ecdf (t)“审查”、审查);

画出CDF和置信区间。

图()ecdf (t)“审查”,审查,“界限”,“上”);保持

叠加的已知人口的CDF的曲线图。

XX = 0:0.1:最大(T);YY = 1-EXP(-xx / 15);图(XX,YY,'G-','行宽'(2)轴([0 50 0 1])“经验”,'LCB','UCB',“人口”,...'位置',“东南”)保持

产生生存数据并绘制有99%的置信区间的经验幸存者功能。

从参数为100和2的威布尔分布生成生存期数据。

rng (“默认”)%的再现性R = wblrnd(100,2,100,1);

绘制幸存者功能与99%置信区间的数据。

ecdf (R,“函数”,“幸存者”,'Α',0.01%,“界限”,“上”)保持

拟合Weibull幸存者功能。

X = 1:1:250;wblsurv = 1-CDF(“威布尔”,100岁的x 2);情节(x, wblsurv,'G-','行宽',2)图例(“经验”,'LCB','UCB',“人口”,...'位置',“东北”)

基于实际分布的幸存者函数在置信范围内。

输入参数

全部折叠

输入数据,指定为向量。例如,在生存或可靠性分析中,数据可能是每个项目或个人的生存或失败时间。

ECDF忽略了价值观y。此外,任何截尾向量中的值(“审查”)或频率向量('频率')原因ECDF中忽略相应的值y

数据类型:|

轴手柄图ECDF绘图到,指定为句柄。

例如,如果h那么,这是一个数字的句柄吗ECDF可以绘制该图如下所示。

例子:ECDF(H,X)

名称-值对的观点

指定可选的逗号分隔的对名称,值参数。名称参数名和是对应的值。名称必须出现在引号内。可以按任意顺序指定多个名称和值对参数Name1, Value1,…,的家

例子:'截尾',C, '功能', '累积风险', '阿尔法',0.025, '边界', '上'指定ECDF返回累积危险函数,并绘制97.5%的置信范围,用于向量指定的审查数据c

指标的审查数据,指定为逗号分隔的对,包括“审查”和大小相同的布尔数组x。输入1为观察那些右审查和0对于被充分观察到的观测。默认值是所有观察值都被完全观察到。

ECDF忽略任何值在该截尾矢量。此外,任何价值观y或频矢量('频率')原因ECDF忽略在截尾矢量对应的值。

例子:如果矢量CDATA存储经过审查的数据信息,输入'截尾',CDATA

数据类型:逻辑

观察频率,由逗号分隔的对组成'频率'和含有载体的非负整数计数。这个向量是大小为向量相同x。的j该矢量的第i个元素给出的次数的数jth元素x被观察到。的每个元素一个观察值x

ECDF忽略任何值在这个频率矢量。此外,任何价值观y或截尾载体(“审查”)原因ECDF忽略在频矢量对应的值。

例子:如果failurefreq是频率的矢量,输入“频率”,failurefreq

数据类型:|

显着性水平为评价函数的置信区间,指定为逗号分隔的一对组成的'Α'以及(0,1)范围内的标量值。95%置信值默认为0.05。对于给定的值α,置信水平为100(1-α)%。

例如,对于一个99%的置信区间,你可以按如下方式指定alpha值。

例子:'阿尔法',0.01

数据类型:|

功能该类型ECDF计算并返回,指定为逗号分隔的一对组成的“函数”和下面的一个。

'CDF' 违约。累积分布函数。
“幸存者” 幸存者的功能。
“累积风险” 累积风险函数。

例子:“功能”,“累积危险”

指示器为包括界限,规定为逗号分隔的一对组成的“界限”和下面的一个。

“关闭” 违约。指定为省略边界。
“上” 指定包含界限。

请注意

此名称-值参数仅用于绘图。

例子:“界限”,“上”

输出参数

全部折叠

中各点处的函数值x,作为列向量返回。

在数据向量排序观测点y,作为列向量返回。

ECDF排序y,删除在排序重复值y,并将结果保存到输出x。输出x的最小值y作为它的前两个值。这两个值是有用的用于绘制的输出ECDF使用楼梯函数。

被求值函数的置信下限,以列向量的形式返回。ECDF使用。计算置信界限格林伍德公式。他们是不是同时置信区间。

求值函数的上置信界,作为列向量返回。ECDF使用。计算置信界限格林伍德公式。他们是不是同时置信区间。

更多关于

全部折叠

格林伍德的公式

Kaplan-Meier估计量方差的近似。

方差估计由

V ( 年代 ( t ) ) = 年代 2 ( t ) Σ t < T d r ( r - d ) ,

哪里r是在时间的风险数td失败的次数是多少t

参考文献

[1]考克斯,D. R.和D.奥克斯。生存数据分析。伦敦:查普曼和霍尔,1984年。

无法无天,j.f。寿命数据的统计模型和方法。第二版,Hoboken, NJ: John Wiley & Sons, Inc., 2003。

扩展功能

R2006a前推出