什么是生存分析?

介绍

生存分析是时间 - 事件分析,即当所关注的结果是,直到事件发生的时间。时间对事件的例子是时间,直到感染,疾病复发,或在健康科学的复苏,失业率在经济的持续时间,直到机器零件或工程灯泡寿命的失败,等等。生存分析是在工程的可靠性研究的一部分。在这种情况下,它通常用于研究工业部件的寿命。在可靠性分析中,存活时间通常被称为失败倍感兴趣的变量是多少时间出现故障的部件功能正常了。

生存分析包括参数方法、半参数方法和非参数方法。您可以使用这些来估计生存研究、幸存者和危险函数中最常用的度量,对不同组进行比较,并评估预测变量与生存时间的关系。一些统计概率分布很好地描述了生存时间。常用的分布有指数分布、威布尔分布、对数正态分布、Burr分布和Birnbaum-Saunders分布。统计和机器学习工具箱™功能ecdfksdensity计算CDF,累积风险,和幸存者功能的经验和内核密度估计。coxphfit适合Cox比例风险模型中的数据。

截尾

生存分析中的一个重要概念就是审查。由于各种原因,有些个体的生存时间可能没有被完全观察到。在生命科学中,当生存研究(例如临床试验)在所有个体的完整生存时间还未观察到之前就停止,或者一个人退出研究,或者对于长期研究,当患者失去随访时,就可能发生这种情况。在工业环境中,不是所有的部件都可能在可靠性研究结束前失效。在这种情况下,个体会在研究结束后存活下来,而确切的存活时间尚不清楚。这就是所谓的右审查。

在生存研究无论是个人观察到的时间失败Ť,或者对那个人的观察在时间上停止C。然后观察是min(ŤC)和指标变量一世C节目如果个人审查或没有。对于危险和幸存者功能的计算必须进行调整,以帐户审查。统计和机器学习工具箱功能,如ecdfksdensitycoxphfit,MLE占了审查。

数据

生存数据通常由感兴趣的事件发生前的时间和每个个体或组件的审查信息组成。下表显示了在6个月的研究中虚构的个人失业时间。两个个体被正确地审查(通过审查值1表示)。一个个体在研究结束的第24周后仍然没有工作。在第21周结束时,与另一名被审查人员失去了联系。

失业时间(周) 截尾
14 0
23 0
7 0
21 1
19 0
16 0
24 1
8 0

存活数据还可以包括失败的在一定的时间数(次数观察到特定存活或失效时间的数目)。下表显示了模拟的时间,直到一个发光二极管下降到其全光输出电平的70%,以小时为单位,在加速寿命试验。

故障时间(小时) 频率
8600 6
15300 19
22000 11
28600 20
35300 17
42000 14
48700 8
55400 2
62100 0
68800 2

数据还可能包含关于预测变量的信息,用于半参数回归方法,如Cox比例风险回归。

时间,直到恢复(周) 截尾 性别 收缩压 舒张压
12 1 124 93
20 0 109 77
7 0 125 83
13 0 117 75
9 1 122 80
15 0 121 70
17 1 130 88
8 0 115 82
14 0 118 86

幸存者函数

幸存者功能是生存时间的函数的概率。它也被称为生存函数。它给出了一个人的存活时间超过一定值的概率。由于累积分布函数,FŤ),是存活时间的概率小于或等于给定时间点,对于连续分配生存函数,小号Ť),是累积分布函数的互补:

小号Ť)= 1 -FŤ)。

幸存者功能也与风险函数。如果数据具有危险性的功能,HŤ),则幸存者功能是

小号 Ť = EXP - 0 Ť H ü d ü

这对应于

小号 Ť = EXP - H Ť

哪里HŤ)是累积风险函数。

Burr分布存活函数

计算并绘制带有参数的毛刺分布的幸存者函数503,1

X = 0:0.1:200;图()情节(X,1-CDF(“毛刺”中,x,50,3,1))xlabel(“故障时间”);ylabel(“生存概率”);

数据幸存者函数

这个例子显示了如何估算数据幸存者功能。

加载示例数据。

加载readmissiontimes

列向量ReadmissionTime显示了100名患者重新接纳倍。列向量截尾有每个患者的审查信息,其中1表示审查数据,0表示观察到的确切再入院时间。这些数据是模拟的。

[ReadmissionTime截尾]
ANS =100×25 1 3 1 19 0 17 0 9 0 16 0 4 0 2 0 3 0 15 0⋮

前两个再入院时间,3,都受到审查。

显示经验幸存函数与审查使用ecdf使用名称-值对参数“功能”,“幸存者”“审查”,审查

ecdf (ReadmissionTime“截尾”审查,“函数”'幸存者'

危害功能

风险函数给出了空调的事实,个别幸存下来,直到给定的时间内个别的瞬时故障率。那是,

H Ť = LIM Δ Ť 0 P Ť Ť < Ť + Δ Ť | Ť Ť Δ Ť

其中ΔŤ是一个很小的时间间隔。的危险率,因此,有时也被称为条件故障率。风险函数始终为正值。但是,这些值不符合概率和可能大于1。

风险函数有关的概率密度函数,FŤ)、累积分布函数、FŤ),以及幸存者功能,小号Ť),如下:

H Ť = F Ť 小号 Ť = F Ť 1 - F Ť

这也相当于

H Ť = - d d Ť ln 小号 Ť

所以,如果你知道生存函数的形状,你也可以推导出相应的危险函数。

毛刺分布危害函数

计算并绘制一个带参数的毛刺分布的风险函数503,1

x = 0:1:200;Burrhazard = pdf (“毛刺”中,x,50,3,1)./(1-CDF(“毛刺”中,x,50,3,1));图()情节(X,Burrhazard)xlabel(“故障时间”);ylabel(的故障率);

韦伯风险函数

有不同类型的风险函数。上图显示的情况时,争取早日时段的风险率上升,然后逐渐下降。风险率也可能是单调递减,增加,或随时间保持恒定。不同类型的风险函数数据从不同的威布尔分布来的如下图所示的例子。

图AX1 =副区(3,1,1);X1 = 0:0.05:10;hazard1 = PDF(“wbl”,x1,3,0.6)./(1-CDF(“wbl”,x1,3,0.6));图(X1,hazard1,'颜色''B')设置(AX1,'Ylim'0.6 [0]);传奇(ax₁'A = 3,B = 0.6');AX2 =副区(3,1,2);X2 = 0:0.05:10;hazard2 = PDF(“wbl”4)。/ (x2, 9日1-cdf (“wbl”4) x2, 9日);情节(x2, hazard2,'颜色''R')设置(AX2,'Ylim'0.6 [0]);传说(AX2,'A = 9,B = 4'“位置”“东南”);ax3 =情节(3、1,3);x3 = 0:0.05:10;hazard3 = pdf (“wbl”,x3,2.5,1)./(1-CDF(“wbl”x3, 2.5, 1));情节(x3, hazard3'颜色''G')设置(AX3,'Ylim'0.6 [0]);传说(AX3,'一个= 2.5,B = 1');

在第三种情况下,威布尔分布的形状参数值为1,其对应于所述指数分布。指数分布总是随着时间恒定的危险率。

参考

[1]考克斯,D.R。,和D.奥克斯。生存数据分析。伦敦:查普曼和霍尔出版社,1984年。

[2] Lawless, j.f。统计模型和寿命数据的方法。新泽西州霍博肯:威利国际科学出版社,2002年。

dr . bb0 Kleinbaum和M. Klein。生存分析。生物和健康统计。第二版。施普林格,2005年。

也可以看看

||

相关的例子

更多关于