主要内容

什么是生存分析?

介绍

生存分析是发生时间分析,即当感兴趣的结果是事件发生的时间。时间对事件的实例是直到感染,再发产的时间,或在健康科学中恢复,经济学失业的持续时间,直到工程中的电灯泡的机器部分或寿命的失败,等等。生存分析是工程可靠性研究的一部分。在这种情况下,通常用于研究工业部件的寿命。在可靠性分析中,随着感兴趣的变量,生存时间通常被称为故障时间,因为感兴趣的变量是在失败之前函数正常运行的时间。

生存分析包括参数,半甲型和非参数方法。您可以使用这些来估计生存研究中最常用的措施,幸存者和危险功能,将它们与不同的群体进行比较,并评估预测变量与生存时间的关系。一些统计概率分布描述了存活时间。常用的分布是指数级,威布尔,逻辑,毛刺和Birnbaum-Saunders分布。统计和机器学习工具箱™功能ecdf.ksdity.计算CDF,累积危险和幸存者功能的经验和核心密度估计。Coxphfit.适合数据的COX比例危险模型。

审查

存活分析中的一个重要概念是审查。由于不同的原因,某些个体的存活时间可能无法完全观察到。一世n life sciences, this might happen when the survival study (e.g., the clinical trial) stops before the full survival times of all individuals can be observed, or a person drops out of a study, or for long-term studies, when the patient is lost to follow up. In the industrial context, not all components might have failed before the end of the reliability study. In such cases, the individual survives beyond the time of the study, and the exact survival time is unknown. This is called right censoring.

在生存期间,观察个人失败的人T.或者对那些个人停止的观察C。然后观察是min(T.C)和指示变量一世C展示如果个人被审查或不进行。必须调整危险和幸存者功能的计算,以解释审查。统计和机器学习工具箱功能如ecdf.ksdity.Coxphfit., 和m审查审查。

数据

生存数据通常包括在发生感兴趣事件的时间和每个个人或组件的审查信息。下表显示了6个月的研究中个人的虚拟失业时间。两名个人被审查(由审查价值为1)。学习结束后24周后,一个人仍失业。与其他审查的个人联系在21周末丢失。

失业时间(周) 审查
14. 0.
23. 0.
7. 0.
21. 1
19. 0.
16. 0.
24. 1
8. 0.

存活数据还可以包括一定时间的故障数(观察到特定存活或失效时间的次数)。下表显示了仿真时间,直到发光二极管落入其全光输出水平的70%,在加速寿命测试中。

失败时间(HRS) 频率
8600. 6.
15300 19.
22000. 11.
28600 20.
35300 17.
42000. 14.
48700 8.
55400. 2
62100. 0.
68800 2

数据还可能有关于预测变量的信息,以用于半参数回归的方法,例如Cox比例危险回归。

时间直到恢复(周) 审查 性别 收缩压 舒张压血压
12. 1 男性 124. 93.
20. 0. 女性 109. 77.
7. 0. 女性 125. 83.
13. 0. 男性 117. 75.
9. 1 男性 122. 80
15. 0. 女性 121. 70
17. 1 男性 130. 88.
8. 0. 女性 115. 82.
14. 0. 男性 118. 86.

幸存者功能

幸存者功能是作为时间的函数的存活率。它也称为生存函数。它给出了个体的生存时间超过一定价值的概率。自累积分布函数以来,FT.),存活时间小于或等于给定时间点的概率,用于连续分布的生存功能,S.T.),是累积分布函数的补充:

S.T.)= 1 -FT.)。

幸存者功能也与之相关危险功能。如果数据具有危险功能,HT.),然后幸存者函数是

S. T. = exp. - 0. T. H D.

这对应于

S. T. = exp. - H T.

在哪里HT.)是累积危险功能。

毛刺分配幸存者功能

计算和绘制与参数的毛刺分布的幸存功能50.3., 和1

x = 0:0.1:200;图()绘图(x,1-cdf('毛刺',x,50,3,1))xlabel('失败时间');ylabel('生存概率');

图包含轴。轴包含类型线的对象。

来自数据的幸存者函数

此示例显示了如何估算来自数据的幸存者函数。

加载样本数据。

加载Readmission it.

栏矢量ReadmissionTime.显示100名患者的阅约度。栏矢量审查是否具有每个患者的审查信息,其中1表示缩短的数据,并且0表示观察到精确的读取时间。模拟此数据。

[ReadmissionTime C屏]
ans =.100×25 1 3 1 19 0 17 0 9 0 16 0 4 0 2 0 3 0 15 0⋮

前两次阅读时间,5.3.,都被审查了。

使用审查使用审查经验幸存者功能ecdf.使用名称值对参数'功能','survivor'“审查”,审查

ecdf(ReadmissionTime,'审查',审查,'功能''幸存者'

图包含轴。轴包含楼梯类型的对象。

危险功能

危险功能给出了个体条件的瞬时失效率,即个体在给定时间才能存在。那是,

H T. = δ. T. 0. P. T. ≤. T. < T. + δ. T. | T. T. δ. T.

其中δ.T.是一个非常小的时间间隔。因此,危险率有时被称为条件失败率。危险功能总是占据正值。但是,这些值与概率不相对应,并且可能大于1。

危险功能与概率密度函数有关,FT.), 累积分布函数,FT.)和幸存者功能,S.T.), 如下:

H T. = F T. S. T. = F T. 1 - F T.

这也是等同于

H T. = - D. D. T. LN. S. T.

因此,如果您知道生存函数的形状,您还可以派生相应的危险功能。

毛刺分布危险功能

计算和绘制与参数的毛刺分布的危险功能50.3., 和1

x = 0:1:200;Burrhazard = PDF('毛刺',x,50,3,1)./(1-CDF('毛刺',x,50,3,1));图()绘图(x,burrhazard)xlabel('失败时间');ylabel('危险率');

图包含轴。轴包含类型线的对象。

威布尔危险功能

有不同类型的危险功能。前图显示了危险率为早期时间段增加的情况,然后逐渐减少。随着时间的推移,危险率也可能单调地减小,增加或恒定。下图显示了来自不同Weibull分布的数据的不同类型的危险功能的示例。

图AX1 =子图(3,1,1);X1 = 0:0.05:10;Hazard1 = PDF('WBL',x1,3,0.6)./(1-CDF('WBL',x1,3,0.6));绘图(X1,Hazard1,'颜色''B')设置(AX1,'ylim',[0 0.6]);传奇(AX1,'a = 3,b = 0.6');AX2 =子图(3,1,2);X2 = 0:0.05:10;Hazard2 = PDF('WBL',x2,9,4)./(1-CDF('WBL',x2,9,4));绘图(X2,Hazard2,'颜色''r')设置(AX2,'ylim',[0 0.6]);传奇(AX2,'a = 9,b = 4''地点''东南');AX3 =子图(3,1,3);X3 = 0:0.05:10;Hazard3 = PDF('WBL',x3,2.5,1)./(1-CDF('WBL',x3,2.5,1));绘图(X3,Hazard3,'颜色''G')设置(AX3,'ylim',[0 0.6]);传奇(AX3,'a = 2.5,b = 1');

图包含3个轴。轴1包含类型线的对象。该对象表示a = 3,b = 0.6。轴2包含类型线的对象。该对象表示a = 9,b = 4。轴3包含类型线的对象。该对象表示a = 2.5,b = 1。

在第三种情况下,威布尔分布具有形状参数值1,这对应于指数分布。随着时间的推移,指数分布始终具有恒定的危险率。

参考

[1] Cox,D. R.和D. oakes。存活数据分析。伦敦:1984年Chapman&Hall。

[2]律,J.F。终身数据的统计模型和方法。Hoboken,NJ:Wiley-Interscience,2002。

[3] Kleinbaum,D。G.和M. Klein。生存分析。生物学与健康的统计数据。第2版​​。Springer,2005年。

也可以看看

||

相关例子

更多关于