生存分析最佳截断值的确定
发布网友
发布时间:2024-09-15 01:38
我来回答
共1个回答
热心网友
时间:2024-10-12 03:49
在生存分析中,连续型变量的最佳截断值选择是一个热点问题。即便通过单因素或多因素分析得到结果,K-M生存分析时P值可能仍不显著(P>0.05)。这时,需要重新寻找最佳截断值,以确保K-M生存分析有意义。
目前,常见的方法包括:
这两种方法都很便捷。X-tile软件基于穷举法,可在以下网址免费下载:medicine.yale.edu/lab/r...,当前版本为3.6.1。虽然软件很久没有更新,但功能已很完备。虽然我不常用这个软件,但网上有许多教程可供参考。
surv_cutpoint()函数的用法我在之前的推文中已有详细介绍。
surv_cutpoint()和X-tile软件都能计算连续型变量的最佳截断值,通过这个值将数据划分为两组。对这两组进行K-M生存分析,得到的P值最小。
然而,这两种方法也略有不同:
以myeloma数据为例进行演示。
首先使用surv_cutpoint()函数寻找最佳截断值:
查看根据最佳切点分组后的数据分布情况:
接着使用surv_categorize()函数根据最佳截断值对数据进行分组,数据将根据最佳截断值分为高表达/低表达组。
根据最佳切点绘制生存曲线:
将myeloma数据存为TXT格式,重新计算X-tile软件的结果。
点点点即可:
对于DEPDC1变量,X-tile软件得到的结果也是279.8。
可以看到,两种方法得到的生存曲线基本一致。虽然有些数据两种方法得到的结果可能不完全一样,但相差不会很大,因此这两种方法的结果基本一致。
关于survivalROC包,它也是寻找最佳截断值,但使用场景与前两种方法不同。它需要指定一个时间点,寻找的最佳截断值是使得ROC曲线下面积最大的值。
这个方法实际上是寻找ROC曲线的最佳截点,与上述两种方法的概念不同。
关于survivalROC包的使用,我在之前的推文中已有介绍。