SPSSPRO,让数据分析更简单,问卷调查类数据分析不再愁 产品介绍 帮助中心 客户端
微信登录
  • 产品简介

  • 我的数据

  • 数据处理

  • 数据分析

    • 描述性分析

    • 问卷分析

    • 综合评价

    • 差异性分析

    • 相关性分析

    • 预测模型

    • 统计建模

    • 计量经济模型

    • 医学统计模型

      • 比例风险回归(COX回归)
      • Kaplan-Meier生存曲线
        • 1、作用
        • 2、输入输出描述
        • 3、案例示例
        • 4、案例数据
        • 5、案例操作
        • 6、输出结果分析
        • 7、注意事项
        • 8、模型理论
        • 9、参考文献
      • Ridit分析
      • 卡方检验(自动选取最优求解器)
      • Pearson卡方检验
      • Yates校正卡方检验
      • Fisher精确检验
      • 分层卡方分析
      • 配对卡方检验
      • 重复测量方差
      • 条件逻辑回归
      • Bland-Altman法
      • 竞争风险模型
      • 概率单位回归(剂量分析)
      • 寿命表
    • 机器学习分类

    • 机器学习回归

    • 规划求解

    • 研究模型

    • 信号分析

    • 自定义算法

Kaplan-Meier生存曲线

操作视频
SPSSPRO教程-Kaplan-Meier生存曲线

# 1、作用

Kaplan-Meier 曲线又称生存曲线,是一种生存分析的常用方法,主要分析单一因素对生存期的影响。

# 2、输入输出描述

输入:时间变量,状态变量,待分析自变量 X。
输出:单一因素对生存期的影响情况。

# 3、案例示例

案例:医院需要研究一种新药的疗效情况,使用 Kaplan-Meier 曲线得到是否使用新药对患者总生存时间的影响。

# 4、案例数据


Kaplan-Meier 生存曲线案例数据

# 5、案例操作


Step1:新建分析;
Step2:上传数据;
Step3:选择对应数据打开后进行预览,确认无误后点击开始分析;

step4:选择【Kaplan-Meier 生存曲线】;
step5:查看对应的数据数据格式,拖入对应的选项;
step6:点击【开始分析】,完成全部操作。

# 6、输出结果分析

输出结果 1:模型数据摘要

图表说明:
上表展示了样本的事件数(状态=1)/删失数(状态=0)以及事件数占比的情况。

输出结果 2:生存情况的均值和中位数

是否使用 均值 中位数
估计 标准误 95%置信区间 估计 标准误 95%置信区间
下限 上限 下限 上限
不使用 25.706 2.257 21.282 30.13 26 1.531 19 29
使用 56.628 0.954 54.758 58.498 58 1.02 56 60
整体 50.134 1.331 47.526 52.742 56 1.02 53 58

图表说明:
上表展示了各项均值和中位数的估计值和标准误差以及其 95%的置信区间,一般以中位数为准。
分析:
使用新药的中位生存时间是 58 周,而不使用新药是 26 周。可以认为新药的使用明显带来好处,使得生存时间有较大延长。

输出结果 3:生存状态差异检验

图表说明:
上表展示了三种卡方检验方法的结果,用以检验生存函数在两组样本上是否存在 统计学差异(一般判断标准为 P 值小于 0.05):
Log-Rank 检验,每个时点有相同的权重,对后期的差异更为敏感,最为常用。
Breslow 检验,各时间点的观察例数为权重,例数越多权重越高,对前期的差异更为敏感。
Tarone-Ware 检验,结合以上两种方法,适合生存曲线有交叉的情况使用。
分析:
三种方法的 P 值均小于 0.05,可以认为水平呈现显著性,拒绝原假设,因此认为这两组的生存率存在差异(原假设为生存率无差异)。

输出结果 4:Kaplan-Meier 曲线

图表说明:
上图展示了 Kaplan-Meier 曲线,横轴为时间,纵轴为生存率,该曲线展示了随着时间变化生存率的变化情况。
分析:
从图可见使用新药相比未使用新药,能明显增加生存率。

# 7、注意事项

  • 状态变量只能是二分类 0、1 变量,并且 1 代表是事件发生(如死亡/阳性等);
  • Kaplan-Meier 生存曲线在于研究某 1 个因素对于 Y 的影响,COX 回归研究多个因素对于 Y 的影响。

# 8、模型理论

Kaplan-Meier 算法(K-M 法)是由英国科学家 Kaplan 和 Meier 于 1958 年提出的,是利用概率乘法定理计算生存率,故又称乘积限法(Product-Limit Method,P-L 法),Kaplan-Meier 过程适用于小样本或大样本未分组资料生存率的 Kaplan-Meier 分析,生存率和组间生存率比较。
(1)Kaplan-Meier 生存曲线的画法:
1.在每个发生死亡事件的时间点上,进行生存率的计算
2.在每个发生删失的时间点上,画小竖线标记删失样本
3.根据观察/对照条件分组作图
(2)生存率的点估计
设 ni-1,ni,di 和 ci 分别表示活过时间 ti-1 且未在 ti-1 截尾的对象处、期初例数、死亡数和截尾数,则时间 ti 处的生存率估计为:

(3)生存率的区间估计
Greenwood 生存率标准误差的近似计算公式为:

假定生存率近似服从正态分布,则总体生存率的(1-α)置信区间为:

(4)生存率的组间比较
Log rank 检验是生存率比较的非参数方法之一,其基本思想是当 H0 成立时,根据 ti 时点的死亡率,可以计算出各组的理论死亡数,则统计量的计算公式为:

其中,Vg 为第 g 组理论数 Tg 的方差估计。
对 Log rank 检验,wi=1,当比较的两总体生存曲线成比例时,检验效能最大;
wi=ni,则对应 Breslow 检验或 Wilcoxon 检验,该检验给实际死亡率与理论死亡数的早期差别最大的权重。
而在 Tarone-Ware 检验中,wi=√ni,其中 ni 表示时间 ti 处所对应的期初例数。近似服从自由度为(组数-1)的分布。由于该检验能对各组的生存率做整体比较,因此实际工作中应用较多。

# 9、参考文献

[1] Scientific Platform Serving for Statistics Professional 2021. SPSSPRO. (Version 1.0.11)[Online Application Software]. Retrieved from https://www.spsspro.com.
[2]金春林,王锦福,郑树忠.生存分析 Kaplan—meier 法简介[J].卫生软科学,1994(06):30-34.

建议反馈