ROC曲线
# 1、作用
ROC 曲线是受试者工作特征曲线,表示一个特定的诊断方法对区别特定的患者组与非患者组样本的检测能力,在其它领域中,用于判断某检验变量是否能够良好地区分某状态变量。
# 2、输入输出描述
输入: 检验变量(正向检验变量与负向检验变量)为至少两项定量,状态变量为一项 0-1 二分类变量。
输出:ROC 曲线,ROC 曲线下面积越大说明检验变量能更好地区分状态变量。
# 3、案例示例
案例:一般来说,年龄越大代谢慢易导致肥胖,运动量少也易导致肥胖,现通过 ROC 曲线研究年龄与运动量是否能够良好地区分肥胖。
# 4、案例数据

# 5、案例操作
Step1:新建分析;
Step2:上传数据;
Step3:选择对应数据打开后进行预览,确认无误后点击开始分析;
step4:选择【ROC 曲线】;
step5:查看对应的数据数据格式,【ROC 曲线】要求特征序列为至少两项二分类 0-1 变量,即多选题变量,其中 1 代表选中,0 代表未选中;
step6:点击【开始分析】,完成全部操作。
# 6、输出结果分析
输出结果 1:ROC 曲线

图表说明:ROC 曲线是以真阳性率(灵敏度)为纵坐标,假阳性率(1-特异度)为横坐标绘制的曲线,其中最靠近左上角的那一点为最佳临界点。我们将可将各检验指标的 ROC 曲线绘制到同一坐标中,以直观地鉴别优劣,靠近左上角的 ROC 曲线所代表的受试者工作最准确,由图可知,也就是运动量来的曲线更靠近左上角,说明一个人的运动量更能区分是否配胖。若是 ROC 曲线较为接近,则可以根据 AUC 值,也就是 ROC 曲线的面积进行判断,可看输出结果 2。
输出结果 2:AUC 评价
图表说明:AUC 是代表 ROC 曲线下面积,AUC 值越大说明检验变量能更好地区分状态变量。
# 7、注意事项
- 正向检验指标是指标 A 越大越容易出现阳性结果(二分类变量=1),负向检验指标是指标 B 越小越出现阳性结果(二分类变量=1)。
# 8、模型理论
ROC 曲线是根据一系列不同的二分类方式(分界值或决定阈),以真阳性率(灵敏度)为纵坐标,假阳性率(1-特异度)为横坐标绘制的曲线。
真阳性率(灵敏度):阳性人群中,检测出阳性的几率。
假阳性率(1-特异度):阴性人群中,检测为阳率的几率。
从 AUC 判断分类器(预测模型)优劣的标准:
- AUC = 1,是完美分类器。
- AUC = [0.85, 0.95], 效果很好
- AUC = [0.7, 0.85], 效果一般
- AUC = [0.5, 0.7],效果较低,但用于预测股票已经很不错了
- AUC = 0.5,跟随机猜测一样(例:丢铜板),模型没有预测价值
- AUC < 0.5,比随机猜测还差;但只要总是反预测而行,就优于随机猜测
# 9、参考文献
[1] Scientific Platform Serving for Statistics Professional 2021. SPSSPRO. (Version 1.0.11)[Online Application Software]. Retrieved from https://www.spsspro.com.