zl程序教程

您现在的位置是:首页 >  其他

当前栏目

多指标联合诊断的ROC曲线

2023-03-07 09:12:33 时间

关于ROC曲线,前前后后写了很多篇推文,关于二分类数据和生存资料的都有,目前只有多指标联合诊断的ROC曲线还没介绍了,今天就介绍多指标联合诊断的ROC曲线

准备数据

library(pROC)

data(aSAH)
str(aSAH)
## 'data.frame': 113 obs. of  7 variables:
##  $ gos6   : Ord.factor w/ 5 levels "1"<"2"<"3"<"4"<..: 5 5 5 5 1 1 4 1 5 4 ...
##  $ outcome: Factor w/ 2 levels "Good","Poor": 1 1 1 1 2 2 1 2 1 1 ...
##  $ gender : Factor w/ 2 levels "Male","Female": 2 2 2 2 2 1 1 1 2 2 ...
##  $ age    : int  42 37 42 27 42 48 57 41 49 75 ...
##  $ wfns   : Ord.factor w/ 5 levels "1"<"2"<"3"<"4"<..: 1 1 1 1 3 2 5 4 1 2 ...
##  $ s100b  : num  0.13 0.14 0.1 0.04 0.13 0.1 0.47 0.16 0.18 0.1 ...
##  $ ndka   : num  3.01 8.54 8.09 10.42 17.4 ...

其中outcome是结果变量,是二分类的,其余列是预测变量。

多指标联合诊断的ROC

假如现在我想使用s100b/ndka/age这3个变量来预测结果,该如何画出这3个变量联合诊断的ROC曲线呢?

首先,使用这3个变量建立逻辑回归:

f <- glm(outcome ~ s100b + ndka + age, data = aSAH, family = binomial())

然后,计算逻辑回归给出的概率:

# 等价于直接使用 f$fitted
pred <- predict(f, newdata = aSAH, type = "response")

aSAH$pred <- pred

用这个pred就可以画ROC曲线了,这个就是多指标联合诊断的ROC曲线。

library(yardstick)

roc_curve(aSAH, truth = outcome, estimate=pred,event_level = "second") |> 
  autoplot()

测试集怎么办?

很简单,只要把predict中的数据集换成测试集即可:

# 换成测试集即可
pred <- predict(f, newdata = 你的测试集, type = "response")

剩下的就都一样了!