zl程序教程

您现在的位置是:首页 >  后端

当前栏目

MIMIC-III 数据集处理 | OverflowError: Overflow in int64 addition 解决方法

方法数据 处理 解决 in III overflow
2023-09-27 14:19:44 时间

MIMIC-III 数据集处理,遇到问题如下:

在这里插入图片描述

由入院时间减去出生时间计算入院时年龄,遇到报错:OverflowError: Overflow in int64 addition。查看了一下本地的 pandas 版本为 1.3.5 ,如下所示:

Github Issues 有好心人回答了一些解决方法,主要包括降低 pandas 版本为 0.23.4 或 0.20.3(但 pandas 是很多库的依赖,这可能导致与其他依赖库发生冲突,一般不要轻易改变它的版本)。所以最好是改写一下代码:

df1_2['ADMITTIME'] = pd.to_datetime(df1_2['ADMITTIME']).dt.date
df1_2['DOB'] = pd.to_datetime(df1_2['DOB']).dt.date
df1_2["AGE"] = df1_2.apply(lambda e: (e['ADMITTIME'] - e['DOB']).days / 365, axis=1)

结果如下:

在这里插入图片描述


Reference:

  • Github Issues:https://github.com/YerevaNN/mimic3-benchmarks/issues/84