python re.findall()正则表达式抽取两个词之间的内容,re.split()批量拆分文本
2023-09-27 14:20:36 时间
抽取场景:批量抽取初步诊断后面的诊断内容,
text = """
确定诊断 : 初步诊断:
1.糖尿病酮症酸中毒
2.2型糖尿病
3.左侧肾上腺占位性质待查
4。双肾结实
医师:XXX
2022年xx月xx日 """
代码:
import re
def PRE_DIAG_NAME(content):
'''获取初步诊断名称'''
data = re.findall('初步诊断[::]([\s\S]*?)医师', content)
if not data:
data = re.findall('初步诊断[::]([\s\S]*?) ', content)
pattern = re.compile('\d+[,,。.、;; ]|\s')
if data:
data_list = pattern.split(data[0])
res_list = [i for i in data_list if i]
if res_list:
return res_list
else:
return []
text = """
确定诊断 : 初步诊断:
1.糖尿病酮症酸中毒
2.2型糖尿病
3.左侧肾上腺占位性质待查
4。双肾结实
医师:XXX
2022年xx月xx日 """
res = PRE_DIAG_NAME(text)
print(res)
结果:
相关文章
- 利用Python批量识别电子账单数据
- 【Python 百练成钢】DNA、蛇形矩阵、Huffuman树、K-进制数、K倍区间、交换瓶子、第几个幸运数、四平方和、The 3n + 1 problem、大数乘法
- python画动图制作GIF教程(Spyder+ScreenToGif)
- [ Python - 10 ] 练习:批量管理主机工具
- python re正则表达式提取含有某些关键词的句子,findall()查找含有关键词的句子
- ubuntu 20.04系统下安装python开发环境配置
- 11月4日科技资讯|罗永浩回应被列老赖;三星解散自研 CPU 团队;Python 采用 12 个月的发布周期 | 极客头条
- Python自动化办公:提取 PDF 指定内容,并批量重命名文件
- Python 批量处理图像尺寸
- pip --upgrade批量更新过期的python库
- python入门之后须掌握的知识点(excel文件处理+邮件发送+实战:批量化发工资条)【二】
- python之对指定目录文件夹的批量重命名
- Python pandas.DataFrame.applymap函数方法的使用
- python下线程以及锁
- python 批量替换文本内容
- 爱剪辑加字幕之经验及Python程序批量加字幕
- Maya Python弹出模态对话框
- Maya批量导入fbx python脚本
- python--物理引擎pymunk
- python批量重置图片格式-批量重置图片大小-压缩图片
- python使用pymongo操作mongo的完整步骤
- python 实现腾讯企业邮箱发送邮件