zl程序教程

您现在的位置是:首页 >  后端

当前栏目

Python代码库之gbk与utf8正确转换并提取关键内容(含demo源码)

Python转换源码代码 内容 正确 Demo 提取
2023-09-11 14:18:32 时间

格式转换问题是处理文件的难点之一,下面我们来介绍一个最优解决方案

关键代码

  • 无论什么格式都先读取进来
f=open(filename,"rb")
  • 解码gbk
d=c.decode('gbk',errors="ignore")

完成demo源码

filename="1116.html"
#读取文件
f=open(filename,"rb")
c=f.read()

# 格式转码
d=c.decode('gbk',errors="ignore")

#解析
import re 
def getSearch(mstr,d):
    v=''
    m=re.search(mstr,d,re.I)
    if m:v=m.group(1)
    return v

#d="<li >拼 音:bìng</li>"

mstr=r"拼 音:(.*?)<"
pinyin=getSearch(mstr,d).strip()

更多精彩代码请关注我的专栏

关键词

程序员 方向 云计算 前途 微信 毕设 学霸 能量