Python代码库之gbk与utf8正确转换并提取关键内容(含demo源码)
2023-09-11 14:18:32 时间
格式转换问题是处理文件的难点之一,下面我们来介绍一个最优解决方案
关键代码
- 无论什么格式都先读取进来
f=open(filename,"rb")
- 解码gbk
d=c.decode('gbk',errors="ignore")
完成demo源码
filename="1116.html"
#读取文件
f=open(filename,"rb")
c=f.read()
# 格式转码
d=c.decode('gbk',errors="ignore")
#解析
import re
def getSearch(mstr,d):
v=''
m=re.search(mstr,d,re.I)
if m:v=m.group(1)
return v
#d="<li >拼 音:bìng</li>"
mstr=r"拼 音:(.*?)<"
pinyin=getSearch(mstr,d).strip()
更多精彩代码请关注我的专栏
关键词
程序员 方向 云计算 前途 微信 毕设 学霸 能量
相关文章
- Python脚本写端口扫描器(socket,python-nmap)
- python是否存在某个字符串 效率最高_Python中判断子串存在的性能比较及分析总结...
- Python 16进制与字符串的转换、二进制 to 十进制、十六进制 to 十进制、十进制 to 二进制
- python将json字典转换为对象格式
- python强大之处在哪里?为什么那么多人喜欢Python?
- 每天一个python小知识——如何在Python 3中转换数据类型
- 他们说千万别再学Python了?Python没用了?马上就要被淘汰啦?真的吗?
- Python中python-nmap模块的使用
- 源码编译vi过程中进行配置时报“checking if compile and link flags for Python are sane... no: PYTHON DISABLED”怎么办?
- 【Python】操作txt文件
- python之模块colorsys颜色转换模块 暂不了解
- python数字图像处理(11):图像自动阈值分割
- 使用numba加速python程序
- python Unicode
- python如何实现事务机制
- Python 数据分析教程之如何验证线性回归的假设,线性回归的假设是什么?以及如何用python验证它们?
- Python 代码库之unicode 编码与字符串之间相互转换
- Python学习---Django的新工程设置模板
- 【Python基础】我的第一个 python 程序
- Python绘制RTKLIB的POS文件中的XYZ误差曲线及计算RMSE
- Python 基础 之 python 进程知识点整理,实现一个简单使用进程池的多进程文件夹文件copy器
- python爬取URL动态生成的table表格并保存到文件
- python:关于py文件之间相互import的问题
- [Python]2分钟完成python + Selenium Web端自动化环境搭建,开启~~~
- python 中json和字符串互相转换
- Python爬虫伪装
- 用Python求偶数和