使用python把pdf转化成word
2023-03-07 09:13:11 时间
1、引入pdf2docx
注意管理员模式安装
pip install pdf2docx
2、主体代码
直接复制使用,将需要转化的文件和py放在同一个文件夹下,直接运行即可。
import os
from pdf2docx import Converter
def pdf_docx():
# 获取当前工作目录
file_path = os.getcwd()
# 获取所有文件
files = os.listdir(file_path)
# 遍历所有文件
for file in files:
# 过滤临时文件
if '~$' in file:
continue
# 过滤非pdf格式文件
if file.split('.')[-1] != 'pdf':
continue
# 获取文件名称
file_name = file.split('.')[0]
# pdf文件名称
pdf_name = os.getcwd() + '\\' + file
# docx文件名称
docx_name = os.getcwd() + '\\' + file_name + '.docx'
# 加载pdf文档
cv = Converter(pdf_name)
# cv.convert(docx_name, start=0, end=12)
cv.convert(docx_name)
cv.close()
if __name__ == '__main__':
pdf_docx()
相关文章
- 图像处理工具Python扩展库,你了解吗?
- 十个常用的损失函数解释以及Python代码实现
- 30 个数据科学工作中必备的 Python 包
- 如何在 Windows 上安装 Python
- 几行 Python 代码就可以提取数百个时间序列特征
- 使用Python快速搭建接口自动化测试脚本实战总结
- 哪种编程语言最适合开发网页抓取工具?
- 不要在 Python 中使用循环,这些方法其实更棒!
- 震惊!用Python探索《红楼梦》的人物关系!
- 如何最简单、通俗地理解Python模块?
- 酷炫,Python实现交通数据可视化!
- 为什么急于寻找Python的替代者?
- 30 个数据工程必备的Python 包
- 去字节面试被面这题能答上来吗?谈谈你对时间轮的理解?
- 火山引擎在行为分析场景下的 ClickHouse JOIN 优化
- 用Python爬取了某宝1166家月饼数据进行可视化分析,终于找到最好吃的月饼~
- 在 Linux 上试试这个基于 Python 的文件管理器
- Python列表解析式到底该怎么用?
- 如何快速把你的 Python 代码变为 API
- 十个Python初学者常犯的错误