如何用Python合并多个pdf 的文件夹
2023-03-20 14:46:11 时间
当我们下载了需要学习的资料时,发现每篇都是一个独立的章节用起来很不方便,这时候我们可以用Python把它们合并,接下来就一起看看操作方法吧。
一、文件图
二、合并效果
三、python代码
<p style="line-height: 1.75em"><span># -*- coding:utf-8*- import sys reload(sys) sys.setdefaultencoding('utf-8') import os import os.path from pyPdf import PdfFileReader,PdfFileWriter import time time1=time.time() # 使用os模块walk函数,搜索出某目录下的全部pdf文件 ######################获取同一个文件夹下的所有PDF文件名####################### def getFileName(filepath): file_list = [] for root,dirs,files in os.walk(filepath): for filespath in files: # print(os.path.join(root,filespath)) file_list.append(os.path.join(root,filespath)) return file_list ##########################合并同一个文件夹下所有PDF文件######################## def MergePDF(filepath,outfile): output=PdfFileWriter() outputPages=0 pdf_fileName=getFileName(filepath) for each in pdf_fileName: print each # 读取源pdf文件 input = PdfFileReader(file(each, "rb")) # 如果pdf文件已经加密,必须首先解密才能使用pyPdf if input.isEncrypted == True: input.decrypt("map") # 获得源pdf文件中页面总数 pageCount = input.getNumPages() outputPages += pageCount print pageCount # 分别将page添加到输出output中 for iPage in range(0, pageCount): output.addPage(input.getPage(iPage)) print "All Pages Number:"+str(outputPages) # 最后写pdf文件 outputStream=file(filepath+outfile,"wb") output.write(outputStream) outputStream.close() print "finished" if __name__ == '__main__': file_dir = r'D:/course/' out=u"第一周.pdf" MergePDF(file_dir,out) time2 = time.time() print u'总共耗时:' + str(time2 - time1) + 's'<br /></span></p>
<p style="line-height: 1.75em"><span>"D:Program FilesPython27python.exe" D:/PycharmProjects/learn2017/合并多个PDF文件.py D:/course/C1W1L01 Welcome.pdf 3 D:/course/C1W1L02 WhatIsNN.pdf 4 D:/course/C1W1L03 SupLearnWithNN.pdf 4 D:/course/C1W1L04 WhyIsDLTakingOff.pdf 3 D:/course/C1W1L05 AboutThisCourse.pdf 3 D:/course/C1W1L06 CourseResources.pdf 3 All Pages Number:20 finished 总共耗时:0.128000020981s Process finished with exit code 0<br /></span></p>
合并好的pdf是不是方便查阅了呢~更多Python学习推荐:PyThon学习网教学中心。
相关文章
- 大数据全栈式开发语言 – Python
- 十大妙招可大大节省Python开发者的时间
- Web 开发员 vs 数据科学家:谁将统治 Python?
- 数据分析师必知必会的7款Python工具
- 数据科学家都应会使用的7款Python工具
- 5种使用Python代码轻松实现数据可视化的方法
- 基于 Python 和 Scikit-Learn 的机器学习介绍
- 不踩坑的Python爬虫:如何在一个月内学会爬取大规模数据
- 3月编程排行榜:Python第四,R第20
- 推荐用于Web开发的最好 Python 框架
- Python数据预处理:使用Dask和Numba并行化加速
- Python拉勾网数据采集与可视化
- 整理汇总Python框架、库以及软件资源
- 主流脚本编程语言大比拼 优缺点一目了然
- 基于Python实现的微信好友数据分析
- 这几种语言最合适数据分析
- Python 装饰器学习以及实际使用场景实践
- 用Python研究了三千套房子,告诉你究竟是什么抬高了房价?
- 从0到1:Python爬虫知识点梳理
- 使用Python+机器学习方法进行情感分析(详细步骤)