PDF文件转word
安装pdf2docx模块
pip install pdf2docx
代码
from pdf2docx import Converter #导入pdf2docx包的Converter类 def pdf2word(file_path): doc_file = "c:/test/test.docx" #word文档的文件路径和文件名 conveter = Converter(file_path) #创建Converter对象 打开pdf文件 conveter.convert(doc_file) #转换pdf文件 conveter.close() pdf2word("c:/test/2.pdf")
PDF文件转图片
安装pymupdf模块
pip install pymupdf==1.18
代码
import fitz #pip install pymupdf==1.18 doc = fitz.open("c:/test/1.pdf") #打开pdf文件 生成doc对象 #doc.pageCount pdf文件的总页数 #range(doc.pageCount) 根据pdf文件的总页数 生成序列 for pg in range(doc.pageCount): page = doc[pg] #pg页码 从pdf文件中间取一页 trans = fitz.Matrix(2,2).preRotate(0) #2,2分别是x和y方向的缩放 pm = page.getPixmap(matrix=trans,alpha=False) #从pdf取出的一页 生成一张图片 pm.writePNG(f"c:/test/{pg}.png") #生成的图片 保存成为文件
安装1.18版
0条评论
点击登录参与评论