我们来看看通过java怎么把pdf文件转成word文件。
一、首先,新建一个项目,然后添加下面的依赖
<dependency> <groupId>org.apache.pdfbox</groupId> <artifactId>pdfbox</artifactId> <version>2.0.12</version> </dependency>
二、新建一个测试类,然后添加一个测试方法。
@Test public void testPdfToWord(){ try { String pdfFile = "D:/test.pdf"; PDDocument doc = PDDocument.load(new File(pdfFile)); int pagenumber = doc.getNumberOfPages(); pdfFile = pdfFile.substring(0, pdfFile.lastIndexOf(".")); String fileName = pdfFile + ".doc"; File file = new File(fileName); if (!file.exists()) { file.createNewFile(); } FileOutputStream fos = new FileOutputStream(fileName); Writer writer = new OutputStreamWriter(fos, "UTF-8"); PDFTextStripper stripper = new PDFTextStripper(); stripper.setSortByPosition(true);// 排序 stripper.setStartPage(1);// 设置转换的开始页 stripper.setEndPage(pagenumber);// 设置转换的结束页 stripper.writeText(doc, writer); writer.close(); doc.close(); System.out.println("pdf转换word成功!"); } catch (IOException e) { e.printStackTrace(); } }
三、运行这个测试方法,提示转换成功。
四、查看文件,pdf成功转换成了word文件。
0条评论
点击登录参与评论