2021-12-22 10:51

Java实现PDF转Word

wanmatea

JavaEE

(1302)

(0)

收藏

我们来看看通过java怎么把pdf文件转成word文件。

一、首先,新建一个项目,然后添加下面的依赖

<dependency>
    <groupId>org.apache.pdfbox</groupId>
    <artifactId>pdfbox</artifactId>
    <version>2.0.12</version>
</dependency>

二、新建一个测试类,然后添加一个测试方法。

@Test
public void testPdfToWord(){
    try {
        String pdfFile = "D:/test.pdf";
        PDDocument doc = PDDocument.load(new File(pdfFile));
        int pagenumber = doc.getNumberOfPages();
        pdfFile = pdfFile.substring(0, pdfFile.lastIndexOf("."));
        String fileName = pdfFile + ".doc";
        File file = new File(fileName);
        if (!file.exists()) {
            file.createNewFile();
        }
        FileOutputStream fos = new FileOutputStream(fileName);
        Writer writer = new OutputStreamWriter(fos, "UTF-8");
        PDFTextStripper stripper = new PDFTextStripper();
        stripper.setSortByPosition(true);// 排序
        stripper.setStartPage(1);// 设置转换的开始页
        stripper.setEndPage(pagenumber);// 设置转换的结束页
        stripper.writeText(doc, writer);
        writer.close();
        doc.close();
        System.out.println("pdf转换word成功!");
    } catch (IOException e) {
        e.printStackTrace();
    }
}

三、运行这个测试方法,提示转换成功。

image.png

四、查看文件,pdf成功转换成了word文件。

image.png

0条评论

点击登录参与评论