Java 读取PDF文本内容

 时间:2024-10-13 00:43:02

以下示例将介绍如何通过Java编程来读取PDF文档中的文本内容。

工具/原料

Spire.PDF for Java

文件引用

1、首先,在Java程序中新建一个文件夹可命名为Lib。下载控件包后,解压,将解压后的文件夹下的子文件夹造婷用痃lib中的Spire.Pdf.jar和Spire.Common.jar两个文件复制到新建的文件夹下,如下图:

Java 读取PDF文本内容

Java代码示例(供参考)

1、 //创建PdfDocument实例 PdfDocument doc = new PdfDocu罪焐芡拂ment(); //加载PDF文件 doc.loadFromFile("sample.pdf"); //创建StringBuilder实例 StringBuilder sb = new StringBuilder(); PdfPageBase page; //遍历PDF页面,获取每个页面的文本并添加到StringBuilder对象 for(int i= 0;i<doc.getPages().getCount();i++){ page = doc.getPages().get(i); sb.append(page.extractText(true)); } FileWriter writer; try { //将StringBuilder对象中的文本写入到文本文件 writer = new FileWriter("ExtractText.txt"); writer.write(sb.toString()); writer.flush(); } catch (IOException e) { e.printStackTrace(); } doc.close();

2、测试文档:

Java 读取PDF文本内容
  • 如何使用FineReport报表工具实现报表列排名
  • 剑灵55级后怎么弄装备
  • bootstrap-table如何固定高度
  • BarTender打印标签后如何紧接着打一个空白标签
  • 怎样使用VBA对选区文本以字母顺序升序排序?
  • 热门搜索
    炉火纯青是什么意思 报考二建需要什么条件 粉丝是什么意思 男票是什么意思 什么牌子的笔记本好用 ecm是什么意思 什么动物能贴在墙上 虔诚是什么意思 宾至如归的意思 戒指在中指什么意思