我正在尝试从pdf文件中获取特定文本或行的字体大小或格式(粗体等),但到目前为止没有任何成功。

像下面那样使用PDFTextStripper只会得到纯文本


  PDFTextStripper stripper =新的PDFTextStripper();
  字符串actualText = stripper.getText(actualDoc);


您能帮我吗?
谢谢。

最佳答案

您需要扩展PDFTextStripper并覆盖PDFTextStripper#processTextPosition。通过此方法,您可以访问保存字体属性的TextPosition对象。
然后,您需要收集位于指定框(您的行)中的所有TextPosition,并将它们放在一起。

09-25 23:47