我正在尝试从pdf文件中获取特定文本或行的字体大小或格式(粗体等),但到目前为止没有任何成功。
像下面那样使用PDFTextStripper只会得到纯文本
PDFTextStripper stripper =新的PDFTextStripper();
字符串actualText = stripper.getText(actualDoc);
您能帮我吗?
谢谢。
最佳答案
您需要扩展PDFTextStripper
并覆盖PDFTextStripper#processTextPosition
。通过此方法,您可以访问保存字体属性的TextPosition
对象。
然后,您需要收集位于指定框(您的行)中的所有TextPosition,并将它们放在一起。