我正在使用PDFBox,已成功从PDF检索字段坐标。转到多页PDF,我遇到了一种情况,我需要确定这些字段来自哪个页面,另外还要将坐标从下向上转换为自上而下。我已经阅读了文档的许多页面,以找到一种可以工作的方法,大多数方法返回null或失败,并且在搜索时没有结果。
我在找什么文件大纲? BBbos? mediaBox? cropBox?
对于页码,其他一些库也具有诸如getCurrentPageNo()这样简单标题的方法。我需要:
List allPages = document.getDocumentCatalog().getAllPages();
for (int i = 0; i < allPages.size(); i++) {
// etc for each one?
}
这是一种核心能力,令我有些惊讶的是我还没有找到一个例子。
最佳答案
得到它了:
PDPage page = .........
PDRectangle mediaBox = page.getMediaBox();
System.out.println( "Width:" + mediaBox.getWidth() );
System.out.println( "Height:" + mediaBox.getHeight() )
用于页码:
page.getCOSDictionary().equals(page))