我正在使用PDFBox,已成功从PDF检索字段坐标。转到多页PDF,我遇到了一种情况,我需要确定这些字段来自哪个页面,另外还要将坐标从下向上转换为自上而下。我已经阅读了文档的许多页面,以找到一种可以工作的方法,大多数方法返回null或失败,并且在搜索时没有结果。

我在找什么文件大纲? BBbos? mediaBox? cropBox?

对于页码,其他一些库也具有诸如getCurrentPageNo()这样简单标题的方法。我需要:

List allPages = document.getDocumentCatalog().getAllPages();
  for (int i = 0; i < allPages.size(); i++) {
  // etc for each one?
}


这是一种核心能力,令我有些惊讶的是我还没有找到一个例子。

最佳答案

得到它了:

PDPage page = .........
PDRectangle mediaBox = page.getMediaBox();
System.out.println( "Width:" + mediaBox.getWidth() );
System.out.println( "Height:" + mediaBox.getHeight() )


用于页码:

page.getCOSDictionary().equals(page))

10-06 01:49