我想获取带标签的PDF中标签的页码。

我已经尝试过下面的代码,但不确定。

for(Object coDic: structElement.getKids()) {
   int page=((PDStructureElement) coDic).getCOSObject().getCOSDictionary(COSName.PG).getInt(COSName.STRUCT_PARENTS);
}

最佳答案

structParents是完全不同的东西(请参见PDF specification)。做这个:

PDPage page = new PDPage(((PDStructureElement) coDic).getCOSObject().getCOSDictionary(COSName.PG));
int pageNum = doc.getPages().indexOf(page);


或更好:

PDPage page = ((PDStructureElement) coDic).getPage();
int pageNum = doc.getPages().indexOf(page);


(省略了空检查和类检查)

关于java - 如何在加标签的pdf中获取标签的页码,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/60371287/

10-10 10:41