我想获取带标签的PDF中标签的页码。
我已经尝试过下面的代码,但不确定。
for(Object coDic: structElement.getKids()) {
int page=((PDStructureElement) coDic).getCOSObject().getCOSDictionary(COSName.PG).getInt(COSName.STRUCT_PARENTS);
}
最佳答案
structParents是完全不同的东西(请参见PDF specification)。做这个:
PDPage page = new PDPage(((PDStructureElement) coDic).getCOSObject().getCOSDictionary(COSName.PG));
int pageNum = doc.getPages().indexOf(page);
或更好:
PDPage page = ((PDStructureElement) coDic).getPage();
int pageNum = doc.getPages().indexOf(page);
(省略了空检查和类检查)
关于java - 如何在加标签的pdf中获取标签的页码,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/60371287/