在 PyPDF2 pdfreader.getNumPages() 中,我给出了 pdf 文件的总页数。

我怎样才能使用 pdfminer 得到这个?

最佳答案

我讨厌只留下一个代码片段。此处的上下文是 link to the current pdfminer.six repo,您可以在其中了解更多有关 resolve1 方法的信息。

当您使用 pdfminer 时,您可能会打印并遇到一些 PDFObjRef 对象。本质上,您可以使用 resolve1 来扩展这些对象(它们通常是字典)。

from pdfminer.pdfparser import PDFParser
from pdfminer.pdfdocument import PDFDocument
from pdfminer.pdfpage import PDFPage
from pdfminer.pdfinterp import resolve1

file = open('some_file.pdf', 'rb')
parser = PDFParser(file)
document = PDFDocument(parser)

# This will give you the count of pages
print(resolve1(document.catalog['Pages'])['Count'])

关于python - 如何在python中使用pdfminer获取pdf总页数的总数,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/45841012/

10-12 18:02