如何在pdf文件中搜索单词或行?

是否有一个简洁的模块可以做到这一点?

先感谢您,

最佳答案

有一个叫做pyPDF.的东西
这是一个构建为Pure-PythonPDF toolkit.

您可以提取(使用extractText()方法),还可以使用以下代码对pdf文件执行搜索。

pdf = pyPdf.PdfFileReader(file(path, "rb"))
content = pdf.getPage(1).extractText()

10-08 19:10