如何在pdf文件中搜索单词或行?
是否有一个简洁的模块可以做到这一点?
先感谢您,
最佳答案
有一个叫做pyPDF.的东西
这是一个构建为Pure-Python
的PDF toolkit.
库
您可以提取(使用extractText()
方法),还可以使用以下代码对pdf文件执行搜索。
pdf = pyPdf.PdfFileReader(file(path, "rb"))
content = pdf.getPage(1).extractText()
如何在pdf文件中搜索单词或行?
是否有一个简洁的模块可以做到这一点?
先感谢您,
最佳答案
有一个叫做pyPDF.的东西
这是一个构建为Pure-Python
的PDF toolkit.
库
您可以提取(使用extractText()
方法),还可以使用以下代码对pdf文件执行搜索。
pdf = pyPdf.PdfFileReader(file(path, "rb"))
content = pdf.getPage(1).extractText()