是否可以使用grep或其他命令和/或regex在pdf文件中搜索特定模式?

最佳答案

如果安装了pdftotext实用程序,则可以使用以下命令搜索pdf文件的文本:

pdftotext myfile.pdf - | grep 'pattern'

您必须使用一些实用程序(如pdftotext)将pdf文件转换为文本,然后再将其输入grep(否则grep将很难理解原始pdf文件),但任何这样做的实用程序都应该可以工作。
在ubuntu和debian上,pdftotextpoppler-utils包的一部分。

08-25 12:42