是否可以使用grep
或其他命令和/或regex
在pdf文件中搜索特定模式?
最佳答案
如果安装了pdftotext
实用程序,则可以使用以下命令搜索pdf文件的文本:
pdftotext myfile.pdf - | grep 'pattern'
您必须使用一些实用程序(如
pdftotext
)将pdf文件转换为文本,然后再将其输入grep
(否则grep
将很难理解原始pdf文件),但任何这样做的实用程序都应该可以工作。在ubuntu和debian上,
pdftotext
是poppler-utils
包的一部分。