Closed. This question is off-topic。它当前不接受答案。
想改善这个问题吗? Update the question,所以它是on-topic,用于堆栈溢出。
3年前关闭。
如何从多页PDF中提取文本?我需要将每个页面作为单独的文本字符串
第1页作为一个字符串,第2页作为另一字符串等
我需要一个Linux命令行工具
想改善这个问题吗? Update the question,所以它是on-topic,用于堆栈溢出。
3年前关闭。
如何从多页PDF中提取文本?我需要将每个页面作为单独的文本字符串
第1页作为一个字符串,第2页作为另一字符串等
pdftotext
或任何其他工具可能吗?我需要一个Linux命令行工具
最佳答案
最简单的方法是使用已经命名的pdftotext
工具,可以通过运行sudo apt-get install poppler-utils
进行安装。之后,您只需运行pdftotext /link/to/input.pdf /link/to/output.txt
。
10-01 17:40