Closed. This question is off-topic。它当前不接受答案。
                            
                        
                    
                
                            
                                
                
                        
                            
                        
                    
                        
                            想改善这个问题吗? Update the question,所以它是on-topic,用于堆栈溢出。
                        
                        3年前关闭。
                                                                                            
                
        
如何从多页PDF中提取文本?我需要将每个页面作为单独的文本字符串

第1页作为一个字符串,第2页作为另一字符串等

pdftotext或任何其他工具可能吗?

我需要一个Linux命令行工具

最佳答案

最简单的方法是使用已经命名的pdftotext工具,可以通过运行sudo apt-get install poppler-utils进行安装。之后,您只需运行pdftotext /link/to/input.pdf /link/to/output.txt

10-01 17:40