对我来说,这实际上是python的第一天。过去,我曾使用VBA,Java和Swift进行过编码,但是按照网上的pdf刮板编码指南,我的工作特别困难。由于我不知道自己在做什么,因此每次我想测试一下我在网上找到的一些代码时,都会碰壁。

基础信息


Windows 7 64位
python 3.6.0
间谍3
我有许多与pdf相关的代码包(PyPDF2,pdfminer,pdfquery,pdfwrw等)


目标

在python中创建一些东西,使我可以将文件夹中的PDF转换为excel文件(ideallY)或文本文件(我将使用VBA进行转换)。

问题

每次我尝试从网上找到的指南中的一些示例代码时,我总是会在调用pdf的行上遇到语法错误,在该行上我要测试该代码。以下是一些指南链接和错误示例。我应该将test.pdf与.py文件放入同一文件吗?


How to scrape tables in thousands of PDF files?


由于最后一行出现“ for”,我收到了无效的语法错误

PDFMiner指南(Link




runfile('C:/Users/U587208/Desktop/pdffolder/pdfminer.py', wdir='C:/Users/U587208/Desktop/pdffolder')
  File "C:/Users/U587208/Desktop/pdffolder/pdfminer.py", line 79
    print pdf_to_csv('test.pdf', separator, threshold)
                   ^
SyntaxError: invalid syntax

最佳答案

您正在遵循的教程似乎使用了python2。通常没有什么明显的区别,最大的是在python 3中,print成为一种功能,因此

print()


我建议更改您的python版本或为python 3查找教程。希望这会有所帮助

关于python - 将PDF数据抓取到Excel *绝对新手*,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/44503913/

10-08 22:29
查看更多