我想使用 pdfminer 来提取文本信息。我已经下载了pdfminer-20131113。我已经在 C:\python34
中安装了 python。
现在使用cmd,我正在设置pdfminer的setup.py
文件的路径。
并运行以下命令。
python setup.py install
但我收到以下错误。
> D:\pdfminer-20101226>python setup.py install
Traceback (most recent call last):
File "setup.py", line 3, in <module>
from pdfminer import __version__
File "D:\pdfminer-20101226\pdfminer\__init__.py", line 4
if __name__ == '__main__': print __version__
^
SyntaxError: invalid syntax
pdfminer的setup.py文件好像有错误,不知道怎么解决。
另外,我在pdfminer的构建文件夹中看到了一个pdf2txt.py文件。我也尝试将其用作
pdf2txt.py -o output.html pdffilename.pdf
(带有完整路径)。但不是转换它。它打开 pdf2txt.py
文件。 最佳答案
PDFMiner project homepage 指出:
再往下:
所以你必须安装 Python 2 才能运行这个项目。
或者,您可以尝试 Python 3 port, pdfminer3k
;它在 20 个月内没有看到任何更新,而 PDFMiner 确实有更新的版本,因此您的里程可能会有所不同。
关于python - 使用python安装pdfminer时出现语法错误,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/22631946/