我想使用 pdfminer 来提取文本信息。我已经下载了pdfminer-20131113。我已经在 C:\python34 中安装了 python。
现在使用cmd,我正在设置pdfminer的setup.py文件的路径。
并运行以下命令。

python setup.py install

但我收到以下错误。
> D:\pdfminer-20101226>python setup.py install
Traceback (most recent call last):
  File "setup.py", line 3, in <module>
    from pdfminer import __version__
  File "D:\pdfminer-20101226\pdfminer\__init__.py", line 4
    if __name__ == '__main__': print __version__
                                               ^
SyntaxError: invalid syntax

pdfminer的setup.py文件好像有错误,不知道怎么解决。

另外,我在pdfminer的构建文件夹中看到了一个pdf2txt.py文件。我也尝试将其用作 pdf2txt.py -o output.html pdffilename.pdf(带有完整路径)。但不是转换它。它打开 pdf2txt.py 文件。

最佳答案

PDFMiner project homepage 指出:



再往下:



所以你必须安装 Python 2 才能运行这个项目。

或者,您可以尝试 Python 3 port, pdfminer3k ;它在 20 个月内没有看到任何更新,而 PDFMiner 确实有更新的版本,因此您的里程可能会有所不同。

关于python - 使用python安装pdfminer时出现语法错误,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/22631946/

10-12 01:34