Boilerpipe是用于清理网页的出色Java程序,我过去曾使用过它。今天我注意到许多用户无法安装Python包装器版本并获得404和其他错误。这是我从conda复制的尝试之一。

/ Users / Duncan> sudo -H pip install https://pypi.python.org/packages/source/b/boilerpipe-py3/boilerpipe-py3-1.2.0.0.tar.gz
收集https://pypi.python.org/packages/source/b/boilerpipe-py3/boilerpipe-py3-1.2.0.0.tar.gz
  正在下载boilerpipe-py3-1.2.0.0.tar.gz(1.3MB)
    100%|█████████████████████████████████| 1.3MB 436kB /秒
    来自命令python setup.py egg_info的完整输出:
    追溯(最近一次通话):
      文件“”,第1行,位于
      文件“ /tmp/pip-r6swd0hy-build/setup.py”,第33行,在
        download_jars(数据路径=数据路径)
      在download_jars中的文件“ /tmp/pip-r6swd0hy-build/setup.py”,第26行
        urlretrieve(tgz_url,tgz_name)
      在URLretrieve中的文件“ /Users/duncan/anaconda/lib/python3.5/urllib/request.py”,第188行
        使用contextlib.closing(urlopen(url,data))作为fp:
      urlopen中的文件“ /Users/duncan/anaconda/lib/python3.5/urllib/request.py”,第163行
        返回opener.open(URL,数据,超时)
      打开文件“ /Users/duncan/anaconda/lib/python3.5/urllib/request.py”,第472行
        响应= meth(req,响应)
      文件“ /Users/duncan/anaconda/lib/python3.5/urllib/request.py”,第582行,位于http_response中
        'http',请求,响应,代码,msg,hdr)
      文件“ /Users/duncan/anaconda/lib/python3.5/urllib/request.py”,第510行,错误
        返回self._call_chain(* args)
      _call_chain中的文件“ /Users/duncan/anaconda/lib/python3.5/urllib/request.py”,行444
        结果= func(* args)
      文件“ /Users/duncan/anaconda/lib/python3.5/urllib/request.py”,第590行,位于http_error_default中
        引发HTTPError(req.full_url,code,msg,hdrs,fp)
    urllib.error.HTTPError:HTTP错误404:找不到

----------------------------------------


命令“ python setup.py egg_info”在/ tmp / pip-r6swd0hy-build /中失败,错误代码为1

我见过几种对我不起作用的解决方案(例如:google更改了其模块的URL)如果有人有解决方案,我将不胜感激!

我的平台是16GB El Capitan,但我已经在Ubuntu和其他平台上看到过此报道。多谢您的协助!

最佳答案

我只是将boilerpipe-1.2.0-bin.tar.gz从此处code.google.com分叉并重新下载到我的存储库https://github.com/slaveofcode/boilerpipe3

您可以使用pip安装锅炉

pip install boilerpipe3


或按项目存储库

pip install git+ssh://[email protected]/slaveofcode/boilerpipe3@master

关于python - Boilerpipe-py3的安装尝试给出404错误,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/39887711/

10-12 23:50