我已经从pip下载了适用于python的treetagger包装器,用于POS标记,还从http://www.smo.uhi.ac.uk/~oduibhin/oideasra/interfaces/winttinterface.htm下载了官方的Treetagger应用程序

我还下载了英文的语言模型文件,名称为“ english-bnc.par”,后来根据python 3中的编码支持将其重命名为“ english-utf8”。

另外,在创建TreeTagger对象时,我还使用TAGDIR参数包含了TreeDirectory路径。

现在我收到一个错误消息,说无效的二进制文件!

我是python和自然语言处理的新手,所以如果有人遇到过此问题,请让我知道,在此先感谢enter image description here

Python 3.7.1(默认,2018年12月10日,22:54:23)[MSC v.1915 64位(AMD64)] ::在Win32上的Anaconda,Inc.
键入“帮助”,“版权”,“信用”或“许可证”以获取更多信息。


  
    
      导入pprint
      导入treetaggerwrapper
      C:\ Users \ ranak_viod5a3 \ Anaconda3 \ treetaggerwrapper.py:740:FutureWarning:可能在位置8嵌套设置
        re.IGNORECASE |重新(详细)
      C:\ Users \ ranak_viod5a3 \ Anaconda3 \ treetaggerwrapper.py:2044:FutureWarning:可能的嵌套集位于位置152
        re.VERBOSE | re.IGNORECASE)
      C:\ Users \ ranak_viod5a3 \ Anaconda3 \ treetaggerwrapper.py:2067:FutureWarning:可能在位置409嵌套设置
        UrlMatch_re = re.compile(UrlMatch_expression,re.VERBOSE | re.IGNORECASE)
      C:\ Users \ ranak_viod5a3 \ Anaconda3 \ treetaggerwrapper.py:2079:FutureWarning:可能在位置192的嵌套集
        EmailMatch_re = re.compile(EmailMatch_expression,re.VERBOSE | re.IGNORECASE)
      tagger = treetaggerwrapper.TreeTagger(TAGLANG ='en',TAGDIR ='C:/ TreeTagger / bin')
      追溯(最近一次通话):
        文件“”,第1行,位于
        初始化文件“ C:\ Users \ ranak_viod5a3 \ Anaconda3 \ treetaggerwrapper.py”,行1006
          自己.set_tagger(kargs)
        文件“ C:\ Users \ ranak_viod5a3 \ Anaconda3 \ treetaggerwrapper.py”,行1072,位于_set_tagger中
          引发TreeTaggerError(“ TreeTagger二进制无效:” + self.tagbin)
      treetaggerwrapper.TreeTaggerError:TreeTagger二进制无效:C:\ TreeTagger \ bin \ bin \ tree-tagger.exe

最佳答案

我遇到了“ treetaggerwrapper.TreeTaggerError:TreeTagger二进制无效:/ TreeTagger / cmd / bin / tree-tagger”相同的问题,我从https://www.cis.uni-muenchen.de/~schmid/tools/TreeTagger/下载了TreeTagger

我通过将整个/ bin目录复制到/ cmd解决了它。

08-16 00:42