我已经从pip下载了适用于python的treetagger包装器,用于POS标记,还从http://www.smo.uhi.ac.uk/~oduibhin/oideasra/interfaces/winttinterface.htm下载了官方的Treetagger应用程序
我还下载了英文的语言模型文件,名称为“ english-bnc.par”,后来根据python 3中的编码支持将其重命名为“ english-utf8”。
另外,在创建TreeTagger对象时,我还使用TAGDIR参数包含了TreeDirectory路径。
现在我收到一个错误消息,说无效的二进制文件!
我是python和自然语言处理的新手,所以如果有人遇到过此问题,请让我知道,在此先感谢enter image description here
Python 3.7.1(默认,2018年12月10日,22:54:23)[MSC v.1915 64位(AMD64)] ::在Win32上的Anaconda,Inc.
键入“帮助”,“版权”,“信用”或“许可证”以获取更多信息。
导入pprint
导入treetaggerwrapper
C:\ Users \ ranak_viod5a3 \ Anaconda3 \ treetaggerwrapper.py:740:FutureWarning:可能在位置8嵌套设置
re.IGNORECASE |重新(详细)
C:\ Users \ ranak_viod5a3 \ Anaconda3 \ treetaggerwrapper.py:2044:FutureWarning:可能的嵌套集位于位置152
re.VERBOSE | re.IGNORECASE)
C:\ Users \ ranak_viod5a3 \ Anaconda3 \ treetaggerwrapper.py:2067:FutureWarning:可能在位置409嵌套设置
UrlMatch_re = re.compile(UrlMatch_expression,re.VERBOSE | re.IGNORECASE)
C:\ Users \ ranak_viod5a3 \ Anaconda3 \ treetaggerwrapper.py:2079:FutureWarning:可能在位置192的嵌套集
EmailMatch_re = re.compile(EmailMatch_expression,re.VERBOSE | re.IGNORECASE)
tagger = treetaggerwrapper.TreeTagger(TAGLANG ='en',TAGDIR ='C:/ TreeTagger / bin')
追溯(最近一次通话):
文件“”,第1行,位于
初始化文件“ C:\ Users \ ranak_viod5a3 \ Anaconda3 \ treetaggerwrapper.py”,行1006
自己.set_tagger(kargs)
文件“ C:\ Users \ ranak_viod5a3 \ Anaconda3 \ treetaggerwrapper.py”,行1072,位于_set_tagger中
引发TreeTaggerError(“ TreeTagger二进制无效:” + self.tagbin)
treetaggerwrapper.TreeTaggerError:TreeTagger二进制无效:C:\ TreeTagger \ bin \ bin \ tree-tagger.exe
最佳答案
我遇到了“ treetaggerwrapper.TreeTaggerError:TreeTagger二进制无效:/ TreeTagger / cmd / bin / tree-tagger”相同的问题,我从https://www.cis.uni-muenchen.de/~schmid/tools/TreeTagger/下载了TreeTagger
我通过将整个/ bin目录复制到/ cmd解决了它。