我试图在 python 2.7 中导入 nltk 包

  import nltk
  stopwords = nltk.corpus.stopwords.words('english')
  print(stopwords[:10])

运行这会给我以下错误:
LookupError:
**********************************************************************
Resource 'corpora/stopwords' not found.  Please use the NLTK
Downloader to obtain the resource:  >>> nltk.download()

因此,我打开了我的 python 终端并执行了以下操作:
import nltk
nltk.download()

这给了我:
showing info https://raw.githubusercontent.com/nltk/nltk_data/gh-pages/index.xml

然而这似乎并没有停止。再次运行它仍然给我同样的错误。任何想法哪里出了问题?

最佳答案

您当前正在尝试下载 nltk 数据中的每个项目,因此这可能需要很长时间。您可以尝试仅下载您需要的停用词:

import nltk
nltk.download('stopwords')

或者从命令行(感谢 Rafael Valero's answer ):

python -m nltk.downloader stopwords

引用:
  • Installing NLTK Data - Command line installation
  • 关于python - 导入 nltk 库时找不到语料库/停用词,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/41610543/

    10-13 06:40