我试图在 python 2.7 中导入 nltk 包
import nltk
stopwords = nltk.corpus.stopwords.words('english')
print(stopwords[:10])
运行这会给我以下错误:
LookupError:
**********************************************************************
Resource 'corpora/stopwords' not found. Please use the NLTK
Downloader to obtain the resource: >>> nltk.download()
因此,我打开了我的 python 终端并执行了以下操作:
import nltk
nltk.download()
这给了我:
showing info https://raw.githubusercontent.com/nltk/nltk_data/gh-pages/index.xml
然而这似乎并没有停止。再次运行它仍然给我同样的错误。任何想法哪里出了问题?
最佳答案
您当前正在尝试下载 nltk 数据中的每个项目,因此这可能需要很长时间。您可以尝试仅下载您需要的停用词:
import nltk
nltk.download('stopwords')
或者从命令行(感谢 Rafael Valero's answer ):
python -m nltk.downloader stopwords
引用:
关于python - 导入 nltk 库时找不到语料库/停用词,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/41610543/