所以我有一个数据集,我想从中删除停用词

stopwords.words('english')

我在如何在我的代码中使用它来简单地取出这些单词而苦苦挣扎。我已经有一个来自此数据集的单词列表,我正在努力的部分是与此列表进行比较并删除停用词。
任何帮助表示赞赏。

最佳答案

from nltk.corpus import stopwords
# ...
filtered_words = [word for word in word_list if word not in stopwords.words('english')]

关于python - 如何使用nltk或python删除停用词,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/5486337/

10-09 00:50