我已经建立了一个内容聚合器,并且想添加一个代表当前趋势的标签云。
不幸的是,这是相当复杂的,因为我必须寻找代表每一篇文章的上下文的关键字。
例如,像我,是,是,惊人,尼斯这样的词与上下文无关。
非常感谢您的帮助!:)
最佳答案
使用NLTK,尤其是它的stopwords语料库:
除了常规的内容词,还有
另一类词叫做stop
表现重要的词语
语法功能,但是
不太可能有趣
他们自己。其中包括
介词、补语和
决定因素。NLTK与
停止语语料库,有2400个
在11个不同的
语言(包括英语)。
我已经建立了一个内容聚合器,并且想添加一个代表当前趋势的标签云。
不幸的是,这是相当复杂的,因为我必须寻找代表每一篇文章的上下文的关键字。
例如,像我,是,是,惊人,尼斯这样的词与上下文无关。
非常感谢您的帮助!:)
最佳答案
使用NLTK,尤其是它的stopwords语料库:
除了常规的内容词,还有
另一类词叫做stop
表现重要的词语
语法功能,但是
不太可能有趣
他们自己。其中包括
介词、补语和
决定因素。NLTK与
停止语语料库,有2400个
在11个不同的
语言(包括英语)。