Possible Duplicate:
Extracting nouns from Noun Phase in NLP
有没有人举一些例子说明如何使用Python的NLTK从字符串中提取所有名词?
例如,我有一条线:“我喜欢西红柿和莴苣”。我想建立一个返回“番茄”和“莴苣”的方法
如果不是在Python中,有人知道其他的解决方案吗?

最佳答案

获取NLTK包,然后使用它的内置解析器this method;或者,更快地,part-of-speech tag字符串,并获取所有具有标记NN的单词,这些是名词。阅读语音标签的其他部分,了解如何正确提取Ilike
这两种方法都不是完美无缺的,但都是你能做的最好的。在干净的输入下,一个好的词性标记器的准确率将达到95%以上。我不认为你可以达到这样的精度,与一个基于WordNet的方法,没有很多额外的工作。

08-20 01:10
查看更多