我浏览了NLTK书中的chapter 7,以寻求解决方案,但到目前为止我还不清楚。


<NN>*表示0个或多个名词
本书所解释的<NN.*>*表示0个或多个任何类型的名词


在NLTK中,NNNNSNNPNNPS是否彼此排斥? (我认为NN是其余的保护伞可能是错误的)

在那种情况下,<NN.*>*表示NNNNSNNPNNPS中的任意0个或多个,其本身可以重复0次或多次(那个外部*)吗?还是只是简单地表示NN重复0次或多次,然后又重复0次或多次?
还是我完全误会了?

最佳答案

Here是Penn树库POS标签的列表。如您所见,NN不包含NNSNNPNNPS;它仅表示单数名词和质量名词。


  NN-名词,奇数或质量
  NNS-名词,复数
  NNP-专有名词,单数
  NNPS-专有名词,复数


<NN.*>*表示NNNNSNNPNNPS中的任何一个重复0次或多次(从外部*开始),而<NN>*表示仅<NN>重复0次或多次。 。

关于python - NLTK正则表达式模式中的<NN> *和<NN。*> *有什么区别?,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/55038360/

10-12 17:53