我浏览了NLTK书中的chapter 7,以寻求解决方案,但到目前为止我还不清楚。<NN>*
表示0个或多个名词
本书所解释的<NN.*>*
表示0个或多个任何类型的名词
在NLTK中,NN
,NNS
,NNP
,NNPS
是否彼此排斥? (我认为NN是其余的保护伞可能是错误的)
在那种情况下,<NN.*>*
表示NN
,NNS
,NNP
,NNPS
中的任意0个或多个,其本身可以重复0次或多次(那个外部*)吗?还是只是简单地表示NN
重复0次或多次,然后又重复0次或多次?
还是我完全误会了?
最佳答案
Here是Penn树库POS标签的列表。如您所见,NN
不包含NNS
,NNP
和NNPS
;它仅表示单数名词和质量名词。
NN-名词,奇数或质量
NNS-名词,复数
NNP-专有名词,单数
NNPS-专有名词,复数<NN.*>*
表示NN
,NNS
,NNP
,NNPS
中的任何一个重复0次或多次(从外部*
开始),而<NN>*
表示仅<NN>
重复0次或多次。 。
关于python - NLTK正则表达式模式中的<NN> *和<NN。*> *有什么区别?,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/55038360/