我已经用NLTK玩了一段时间,现在正准备为特殊的分块定义自定义解析器语法我遵循http://nltk.googlecode.com/svn/trunk/doc/book/ch07.html中的描述,但我感兴趣的是与本章中描述的稍有不同。例如,在示例7.10中,对动词阶段使用以下语句:
副总裁:{+$}
我只想匹配使用一个特定动词而不是任何动词的句子类似于:
副总裁:{go+$}
换句话说,我想匹配实际单词而不是单词的pos标记,并在正则表达式中混合和匹配实际单词和pos标记。
这可能吗?

最佳答案

不是用nltk PoS标签机生产的标准PoS标签。
如果需要为不同的动词编写语法,一个有用的技巧可能是对标记进行预处理,并将标记附加到所有动词的标记中。因此,可以使用类似VP:{++$}的regex字符串

09-25 16:56