我正在使用斯坦福匕首确定词性。但是,我想从文本中获取更多信息。是否有可能获得更多信息,例如句子的时态或主动/被动?

到目前为止,我使用的是非常基本的PoS标记方法:

List<List<TaggedWord>> taggedUnits = new ArrayList<List<TaggedWord>>();

String input = "This sentence is going to be future. The door was opened.";
for (List<HasWord> sentence : MaxentTagger.tokenizeText(new StringReader(input)))
{
     taggedUnits.add(tagger.tagSentence(sentence));
}

最佳答案

您可以从各种penn标签获取紧张的信息:

27. VB  Verb, base form
28. VBD Verb, past tense
29. VBG Verb, gerund or present participle
30. VBN Verb, past participle
31. VBP Verb, non-3rd person singular present
32. VBZ Verb, 3rd person singular present


关于主动/被动方面,您可以使用Stanford Core NLP中包含的类型化依赖项。


如果句子是主动语态,则应该存在“ nsubj”依赖项。
如果句子是被动语态,则应使用“ nsubjpass”依赖项
存在


希望这可以帮助。

10-01 20:19