通常的共指解析以下列方式工作:

假如

The man likes math. He really does.

它指出
he


the man.

有很多工具可以做到这一点。

但是,有办法倒退吗?

例如,

给定
The man likes math. The man really does.

我想做代词“倒退”

这样我得到一个输出
The man likes math. He really does.

我的输入文字主要是3〜10个句子,而我正在使用python。

最佳答案

也许这并不是真正让人满意的答案,但我认为答案是,尽管您可以自己编写代码而没有太多困难,但任何地方都没有内置这种功能。概述如何使用CoreNLP:

  • 仍在运行coref。这将告诉您“男人”和“男人”是相互关联的,因此您可以用代词代替第二个。
  • 从CoreNLP运行gender注释器。这是一个文献记载不充分,甚至广告宣传不力的注释器,试图将性别附加到句子中的标记上。
  • 以某种方式找出复数。大多数情况下,您可以使用词性标记:复数名词获得标记NNS或NNPS,但存在一些复杂性,因此您可能还需要考虑(1)在先行词中是否存在连词; (2)单词的引理与其文字不同; (3)特别是与2结合使用时,以's'或'es'结尾的单词-可以区分去除复数的词条化和去除时态的词条化等。
  • 这足以找出正确的代词。现在,只需将句子切成小段然后重新组合即可。如果您在CoreNLP中进行操作,这会有些痛苦-代码只是未设置为更改句子的文本-但在最坏的情况下,您始终可以重新注释新的表面形式。

  • 希望这会有所帮助!

    10-07 18:51