在自然语言处理中,命名实体识别是识别命名实体(例如组织、地点和最重要的名称)的挑战。
尽管我称之为同义词,但其中有一个重大挑战:伯爵和德古拉实际上指的是同一个人,但有可能在文本中从未直接讨论过。
解决这些同义词的最佳算法是什么?
如果任何基于 Python 的库中有此功能,我很想接受教育。我正在使用 NLTK。
最佳答案
您正在描述 coreference resolution 和命名实体链接的问题。我提供单独的链接,因为我不完全确定您指的是哪一个。
关于nlp - 如何在命名实体识别中解析同义词?,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/15835563/