我将开发具有许多(100+)类的命名实体识别系统。假设它们的频率大致相等,那么哪种算法应该表现最好?根据我对CRF工作原理的理解(很遗憾,距离理想还很远),在这里应该没问题。但是在某些来源(google books)中,我发现了另一种观点。

那么,CRF是否适用于具有大量类的NER算法?

最佳答案

我们在这里谈论什么样的课程?不要害羞:)

您最好使用分层方法:


具有少量的根类,例如“产品”,“人”,“地点”。第一遍找出哪个是哪个。
然后,对于每个根类,都有子类,例如“汽车产品”,“电子产品”等。

关于machine-learning - NER的CRF有很多类(class),我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/25222435/

10-12 22:04