我想使用命名实体识别(NER)为数据库中的文本找到足够的标签。我不想使用NLTK或Lingpipe之类的工具,而是要构建自己的工具。

所以我的问题是:

  • 我应该使用哪种算法?
  • 构建此工具有多困难?
  • 最佳答案

    前一段时间,当我研究马尔可夫链时,我做到了。

    无论如何,答案是:



    例如,斯坦福大学NLP使用条件随机场(CRF)。如果您没有设法有效地执行此操作,那么您就像是pissing in the wind的Jackass 3d的家伙。解析人类语言没有简单的方法,因为它的构造很复杂并且有很多异常(exception)。



    好吧,如果您知道自己在做什么,那一点也不难。输入规则和逻辑的过程可能很烦人并且很耗时,并且修复错误可能并不容易。但是在20年内,您可以(自己)做点几乎有用的事情。

    10-07 16:16