我了解DBPedia的聚光灯可以在给定的文档上进行命名实体识别。为此,它使用存储在文件系统中的下载的DBPedia文件。请引用URL:https://github.com/dbpedia-spotlight/dbpedia-spotlight/wiki/Run-from-a-JAR

我需要的是一个等效的API,例如Freebase的Spotlight。在浏览的过程中,我找不到在Freebase Triple Store上运行的任何此类工具/API。有人可以帮忙吗?

最佳答案

Freebase当前没有等效的项目用于命名实体识别。但是,Freebase在sameAs.org上具有指向DBpedia的链接,因此您可以使用DBpedia聚光灯,然后将ID解析回Freebase(该数据在Freebase RDF dumps中也可用)。

如果您正在寻找这一领域的编码项目,我认为应该有可能改编DBpedia Spotlight代码,以便您可以使用Freebase数据来训练其模型。这样做的主要好处是,与DBpedia相比,Freebase涵盖的实体范围更广,因此您会得到更好的记忆。另外,您还可以利用Freebase中的其他数据(例如“值得注意的类型”)来获得更好的精度。

通过查看Freebase中的/type/object/name和/common/topic/alias属性,您应该能够获得一组良好的实体“表面形式”。对应于Wikpedia页面的任何Freebase实体在/wikipedia/en命名空间中将具有一个或多个/type/object/key值。这些对应于Wikipedia页面名称(和重定向),这将使您能够解析Wikipedia XML转储并确定页面上的哪些链接与Freebase主题相对应。 Freebase key 编码方案描述为here

您可能还对OpenCalaisAlchemyAPI感兴趣,它们提供命名实体识别服务,并在其API响应中提供Freebase ID。

关于freebase - 使用Freebase命名实体识别,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/20796266/

10-13 00:11