本文介绍了dbpedia聚光灯数据集的处理方法,对大家解决问题具有一定的参考价值,需要的朋友们下面随着小编来一起学习吧!

问题描述

我从,并希望通过从。

有人可以告诉我如何在jar文件中使用点检词典和歧义消除索引中的数据。

Can someone tell me how to use the data from spotter lexicon and disambiguation index with the jar files.

推荐答案

假设已经下载并解压缩了以下文件:

Assuming you have already downloaded and decompressed the files below:

wget http://spotlight.dbpedia.org/download/release-0.5/context-index-compact.tgz
tar zxvf context-index-compact.tgz
wget http://spotlight.dbpedia.org/download/release-0.4/surface_forms-Wikipedia-TitRedDis.uriThresh75.tsv.spotterDictionary.gz
gunzip surface_forms-Wikipedia-TitRedDis.uriThresh75.tsv.spotterDictionary.gz

现在只需更改server.properties文件以指向您新提取的文件即可:

Now you just need to change the server.properties file to point to your newly extracted files:

org.dbpedia.spotlight.index.dir = index-withSF-withTypes-compressed
org.dbpedia.spotlight.spot.dictionary = surface_forms-Wikipedia-TitRedDis.uriThresh75.tsv.spotterDictionary

如果您使用最大的Spotter字典,则可能需要增加Java堆空间-例如-Xmx10G在您的命令行中。

If you are using the largest spotter dict, you may need to increase the java heap space -- e.g. -Xmx10G in your command line.

这篇关于dbpedia聚光灯数据集的文章就介绍到这了,希望我们推荐的答案对大家有所帮助,也希望大家多多支持!

10-22 12:08