本文介绍了dbpedia聚光灯数据集的处理方法,对大家解决问题具有一定的参考价值,需要的朋友们下面随着小编来一起学习吧!
问题描述
我从,并希望通过从。
有人可以告诉我如何在jar文件中使用点检词典和歧义消除索引中的数据。
Can someone tell me how to use the data from spotter lexicon and disambiguation index with the jar files.
推荐答案
假设已经下载并解压缩了以下文件:
Assuming you have already downloaded and decompressed the files below:
wget http://spotlight.dbpedia.org/download/release-0.5/context-index-compact.tgz
tar zxvf context-index-compact.tgz
wget http://spotlight.dbpedia.org/download/release-0.4/surface_forms-Wikipedia-TitRedDis.uriThresh75.tsv.spotterDictionary.gz
gunzip surface_forms-Wikipedia-TitRedDis.uriThresh75.tsv.spotterDictionary.gz
现在只需更改server.properties文件以指向您新提取的文件即可:
Now you just need to change the server.properties file to point to your newly extracted files:
org.dbpedia.spotlight.index.dir = index-withSF-withTypes-compressed
org.dbpedia.spotlight.spot.dictionary = surface_forms-Wikipedia-TitRedDis.uriThresh75.tsv.spotterDictionary
如果您使用最大的Spotter字典,则可能需要增加Java堆空间-例如-Xmx10G在您的命令行中。
If you are using the largest spotter dict, you may need to increase the java heap space -- e.g. -Xmx10G in your command line.
这篇关于dbpedia聚光灯数据集的文章就介绍到这了,希望我们推荐的答案对大家有所帮助,也希望大家多多支持!