- Using openrdf-sesame-latest
- Using in-memory repository in Sesame Standalone Server
- Using REST api interface (SPARQL queries) to Sesame Standalone server
- Have few hundred thousands triples for now
- have 16GB of memory on Sesame Server
- Moderate writes and reads
我只是在这里寻求专家的意见/帮助
我将它作为 POC 开始,并在它之上构建我的应用程序。我正在寻找 4Stores 和 Mulgara,Alleograph(免费)选项。
我必须离开芝麻服务器。
只是我试图避免在迁移上投入时间,除非绝对需要。让我换一种说法“我可以在生产中使用带有内存存储库 (16GB) 的 openrdf-sesame-latest 独立服务器吗?如果不能,为什么不呢?
最佳答案
作为芝麻街的开发者之一,我显然有偏见,但我不明白你为什么不能。
Sesame 已成功用于许多生产环境。内存存储随着可用 RAM 的数量而扩展,尽管我个人从未用超过几百万的三元组对其进行过测试,但我希望您可以继续添加而不会显着降低性能,只要您没有用完堆空间.你提到 100,000 个三元组,这是很小的,芝麻可以轻松应对数量级更大的数据集。
Sesame 的一个优势还在于它实际上不是一个单一的三元组,而是一个支持多个存储后端的框架和 API。对于任何高达 1.5 亿的三元组,Sesame 本地存储是一个很好的解决方案(更好的持久性,更少的内存占用,即使您拥有的数据量适合内存,这可能也是使用它的好理由)。
如果您需要超越此范围,还有其他几种选择,包括支持芝麻 API 的第三方三元组,例如 OWLIM 或 BigData - 因此,即使您发现需要更大的三元组,您也无需在代码级别 - 您只需插入不同的商店即可。
关于semantic-web - 芝麻内存三重存储,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/11403314/