我只是使用Graphdb EE进行评估。

我打算将我的大数据从Cassandra迁移到Graphdb,但我阅读了文档,其中可以包含2 ^ 40个实体= 2,000B个实体。我对此有几个疑问:

  • 是否可以扩展到无限实体?
  • 我想使用许多存储库来管理我的数据以及将它们连接为单个存储库的方式吗?
  • 是否可以搜索多个实体和多个属性(已经在elasticsearch上建立索引)/ entity?
  • 是否需要为每个ES连接器创建所有属性/每个实体以获得最佳性能?
  • 最佳答案

    戴维,请看下面的快速解答。



    2 ^ 40表示1T实体。您真的需要更多吗?

    GraphDB中的实体是图中的节点:URI,文字,空白列表。平均而言,每个节点将有多个边/语句(例如5x)。



    是的,请参阅所谓的internal federation,它使您可以跨一个和同一个GraphDB实例中的存储库在SPARQL查询中高效地进行联合。



    我不确定我是否理解您的问题。您绝对可以在单个SPARQL查询中嵌入多个FTS查询。这些FTS查询可以使用不同的字段搜索不同的实体。您可以在here上阅读更多内容。



    您可以为一个和相同的仓库拥有多个索引。提高性能的最佳方法是为那些对您最关键的查询使用特定的索引(在具有特定过滤器的特定属性/字段上)。

    09-11 15:44