我有一个现有的 Solr 设置,在独立的 Solr 实例上运行。
我被要求为此设置添加弹性和高可用性。
所以我想在我的设置中添加复制,我相信 SolrCloud 是要走的路吗?

我已经浏览了 SolrCloud wiki 上的演示。
但是我不确定如何将我现有的 Solr 实例添加到 ZooKeeper,然后添加更多节点以将其复制到。这可能不重新膨胀吗?

维基指出



但是我不确定它指的是哪些文件以及如何执行此操作?

当前设置信息:

  • Solr 4.5.1
  • 2vCPU 的 24GB RAM
  • 索引
  • 中有 6600 万个文档
  • 58Gb 索引大小
  • 批量索引时间 ~50 小时
  • 4000 最大用户
  • 400 平均并发用户
  • 每天 20k 次更新
  • 用户通过 solrJ 应用程序搜索
  • 查询涉及分组

  • 愿望 list
  • 现有 Solr 索引复制到 2 个新节点
  • 3 个 Zookeeper 节点提供弹性

  • 我尝试过的:
  • 下载Zookeeper,运行zkServer,默认设置-OK
  • 使用选项 -DzkHost=actualhostname:2181 启动现有的 solr 设置

  • 但是我从 solr 收到错误“无法加载 SOLR 配置”。

    所以我想我的问题总结为:
  • 对于我的设置,SolrCloud 是要走的路,而不是说 ReplicationHandler?
  • 是否可以在不重新索引的情况下添加 solrCloud 和 ZK 支持(50 小时是很长的时间)?
  • 我应该将哪些配置文件添加到 zk 以及如何添加?
  • 我是否正确,没有额外的配置更改分片不是一个选项,因为我在我的查询中使用分组?
  • 我应该从 solr 4.5.1 升级多远?
  • 最重要的是,我的“愿望 list ”看起来像一个好主意/坏主意/一针见血吗?如果好,如何实现?如果不好,有什么建议吗?

  • 我对 Solr 非常陌生(使用约 12 个月),对 Zookeeper 和 SolrCloud 非常陌生(约 2 周阅读/实验),因此非常感谢有关实现上述目标的任何建议。

    最佳答案

  • 对于我的设置,SolrCloud 是要走的路,而不是说 ReplicationHandler?

  • SolrCloud 是 Solr 的前进方向,所以我会说是的。
  • 是否可以在不重新索引的情况下添加 solrCloud 和 ZK 支持(50 小时是很长的时间)?

  • 如果不使用分片,只使用副本,无需重新索引。
  • 我应该将哪些配置文件添加到 zk 以及如何添加?

  • 使用 -Dbootstrap_conf=true 启动您的第一个 Solr,这会将您的配置文件加载到 ZK 中。
  • 我是否正确,没有额外的配置更改分片不是一个选项,因为我在我的查询中使用分组?

  • 取决于您对分组的具体操作,请参阅 https://wiki.apache.org/solr/DistributedSearch 以了解支持与否。
  • 我应该从 solr 4.5.1 升级多远?

  • 升级到最新版本是个好主意,虽然在 Solr 4.7 之后,您将需要 Java 7。
  • 最重要的是,我的“愿望 list ”看起来像一个好主意/坏主意/一针见血吗?如果好,如何实现?如果不好,有什么建议吗?

  • 我投票赞成好主意,我有一个类似的主意。

    关于solr - 将 Zookeeper 添加到现有 Solr,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/28176542/

    10-16 16:32