我是SolrCloud新手,我的设置是3个碎片,3个副本,外部Zookeeper

今天,我发现shard3掉线了,replica3接任了领导者,所以索引正在复制到replida3而不是shard3。我以相反的顺序(R3,R2,R1,S3,S2,S1)停止了Tomcat / SOLR,然后以向前的顺序(S1,S2,S3,R1,R2,R3)重新启动。我没有删除任何tlog或Replication.properties文件。云图显示所有主机及其正确分配。据我了解,这些分配是在首次启动时在Zookeeper中设置的。

我的问题是索引到副本3的数据如何返回到恢复的分片3?

令人惊讶的是,shard3 = 87G,而replica3 = 80G。

困惑!

最佳答案

担,

副本的大小并不重要,只有集合所包含的文档数量才重要。

Solr的工作方式是,您可以在集合中删除仅在合并操作中删除的文档,这多余的7G可以被删除。

10-08 07:06