我在集群中有四个节点,我需要对其进行同步。当节点BRJGSD309173尝试通过JGROUPs向BRJGSD333007发送消息时,服务器BRJGSD333007通知了以下消息:


  11:34:07,759警告[org.jgroups.protocols.pbcast.NAKACK](传入2,maestroCacheManager,BRJGSD333007-24075)BRJGSD333007-24075:从BRJGSD309173-7667丢弃了消息4787(发件人不在表[BRJGSD333007-24075]中) ,查看= [BRJGSD333007-24075 | 0] [BRJGSD333007-24075]


eh jgroups_tcp.xml的以下配置

<?xml version='1.0'?>
 <config>
     <TCP bind_port="7800"
          max_bundle_size="5M" />
     <TCPPING timeout="3000"
              initial_hosts="brjgsm10.weg.net[7800],brjgsm11.weg.net[7800],brjgsd309173.weg.net[7800],brjgsd333007.weg.net[7800]"
              port_range="10"
              num_initial_members="5"/>
     <VERIFY_SUSPECT timeout="1500"  />
     <pbcast.NAKACK use_mcast_xmit="false"
                    retransmit_timeout="300,600,1200,2400,4800"
                discard_delivered_msgs="true"/>
     <pbcast.STABLE stability_delay="1000" desired_avg_gossip="50000" max_bytes="400000"/>
     <pbcast.GMS print_local_addr="true" join_timeout="5000" view_bundling="true"/>
 </config>


还有ehcache.xml的一个片段

<ehcache xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance"
    updateCheck="false" xsi:noNamespaceSchemaLocation="ehcache.xsd" name="maestroCacheManager">
...
    <cache
        name="objectServiceExecute"
        maxEntriesLocalHeap="100000"
        eternal="false" >
        <cacheEventListenerFactory
              class="net.sf.ehcache.distribution.jgroups.JGroupsCacheReplicatorFactory"
              properties="replicateAsynchronously=true, replicatePuts=true,
              replicateUpdates=true, replicateUpdatesViaCopy=true, replicateRemovals=true" />
    </cache>

    <diskStore
        path="java.io.tmpdir/ehcache" />

    <cacheManagerPeerProviderFactory
        class="net.sf.ehcache.distribution.jgroups.JGroupsCacheManagerPeerProviderFactory"
        properties="file=jgroups_tcp.xml"
        propertySeparator=";"
    />

    <cache
        name="org.hibernate.cache.internal.StandardQueryCache"
        maxElementsInMemory="10000000"
        eternal="true"
        memoryStoreEvictionPolicy="LRU" />

    <defaultCache
        maxElementsInMemory="10000000"
        eternal="true"
        memoryStoreEvictionPolicy="LRU" >
        <cacheEventListenerFactory
              class="net.sf.ehcache.distribution.jgroups.JGroupsCacheReplicatorFactory"
              properties="replicateAsynchronously=true, replicatePuts=true,
              replicateUpdates=true, replicateUpdatesViaCopy=true, replicateRemovals=true" />
    </defaultCache>

</ehcache>

最佳答案

这是一个非常坚固的JGroups配置!您缺少故障检测协议,UNICAST3MERFGE3等!

上面的错误意味着您收到的消息不是来自集群中的成员,因此已被删除。为什么成员不在群集中的原因尚不清楚,也许它没有正确加入。由于您没有任何故障检测协议,因此不会被怀疑和驱逐出该协议。

我建议复制JGroups随附的tcp.xml,并用TCPPING配置替换TCPPING。另外,还要确保在bind_addr中设置了TCP,以确保JGroups绑定到正确的接口。

希望这可以帮助,
干杯

10-08 10:54