我在集群中有四个节点,我需要对其进行同步。当节点BRJGSD309173尝试通过JGROUPs向BRJGSD333007发送消息时,服务器BRJGSD333007通知了以下消息:
11:34:07,759警告[org.jgroups.protocols.pbcast.NAKACK](传入2,maestroCacheManager,BRJGSD333007-24075)BRJGSD333007-24075:从BRJGSD309173-7667丢弃了消息4787(发件人不在表[BRJGSD333007-24075]中) ,查看= [BRJGSD333007-24075 | 0] [BRJGSD333007-24075]
eh jgroups_tcp.xml的以下配置
<?xml version='1.0'?>
<config>
<TCP bind_port="7800"
max_bundle_size="5M" />
<TCPPING timeout="3000"
initial_hosts="brjgsm10.weg.net[7800],brjgsm11.weg.net[7800],brjgsd309173.weg.net[7800],brjgsd333007.weg.net[7800]"
port_range="10"
num_initial_members="5"/>
<VERIFY_SUSPECT timeout="1500" />
<pbcast.NAKACK use_mcast_xmit="false"
retransmit_timeout="300,600,1200,2400,4800"
discard_delivered_msgs="true"/>
<pbcast.STABLE stability_delay="1000" desired_avg_gossip="50000" max_bytes="400000"/>
<pbcast.GMS print_local_addr="true" join_timeout="5000" view_bundling="true"/>
</config>
还有ehcache.xml的一个片段
<ehcache xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance"
updateCheck="false" xsi:noNamespaceSchemaLocation="ehcache.xsd" name="maestroCacheManager">
...
<cache
name="objectServiceExecute"
maxEntriesLocalHeap="100000"
eternal="false" >
<cacheEventListenerFactory
class="net.sf.ehcache.distribution.jgroups.JGroupsCacheReplicatorFactory"
properties="replicateAsynchronously=true, replicatePuts=true,
replicateUpdates=true, replicateUpdatesViaCopy=true, replicateRemovals=true" />
</cache>
<diskStore
path="java.io.tmpdir/ehcache" />
<cacheManagerPeerProviderFactory
class="net.sf.ehcache.distribution.jgroups.JGroupsCacheManagerPeerProviderFactory"
properties="file=jgroups_tcp.xml"
propertySeparator=";"
/>
<cache
name="org.hibernate.cache.internal.StandardQueryCache"
maxElementsInMemory="10000000"
eternal="true"
memoryStoreEvictionPolicy="LRU" />
<defaultCache
maxElementsInMemory="10000000"
eternal="true"
memoryStoreEvictionPolicy="LRU" >
<cacheEventListenerFactory
class="net.sf.ehcache.distribution.jgroups.JGroupsCacheReplicatorFactory"
properties="replicateAsynchronously=true, replicatePuts=true,
replicateUpdates=true, replicateUpdatesViaCopy=true, replicateRemovals=true" />
</defaultCache>
</ehcache>
最佳答案
这是一个非常坚固的JGroups配置!您缺少故障检测协议,UNICAST3
和MERFGE3
等!
上面的错误意味着您收到的消息不是来自集群中的成员,因此已被删除。为什么成员不在群集中的原因尚不清楚,也许它没有正确加入。由于您没有任何故障检测协议,因此不会被怀疑和驱逐出该协议。
我建议复制JGroups随附的tcp.xml
,并用TCPPING
配置替换TCPPING
。另外,还要确保在bind_addr
中设置了TCP
,以确保JGroups绑定到正确的接口。
希望这可以帮助,
干杯