在aix 7105上安装oracle 10.2.0.5 rac,遇到了一个奇怪现象,执行完10.2.0.5的root102.sh后,发现原本两边都正常启动的crs服务,只能在一个节点上启动,另一个执行crsctl start crs后,执行crs_stat -t就会处于挂起状态,此时如果关闭正常节点上的crs,这个命令的结果立即输出,crs也正常起来,反之亦然,像极了压跷跷板。

诊断10g的crs,主要还是看相关日志,这种情况下直接去$CRS_HOME/log/目录下找alert.log和ocssd.log,发现一直报错:
CSS has not reached fatal mode.Registration is not yet safe.Retrying

当节点2正常启动crs后,节点1上的ocssd.log会提示:
memberNo(1) already assigned

嗯,很奇怪,没错就是bug。
1935738.1

压跷跷板一样,记一例crs集群启动现象-LMLPHP
压跷跷板一样,记一例crs集群启动现象-LMLPHP

注意,问题解决后,在接下来的打补丁过程中可能还会再出现,因为/etc/init.cssd会被还原。
因此,如果遇到crs不能同时启动,先看看 grep CLSOMON_ARGS /etc/init.cssd 的结果。

-mbrnum大小写敏感,否则在$CRS_HOME/log//cssd/oclsomon目录下的文件中会提示参数不对。

关于oclsomon的用途,请参考: https://blog.csdn.net/a743044559/article/details/78259350

09-07 22:46
查看更多