现在的位置: 首页 > 综合 > 正文

这个诡异的RAC宕机

2012年07月15日 ⁄ 综合 ⁄ 共 1861字 ⁄ 字号 评论关闭
又遇到RAC宕机,特别的诡异,只所以诡异叻,是因为实在是没有很有价值的错误日志可以进行参考。

首先系统日志,没有任何有关系统的异常,crs信息,也是一切OK。

不过在ocssd.log里看到crs出错后,dump出来的信息。

在dump之前有一个提示

from con(d940a0) proc(d89310) pid() proto(10:2:1:1)

[ CSSD]2010-04-05 22:20:32.702 [9] >TRACE:
clssgmClientConnectMsg: Connect

from con(d940a0) proc(d89310) pid() proto(10:2:1:1)

[ CSSD]2010-04-05 22:20:51.766 [9] >TRACE:
clssgmClientConnectMsg: Connect

from con(d940a0) proc(d89310) pid() proto(10:2:1:1)

[ CSSD]2010-04-05 22:21:52.739 [9] >TRACE:
clssgmClientConnectMsg: Connect

from con(d940a0) proc(d89310) pid() proto(10:2:1:1)

[ CSSD]2010-04-05 22:22:53.694 [9] >TRACE:
clssgmClientConnectMsg: Connect

from con(d940a0) proc(d89310) pid() proto(10:2:1:1)

[ CSSD]2010-04-05 22:23:35.734 [9] >TRACE:
clssgmClientConnectMsg: Connect

from con(d940a0) proc(d89310) pid() proto(10:2:1:1)

[ CSSD]2010-04-05 22:23:36.129 [9] >TRACE:
clssgmClientConnectMsg: Connect

from con(d92eb0) proc(d933c0) pid() proto(10:2:1:1)

[ CSSD]2010-04-05 22:23:54.664 [9] >TRACE:
clssgmClientConnectMsg: Connect

from con(d940a0) proc(d89310) pid() proto(10:2:1:1)

[ CSSD]2010-04-05 22:25:55.550 [6] >WARNING: clssnmDPT:
timeout waiting on l

ock (67244 ms/61000 ms)

[ CSSD]2010-04-05 22:25:59.085 [7] >ERROR: clssnmDiskPMT: 1
of 1 voting di

sks unavailable (0/0/1)

[ CSSD]2010-04-05 22:26:00.736 [13] >TRACE:
clssnmPollingThread: node rac1

(1) missed(2) checkin(s)

[ CSSD]2010-04-05 22:26:03.321 [7] >TRACE: clssscctx: dump of
0×51c950, l

en 3792

[ CSSD]2010-04-05 22:26:03.692 [7] >TRACE: 0×51c950 e0 fe 85
00 00 00 00 0

0 - a0 89 7e 00 00 00 00 00 ……….~…..

不过检查votedisk又一切正常,不过在宕机的时候,程序的负载很大,

尝试着修改了misscount,还是有宕机的情况出现。

查看了有关css的一些文档,最后修改其中的priority的参数,

$crsctl get css priority

Configuration parameter priority is not defined.

$crsctl set css priority 4

Configuration parameter priority is now set to 4.

宕机现象消失。不过不知道以后还会不会出现,会不知道会不会带来其他什么样的后果,先记下了。

抱歉!评论已关闭.