Oracle DRM引发的一次数据库重启
点击上方“IT那活儿”公众号--专注于企业全栈运维技术分享,不管IT什么活儿,干就完了!!!
背景描述
某天,某库两节点实例先后发生重启,实例重启前alter日志同时出现IPC Send timeout detected IPC超时。
版本信息:- 操作系统:AIX 7100-04-07-1845(SP07)
数据库版本:oracle 11.2.0.4.0 两节点RAC
- 23:24:48节点2 LMS进程终止了自己的实例,随后节点1 在23:24:58由PMON进程终止了自己的实例;
- 数据库alert 首先出现IPC Send timeout,IPC超时,随后节点2被驱逐,节点1也终止自己的实例。
- Lmon 通知所有实例,准备进行remastering。
- 在旧的master实例清除对应buffer的master信息。
- 将master信息传递给新的master实例。
- 在新的master实例构建资源的最新状态。
- 结束,并释放所有之前所有步骤占用的资源。
- 该特性的设计初衷是为了降低跨节点频繁访问需求,通过更改所访问资源的master node。
- DRM freeze 可能会导致系统hang住。