[Linux-ha-jp] corosync+pacemakerでのwatchdog動作が不安定

Back to archive index

高瀬智大 tomoh****@kccs*****
2018年 9月 29日 (土) 16:18:33 JST


お世話になっております。

現在、corosync+pacemakerにてHA構成を組んでおります。

corosyncプロセスをKILL(コマンド「kill -9
プロセスID」)した際に切り替わる事+watchdogが動作し、OS再起動が発生する事を確認したいのですが、
うまく動作していない状況です。

何か情報があればご教示ください。

環境、詳細な事象は以下となります。

【使用ソフト】
CentOS 6.9 64bit
Pacemaker 1.1.16-1
pacemaker-repo 1.1.16-1.1
corosync 2.4.2-1

【構成】
2台でHA構成のActive-Standby構成

【事象】
①corosyncプロセスをKILLした際に切替が発生しない。
→Standby側にてVIPCheckが失敗し、その後の切替処理が止まってしまう。
この後にActive側にてwatchdogが動作しOS再起動され切替が発生する想定だったが、以下②の事象が発生し
OS再起動がされない。

②corosyncをKILLしたが、以下エラーメッセージが出力され、watchdogが動作しない。
----------
hostname stonith-ng:    error: pcmk_cpg_dispatch: Connection to the CPG API
failed: Library error (2)
hostname stonith-ng:    error: stonith_peer_cs_destroy: Corosync connection
terminated
hostname pacemakerd:    error: pcmk_cpg_dispatch: Connection to the CPG API
failed: Library error (2)
hostname  pacemakerd:    error: mcp_cpg_destroy: Connection destroyed
hostname       crmd:    error: crmd_quorum_destroy: connection terminated
hostname         cib:    error: pcmk_cpg_dispatch: Connection to the CPG
API failed: Library error (2)
hostname         cib:    error: cib_cs_destroy: Corosync connection lost!
Exiting.
hostname       attrd:    error: pcmk_cpg_dispatch: Connection to the CPG
API failed: Library error (2)
----------

以上、よろしくお願い致します。
-------------- next part --------------
HTML$B$NE:IU%U%!%$%k$rJ]4I$7$^$7$?(B...
URL: https://lists.osdn.me/mailman/archives/linux-ha-japan/attachments/20180929/200f02a3/attachment.htm 



Linux-ha-japan メーリングリストの案内
Back to archive index