[Linux-ha-jp] pacemaker(heartbeat)の切り替えがうまく動作しない件について

Back to archive index

岩崎@サード 岩崎@サード
2011年 5月 17日 (火) 09:18:05 JST


 岩崎@サードウェアです

 OpenVZいいですねー。
 DRBDがSecondaryからPrimaryに出来ない理由について、ログが見あたらなかったものでよくわからないのですがいくつかパターンがあるので確認してみてはいかがでしょうか。

 ・Primary側が落とせないプロセスがDRBDのマウントポイントを掴んでいる時(8.3.4だともしかするとシェルでログインしてるだけでも駄目)
 ・OutDatedステータスになっている。(スプリットブレイン発生を防ぐ安全装置)
 ・メタデータ領域が壊れている。(ほぼ無いですが外部メタデータにしててうっかりDDで消したりするとアクセスできなったり)

 多くの場合が、相手側ノードのPrimaryをSecondary状態に降格できない時にSecondaryからPrimaryに昇格できない症状が出ます。
 今回の場合、リブートしてしまった時に起きているという事なので、OutDated状態になっていてフェイルオーバーできずにいて、
 セカンダリノードが上がったときにDRBDも立ち上がり、再接続することでステータスが正常化してしまっている可能性があります。

 これが試験環境であれば、sysrq-triggerを使って再起動を行い正常に再起動されるかの確認をすると状況を再現できるかと思います。
 あと、chkconfigでheartbeatとDRBDはoffにしておいたほうが良いです。
 この2つは中途半端な状態で上がられると困るものなので、落ちたなら安全が確認できるまで上がってくれないほうが良いものになります。

 # OpenVZのリソースエージェントに興味津々(実は私もコンテナ単位でF/OできるRAを作ってます)


 On Mon, 16 May 2011 10:52:52 +0900, nemo****@zuku***** wrote:
> 根本と申します。
>
> 4/30にDRBD+pacemakerで構成していたサーバの片方が
> 謎のリブートをした時に、サービスがうまく切り替わ
> らない問題が発生しました。現在原因を調査しており
> ますが、原因が掴めておりません。
>
> [環境]
> OS : CentOS 5.6
> ※ 正確には、Openvz Kernelです。
> # uname -a
> Linux 02a.ss.jp 2.6.18-194.26.1.el5.028stab079.2 #1 SMP Fri Jan 28
> 20:28:13 JST 2011 x86_64 x86_64 x86_64 GNU/Linux)
>
> 構成:姉妹構成(2台構成)
> pacemaker-1.0.10-1.4.el5(Linux-HA Japan提供)
> DRBD領域を2つ用意して、お互いがPrimary且つSecondaryにしています。
>
> 02aから見た/proc/drbd
> [root @ 02a ~]# cat /proc/drbd
> version: 8.3.4 (api:88/proto:86-91)
> GIT-hash: 70a645ae080411c87b4482a135847d69dc90a6a2 build by
> xemul****@ovzco*****, 2009-10-12 19:29:01
>
>  1: cs:Connected ro:Primary/Secondary ds:UpToDate/UpToDate C r----
>     ns:1138230316 nr:0 dw:912902096 dr:411045257 al:2333158 bm:118286
> lo:0 pe:0 ua:0 ap:0 ep:1 wo:b oos:0
>  2: cs:Connected ro:Secondary/Primary ds:UpToDate/UpToDate C r----
>     ns:687291028 nr:0 dw:339801384 dr:409325753 al:17077 bm:29038
> lo:0 pe:0 ua:0 ap:0 ep:1 wo:b oos:0
>
> /dev/drbd1 が /vz1 として
> /dev/drbd2 が /vz2 としてマウントしてます。
>
> ログを見る限り、DRBDをSecondaryからPrimaryするところでこけている感じがするのですが
> それ以上の原因がよくわかりません。そのときのログを添付しますので、ご意見を頂ければと思います。
> なお、ログ内の res_vps1 と res_vps2は、Openvzの起動、停止用に自作したリソース・エージェントです。
>
> 第二回勉強会の準備などで忙しい方々もいらっしゃると思いますが、よろしくお願い致します。。
> また、勉強会は私も参加させて頂ければと思います。
>
>
> 不明点などがあれば、ご指摘頂下さい。
> 以上、よろしくお願い致します。
>
>
>
>
> 根本 稔也
> ----
> nemo****@zuku*****
> ----

-- 
 ----------------------------------------------------------------------
 岩崎  登               (株)サードウェア

 Noboru Iwasaki           274-0815 千葉県船橋市西習志野3-39-8
 iwasa****@3ware*****      URL: http://www.3ware.co.jp/
 Phone: 047-496-3341      Fax: 047-496-3370





Linux-ha-japan メーリングリストの案内
Back to archive index