[Linux-ha-jp] sfexによる共有ディスクの排他制御について

Back to archive index

john john johna****@hotma*****
2010年 12月 19日 (日) 02:45:52 JST


齊藤と申します。

2台のESXi上にそれぞれ1つずつゲストOSを稼働させています。
それぞれ、serverAとserverB。
OSはCentOS 5.5 x64で、本日時点で最新のパッチ適用済みです。
MySQLのデータベースを共有ディスクに配置しています。
sfexを使って共有ディスクの排他制御を実現していて、ハートビートセグメントを切断しても排他制御が動作し、スプリットブレインが起きないことを確認しました。

serverBがActiveな状態の時に、ハートビートセグメントを停止した際に、crm_monでモニタリングしていると、以下のようなエラーが出てserverAでリソースが起動しない事を確認しました。
しかし、その後ハートビートセグメントを復旧させて、serverBを/etc/init.d/corosync stopで停止させても同じエラーが表示されたままでserverAにフェイルオーバしませんでした。

Failed actions:
    Disk-HB_start_0 (node=serverA, call=9, rc=1, status=complete): unknown error

serverAで/etc/init.d/corosync stopで停止した後、/etc/init.d/corosync startで起動させる事で、Failed actionsが消え、フェイルオーバできる状態になりました。


4点質問がございます。

1.リソースグループをフェイルオーバさせる手順はありますか?
今は、フェイルオーバさせたいサーバで/etc/init.d/corosync stopで停止させてフェイルオーバさせています。
crm resource stopではリソースグループを指定できないようなので、困っています。

2.ハートビートセグメント切断後の正しい復旧手順は、/etc/init.d/corosyncの再起動以外にあるのでしょうか?

3.sfexを利用する前にsfex_init -n 1 /dev/sdb1でQuorum領域の初期化をしました。このようなsfex用のコマンドは他にあるのでしょうか?
Quorum領域に書き込まれている情報を表示するようなコマンドはないのでしょうか?

4.そもそも、スプリットブレイン対策でノードフェンシングという機能が存在していると思うのですが、今回のようにsfexで共有ディスクの排他制御を実現している場合は、STONITHは無効にしていても問題ないでしょうか?

以上、よろしくお願い致します。
 		 	   		  



Linux-ha-japan メーリングリストの案内
Back to archive index