[Linux-ha-jp] sfexによる共有ディスクの排他制御について

Back to archive index

matsuo matsu****@gmail*****
2010年 12月 20日 (月) 10:26:16 JST


斎藤さん

松尾です

>
> 4点質問がございます。
>
> 1.リソースグループをフェイルオーバさせる手順はありますか?
> 今は、フェイルオーバさせたいサーバで/etc/init.d/corosync stopで停止させてフェイルオーバさせています。
> crm resource stopではリソースグループを指定できないようなので、困っています。

一度faild_actionsをクリアしないと、serverAにはフェイルオーバできません。
crm_resource コマンドでクリア可能です。

#  crm_resource -C -r リソースID -N ノード名

crm コマンドのインタフェースでも以下で可能です。(私はいつも上の方法でやっているので未確認ですが。)

 # crm resource cleanup リソースID ノード名

> 2.ハートビートセグメント切断後の正しい復旧手順は、/etc/init.d/corosyncの再起動以外にあるのでしょうか?

上記の方法を使えば、再起動までする必要はないかもしれませんが、
今のところ、念のため再起動した方がよいかもしれません。

> 3.sfexを利用する前にsfex_init -n 1 /dev/sdb1でQuorum領域の初期化をしました。このようなsfex用のコマンドは他にあるのでしょうか?
> Quorum領域に書き込まれている情報を表示するようなコマンドはないのでしょうか?
>
> 4.そもそも、スプリットブレイン対策でノードフェンシングという機能が存在していると思うのですが、今回のようにsfexで共有ディスクの排他制御を実現している場合は、STONITHは無効にしていても問題ないでしょうか?

無効にしてもsfexでデータの整合性は保つことができると思いますが、
リソースのSTOPに失敗したような場合、保守者が手動で復旧する必要がでてきますので、
その分サービス継続性は低くなってしまいます。
そのためSTONITHを使うのを推奨します。



Linux-ha-japan メーリングリストの案内
Back to archive index