[Linux-ha-jp] stonith、ファイルシステム監視について

Back to archive index

renay****@yahoo***** renay****@yahoo*****
2014年 8月 28日 (木) 16:46:36 JST


久慈さん

こんにちは、山内です。

>>3.stonithについて
>>>上記構成1でsfexによる共有ディスクの排他制御を設定しています。
>>>この構成でstonithを設定する場合、ハートビートが切断時のどのような制御が可能になるのでしょうか。
>>>切断を検知したら即フェンシングが実行されるのでしょうか。
>>>それとも共有ディスクが生きていて排他制御により二重起動を防げている場合はフェンシングを実行しない、というようなことも可能なのでしょうか。
>>
>>
>>sfexでの排他がかかるのは、両ノードでsfexを起動した場合です。
>>よって、通常、ハートビート切断時は、設定されたstonithが実行されますので、sfexの制御のかからないことになります。
>>(よって、久慈さんの「切断を検知したら即フェンシング」が基本的には正しいです。
>>
>>ただし、stonith無の場合や、stonith-helperを使ってstonithの実行を判断させ不要となった場合には、stonithは実行
>>されずに、sfexが開始されますので、排他制御が掛かります。
>>
> stonithによりフェンシングされるのでsfexは関係ないということですね。
>sfexで排他制御がかかるのはstonithのフェンシングが失敗した時ですね。

厳密には、stonithのフェンシングが失敗するとフェンシングを繰り替え仕様(FO動作をしない)ですので、
フェンシングが成功(成功するはずがない)した場合です。
#今回の構成だと、フェンシング成功後にSTBでsfexが開始されますので....


>もし、stonithの設定に、stonith-helperを利用されていないのでしたら、利用されるようお願いいたします。
>>
>>利用されない場合、最悪の場合、PM1.0系では、ハートビート切断時にACT/STB間の落としあいが発生して両系再起動となる
>>可能性があります。
>ありがとうございます。
>現在、stonith-helper、meatwareの使用を想定して検証しています。
>linux-ha-japanさんの過去のOSCの資料を幾つか拝見し、なんとく理解が出来てきたところです。
>追加になってしまい申し訳ありませんが、stonithのプラグインで質問させて下さい。
>
>
>1.stonith-helperについて
>standby_check_commandでリソースのアクティブ/スタンバイを判定し、スタンバイはstandby_wait_timeの時間だけ
>
>待つということですが、もしアクティブ→スタンバイへのフェンシングが失敗した場合はstandby_wait_time経過後、
>スタンバイ→アクティブへのフェンシングが実行される認識でよろしいでしょうか。

はい。
現状、そのような動きになっているはずです。


>その場合、リソースが起動しているアクティブをフェンシングさせたくないとなった時に
>スタンバイ→アクティブへのフェンシングのみを実行させないことは可能でしょうか。

これを実現するstonith-helperとしては設定はありません。
かならず、指定したリソースの稼働状態を確認して

1)ACT->STBでSTONITH
2)standby_wait_time経過
3)STB->ACTでSTONITH

となりますので、1)が失敗して、3)が成功してしてしまうとFOになります。
standby_wait_timeを異常に長くのばせば、ACTからの次のSTONITHが実行されるので、一応似たようなことが出来ますが、
実際には、ACTノードダウンなどで、3)が成功してFOして欲しい場合にも、異常に長い時間待ってしまうことになりますので、
使えないと思います。

>2.stonith実行プラグインについて
>HPやIBMなどの各ベンダごとにstonith実行プラグイン存在するようですが、
>富士通製のPRIMERGY(iRMC)で実績のあるstonith実行プラグインはありますでしょうか。

こちらはどうでしょう?
私の方では、把握していません。


>3.meatwareについて
>stonith実行プラグインでのフェンシング失敗時にstonith-helper、stonith実行プラグイン、meatwareが
>ループし起動し続けてしまうため保守社介在によりstonithグループリソースを正常に停止させる、
>という認識でよろしいでしょうか。

そんな感じの機能ですが・・・
実際には、stonithを成功と見なす機能となっているはずです。
ですので、meatwareで制御後は、stonithは成功したとして動作を続けるはずです。

>
>"meatclient -c <ノード名>"を実行するのはmeatwareが起動しているタイミングじゃないと
>
>受け付けないのでしょうか。(リソースが遷移してstonith-helperや実行プラグインの時はNG?)

はい。そのはずです。
#すいません、最近、meatwareは触っていないです・・・・


>meatwareを使用しない場合、stonith実行プラグインのフェンシング失敗時に
>stonithリソースが起動しているため、heartbeatが停止出来ず、OS再起動ができないということが
>考えられますが、他にどのようなケースがありえるのでしょうか。

どうでしょう・・・・?

設定によっては、ACT故障時のSTBからのSTONITHが成功しないはずですので、その場合には、meatwareで
STONITHを成功させないと、FO出来ないと思います。


以上です。





Linux-ha-japan メーリングリストの案内
Back to archive index