H.Nakai
nakai****@shink*****
2011年 7月 26日 (火) 15:56:47 JST
初めまして、中井です。 CentOS 5.5上でWebアプリケーションサーバを構築しました。 DRBD 8.3.8 + HeartBeat 3.0.3です。 正常にsecondary->primaryの昇格や復帰時の自動同期等が行われています。 素晴らしい! 問題は、primaryもsecondaryも落とした後、前回primaryだったサーバが 故障のため起動しなかったときを想定して、前回secondaryだったサーバのみを 起動したときです。当然なのかどうかsecondaryは起動しません。 DRBDのレベルで止まってしまいます。 DRBDの状態は、下記のようになっています。 cs:WFConnection ro:Secondary/Unknown ds:Outdated/DUnknown そこで、次のコマンドを実行しました。 drbdadm -- --overwrite--data-of-peer primary r0 これで、強制的にprimaryになるのですが、/dev/drbd0をマウントできません でした。原因は、ファイルシステムが不完全なためです。 fsckを実行してファイルシステムを修復し、heartbeatを再起動して 初めてリソースが正常に起動します。但し、一部のデータが失われています。 どうもsecondaryを停止するときに、同期が不十分なままで停止したように 見受けられます。フェンシングの設定はしていません。 どうすればいいでしょうか。 前回primaryだったサーバを単独で起動すると、正常にサービスが起動します。 その後にsecondaryだったサーバを起動すると、正常に同期を取り、secondary として正常に動作します。 二つのサーバは、Webサービス提供用のLANとデータ同期等用のLANの二回線の LANだけで繋がっています。予備のシリアル回線等はつながっていません。 宜しくお願いします。 -- -=-=-=-= SHINKO ELECTRIC INDUSTRIES CO., LTD. =-=-=-=- =-=-=-=- Research & Development Div. -=-=-=-= -=-=-=-= Designing Technology Development Dept. =-=-=-=- =-=-=-=- Name:Hisakazu Nakai TEL:026-263-3922 -=-=-=-= -=-=-=-= Mail:nakai****@shink***** FAX:026-263-4562 =-=-=-=-