Takehiro Matsushima
takeh****@gmail*****
2015年 2月 10日 (火) 16:20:13 JST
北林 さん 松島です。詳細な情報をありがとうございます。 なかなか手ごわいですね。 私もよくわかっていない部分があるのでお恥ずかしいです。 パッとみたところでは問題はなさそうですが、エラーが > Failed actions: > tomcat_start_0 on second 'unknown error' (1): call=20, status=Timed Out, > last-rc-change='Tue Feb 10 10:49:55 2015', queued=0ms, exec=60002ms > tomcat_start_0 on first 'unknown error' (1): call=20, status=Timed Out, > last-rc-change='Tue Feb 10 11:00:04 2015', queued=0ms, exec=60002ms で"Timed Out"といっているので、Tomcatの起動に時間がかかっているのを Pacemakerが待ちきれなかったのだと思います。 試しに > primitive tomcat ocf:heartbeat:tomcat \ > params \ > java_home="/usr/lib/jvm/java-1.7.0-openjdk.x86_64" \←変更しました > catalina_home="/var/lib/tomcat" \ > tomcat_user="tomcat" \ > op start interval=0 timeout=60 on-fail="restart" \ > op stop interval=0 timeout=120 on-fail="ignore" \ > op monitor interval=10 timeout=30 on-fail="restart" の op start interval=0 timeout=60 on-fail="restart" \ を op start interval=0 timeout=120 on-fail="restart" \ としてみていかがでしょうか。 必要であればもうすこし長めにしたり、調整をしてみてください。 この時間の見積がTomcatの難しいところだと思います。 > 3.# crm_mon -fAD1 > > (出力結果) > online: [ first second ] > > Resource Group: web-group > vipcheck (ocf::heartbeat:VIPcheck): Started first > tomcat (ocf::heartbeat:tomcat): Stopped > apache (ocf::heartbeat:apache): Stopped > vip (ocf::heartbeat:IPaddr2): Stopped > > Node Attributes: > * Node first: > * Node second: > > Migration summary: > * Node second: > tomcat: migration-threshold=1 fail-count=1000000 last-failure='Tue > Feb 10 10:50:55 2015' > * Node first: > tomcat: migration-threshold=1 fail-count=1000000 last-failure='Tue > Feb 10 11:01:04 2015' > Failed actions: > tomcat_start_0 on second 'unknown error' (1): call=20, status=Timed Out, > last-rc-change='Tue Feb 10 10:49:55 2015', queued=0ms, exec=60002ms > tomcat_start_0 on first 'unknown error' (1): call=20, status=Timed Out, > last-rc-change='Tue Feb 10 11:00:04 2015', queued=0ms, exec=60002ms > > > > 以上です。 > tomcat,apache,vipも起動しないという状態になってしまいました。 これにつきましては、groupでひとまとめにしているので正しい動作です。 groupを定義した時の並びの、左から順に起動して、右から順に停止していきます。 加えて、グループ内のリソースたちがそれぞれ前段に依存する構成がつくられます。 従いまして、 1. vipcheckがsecondで起動する 2. tomcatをvipcheckが動いたsecondで起動しようとする 3. tomcatの起動が待ちきれずfailと判定する 4. firstがフェイルオーバー先として有効であると判断される 5. tomcatを停止する 6. vipcheckを停止する 7. vipcheckがfirstで起動する 8. tomcatをfirstで起動する 9. tomcatの起動がやはり待ちきれずfailと判定する 10. 妥当なフェイルオーバー先が無いと判定される 11. vipcheckを停止する理由がないのでそのままになる おおまかにこのような感じで処理が進められて、この状況が出来上がっていると推測します。 tomcatさえ動作すれば、ここはクリアできるはずです。 取り急ぎ、以上よろしくお願いいたします。 ---- Takehiro Matsushima