[Linux-ha-jp] tomcatのリソース定義ファイル記述方法に関しまして

Back to archive index

Takehiro Matsushima takeh****@gmail*****
2015年 2月 10日 (火) 16:20:13 JST


北林 さん

松島です。詳細な情報をありがとうございます。
なかなか手ごわいですね。
私もよくわかっていない部分があるのでお恥ずかしいです。

パッとみたところでは問題はなさそうですが、エラーが
> Failed actions:
> tomcat_start_0 on second 'unknown error' (1): call=20, status=Timed Out,
> last-rc-change='Tue Feb 10 10:49:55 2015', queued=0ms, exec=60002ms
>     tomcat_start_0 on first 'unknown error' (1): call=20, status=Timed Out,
> last-rc-change='Tue Feb 10 11:00:04 2015', queued=0ms, exec=60002ms
で"Timed Out"といっているので、Tomcatの起動に時間がかかっているのを
Pacemakerが待ちきれなかったのだと思います。

試しに
> primitive tomcat ocf:heartbeat:tomcat \
>         params \
>                 java_home="/usr/lib/jvm/java-1.7.0-openjdk.x86_64" \←変更しました
>                 catalina_home="/var/lib/tomcat" \
>                 tomcat_user="tomcat" \
>         op start   interval=0  timeout=60  on-fail="restart" \
>         op stop    interval=0  timeout=120 on-fail="ignore" \
>         op monitor interval=10 timeout=30  on-fail="restart"
の
op start interval=0 timeout=60 on-fail="restart" \
を
op start interval=0 timeout=120 on-fail="restart" \
としてみていかがでしょうか。
必要であればもうすこし長めにしたり、調整をしてみてください。
この時間の見積がTomcatの難しいところだと思います。


> 3.# crm_mon -fAD1
>
> (出力結果)
> online: [ first second ]
>
>  Resource Group: web-group
>      vipcheck   (ocf::heartbeat:VIPcheck):      Started first
>      tomcat     (ocf::heartbeat:tomcat):        Stopped
>      apache     (ocf::heartbeat:apache):        Stopped
>      vip        (ocf::heartbeat:IPaddr2):       Stopped
>
> Node Attributes:
> * Node first:
> * Node second:
>
> Migration summary:
> * Node second:
>    tomcat: migration-threshold=1 fail-count=1000000 last-failure='Tue
> Feb 10 10:50:55 2015'
> * Node first:
>    tomcat: migration-threshold=1 fail-count=1000000 last-failure='Tue
> Feb 10 11:01:04 2015'
> Failed actions:
> tomcat_start_0 on second 'unknown error' (1): call=20, status=Timed Out,
> last-rc-change='Tue Feb 10 10:49:55 2015', queued=0ms, exec=60002ms
>     tomcat_start_0 on first 'unknown error' (1): call=20, status=Timed Out,
> last-rc-change='Tue Feb 10 11:00:04 2015', queued=0ms, exec=60002ms
>
>
>
> 以上です。
> tomcat,apache,vipも起動しないという状態になってしまいました。

これにつきましては、groupでひとまとめにしているので正しい動作です。
groupを定義した時の並びの、左から順に起動して、右から順に停止していきます。
加えて、グループ内のリソースたちがそれぞれ前段に依存する構成がつくられます。
従いまして、
1. vipcheckがsecondで起動する
2. tomcatをvipcheckが動いたsecondで起動しようとする
3. tomcatの起動が待ちきれずfailと判定する
4. firstがフェイルオーバー先として有効であると判断される
5. tomcatを停止する
6. vipcheckを停止する
7. vipcheckがfirstで起動する
8. tomcatをfirstで起動する
9. tomcatの起動がやはり待ちきれずfailと判定する
10. 妥当なフェイルオーバー先が無いと判定される
11. vipcheckを停止する理由がないのでそのままになる

おおまかにこのような感じで処理が進められて、この状況が出来上がっていると推測します。

tomcatさえ動作すれば、ここはクリアできるはずです。


取り急ぎ、以上よろしくお願いいたします。

----
Takehiro Matsushima



Linux-ha-japan メーリングリストの案内
Back to archive index