renay****@ybb*****
renay****@ybb*****
2009年 2月 25日 (水) 03:29:30 JST
こんにちは、メイトリックスの山内といいます。 私も何度かVMWare上でCentOSで構築していますが、あまりうまくいかないケースに遭遇した事がありません。 伺った環境では、ping,sshでの疎通は可能とのことですが、Heartbeatで通信をしているポート:694による通信 は可能になっておりますでしょうか? tcpdumpなどのコマンドを使って、ポート:694の通信状態を確認してみるのも良いかと思います。 以上、よろしくお願いいたします。 --- Tatsuo Indou <tatsu****@mtb*****> wrote: > お世話になります。 > > VMware上で、CentOS5.2、heartbeatをインストールしました。仮想環境上で、二 > 代のサーバを作成し、hertbeatを試してみようと考えています。 > > /etc/ha.d/ha.cfと/etc/ha.d/authkeysを作成し、heartbeatを両系で実行しました。 > しばらくの後、hb_monitor を実行してみると、以下のような状態です。 > > ■CentOS523(正系) > ============ > Last updated: Wed Feb 25 02:39:50 2009 > Current DC: NONE > 1 Nodes configured. > 0 Resources configured. > ============ > Node: centos523.tsystem.gr.jp (8be21ed6-2d24-6752-ccad-83ddfe59ae12): > online > > ■CentOS524(副系) > ============ > Last updated: Wed Feb 25 02:37:58 2009 > Current DC: NONE > 1 Nodes configured. > 0 Resources configured. > ============ > Node: centos524.tsystem.gr.jp (939d5b4d-bc3b-60ec-e72f-f04d3ef1b5d4): > online > > リソースはまだ定義していません。このときでも、ha.cfに書かれているNodeが > 両方ともonlineになると認識しているですが、片側が出力されませんでした。 > > また、Current DCはどちらも、monitorを実行したホストとなってしまいます。 > hb_monitor -e -i 1 -nにより詳細を表示してみると、 > いずれもオンライン側には、 > === FAIL-COUNT === > === INSTANCE-ATTRIBUTES === > attribute (probe_complete:true) > === INTERCONNECT-LAN === > heartbeat-comm (eth1:dead): Heartbeat is failure !! > のメッセージが出ています。 > ネットワークに問題があると思われ、ifconfigを実行してみますと、eth0(通常 > LAN(ブリッジ))、eth1(ハートビート用LAN(ホストオンリー))のいずれも動作し > ていると思われます。 > > 互いに、逆側のホストのeth1のIPアドレスにpingは通りますし、sshによる逆側 > のホストのeth1のIPアドレスへのログインも可能です。 > ha.cf内で、debugを指定したファイル、またログファイルには、 > WARN: node 逆のノード: is dead > と出ています。逆のノードへの通信がうまくいっていないように思えます。 > ha.cf内の、bcast eth1を、ucast eth1 逆側のホストのeth1のIPアドレス と指 > 定しても同様でした。 > > 初回に動作させたのち、/var/lib/heartbeat/crm/cib.xmlが作成されていました > ので、<nodes></nodes>の間に、逆側のnodeをコピーして追記しました。 > その時には、crm_mon、hb_monitorともNodeの欄には定義したnodeは出ますが、 > 通信ができていないようですので、OFFLINEのままです。 > > Node: centos524.tsystem.gr.jp (939d5b4d-bc3b-60ec-e72f-f04d3ef1b5d4): > OFFLINE > Node: centos523.tsystem.gr.jp (8be21ed6-2d24-6752-ccad-83ddfe59ae12): > OFFLINE > > eth1経由での通信が正しく動作していないようなのですが、どのようの対応すれ > ば良いのでしょうか。 > 私は、ifconfigでeth1が、UPと表示さること。 > 逆側のeth1へのpingと、ssh接続で正しくネットワークは動作していると考えて > いました。 > そのため、対処方法が思いつかない状態です。どなたか、お気づきの点ありまし > たら、ご指摘していただけませんか。よろしくお願いします。 > > ■各ソフトのバージョンです。 > > ホストOS > Windows Vista SP1 > > VMware > VMware Workstation 6.0.5 build-109488 > OS > CentOS 5.2 x86_64 > > heartbeat > heartbeat-2.1.4-1 > heartbeat-gui-2.1.4-1 > > ■定義ファイルの内容です。 > # cat /etc/ha.d/ha.cf # 両系とも同様のファイルです。 > crm on > debugfile /var/log/ha-debug > logfile /var/log/ha-log > logfacility local0 > keepalive 3 > deadtime 30 > deadping 40 > warntime 10 > initdead 60 > udpport 694 > auto_failback on > bcast eth1 > node CentOS523 > node CentOS524 > respawn hacluster /usr/lib64/heartbeat/pingd -m 100 -d 5s -a > default_ping_set > uuidfrom nodename > ping 192.168.2.193 > > > # cat /etc/ha.d/authkeys > auth 1 > 1 sha1 Hello! > > ■ha-logです。 > 090225 024431:root @ CentOS523:crm# sed -n "5533,\$p" /var/log/ha-log > heartbeat[3853]: 2009/02/25_02:34:12 info: ************************** > heartbeat[3853]: 2009/02/25_02:34:12 info: Configuration validated. > Starting heartbeat 2.1.4 > heartbeat[3854]: 2009/02/25_02:34:12 info: heartbeat: version 2.1.4 > heartbeat[3854]: 2009/02/25_02:34:12 info: Heartbeat generation: 1235230397 > heartbeat[3854]: 2009/02/25_02:34:12 info: seed is -2044534694 > heartbeat[3854]: 2009/02/25_02:34:12 info: glib: UDP Broadcast heartbeat > started on port 694 (694) interface eth1 > heartbeat[3854]: 2009/02/25_02:34:12 info: glib: UDP Broadcast heartbeat > closed on port 694 interface eth1 - Status: 1 > heartbeat[3854]: 2009/02/25_02:34:12 info: glib: ping heartbeat started. > heartbeat[3854]: 2009/02/25_02:34:12 info: G_main_add_TriggerHandler: > Added signal manual handler > heartbeat[3854]: 2009/02/25_02:34:12 info: G_main_add_TriggerHandler: > Added signal manual handler > heartbeat[3854]: 2009/02/25_02:34:12 info: G_main_add_SignalHandler: > Added signal handler for signal 17 > heartbeat[3854]: 2009/02/25_02:34:12 info: Local status now set to: 'up' > heartbeat[3854]: 2009/02/25_02:34:13 info: Link > 192.168.2.193:192.168.2.193 up. > heartbeat[3854]: 2009/02/25_02:34:13 info: Status update for node > 192.168.2.193: status ping > heartbeat[3854]: 2009/02/25_02:39:35 WARN: node centos524: is dead > heartbeat[3854]: 2009/02/25_02:39:35 info: Comm_now_up(): updating > status to active > heartbeat[3854]: 2009/02/25_02:39:35 info: Local status now set to: 'active' > heartbeat[3854]: 2009/02/25_02:39:35 info: Starting child client > "/usr/lib64/heartbeat/ccm" (498,496) > heartbeat[3854]: 2009/02/25_02:39:35 info: Starting child client > "/usr/lib64/heartbeat/cib" (498,496) > heartbeat[3854]: 2009/02/25_02:39:35 info: Starting child client > "/usr/lib64/heartbeat/lrmd -r" (0,0) > heartbeat[3854]: 2009/02/25_02:39:35 info: Starting child client > "/usr/lib64/heartbeat/stonithd" (0,0) > heartbeat[3854]: 2009/02/25_02:39:35 info: Starting child client > "/usr/lib64/heartbeat/attrd" (498,496) > heartbeat[3854]: 2009/02/25_02:39:35 info: Starting child client > "/usr/lib64/heartbeat/crmd" (498,496) > heartbeat[3854]: 2009/02/25_02:39:35 info: Starting child client > "/usr/lib64/heartbeat/mgmtd -v" (0,0) > heartbeat[3854]: 2009/02/25_02:39:35 info: Starting child client > "/usr/lib64/heartbeat/pingd -m 100 -d 5s -a default_ping_set" (498,496) > heartbeat[3914]: 2009/02/25_02:39:35 info: Starting > "/usr/lib64/heartbeat/ccm" as uid 498 gid 496 (pid 3914) > heartbeat[3915]: 2009/02/25_02:39:35 info: Starting > "/usr/lib64/heartbeat/cib" as uid 498 gid 496 (pid 3915) > heartbeat[3916]: 2009/02/25_02:39:35 info: Starting > "/usr/lib64/heartbeat/lrmd -r" as uid 0 gid 0 (pid 3916) > heartbeat[3917]: 2009/02/25_02:39:35 info: Starting > "/usr/lib64/heartbeat/stonithd" as uid 0 gid 0 (pid 3917) > heartbeat[3918]: 2009/02/25_02:39:35 info: Starting > "/usr/lib64/heartbeat/attrd" as uid 498 gid 496 (pid 3918) > heartbeat[3919]: 2009/02/25_02:39:36 info: Starting > "/usr/lib64/heartbeat/crmd" as uid 498 gid 496 (pid 3919) > heartbeat[3921]: 2009/02/25_02:39:36 info: Starting > "/usr/lib64/heartbeat/pingd -m 100 -d 5s -a default_ping_set" as uid 498 > gid 496 (pid 3921) > heartbeat[3920]: 2009/02/25_02:39:36 info: Starting > "/usr/lib64/heartbeat/mgmtd -v" as uid 0 gid 0 (pid 3920) > cib[3915]: 2009/02/25_02:39:36 info: G_main_add_SignalHandler: Added > signal handler for signal 15 > lrmd[3916]: 2009/02/25_02:39:36 info: G_main_add_SignalHandler: Added > signal handler for signal 15 > stonithd[3917]: 2009/02/25_02:39:36 info: G_main_add_SignalHandler: > Added signal handler for signal 10 > attrd[3918]: 2009/02/25_02:39:36 info: G_main_add_SignalHandler: Added > signal handler for signal 15 > ccm[3914]: 2009/02/25_02:39:36 info: Hostname: centos523 > crmd[3919]: 2009/02/25_02:39:36 info: main: CRM Hg Version: fb84f606a422 tip > > pingd[3921]: 2009/02/25_02:39:36 info: Invoked: > /usr/lib64/heartbeat/pingd -m 100 -d 5s -a default_ping_set > mgmtd[3920]: 2009/02/25_02:39:36 info: G_main_add_SignalHandler: Added > signal handler for signal 15 > cib[3915]: 2009/02/25_02:39:36 info: G_main_add_TriggerHandler: Added > signal manual handler > lrmd[3916]: 2009/02/25_02:39:36 info: G_main_add_SignalHandler: Added > signal handler for signal 17 > stonithd[3917]: 2009/02/25_02:39:36 info: G_main_add_SignalHandler: > Added signal handler for signal 12 > attrd[3918]: 2009/02/25_02:39:36 info: register_with_ha: Hostname: centos523 > crmd[3919]: 2009/02/25_02:39:36 info: crmd_init: Starting crmd > cib[3915]: 2009/02/25_02:39:36 info: G_main_add_SignalHandler: Added > signal handler for signal 17 > lrmd[3916]: 2009/02/25_02:39:36 info: G_main_add_SignalHandler: Added > signal handler for signal 10 > stonithd[3917]: 2009/02/25_02:39:36 info: Signing in with heartbeat. > crmd[3919]: 2009/02/25_02:39:36 info: G_main_add_SignalHandler: Added > signal handler for signal 15 > === 以下のメッセージは省略されました ===