[Linux-ha-jp] 仮想IPだけがリソースの場合の同居・順序制約は必要か?

Back to archive index

momok****@mail***** momok****@mail*****
2015年 11月 11日 (水) 02:00:57 JST


広瀬です

山内さま、ご返答並びにわざわざの検証までして頂き、
ありがとうございます。
周りのHA環境が殆どPM+DRBD(MySQLなど)であるため、
colocation/orderの概念が必然的な感覚で捉えていた所
にあったのかもしれません。

3つある制約--今回の場合は同居と順序ですが--は
必ずしも必要である訳では無いという概念は分かって居
るつもりでしたが、あまり深く考えて作り込みをした事
がありませんでした。

orderに関して言えば、先に書いた通りですが起動時点の
何らかの問題によるリソース故障の回避という繋がりは
あり得るだろうと推察はしていましたので、運用面でどう
考えるかだけかと思いますので、検討したいと思います


この度はありがとうございました。

renay****@ybb*****さん:
> 広瀬さん
> 
> こんばんは、山内です。
> 
> 手元の環境ですが、早速、確認してみました。
> 
> 失礼しました。
> 私の方のPM1.1確認時の、CLIファイルの設定ミスですね。
> 
> ### Resource Location ###
> location rsc_location-prmDummy-1 prmDummy \
>         rule 200: #uname eq xxxx-01 \
>         rule 100: #uname eq xxxx-02 \
>         rule -inf: not_defined disk_chk or disk_chk eq ERROR
> 
> (↑-infが抜けていました。すいません。)
> 
> 
> PM1.1、PM1.0共にdiskdのプロセス故障でもFOしますね。
> 
> pingd/diskdと単純なリソースの組み合わせであれば、locationルールでpingd/diskd故障検知のFOが実現出来
るので、
> colocationは不要だと思います。
> 
> orderルールは設定によっては、orderを組んだリソース故障によってrestartが実現出来ますが、これらの動作
が不要であれば
> 起動が完了してからの監視という観点から言えば、不要かと思います。
> 
> 以上です。
> 
> 
> 
> ----- Original Message -----
> > From: "renay****@ybb*****" <renay****@ybb*****>
> > To: "linux****@lists*****" <linux****@lists*****>
> > Cc: 
> > Date: 2015/11/10, Tue 23:05
> > Subject: Re: [Linux-ha-jp] 仮想IPだけがリソースの場合の同居・順序制約は必要か?
> > 
> > 広瀬さん
> > 
> > こんばんは、山内です。
> > 
> >>  全体コンフィグは改めて添付いたしました通りですが、Ping/Diskdリソース
> >>  内容は上記の通りであり、colocation無くともDiskdプロセス停止時は正常
> >>  にF/O発動はいたしました<改めて試験いたしました。
> >>  また、Pingリソースも名称の違いはあれど、同じ条件ですのでPingリソース
> >>  を停止した場合、またICMPを遮断してもF/Oする事も確認しました。
> > 
> > 
> > すいません。
> > 先ほどの回答ですが、私の方では、PM1.1系で確認していました。
> > 
> > 再度、PM1.0系(PM+Heartbeat)でも明日、確認してみます。
> > #記憶違いがなければ、同じ動作だと思うのですが。。。。
> > 
> > diskdは、primitiveの他にdiskdプロセスが上がっているのでそちらをkillして、先ほどの回答は記載してい
ました。
> > 広瀬さんの方でも、同様の手順であれば、PM1.1の相違だと思います。
> > 
> > また、明日にでも回答いたします。
> > 
> > 以上です。
> > 
> > 
> > 
> > ----- Original Message -----
> >>  From: "momok****@mail*****" <momok****@mail*****>
> >>  To: renay****@ybb*****; linux****@lists*****
> >>  Cc: 
> >>  Date: 2015/11/10, Tue 22:53
> >>  Subject: Re: [Linux-ha-jp] 仮想IPだけがリソースの場合の同居・順序制約は必要か?
> >> 
> >>  広瀬です。
> >> 
> >> 
> >>  山内さま、ご回答ありがとうございます。
> >> 
> >>  Ping/Disk監視プロセスが落ちた場合という事を頭に入れておらず、
> >>  Ping/Disk監視で、”異常”を検知した場合のみに固執していました。
> >>  ご指摘ありがとうございます。
> >> 
> >>  primitive res_diskd ocf:pacemaker:diskd \
> >>          params name="disk_chk" write_dir="/tmp" 
> >>  interval="10" \
> >>          op start interval="0" timeout="60" 
> >>  on-fail="restart" \
> >>          op stop interval="0" timeout="60" 
> >>  on-fail="block" \
> >>          op monitor interval="10" timeout="60" 
> >>  on-fail="restart" \
> >>          meta migration-threshold="1"
> >> 
> >>  primitive res_pingd ocf:pacemaker:ping \
> >>          params name="ping_chk" host_list="<IPアドレス>" 
> >>  multiplier="100" dampen="10" \
> >>          op start interval="0" timeout="60" 
> >>  on-fail="restart" \
> >>          op stop interval="0" timeout="20" 
> >>  on-fail="block" \
> >>          op monitor interval="10" timeout="60" 
> >>  on-fail="restart" \
> >>          meta migration-threshold="1"
> >> 
> >>  全体コンフィグは改めて添付いたしました通りですが、Ping/Diskdリソース
> >>  内容は上記の通りであり、colocation無くともDiskdプロセス停止時は正常
> >>  にF/O発動はいたしました<改めて試験いたしました。
> >>  また、Pingリソースも名称の違いはあれど、同じ条件ですのでPingリソース
> >>  を停止した場合、またICMPを遮断してもF/Oする事も確認しました。
> >> 
> >> 
> >>   ※本設定ではシステム領域のDisk異常発生時を見ていますが、実はこれで
> >>    はI/Oエラー発動させると正常には動作しません。別HDDのデータドライ
> >>    ブや、共有ディスクであれば問題なく発動しますが・・・
> >> 
> >> 
> >>  このような条件下であった場合、色々エラー起こして見る限りでは、必ずしも
> >>  ある必要性を見いだせず、同居(配置)、順序制約とも要否に関してどのように
> >>  解釈すれば良いのかと迷う部分があります。一番気になるのはやはり内部のス
> >>  コア計算の概念にどう当てはまって行くのかが悩みどころです。
> >> 
> >> 
> >>  よろしくお願いいたします。
> >> 
> >>  renay****@ybb*****さん:
> >>>   広瀬さん
> >>> 
> >>>   こんばんは、山内です。
> >>> 
> >>>   例えば、
> >>> 
> >>>    2ノードACT/STB構成で、primitiveリソースA(Dummy)とcloneリソース(diskd)
> >>> 
> >>>   をcolocation無(通常、colcation リソースA with cloneリソースを省略)で配置した場合、
> >>> 
> >>>   diskdのプロセスが落ちた場合にprimiverリソースAは、STBノードへファイルオーバーしなくなります。
> >>>   #diskdの故障自体は、検知しますが。。。
> >>> 
> >>>   これは、colocationがない為に、故障後のSTBノードへの配置計算にdiskdの故障が反映出来ない為です。
> >>> 
> >>>   当然、diskdなどリソースの作りにもよる話ですが、colocationを組んでおいた方が良いと思います。
> >>> 
> >>>   以上です。
> >>> 
> >>> 
> >>> 
> >>> 
> >>>   ----- Original Message -----
> >>>   > From: "momok****@mail*****" 
> >>  <momok****@mail*****>
> >>>   > To: Linux****@lists*****
> >>>   > Cc: 
> >>>   > Date: 2015/11/10, Tue 13:17
> >>>   > Subject: [Linux-ha-jp] 仮想IPだけがリソースの場合の同居・順序制約は必要か?
> >>>   > 
> >>>   > 広瀬と申します
> >>>   > 
> >>>   > 
> >>>   > Pacemaker+Heartbeatでの取り扱いになりますが、掲題の通りに
> >>>   > リソースは純粋に仮想IPだけが主役となるノードがあったとします
> >>>   > 
> >>>   > 
> >>>   > ■要約したリソース定義は以下(細かいパラメータは省きました)
> >>>   > =============================================================
> >>>   > primitive res_pingd ocf:pacemaker:ping
> >>>   > primitive res_vip ocf:heartbeat:IPaddr2
> >>>   > primitive res_vipchk ocf:heartbeat:VIPcheck
> >>>   > primitive res_diskd ocf:pacemaker:diskd
> >>>   > group rg_test res_vipchk res_vip
> >>>   > clone cl_diskd res_diskd
> >>>   > clone cl_pingd res_pingd
> >>>   > location l_test rg_test \
> >>>   >     rule 200: #uname eq A-host.local \
> >>>   >     rule 100: #uname eq B-host.local \
> >>>   >     rule -inf: not_defined ping_chk or ping_chk lt 100 \
> >>>   >     rule -inf: not_defined disk_chk or disk_chk eq ERROR
> >>>   > =============================================================
> >>>   > 
> >>>   > 
> >>>   > 基本的にはこれだけでも動作はすると思います。位置制約で設定した
> >>>   > 値に従い、以下で起動してくれます
> >>>   > 
> >>>   >  ①優先ActはA-host.localで起動
> >>>   >  ②F/Oした場合、Failbackは基本的にはしない
> >>>   >  ③Act側のPing、またはDisk監視が異常となった場合、F/Oする
> >>>   >  ④両系ともPing、またはDisk監視が異常ならば一切リソースは
> >>>   >   起動しない
> >>>   > 
> >>>   > 事実上各Primitiveに指定された条件に従い正常にF/Oしますし、両系
> >>>   > が異常ならリソースは両系ともにリソースは起動しませんので、これ
> >>>   > だけでも条件は満たしているのかなと思います。
> >>>   > この状況下において、同居制約、並びに順序制約は必要とする理由は
> >>>   > あるのか疑問が浮かんできました
> >>>   > 順序制約に関しては、Cloneリソースが起動しない内にGroupリソース
> >>>   > が起動する懸念がありますが、起動速度からしてもさして問題にはな
> >>>   > らないかなとも思います
> >>>   > 
> >>>   >  ※そもそも論、Ping/Disk異常がある状態で起動させる事自体があり
> >>>   >   得ないので、正常な構成状態であって初めて起動するので・・・
> >>>   > 
> >>>   > 
> >>>   > 上記の事例においてはcolocation/orderが必要となりうる理由があり
> >>>   > ましたら、ご指摘いただけると幸いです。
> >>>   > 
> >>>   > 
> >>>   > 以上、よろしくお願いいたします。
> >>>   > 
> >>>   > 
> >>>   > _______________________________________________
> >>>   > Linux-ha-japan mailing list
> >>>   > Linux****@lists*****
> >>>   > http://lists.osdn.me/mailman/listinfo/linux-ha-japan 
> >>>   > 
> >>> 
> >>>   _______________________________________________
> >>>   Linux-ha-japan mailing list
> >>>   Linux****@lists*****
> >>>   http://lists.osdn.me/mailman/listinfo/linux-ha-japan 
> >> 
> > 
> > _______________________________________________
> > Linux-ha-japan mailing list
> > Linux****@lists*****
> > http://lists.osdn.me/mailman/listinfo/linux-ha-japan
> > 
> 
> _______________________________________________
> Linux-ha-japan mailing list
> Linux****@lists*****
> http://lists.osdn.me/mailman/listinfo/linux-ha-japan



Linux-ha-japan メーリングリストの案内
Back to archive index