[Linux-ha-jp] pacemaker + corosync 上で PostgreSQL を動かした際の空きメモリ減少について

Back to archive index

renay****@ybb***** renay****@ybb*****
2016年 9月 26日 (月) 18:21:44 JST


秋葉さん

こんばんは、山内です。

了解しました。
こちれでも、時間をみて、頂いた設定をベースに試してみたいと思います。

systemd関連も不具合などもあるようですので、そちらを探してみるのも良いかもしれません。
ちょっと探してみても、以下などもありました。
直接関係があるかは別ですが・・・

 * https://bugzilla.redhat.com/show_bug.cgi?id=1361120


設定などで質問があれば、またご連絡させてください。

以上です。



----- Original Message -----
> From: AKIBA Makoto <akiba****@acroq*****>
> To: linux****@lists*****
> Cc: 
> Date: 2016/9/26, Mon 16:18
> Subject: Re: [Linux-ha-jp] pacemaker + corosync 上で PostgreSQL を動かした際の空きメモリ減少について
> 
> 山内さん
> 
> 秋葉です。
> ご回答・解説ありがとうございます。
> 
> 実際に当方の環境でpacemakerのプロセスメモリサイズを
> 見てみたところ、~8MB程度になっており、頂いた情報の通り
> 大きくはなっていませんでした。
> 
> 一方で、systemd(pid=1)については1GB程度まで大きくなって
> おり、pmapで参照すると[heap]とマッピングされた領域が
> ほとんどを占めているように見えました。
> 
> なので、これ以上の問い合わせは見当違いの可能性もありますが、
> 念の為、当方で使用している設定ファイルを添付致します。
> (固有情報はマスキングしてあります)
> 
> これで何か情報が得られましたら教えていただけますでしょうか。
> また、不足している情報がありましたらご指摘ください。
> 
> お手数をおかけ致しますがよろしくお願い致します。
> 
> 
> 以上
> ----------------
> AKIBA Makoto
> akiba****@acroq*****
> 
>>  -----Original Message-----
>>  From: linux****@lists*****
>>  [mailto:linux****@lists*****] On Behalf Of
>>  renay****@ybb*****
>>  Sent: Friday, September 23, 2016 6:04 PM
>>  To: linux****@lists*****
>>  Subject: Re: [Linux-ha-jp] pacemaker + corosync 上で PostgreSQL を動か
>>  した際の空きメモリ減少について
>> 
>>  秋葉さん
>> 
>>  こんばんは、山内です。
>> 
>>  pacemakerのプロセスがIPC通信の為にマップしているメモリは5Mbyteまでで
>>  す。
>>  よって、最大、5Mbyteまでプロセスのメモリサイズは上がる可能性があります
>>  が、
>>  先のメールの通りで5Mbyteを超えるあたりで再利用する為、それ以上は増えま
>>  せん。
>> 
>>  このサイズですが、/etc/sysconfig/pacemakerのPCMK_ipc_bufferで大きくは
>>  出来ますが、
>>  小さくすることは出来ません。
>> 
>>  #これらのメモリマップの様子は、pmapコマンドで確認することが可能です。
>> 
>> 
>>  以上です。
>> 
>> 
>> 
>>  ----- Original Message -----
>>  > From: "renay****@ybb*****" 
> <renay****@ybb*****>
>>  > To: "linux****@lists*****" 
> <linux****@lists*****>
>>  > Cc:
>>  > Date: 2016/9/22, Thu 10:20
>>  > Subject: Re: [Linux-ha-jp] pacemaker + corosync 上で PostgreSQL を動
>>  かした際の空きメモリ減少について
>>  >
>>  > 秋葉さん
>>  >
>>  > こんにちは、山内です。
>>  >
>>  > systemdプロセスではありませんが、
>>  > pacemakerとcorosyncを組み合わせてクラスタを構成した場合、
>>  pacemaker/corosyncプロセスのメモリの使用量が一定期間、増加していく動作
>>  となります。
>>  >
>>  > 詳細な動作は、失念していますが、pacmakerのプロセスがメモリマップして
>>  いる(??MByteまでだったはず)エリア
>>  > を利用して通信などを行う為、クラスタ構成後、マップした一定量まで増加
>>  が続きます。
>>  > ですが、一定量までで、それ以降は、マップしたエリアを古い方から再利用
>>  する為、増加は止まります。
>>  > (上記のマップしているサイズについては、確認して、再度、ご連絡します)
>>  >
>>  > (1)(4)あたりは上記で説明が付くかと思いますが。。。(2)(3)の原因には直接
>>  影響しないかと思います。
>>  >
>>  > 実際に増加しているのがsystemdプロセスとのことですが、
>>  pacemaker+corosyncのクラスタ構成で、リソースなどはsystemdを経由して
>>  > 実行・監視しているでしょうか?
>>  > #pacemakerのprimitiveリソースとしてsystemdリソースを利用しているか
>>  どうか?ということです。
>>  >
>>  > pacemakerの構成ファイルなど開示して頂ければ、私の方でも確認可能かも知
>>  れません。
>>  > #本当にリークしているのがsystemdプロセスである可能性もあるとは思い
>>  ますが・・・・
>>  >
>>  > 以上です。
>>  >
>>  >
>>  >>  現在、pacemaker + corosync のクラスタ上で PostgreSQL を
>>  >>  動作させているデータベースサーバがあるのですが、
>>  >>  稼働中にOSのメモリ使用量が増加し続ける問題が起きています。
>>  >>
>>  >>  原因を把握したいのですが、何か該当する現象や確認ポイント
>>  >>  などありますでしょうか?
>>  >>
>>  >>
>>  >>  環境は以下のようになっております。
>>  >>  OS: CentOS Linux release 7.2.1511 (Core)
>>  >>      kernel - 3.10.0-327.18.2.el7
>>  >>      glibc - 2.17-106.el7_2.6
>>  >>  Systemd: 219-19.el7_2.9 / 219-19.el7_2.12 (※)
>>  >>  Pacemaker: 1.1.13-10.el7_2.2
>>  >>  Corosync: 2.3.4-7.el7_2.1
>>  >>  PostgreSQL: 9.4.8-1PGDG.rhel7
>>  >>
>>  >>  (※)systemdのバージョンはどちらでも発生しました
>>  >>
>>  >>
>>  >>  2台のサーバでHotStandby構成にしてPostgreSQLを運用しています。
>>  >>  (両サーバでPostgreSQLが起動し、hot-standby構成にしている)
>>  >>  Active側にVIPを割り当てるようにして、アプリケーションからは
>>  >>  VIPに接続するようにしています。
>>  >>
>>  >>  これまでに観察して見えているのは以下の事象になります。
>>  >>
>>  >>  (1) OS起動しクラスタ状態を正常にした状態で、少しずつ
>>  >>    OSの空きメモリ量(free+buffer+cache)が減少し続ける。
>>  >>    →1日あたり30~100MB程度ずつ減少する
>>  >>     ※DBサーバ自体は4GBメモリを搭載
>>  >>     ※VIPがある/なしに関わらず減少傾向にある。
>>  >>
>>  >>  (2) メモリ使用量が大きいプロセスを確認すると、PID=1の
>>  >>    systemd プロセスで、数十秒ごとに4~8KB程度増加する。
>>  >>
>>  >>  (3) 契機は不明だが、時折数十~数百MB程度空き容量が増える
>>  >>    (回復する)ことがある。
>>  >>    (長期的に見てトータルでは減少し続ける)
>>  >>
>>  >>  (4) pacemaker + corosyncを使わず、1台のみで動作させている
>>  >>    開発サーバでは(1)~(2)のようなメモリ使用量の増減が
>>  >>    発生していないように見える。
>>  >>    →この点があり、何か手がかりが無いかと考え、
>>  >>     こちらのMLに質問をポストさせていただきました。
>>  >>
>>  >>
>>  >>  長文にて恐縮ですが、情報等いただけましたら幸いです。
>>  >>  よろしくお願い致します。
>>  >>
>>  >>  ----------------
>>  >>  AKIBA Makoto
>>  >>  akiba****@acroq*****
>>  >>
>>  >>  _______________________________________________
>>  >>  Linux-ha-japan mailing list
>>  >>  Linux****@lists*****
>>  >>  http://lists.osdn.me/mailman/listinfo/linux-ha-japan 
>>  >>
>>  >
>>  > _______________________________________________
>>  > Linux-ha-japan mailing list
>>  > Linux****@lists*****
>>  > http://lists.osdn.me/mailman/listinfo/linux-ha-japan 
>>  >
>> 
>>  _______________________________________________
>>  Linux-ha-japan mailing list
>>  Linux****@lists*****
>>  http://lists.osdn.me/mailman/listinfo/linux-ha-japan 
> 
> _______________________________________________
> Linux-ha-japan mailing list
> Linux****@lists*****
> http://lists.osdn.me/mailman/listinfo/linux-ha-japan
> 




Linux-ha-japan メーリングリストの案内
Back to archive index