監視設定テンプレート

Hinemosの監視設定のテンプレートです。
※対象バージョン:2.3.0, 2.3.1, 2.4.0

Hinemosの各監視機能の設定方法の参考としてください。

テンプレートの登録方法

  1. 監視設定が登録されている場合、テンプレートにて使用している通知ID及び監視項目IDが、Hinemosに登録されていない事を確認してください。
    • 通知ID
      LOG
      MONITOR
    • 監視項目ID
      監視機能監視項目ID
      PING監視PING-01
      リソース監視CPU-01
      MEM-01
      LOAD_AVG_5
      syslog-ng監視LOG-01
      SNMP監視SNMP-01
      SNMPTRAP監視TRAP-REG-REG
      TRAP-REG-UNREG
      TRAP-UNREG-REG
      TRAP-UNREG-UNREG
      プロセス監視PROCESS-01
      PROCESS-02
      PROCESS-03
      SQL監視SQL-01
      HTTP監視HTTP-01
      HTTP-02
      サービス・ポート監視PORT-01
  2. 前提条件
    • Hinemos Ver.2.3.0 or 2.3.1 or 2.4.0が稼働している
    • Hinemosはhinemosユーザで起動している
      • rootで起動している場合は読み替えてください
    • 以下の手順はhinemosで実行
  3. JBossを停止
    $ /opt/hinemos/bin/jboss_stop.sh 
    
  4. psqlで監視設定のテンプレートをインポートする
    • 監視設定テンプレートSQL(monitor_template_2.x.x.zip)]をダウンロードし、解凍する。
    • 解凍すると以下のファイルが出力される。
      • monitor_template_on.sql(監視設定が有効になっている)
        • インポート後にJBossを起動すると、監視が開始される。
      • monitor_template_off.sql(監視設定が無効)
        • インポート後にJBossを起動しても、監視が開始されない。
        • 監視を有効にする必要がある。
    • monitor_template_on.sql、または monitor_template_off.sql のどちらかを使用します。
      $ /opt/hinemos/postgresql-8.1.3/bin/psql -p 24001 -d hinemos -f monitor_template_off.sql
                           or
      $ /opt/hinemos/postgresql-8.1.3/bin/psql -p 24001 -d hinemos -f monitor_template_on.sql
      
  5. JBossを起動
    $ /opt/hinemos/bin/jboss_start.sh 
    

テンプレートの使用方法

  • 使用方法
    • リポジトリにノードを登録してください。
      • 登録されたノードは「登録ノードすべて」に自動的に割り当てられる為、監視設定を変更しなくても監視対象となります。
    • 必要に応じて監視設定の監視対象を変更して使用してください。
      • 監視対象にはスコープ「登録ノードすべて」または「未登録ノード」を設定しています。
    • 新たな監視設定を作成する際の参考としてください。
  • 注意点
    • 各監視の詳細については、Hinemosプロジェクトにて配布されているユーザマニュアルを参照してください。

テンプレートの監視設定

通知設定

ログ監視用通知設定

  • ログ監視用の通知設定。
    • syslog-ng監視、SNMPTRAP監視にて使用。
  • イベントのみ出力する。
  • 抑制は行わない。
通知IDLOG
ステータス通知チャックなし
イベント通知チェックあり
  • イベント通知詳細
    重要度通知状態抑制状態メールメールアドレス
    通知チェック未確認
    警告チェック未確認
    危険チェック未確認
    不明チェック未確認

監視用通知設定

  • 監視用の通知設定。
  • ログ監視用通知設定の対象以外の監視にて使用。
  • ステータス及びイベントを出力する。
  • ステータスの存続期間は10分とし、10分以上更新されない場合、重要度とメッセージが変更される。
  • イベントは重要度により抑制される。
    • 重要度が変わらない場合、通知されない。
    • 重要度が変わったら、通知される。
通知IDMONITOR
ステータス通知チャックあり
イベント通知チェックあり
  • ステータス通知詳細
    存続期間10分
    存続期間経過後の処理更新されていない旨のメッセージに置き換える
    重要度:警告
  • イベント通知詳細
    重要度通知状態抑制状態メールメールアドレス
    通知チェック未確認チェック確認済
    警告チェック未確認チェック確認済
    危険チェック未確認チェック確認済
    不明チェック未確認チェック確認済
    抑制間隔重要度で抑制する

PING監視

  • スコープ「登録ノードすべて」に割り当てられているノードに対し、PING監視を行います。
  • PINGを一回実施し、PINGの応答時間によりイベントとステータスが出力されます。
    • 応答時間が100msec以下ならば、重要度が通知としてイベント/ステータスが出力される。
    • 応答時間が100msec以上、500msec以下ならば、重要度が警告としてイベント/ステータスが出力される。
    • 応答時間が500msec以上または応答なしならば、重要度が危険としてイベント/ステータスが出力される。
監視項目IDPING-01
監視対象登録ノードすべて
監視間隔5分
回数1回
タイムアウト1000msec
通知パケット紛失=0%以下、応答時間=100msec以下
警告パケット紛失=0%以下、応答時間=500msec以下
危険(通知・警告以外)

リソース監視

CPU使用率

  • スコープ「登録ノードすべて」に割り当てられているノードに対し、CPU使用率の閾値監視を行います。
  • CPU使用率を取得し、閾値判定結果によりイベントとステータスが出力されます。
    • CPU使用率が0%~75%ならば、重要度が通知としてイベント/ステータスが出力される。
    • CPU使用率が75%~90%ならば、重要度が警告としてイベント/ステータスが出力される。
    • CPU使用率が90%~100%ならば、重要度が危険としてイベント/ステータスが出力される。
    • CPU使用率が取得できない場合、重要度が不明としてイベント/ステータスが出力される。
監視項目IDCPU-01
監視対象登録ノードすべて
監視間隔5分
通知閾値の下限=0%以上、閾値の上限=75%以上
警告閾値の下限=75%以上、閾値の上限=95%以上
危険(通知・警告以外)
値取得の失敗時不明

メモリ使用率

  • スコープ「登録ノードすべて」に割り当てられているノードに対し、メモリ使用率の閾値監視を行います。
  • メモリ使用率を取得し、閾値判定結果によりイベントとステータスが出力されます。
    • メモリ使用率が0%~75%ならば、重要度が通知としてイベント/ステータスが出力される。
    • メモリ使用率が75%~90%ならば、重要度が警告としてイベント/ステータスが出力される。
    • メモリ使用率が90%~100%ならば、重要度が危険としてイベント/ステータスが出力される。
    • メモリ使用率が取得できない場合、重要度が不明としてイベント/ステータスが出力される。
監視項目IDMEM-01
監視対象登録ノードすべて
監視間隔5分
通知閾値の下限=0%以上、閾値の上限=75%以上
警告閾値の下限=75%以上、閾値の上限=95%以上
危険(通知・警告以外)
値取得の失敗時不明

ロードアベレージ(5分平均)

  • スコープ「登録ノードすべて」に割り当てられているノードに対し、ロードアベレージ(5分平均)の閾値監視を行います。
  • ロードアベレージ(5分平均)を取得し、閾値判定結果によりイベントとステータスが出力されます。
    • ロードアベレージ(5分平均)が0~1ならば、重要度が通知としてイベント/ステータスが出力される。
    • ロードアベレージ(5分平均)が1~2ならば、重要度が警告としてイベント/ステータスが出力される。
    • ロードアベレージ(5分平均)が2~ならば、重要度が危険としてイベント/ステータスが出力される。
    • ロードアベレージ(5分平均)が取得できない場合、重要度が不明としてイベント/ステータスが出力される。
監視項目IDLOAD_AVG_5-01
監視対象登録ノードすべて
監視間隔5分
通知閾値の下限=0以上、閾値の上限=1以上
警告閾値の下限=1以上、閾値の上限=2以上
危険(通知・警告以外)
値取得の失敗時不明

syslog-ng監視

  • スコープ「登録ノードすべて」に割り当てられているノードに対し、syslog-ng監視を行います。
  • 監視対象ノードのsyslogにて、"error"が出力された場合、重要度が危険としてイベントが出力される。
    • "error"は大文字/小文字の区別は行わない。
監視項目IDLOG-01
監視対象登録ノードすべて
パターンマッチ表現.*[eE][rR][rR][oO][rR].*
処理方法条件に一致したら処理する
重要度危険

SNMP監視

inode使用率

  • スコープ「登録ノードすべて」に割り当てられているノードに対し、SNMPによる取得値の閾値監視を行います。
  • SNMPによりinode使用率を取得し、閾値判定結果によりイベントとステータスが出力されます。
    • inode使用率が0%~70%ならば、重要度が通知としてイベント/ステータスが出力される。
    • inode使用率が70%~95%ならば、重要度が警告としてイベント/ステータスが出力される。
    • inode使用率が95%~ならば、重要度が危険としてイベント/ステータスが出力される。
    • inode使用率が取得できない場合、重要度が不明としてイベント/ステータスが出力される。
監視項目IDSNMP-01
監視対象登録ノードすべて
監視間隔5分
コミュニティ名public
ポート番号161
OID.1.3.6.1.4.1.2021.9.1.9.1
バージョン1
計算方法何もしない
通知閾値の下限=0%以上、閾値の上限=70%以上
警告閾値の下限=70%以上、閾値の上限=95%以上
危険(通知・警告以外)
値取得の失敗時不明

SNMPTRAP監視

登録ノードからの登録済みOIDを全て受信

  • スコープ「登録ノードすべて」に割り当てられているノードから送信されたSNMPTRAPの監視を行います。
  • 監視対象ノードから送信されたSNMPTRAPがマスターに登録されていた場合、イベントが出力される。
監視項目IDTRAP-REG-REG
監視対象登録ノードすべて
コミュニティ名public
監視方法マスターのすべてのOIDを監視

登録ノードからの未登録OIDを全て受信

  • スコープ「登録ノードすべて」に割り当てられているノードから送信されたSNMPTRAPの監視を行います。
  • 監視対象ノードから送信されたSNMPTRAPがマスターに登録されていなかった場合、イベントが出力される。
監視項目IDTRAP-REG-UNREG
監視対象登録ノードすべて
コミュニティ名public
監視方法マスターに登録されていないOIDを監視

未登録ノードからの登録済みOIDを全て受信

  • ノード登録されていないノードから送信されたSNMPTRAPの監視を行います。
  • 未登録ノードから送信されたSNMPTRAPがマスターに登録されていた場合、イベントが出力される。
監視項目IDTRAP-UNREG-REG
監視対象未登録ノード
コミュニティ名public
監視方法マスターのすべてのOIDを監視

未登録ノードからの未登録OIDを全て受信

  • ノード登録されていないノードから送信されたSNMPTRAPの監視を行います。
  • 未登録ノードから送信されたSNMPTRAPがマスターに登録されていなかった場合、イベントが出力される。
監視項目IDTRAP-UNREG-UNREG
監視対象未登録ノード
コミュニティ名public
監視方法マスターに登録されていないOIDを監視

プロセス監視

  • スコープ「登録ノードすべて」に割り当てられているノードに対し、プロセス監視を行います。
  • コマンド/引数に該当するプロセス数を取得し、閾値判定結果によりイベントとステータスが出力されます。
    • プロセス数が1ならば、重要度が通知としてイベント/ステータスが出力される。
    • プロセス数が2以上ならば、重要度が危険としてイベント/ステータスが出力される。
    • プロセス数が取得できない場合、重要度が不明としてイベント/ステータスが出力される。

HinemosマネージャのJBossのプロセス監視

監視項目IDPROCESS-01
監視対象登録ノードすべて
監視間隔5分
コマンド/opt/hinemos/jre1.5.0_09/bin/java
引数.*/opt/hinemos/jboss-4.0.3SP1/.*org.jboss.Main
通知閾値の下限=1以上、閾値の上限=1以上
警告閾値の下限=1以上、閾値の上限=1以上
危険(通知・警告以外)
値取得の失敗時不明

HinemosマネージャのLDAPのプロセス監視

監視項目IDPROCESS-02
監視対象登録ノードすべて
監視間隔5分
コマンド/opt/hinemos/openldap-2.3.20/libexec/slapd
引数-h ldap://0.0.0.0:24000/
通知閾値の下限=1以上、閾値の上限=1以上
警告閾値の下限=1以上、閾値の上限=1以上
危険(通知・警告以外)
値取得の失敗時不明

HinemosマネージャのPostgreSQLのプロセス監視

監視項目IDPROCESS-02
監視対象登録ノードすべて
監視間隔5分
コマンド/opt/hinemos/postgresql-8.1.3/bin/postmaster
引数-D /opt/hinemos/var/data
通知閾値の下限=1以上、閾値の上限=1以上
警告閾値の下限=1以上、閾値の上限=1以上
危険(通知・警告以外)
値取得の失敗時不明

SQL監視

Hinemosマネージャのデータベースサイズ

  • スコープ「登録ノードすべて」に割り当てられているノードに対し、SQL監視を行います。
  • SQL実行結果(結果レコードセットの1レコード目の1カラム目)を取得し、閾値判定結果によりイベントとステータスが出力されます。
    • SQL実行結果が0~1024ならば、重要度が通知としてイベント/ステータスが出力される。
    • SQL実行結果が1024~2048ならば、重要度が警告としてイベント/ステータスが出力される。
    • SQL実行結果が2048以上ならば、重要度が危険としてイベント/ステータスが出力される。
    • SQL実行結果が取得できない場合、重要度が不明としてイベント/ステータスが出力される。
監視項目IDSQL-01
監視対象登録ノードすべて
監視間隔5分
接続先URLjdbc:postgresql://localhost:24001/hinemos
接続先DBPostgreSQL
ユーザIDhinemos
パスワードインストール後のディフォルト値
SQLSELECT pg_database_size('hinemos') / 1024 / 1024;
通知閾値の下限=0以上、閾値の上限=1024以上
警告閾値の下限=1024以上、閾値の上限=2048以上
危険(通知・警告以外)
値取得の失敗時不明

HTTP監視

数値監視

  • スコープ「登録ノードすべて」に割り当てられているノードに対し、HTTP監視を行います。
  • HTTPリクエストの応答時間によりイベントとステータスが出力されます。
    • 応答時間が2sec以下ならば、重要度が通知としてイベント/ステータスが出力される。
    • 応答時間が2sec以上、5sec以下ならば、重要度が警告としてイベント/ステータスが出力される。
    • 応答時間が5sec以上ならば、重要度が危険としてイベント/ステータスが出力される。
    • 応答なし(タイムアウト)の場合、重要度が不明としてイベント/ステータスが出力される。
監視項目IDHTTP-01
監視対象登録ノードすべて
監視間隔5分
URLhttp://localhost:8080/
タイムアウト10秒
通知閾値の下限=0以上、閾値の上限=2以上
警告閾値の下限=2以上、閾値の上限=5以上
危険(通知・警告以外)
値取得の失敗時不明

文字列監視

  • スコープ「登録ノードすべて」に割り当てられているノードに対し、HTTP監視を行います。
  • HTTPリクエストの結果文字列に対し、パターンマッチを行い、イベントとステータスが出力されます。
    • 結果文字列に"JBoss"が含まれているならば、重要度が通知としてイベント/ステータスが出力される。
    • 結果文字列の取得失敗の場合、重要度が不明としてイベント/ステータスが出力される。
監視項目IDHTTP-01
監視対象登録ノードすべて
監視間隔5分
URLhttp://localhost:8080/
タイムアウト10秒
  • 文字列監視詳細
    説明JBoss
    パターンマッチ表現.*JBoss.*
    処理方法条件に一致したら処理する
    重要度通知

サービス・ポート監視

  • サービス・ポート監視はVer2.4.0にて追加された機能です。
  • スコープ「登録ノードすべて」に割り当てられているノードに対し、ポート監視を行います。
  • ポートの応答時間によりイベントとステータスが出力されます。
    • 応答時間が50msec以下ならば、重要度が通知としてイベント/ステータスが出力される。
    • 応答時間が50msec以上、100msec以下ならば、重要度が警告としてイベント/ステータスが出力される。
    • 応答時間が100msec以上ならば、重要度が危険としてイベント/ステータスが出力される。
    • 応答なし(タイムアウト)の場合、重要度が危険としてイベント/ステータスが出力される。
      監視項目IDPORT-01
      監視対象登録ノードすべて
      監視間隔5分
      ポート番号80
      試行回数2回
      試行間隔1秒
      タイムアウト1000msec
      通知閾値の下限=0以上、閾値の上限=50以上
      警告閾値の下限=50以上、閾値の上限=100以上
      危険(通知・警告以外)
      値取得の失敗時危険