<< Nagios 2.5 にバージョンアップ | main | PostgreSQL 8.2 正式版リリース >>

目覚ましは Nagios のアラートメール

Nagios の通知先に携帯のアドレスを登録して以来, 毎朝6時10分過ぎにアラートメールで起こされる日々が。
「SERVLET に繋がらないよ!」ってアラートなのですが, 5分後位には復旧するので特に気にしていませんでした。

が, CRITICAL → RECOVERY の度にメールが来て起こされていい加減鬱陶しくなってきたので, 何が起こっているのかを調べてみたところ...
毎朝6時10分に Tomcat再起動の cron ジョブが(;´Д`)
メモリリーク対策のようで・・・。

Tomcat 毎日再起動って前にもどこかで見たような。
Java での Webアプリは開発も運用もホント面倒くさい。
まぁ, メモリリークするようなアプリがアレっちゃアレなんですが。

それはおいといて, Tomcatの再起動には結構時間がかかります。
配置されている Webアプリの数に比例するようですが, 遅いマシンだと5分以上かかっていてそれで Nagios に引っかかっていた模様。

6時10分〜6時20分までは監視しないように timeperiods.cfg に以下の timeperiod を追加。

# Tomcat timeperiod definition
define timeperiod{
    timeperiod_name tomcathours
    alias Exclude tomcat reboot time
    sunday 00:00-06:10,06:20-24:00
    monday 00:00-06:10,06:20-24:00
    tuesday 00:00-06:10,06:20-24:00
    wednesday 00:00-06:10,06:20-24:00
    thursday 00:00-06:10,06:20-24:00
    friday 00:00-06:10,06:20-24:00
    saturday 00:00-06:10,06:20-24:00
    }

Tomcat の監視にはこの tomcathours を指定したら, 翌日からアラートメールがパッタリと来なくなりましたとさ。
はてブへ追加 この記事のはてブユーザ
Tech > Server | comments (0) | trackbacks (0) | pagetop↑

Comments

Post your Comment

Trackbacks