ICPMタイプ8のエコー要求(いわゆるPingです)によるサーバの死活を監視するテンプレートを作成します。Pingは一番シンプルなサーバ死活の監視方法ですが、ZabbixでのPing監視のアイテムキー icmpping では送信するパケット数や送信間隔などを設定することができます。
テンプレートグループの作成
これから作成するテンプレート用のグループを作成します。
[設定]→[ホストグループ]→[ホストグループの作成]をクリックします。
任意のグループ名を入力して「追加」をクリックすればグループが作成されます。
サーバ死活(Ping)監視テンプレートの作成
[設定]→[テンプレート]→[テンプレートの作成]をクリックします。
[テンプレート]タブを選択 下記を入力し「追加」をクリックすればテンプレートが作成されます。
テンプレート名:A_Template_Ping グループ:A_Templates(いずれも任意です)
↓
アプリケーションの作成
[設定]→[テンプレート] 「A_Template_Ping」行の「アプリケーション」をクリックします。
名前に「ping」を入力し「追加」をクリックすればアプリケーションが作成されます。
アイテムの作成
[設定]→[テンプレート] 「A_Template_Ping」行の「アイテム」をクリックします。
下記を設定し「追加」をクリックすればアイテムが作成されます。
---(設定箇所)---------------------------
名前:0000_PING監視(任意)
タイプ:シンプルチェック
キー:icmpping[,3,5000,68,3000]
値のマッピングの使用:Service state(0 ⇒ Down, 1 ⇒ Up と表示されます)
アプリケーション:ping
------------------------------
アイテムキー icmpping のパラメータ
icmpping[<target>,<packets>,<interval>,<size>,<timeout>]
target - ホストのIPまたはDNS名
packets - パケット数
interval - 連続するパケットの間隔(ミリ秒)
size - パケットサイズ(バイト)
timeout - タイムアウト(ミリ秒)
詳細は公式マニュアル 5 シンプルチェック | Zabbix Documentaion 2.2 を参照してください。
今回設定したアイテムキー icmpping[,3,5000,68,3000] は「連続して ping を 3 発 5,000 ms 間隔で飛ばし,タイムアウト 3,000 ms 以内に1つでも応答があれば「成功」と判断する。パケットサイズは 68 バイトを指定」という意味になります。pingが失敗した場合は「0」、成功した場合は「1」が返ってきます。
トリガーの作成
[設定]→[テンプレート] 「A_Template_Ping」行の「トリガー」をクリックします。
下記を設定し「追加」をクリックすればトリガーが作成されます。
---(設定箇所)---------------------------
名前:{HOST.NAME} Ping
条件式:{A_Template_Ping:icmpping[,3,5000,68,3000].last()}=0
深刻度:致命的な障害
------------------------------
トリガーの名前にはマクロが使用できます。上の設定 {HOST.NAME} はホストの表示名がトリガー名に表示されます。
条件式は、{<テンプレート名>:<アイテムキー>.<トリガー関数>}=<値> の形式です。手入力してもかまいませんが、なかなか複雑な書式ですので、条件式の「追加」ボタンをクリックして対象のアイテムを選択し、関数を選択して「挿入」ボタンをクリックすれば条件式を生成してくれます。
今回設定した条件式は、アイテムキー icmpping[,3,5000,68,3000] の直近の値「last()」が「0(ダウン)」の場合にトリガーが発生します。
▽ サポートされているトリガー関数 | Zabbix Documentaion 2.2
https://www.zabbix.com/documentation/2.2/jp/manual/appendix/triggers/functions
監視テンプレートの動作確認
1-3. ホストの作成で作成したホストに作成した監視テンプレートを適用し、アイテムで指定した対象の値がとれているか、トリガーが正しく動作するかを確認します。
アイテムの動作確認
「A_Template」グループを選択し、作成したテンプレートにチェックを入れて[選択]をクリックします。
「テンプレートとのリンク」に作成したテンプレートが表示されていることを確認し「更新」ボタンをクリックすればテンプレートの適用完了です。
しばらくしたら[監視データ]→[概要]からアイテムの値が取得できていることを確認します。
トリガーの動作確認
ホストを障害トリガーが発生する状態にして、障害通知メールが通知先に届いていることを確認します。
障害通知メールが確認できたら、ホストを復旧トリガーが発生する状態にして、復旧通知メールが通知先に届いていることを確認します。
コメント