本文へジャンプします。

TOP

ニフクラSEハンドブック

監視概要

ドキュメント情報

区分

ガイダンス

リリース日

2022年7月1日

留意事項

2022 年 3 月時点の機能をもとに作成しております。
機能は順次エンハンスされますので、検討時にはニフクラホームページにて最新情報を確認ください。

■ニフクラホームページ

https://pfs.nifcloud.com/

はじめに

  • 本ドキュメントの目的

    • 本ドキュメントは、ニフクラでの商談対応やシステム設計を担当される方々が、ニフクラ上でのシステム設計に必要な知識を習得し、商談対応やシステム設計を円滑に行えるようになることを目的とします。

  • 本ドキュメントの対象読者

    • ニフクラを利用して商談対応、要件定義、システム設計を行われる方々

    • オンプレミスまたはクラウド(IaaS)での商談対応、要件定義、システム設計の経験者

  • 前提知識

    • システム設計/システム運用に関する基本的な知識

      • OSに関する基本的な知識

      • インターネット、イントラネットに関する基本的な知識

      • セキュリティに関する基本的な知識

      • バックアップ、監視、冗長化などシステム設計/システム運用に関する基本的な知識※システム設計経験があることが望ましい

  • 仮想化技術に関する以下の基本的な知識

    • ハイパーバイザー、仮想サーバー、仮想ストレージ、仮想ネットワークに関する基本的な知識

    • VMwareに関する基本的な知識

  • 本ドキュメントの注意事項

    • 本ドキュメントは、2022年3月時点の機能をもとに作成しています。ニフクラは継続的にエンハンスが行われるクラウドサービスです。

  • ニフクラサービスの変更は最新のドキュメントを参照してください。

オンプレミスとの違いと監視の責任範囲

  • オンプレミスでは物理機器、仮想基盤など利用者が管理・監視しますが、ニフクラではそれらは富士通クラウドテクノロジーズが管理・監視します。そのため、利用者が自ら管理・監視することはできません。

  • ニフクラではサーバー作成等すべての操作を専用のコントロールパネル/APIから行います。vCenterServerを操作することは一切できません。

  • 本サービスにおける利用者及び富士通クラウドテクノロジーズ双方の責任範囲は以下のとおりです。

image

クラウド(IaaS)監視概要

利用者にて監視が必要な項目は以下のとおりです。

監視の種類

監視対象

責任範囲

利用者

クラウド事業者

サービス監視

  • URL応答監視

  • 画面遷移監視

  • その他

仮想OS以上のインフラ監視

OS監視

  • OSのログ

  • OSの起動状態等

リソース監視

  • メモリ

  • ネットワークトラフィック

  • CPU

  • ディスク

プロセス監視

  • プロセス稼働監視

  • セッション数

ログ監視

  • OSログ、MWログ、アプリログ

インフラ監視

仮想化基盤監視

  • サービスI/F(管理画面/APIなど)

  • アーキテクチャ

  • 物理設備/装置

ニフクラの監視機能

ニフクラでは、利用者の責任範囲である監視部分を補う監視機能があります。要件に合わせて本機能を利用するか、サードパーティ製の製品を利用者で別途実装するか等検討してください。

機能

機能の概要

基本監視

サーバーおよびロードバランサーの稼働状況・負荷状況の監視を自動で行い、異常が発生した場合には、メールにて通知します。

有人監視

利用者のニーズに応じたレベルでサーバーの稼働状況を24時間365日監視します。
異常が発生した場合には、メールまたは電話で通知し、必要に応じてニフクラに精通したエンジニアが一次対応を行います。

ニフクラの監視機能概要

ニフクラで提供する監視機能で利用者責任範囲を補えるものは以下になります。

監視の種類

監視対象

ニフクラ監視機能

基本監視

有人監視

サービス監視

  • URL応答監視

  • 画面遷移監視

  • その他


一部対応可能

仮想OS以上のインフラ監視

OS監視

  • OSのログ

  • OSの起動状態等


一部対応可能


一部対応可能

リソース監視

  • メモリ

  • ネットワークトラフィック

  • CPU

  • ディスク


一部対応可能

プロセス監視

  • プロセス稼働監視

  • セッション数

ログ監視

  • OSログ、MWログ、アプリログ

ニフクラ以外のリソース(拠点環境の物理サーバー等)

※ニフクラの監視機能で補えない監視項目がある、拠点環境等含めて包括的に監視を行いたい要件がある場合は別途利用者にて監視サーバー、サービスの構築を検討してください。


ニフクラで提供する監視機能の概要は以下のとおりです。

項目

ニフクラ監視機能

基本監視

有人監視

ユーザーインターフェース

ニフクラコントロールパネル

専用Webページ(日本語のみ)

エージェントインストール

不要

必要

監視対象機器のグローバルネットワークへの接続

不要
(ICMP Ping監視は必要)

必要
(プロキシ等も不可)

ニフクラリソース以外の監視

不可

不可

ニフクラ仮想サーバー以外の監視

ロードバランサー(L4)
マルチロードバランサー

不可

死活監視対象/リソース監視対象

サーバー
ロードバランサー(L4)
マルチロードバランサー

サーバー

アラート通知先

メール

メール/電話

アラート時の復旧作業代行について

×

サーバー電源停止/再投入の代行作業可能[1]


1. 月10件まで

基本監視詳細

  • ニフクラ基本監視に関して詳細を記載します。

  • 基本監視で補える監視対象に関して以降に詳細を記載していきます。

監視の種類

監視対象

ニフクラ監視機能

基本監視

有人監視

サービス監視

  • URL応答監視

  • 画面遷移監視

  • その他


一部対応可能

仮想OS以上のインフラ監視

OS監視

  • OSのログ

  • OSの起動状態等


一部対応可能


一部対応可能

リソース監視

  • メモリ

  • ネットワークトラフィック

  • CPU

  • ディスク


一部対応可能

プロセス監視

  • プロセス稼働監視

  • セッション数

ログ監視

  • OSログ、MWログ、アプリログ

ニフクラ以外のリソース(拠点環境の物理サーバー等)

詳細項目

利用者監視範囲のOS監視、リソース監視の詳細に対して基本監視で補えるものを記載します。
以降に、各監視機能の基本仕様、概要、留意事項を記載します。

監視対象

基本監視サービス

アラート設定可否

補足

OS監視

  • OSのログ

  • OSの起動状態

OSのログ

OSの死活監視

PING結果/サーバーステータス(停止)

リソース監視

  • メモリ

  • ネットワークトラフィック

  • CPU

  • ディスク

メモリ使用率

メモリ使用率

メモリ 空きメモリ/使用中メモリ/キャッシュメモリ/バッファ

スワッピング 空き領域/使用中領域/使用率

ネットワークトラフィック

パフォーマンスチャートを利用して流量の確認は可能
ネットワーク転送量 (IN,OUT)[bps]

ネットワーク TCP接続数

CPU使用率

CPU使用率

CPU I/O待ち/アイドル状態

ロードアベレージ

ディスク使用率

ディスク使用率/ディスクのパーティション使用率

ディスクビジー率/ I/O応答時間

死活監視

サーバーの死活監視が可能な監視項目と、設定可能な閾値等は以下のとおりです。

監視ルール

監視項目

PING結果/サーバーステータス(停止)

アラート閾値

継続時間(10~30分)

アラート通知先

アラートを通知するメールアドレスの設定(5件まで)

監視ルールの監視内容設定

5件まで

アラート履歴

監視状況の履歴をコントロールパネルに表示

サーバーの死活監視を実施する際の概要と、留意事項は以下のとおりです。

PING結果

概要

対象サーバーのグローバルIPアドレスに対してPING監視を実施します。グローバルIPアドレスが付与している場合は容易に死活監視を実施することが可能となります。

留意事項

  • 本項目は利用する場合に限り、対象のサーバーはグローバルIPアドレスが付与されている必要があります。

  • PINGの監視元のIPアドレスをOS上、ニフクラファイアウォールで開放する必要があります。

  • マルチIPアドレスグループが割り当てられた仮想サーバーはPINGによる監視ができません。

サーバーステータス
(停止)

概要

対象サーバーのステータスが「停止」になった場合を監視します。
グローバルIPアドレスが付与されていない場合でも対象のサーバーが「停止」になったことを確認できます。

留意事項

対象のサーバーは起動していて、ネットワーク疎通ができない状況の場合などは検知できません。

メモリ使用率

サーバーのメモリ使用率の監視が可能な監視項目と、設定可能な閾値等は以下のとおりです。

監視ルール

監視項目

メモリ使用率

アラート閾値

使用率(0~100%)、継続時間(10~30分)

アラート通知先

アラートを通知するメールアドレスの設定(5件まで)

監視ルールの監視内容設定

5件まで

アラート履歴

監視状況の履歴をコントロールパネルに表示

サーバーのメモリ使用率の監視を実施する際の概要と、留意事項は以下のとおりです。

メモリ使用率

概要

対象サーバーのメモリ使用率を監視します。指定した閾値を指定した継続時間検知するとアラート対象となります。

留意事項

設定時デフォルトで10%以上となりますが、こちらは、推奨値ではありません。
例えばはじめ70%で運用してみるなどして、システムとして適切な値を探し運用してください。

CPU使用率

サーバーのCPU使用率の監視が可能な監視項目と、設定可能な閾値等は以下のとおりです。

監視ルール

監視項目

CPU使用率

アラート閾値

使用率(0~100%)、継続時間(10~30分)

アラート通知先

アラートを通知するメールアドレスの設定(5件まで)

監視ルールの監視内容設定

5件まで

アラート履歴

監視状況の履歴をコントロールパネルに表示

サーバーのCPU使用率の監視を実施する際の概要と、留意事項は以下のとおりです。

CPU使用率

概要

対象サーバーのCPU使用率を監視します。
指定した閾値を指定した継続時間検知するとアラート対象となります。

留意事項

設定時デフォルトで10%以上となりますが、こちらは、推奨値ではありません。
例えばはじめ70%で運用してみるなどして、システムとして適切な値を探し運用してください。

ディスク使用率

サーバーのディスク使用率の監視が可能な監視項目と、設定可能な閾値等は以下のとおりです。

監視ルール

監視項目

ディスク使用率([2])、ディスクのパーティション使用率


2. 作成したサーバーのディスクが対象となります(増設ディスクは含まれません)

アラート閾値

使用率(0~100%)、継続時間(10~30分)

アラート通知先

アラートを通知するメールアドレスの設定(5件まで)

監視ルールの監視内容設定

ディスク使用率:5件まで ディスクのパーティション使用率:1件のみ

アラート履歴

監視状況の履歴をコントロールパネルに表示

サーバーのローカルディスク、付与したディスクの使用率の監視を実施する際の概要と、留意事項は以下のとおりです。

ディスク使用率

概要

対象サーバーのローカルディスク使用率監視を実施します。ローカルディスクの枯渇を未然に防ぐことができます。

留意事項

  • 対象サーバーのローカルディスク全体が対象となります。ローカルディスク中のパーティション、付与した増設ディスクは対象外となります。

  • 設定時デフォルトで10%以上となりますが、こちらは、推奨値ではありません。例えばはじめ70%で運用してみるなどして、システムとして適切な値を探し運用してください。

ディスクのパーティション使用率

概要

対象サーバーのパーティション毎使用率の監視を実施します。各パーティションの枯渇を未然に防ぐことができます。付与した増設ディスクも対象に含まれます。

留意事項

  • ディスクパーティションの使用率は、OS上でdfで表示される使用量と若干の誤差があります。

  • 設定時デフォルトで10%以上となりますが、こちらは、推奨値ではありません。例えばはじめ70%で運用してみるなどして、システムとして適切な値を探し運用してください。

  • 100MBよりも少ない更新量の場合、使用量として計算されないことがあります。

  • パーティションの監視設定が可能なのは、起動中のサーバーのみになります。

  • Linux系OSの場合、監視対象領域をアンマウントしても、使用率の情報が更新されません。

ロードバランサー
  • ニフクラ基本監視ではサーバー以外にも、ロードバランサー(L4)、マルチロードバランサーのネットワーク流量の監視が可能です。

  • ロードバランサー(L4)、マルチロードバランサーの監視が可能な監視項目と、設定可能な閾値等は以下のとおりです。

監視ルール

監視項目

  • ロードバランサー(総量)/ロードバランサー(ポート)のいずれか

  • マルチロードバランサー(総量)/マルチロードバランサー(ポート)のいずれか

アラート閾値

使用率(0~100%)、継続時間(10~30分)

アラート通知先

アラートを通知するメールアドレスの設定(5件まで)

監視ルールの監視内容設定

1件のみ

アラート履歴

監視状況の履歴をコントロールパネルに表示

  • ロードバランサー(L4)、マルチロードバランサーの流量の監視を実施する際の概要と、留意事項は以下のとおりです。

ロードバランサー(L4)、マルチロードバランサー共通

概要

ロードバランサー作成時に指定した流量の使用率を監視することが可能です。
設定したポートごとに監視を実施するか、総量を監視することが可能です。

留意事項

  • 設定時デフォルトで10%以上となりますが、こちらは、推奨値ではありません。
    ロードバランサー作成時に設定した流量を超過した通信はドロップされる仕様となるため、本仕様を考慮した閾値を設定してください。
    例えばはじめ70%で運用してみるなどして、システムとして適切な値を探し運用してください。

  • 監視間隔は10分間隔となります。継続時間を10分とした場合、初めの監視で検知して10分後の監視で再度検知した場合にアラート対象となります。
    監視間隔の間にだけ指定した閾値から復帰していても検知できません。

共通留意事項/考慮事項

ニフクラ基本監視での共通の留意事項/考慮事項を記載します。

留意事項/考慮事項

監視間隔

監視間隔は10分間隔となります。例えば継続時間を10分とした場合、初めの監視で検知して10分後の監視で再度検知した場合にアラート対象となります。
監視間隔の間にだけ指定した閾値から復帰していてもアラート対象となります。また、監視のタイミングだけ、閾値から復帰している状況でもアラート対象になりません。

監視間隔を短くしたい、リアルタイムで監視したいなどの要件がある場合は、ニフクラ基本監視ではなく別途監視の仕組みを検討してください。

監視ルールの監視内容設定

PING結果/サーバーステータス(停止)/CPU使用率/メモリー使用率/ディスク使用率に関しては一つの監視ルールで5件まで複合した監視ルールの設定が可能です。
通知の条件として、「すべての条件に一致した場合通知する」か、いずれかの条件に一致した場合通知する」かを選択可能です。

監視設定ルール数

サーバー(PING結果/サーバーステータス(停止)/CPU使用率/メモリー使用率/ディスク使用率)、ロードバランサー、マルチロードバランサー、ディスクパーティションで作成できる監視ルール数はそれぞれ10件までとなります。

アラートメールの通知タイミング

アラートメールは、監視ルールの条件によりアラートを検知した場合と、検知したアラートから復旧した場合に送信されます。

マウントするファイルシステムについて

以下のファイルシステム以外でマウントしている場合は使用量を取得できないため、監視設定できません。
Ext2, Ext3, Ext4, ReiserFS, ZFS, NTFS, VFAT, UFS, PCFS, HFS, MS-DOS

スタンダードイメージによる仕様

以下のスタンダードイメージから作成されるサーバーはファイルシステムが XFS であるため、open-vm-tools を 9.10.x. 以降のバージョンにバージョンアップすることで利用可能になります。

CentOS 7.0 プレーンインストール(64bit)
CentOS 7.1 プレーンインストール(64bit)
Red Hat Enterprise Linux 7.0(64bit)
Red Hat Enterprise Linux 7.1(64bit)

基本監視で補えない場合の対応

以下のようにシステムを統合的に監視したい場合は、ニフクラの基本監視サービスではなく、別途 Zabbix等の監視用のソフトウエアを導入してください。

  • 仮想サーバー内部でログ監視やプロセス監視を行いたい場合

  • 異常を検知した際に、仮想サーバー内部でリカバリ用のコマンドを発行したいような場合

  • システム内部の監視だけではなく、WebサービスのURL監視等も含めて、統合的/一元的に監視をしたいような場合

有人監視詳細

  • ニフクラ有人監視に関して詳細を記載します。

  • 有人監視で補える監視対象に関して以降に詳細を記載していきます。

監視の種類

監視対象

ニフクラ監視機能

基本監視

有人監視

サービス監視

  • URL応答監視

  • 画面遷移監視

  • その他


一部対応可能

仮想OS以上のインフラ監視

OS監視

  • OSのログ

  • OSの起動状態等


一部対応可能


一部対応可能

リソース監視

  • メモリ

  • ネットワークトラフィック

  • CPU

  • ディスク


一部対応可能

プロセス監視

  • プロセス稼働監視

  • セッション数

ログ監視

  • OSログ、MWログ、アプリログ

ニフクラ以外のリソース(拠点環境の物理サーバー等)

詳細項目

利用者監視範囲のサービス監視、OS監視、リソース監視、プロセス監視の詳細に対して基本監視で補えるものを記載します。以降に、各監視機能の基本仕様、概要、留意事項を記載します。

監視対象

有人監視サービス

アラート設定可否

補足

サービス監視

  • URL応答監視

  • 画面遷移監視

URL応答監視

URI応答監視

画面遷移監視

OS監視

  • OSのログ

  • OSの起動状態

OSのログ

OSの死活監視

ICMP応答監視

リソース監視

  • メモリ

  • ネットワークトラフィック

  • CPU

  • ディスク

メモリ使用率

メモリ使用率

メモリ 空きメモリ/使用中メモリ/キャッシュメモリ/バッファ

スワッピング 空き領域/使用中領域/使用率

スワップ使用率

ネットワークトラフィック

ネットワーク TCP接続数

CPU使用率

CPU使用率

CPU I/O待ち/アイドル状態

ロードアベレージ

ロードアベレージ

ディスク使用率

ディスク使用率

ディスクビジー率/ I/O応答時間

プロセス監視

  • プロセス稼働監視

  • セッション数

プロセス稼働監視

プロセス監視

セッション数

URI応答監視

指定されたURLのhttp/httpsの応答を監視します。

監視概要

指定されたURLのhttp/https応答を監視

エラー判定

以下いずれかの場合

  • 20秒以内に応答がない場合

  • httpステータスによる判定が400番系もしくは500番系の場合
    ※リダイレクトの場合はリダイレクト先のhttpステータスで判定し、リダイレクト回数が7回を超えた場合はエラーと判定

警報条件

3分間隔で監視を実施
エラー判定後、2秒間隔で3回リトライ処理を行い、3回連続でエラーの判定が出た場合に通知

監視システムの方式

外部監視

対象プロトコル

http/https

設定可能URLの上限数

監視対象のサーバー数×5
※サーバー1台毎の上限数を合計して任意で振り分け可能

URI応答監視を実施する際の概要と、留意事項は以下のとおりです。

概要

監視方式は外部監視となります。有人監視システムから監視対象のURLへアクセスを行い、URIを監視する方式となります。
構築したWEBサイトのtopページ、サービスとして重要なページ等を監視対象にすることにより、WEBサイトの監視を実現可能です。

留意事項

監視対象サービスが利用するポートに対して、有人監視システムから接続が可能である必要があります。

ICMP応答監視

サーバーの死活監視を実施します。

監視概要

サーバーの死活を監視

エラー判定

以下のいずれかの場合

  • 10秒以内に応答がない場合

  • ICMPによるpingの結果がNGな場合

警報条件

3分間隔で監視を実施。エラー判定後、2秒間隔で2回リトライ処理を行い、2回ともエラーの判定が出た場合に通知

監視システムの方式

外部監視

監視プロトコル

ICMP

ICMP応答監視を実施する際の概要と、留意事項は以下のとおりです。

概要

監視方式は外部監視となります。有人監視システムから監視対象サーバーに対してアクセスを行い、サーバーの死活を監視する方式となります。

留意事項

  • 監視対象サーバーに対して、有人監視システムから接続が可能である必要があります。

  • ICMP応答監視を有効にしている状態でエージェント切断を検知した場合はICMP応答監視として検知し通知します。

メモリ使用率

サーバーのメモリ使用率の監視を実施します。

監視概要

メモリ使用率を監視

エラー判定

メモリ使用率(初期値95%)※閾値は任意の値に変更可能

警報条件

3分間隔で監視を行い、3回連続で閾値を超えた場合に通知

監視システムの方式

内部監視

メモリ使用率の監視を実施する際の概要と、留意事項は以下のとおりです。

概要

監視方式は内部監視となります。エージェントがサーバー内部ステータスを収集し、外部の有人監視システムにネットワーク経由でデータを送信します。

留意事項

  • 監視対象サーバーから、有人監視システムのIPアドレスおよびポート番号に対してインターネット接続が可能である必要があります。通信はTLS接続により暗号化されます。

  • 初期値は95%となりますが、こちらは、推奨値ではありません。例えばはじめ70%で運用してみるなどして、システムとして適切な値を探し運用してください。

  • エージェントではOSのリソースを消費します[3]。 消費リソースを考慮したサイジングが必要です。


3. エージェントで動作する2種類のプログラムの消費量に関しては、下記の表を参照してください。

エージェントで動作する2種類のプログラムの消費リソース(FJCTの検証値となります。)

項目名

pz-agent

pz-commd

備考

CPU使用量

0%~5%

0% ~ 5%

メモリ使用量

9MB 程度

12MB 程度

ネットワーク使用量

数 KB

3分間平均

スワップ使用率

サーバーのメモリ使用率の監視を実施します。

監視概要

スワップ使用率を監視

エラー判定

スワップ使用率(初期値30%)※閾値は任意の値に変更可能

警報条件

3分間隔で監視を行い、3回連続で閾値を超えた場合に通知

監視システムの方式

内部監視

備考

Windows Serverは対象外

メモリ使用率の監視を実施する際の概要と、留意事項は以下のとおりです。

概要

監視方式は内部監視となります。エージェントがサーバー内部ステータスを収集し、外部の有人監視システムにネットワーク経由でデータを送信します。

留意事項

  • 監視対象サーバーから、有人監視システムのIPアドレスおよびポート番号に対してインターネット接続が可能である必要があります。通信はTLS接続により暗号化されます。

  • 初期値は30%となりますが、こちらは、推奨値ではありません。例えば初期値のまま運用してみるなどして、システムとして適切な値を探し運用してください。

  • エージェントではOSのリソースを消費します[4] 。消費リソースを考慮したサイジングが必要です。


4. エージェントで動作する2種類のプログラムの消費量に関しては、有人監視のメモリ使用率 を参照してください。
CPU使用率

サーバーのCPU使用率の監視を実施します。

監視概要

CPU使用率を監視

エラー判定

CPU使用率(初期値95%)※閾値は任意の値に変更可能

警報条件

3分間隔で監視を行い、3回連続で閾値を超えた場合に通知

監視システムの方式

内部監視

メモリ使用率の監視を実施する際の概要と、留意事項は以下のとおりです。

概要

監視方式は内部監視となります。エージェントがサーバー内部ステータスを収集し、外部の有人監視システムにネットワーク経由でデータを送信します。

留意事項

  • 監視対象サーバーから、有人監視システムのIPアドレスおよびポート番号に対してインターネット接続が可能である必要があります。通信はTLS接続により暗号化されます。

  • 初期値は95%となりますが、こちらは、推奨値ではありません。例えばはじめ70%で運用してみるなどして、システムとして適切な値を探し運用してください

  • エージェントではOSのリソースを消費します[5] 。消費リソースを考慮したサイジングが必要です。


5. エージェントで動作する2種類のプログラムの消費量に関しては、有人監視のメモリ使用率 を参照してください。
ロードアベレージ

サーバーのロードアベレージの監視を実施します。

監視概要

ロードアベレージを監視

エラー判定

5分間のロードアベレージについて、5プロセスを上回った場合 ※プロセス数の閾値は任意の値に変更可能

警報条件

3分間隔で監視を行い、3回連続で閾値を超えた場合に通知

監視システムの方式

内部監視

備考

Windows Serverは対象外

メモリ使用率の監視を実施する際の概要と、留意事項は以下のとおりです。

概要

監視方式は内部監視となります。エージェントがサーバー内部ステータスを収集し、外部の有人監視システムにネットワーク経由でデータを送信します。

留意事項

  • 監視対象サーバーから、有人監視システムのIPアドレスおよびポート番号に対してインターネット接続が可能である必要があります。通信はTLS接続により暗号化されます。

  • プロセス数の閾値の初期値は5プロセスとなっています。こちらは、推奨値ではありません。例えばはじめ初期値で運用してみるなどして、システムとして適切な値を探し運用してください。

  • エージェントではOSのリソースを消費します[6] 。消費リソースを考慮したサイジングが必要です。


6. エージェントで動作する2種類のプログラムの消費量に関しては、有人監視のメモリ使用率 を参照してください。
ディスク使用率

サーバーのディスク使用率の監視を実施します。

監視概要

ディスク使用率を監視

エラー判定

ディスク使用率(初期値中レベル90%、高レベル95%)
※閾値はマウントポイント(Linuxの場合)、ドライブ(Windows Serverの場合)毎に任意の値に変更可能

警報条件

3分間隔で監視を行い、3回連続で閾値を超えた場合に、中高レベル問わず3回目のレベルについて通知
例)中→中→高の場合は高レベルについて通知

監視システムの方式

内部監視

備考

監視対象のサーバーに含まれるマウントポイントはすべて監視対象(サーバーにマウントされた増設ディスクも監視可能)
ディスクi-node使用率の閾値は設定不可

メモリ使用率の監視を実施する際の概要と、留意事項は以下のとおりです。

概要

監視方式は内部監視となります。エージェントがサーバー内部ステータスを収集し、外部の有人監視システムにネットワーク経由でデータを送信します。

留意事項

  • 監視対象サーバーから、有人監視システムのIPアドレスおよびポート番号に対してインターネット接続が可能である必要があります。通信はTLS接続により暗号化されます。

  • 初期値は中レベル90%、高レベル95%となりますが、こちらは、推奨値ではありません。例えばはじめ初期値で運用してみるなどして、システムとして適切な値を探し運用してください。

  • エージェントではOSのリソースを消費します[7] 。消費リソースを考慮したサイジングが必要です。


7. エージェントで動作する2種類のプログラムの消費量に関しては、有人監視のメモリ使用率 を参照してください。
プロセス監視

サーバーのプロセス監視を実施します。

監視概要

指定されたプロセスの起動有無を監視

エラー判定

指定されたプロセスの有無。[8]


8. エラー判定の閾値はプロセス毎にプロセス数の下限数を任意の値に変更可能

警報条件

3分間隔で監視を行い、エラー判定を下回った場合に通知
(例)正常なプロセス数が5本の場合、4本以下が検知された場合に警報通知を実施

監視システムの方式

内部監視

対象プロセス上限数

1サーバーあたり5種類のプロセス

メモリ使用率の監視を実施する際の概要と、留意事項は以下のとおりです。

概要

監視方式は内部監視となります。
エージェントがサーバー内部ステータスを収集し、外部の有人監視システムにネットワーク経由でデータを送信します。

留意事項

  • 監視対象サーバーから、有人監視システムのIPアドレスおよびポート番号に対してインターネット接続が可能である必要があります。通信はTLS接続により暗号化されます。

  • 初期値はありません。対象のプロセスの下限数を、プロセスに合わせて設定してください。

  • エージェントではOSのリソースを消費します[9] 。消費リソースを考慮したサイジングが必要です。


9. エージェントで動作する2種類のプログラムの消費量に関しては、有人監視のメモリ使用率 を参照してください。
警報通知
  • 警報通知有人監視サービスでは、メール、電話での通知が可能です。詳細を以下に記載します。要件に合わせて、通知方法を選択してください。

    • 警報通知は正常な状態から警報条件を満たした場合に行います。

    • 通知方法は「メール」、「電話」、「メール+電話」から選択可能です。

    • 通知先は「メール」、「電話」それぞれ5件ずつ登録が可能です。

    • 「メール」、「電話」ともに、指定したそれぞれの通知先へ、所定のフォーマットで通知します。

監視項目

メール

電話

メール+電話

ICMP応答監視

サーバーリソース監視

CPU使用率

ロードアベレージ

メモリ使用率

スワップ使用率

ディスク使用率

×

〇(メールのみの通知)

プロセス監視

URI応答監視

アラートメール監視

×

〇(電話のみの通知)

一次対応、レポーティング
  • 一次対応、レポーティング

    • ニフクラ有人監視では一次対応、レポーティングが利用可能です。

    • 一次対応を利用することにより、夜間に運用担当者をローテーションで待機させる等の代替できる可能性があります。

  • 一次対応

    • 警報通知時に利用者から指示・依頼されたサーバーの停止・起動を行います。

    • 仮想基盤側から電源操作を実施するため、OSのアカウント情報等は不要です。

    • 一次対応は、ニフクラのコントロールパネル/APIのメンテナンスの際にも対応が可能です。

  • レポーティング

    • 専用のWEBよりレポートを閲覧することが可能です。

    • リソースモニタ

      • 監視を有効にしているリソースのグラフを閲覧可能

      • 過去3か月のデータが保存(指定した日時から24時間、または1週間分のリソース推移を表示可能)

    • 監視レポート

      • 毎月末尾締めでデータを集計し、翌月2日より以下が閲覧可能

        • 月毎のリソースのグラフおよび警報の閾値

        • 期間内に発生した警報の一覧

      • 閲覧期限はなく、過去のすべてのレポートの閲覧が可能

共通留意事項/考慮事項

ニフクラ基本監視での共通の留意事項/考慮事項を記載します。

留意事項/考慮事項

リソース監視の監視間隔

監視間隔が3分間隔となります。(通知条件となる回数等はそれぞれ異なる)。リアルタイムチェックはできません。
3分間隔で要件を満たせない場合、一度でも検知したらエラー判定したい等の要件がある場合別途ミドルウェア等の導入を検討してください。

監視対象サーバー

監視対象にできるサーバーは、ニフクラ上のサーバーでグローバルのIPアドレスを直接付与しているサーバーに限ります。
ニフクラ以外のサーバー、ニフクラ内でもプロキシ経由、NAT経由で外部と通信できる状態のサーバーも対象外になります。

システム監視

以下のようにシステムを統合的に監視したい場合は、ニフクラの有人監視サービスではなく、別途 Zabbix等の監視用のソフトウェアを導入してください。

  • 仮想サーバー内部のログ監視を行いたい場合

  • 異常を検知した際に、仮想サーバー内部でリカバリ用のコマンドを発行したいような場合

  • ニフクラ上のシステムの監視だけではなく、ニフクラと別途接続したホスティング環境、拠点環境等も含めて、統合的/一元的に監視をしたいような場合

参考ページ

本ドキュメントに記載したサービス、監視に関する参考情報のリンクを記載します。詳細の確認等に参照してください。

ドキュメント掲載先

ドキュメント名または本ドキュメント内のタイトル

内容

ニフクラ
一般公開ページ

基本監視

ニフクラで提供している基本監視サービスについての仕様が記載されています。
https://pfs.nifcloud.com/service/watch.htm

ニフクラ
一般公開ページ

有人監視

ニフクラで提供している有人監視サービスについての仕様が記載されています。
https://pfs.nifcloud.com/service/support_manned.htm

ニフクラ
一般公開ページ

障害・お知らせ通知について

ニフクラの障害情報、メンテナンス情報の通知方法、通知ポリシー等の詳細が記載されています。
https://pfs.nifcloud.com/service/notice.htm

ニフクラ
一般公開ページ

ニフクラ Information

ニフクラのトラブル・メンテナンス情報が掲載されます。
https://pfs.nifcloud.com/info/

ニフクラ
一般公開ページ

ニフクラ お問い合わせ

ニフクラの問い合わせ窓口が記載されています。
https://pfs.nifcloud.com/inquiry/

ニフクラ
一般公開ページ

トラブルの早期解決が期待できるお問い合わせ方法

問い合わせ時に早期解決のための、問い合わせ方法等が記載されています。
https://pfs.nifcloud.com/inquiry/best_practice.htm

ニフクラブログ

ゾーン間冗長構成システムの監視実装検証

ニフクラでのゾーン障害等に備えるため、システムをゾーン間で冗長化した構成を構築し、ゾーン間をZabbixを利用して相互に監視を行った検証を紹介しています。
https://blog.pfs.nifcloud.com/20180702_redundant_configuration

ニフクラブログ

ニフクラの各種ログを自動収集して解析してみる

ニフクラではログ収集を行う機能がないため、splunkを利用してログ収取を行い、解析を行う検証を紹介しています。
https://blog.pfs.nifcloud.com/20181207_serverlog_analysis

ニフクラブログ

RDBを利用したZabbix監視構成の検証をしてみた

ニフクラRDBをZabbixで監視する検証を紹介しています。
https://blog.pfs.nifcloud.com/20190329_zabbix_rdb

導入のご相談はお電話でも受け付けております。

0120-22-1200

0120-22-1200

受付時間:9:00~17:45(土日祝・当社指定の休業日を除く)
※携帯電話・PHSからもご利用可能