企業におけるシステム運用では、常に安定したサービスをエンドユーザーに提供することが求められる。障害は避けられないが、障害が発生した際に、いかに早く問題を発見し迅速に対応するか、さらに未然に障害を予兆検知できるかが重要となる。
システムの安定稼働のためにシステムの監視は有効な手段であり、欠かすことはできない。しかし一口に監視といってもさまざまな形態があり、企業規模や業務内容によって監視のレベルや手法は異なる。ここでは監視を、性能監視、メッセージ監視、障害監視の3つに大別し、それらの基本について解説していく。
性能監視
性能監視では、システム資源の利用状況を把握して、システムが最適に稼働していることを監視する。性能監視を定常的に実施することでシステム資源の利用状況の傾向を把握でき、障害発生の異常事態を検知可能となる。
監視の対象はサーバーからネットワークまで幅広く該当するが、とくにプロセッサ、メモリ、ディスクが挙げられる。システムの良好なパフォーマンスを実現するためには、この3資源のバランスが重要で、いずれもある一定の限界を超えるとパフォーマンスが急激に悪化する。システムがこのような状態に陥っていないかを監視するのが、IBM iにおける性能監視の第一歩と言える。
監視方法はさまざまあるが、最も簡単な方法としてIBM Navigator for i(以下、Navigator for i)によりWebブラウザから主要な管理タスクを実行し確認する方法がある。たとえば、図表1はNavigator for iのホームページであるが、CPUとシステムASPの使用率に関するリソース状況をリアルタイムにグラフ表示できる。

また、Navigator for iでは、たとえばメモリであればメモリ・プールというように性能監視で監視すべき項目がメニュー形式で事前定義されており、管理者はメニューから選択するだけなので、IBM i初心者にも使いやすく、わかりやすい。
また外部システムとして監視サーバーを持っていて、他システムと同様に、IBM iの性能監視も対象に含めたい場合もあるだろう。その場合はIBM iのOS機能として同梱されているSNMPエージェントの機能を使用することにより、システム資源情報をSNMPマネージャーに連携させることが可能である。
図表2 Navigator for iのQSYSOPRメッセージ待ち行列画面
メッセージ監視
IBM iのメッセージとはログを意味しており、通常、メッセージ待ち行列(*MSGQ)と呼ばれるオブジェクトに格納されていく。IBM iではシステムの内部が構造化されているが、メッセージも、OS、ジョブ、といったレベルに分けて出力され、見やすくわかりやすいメッセージにより問題が早期解決できるように工夫されている。
OSレベルで出力されるメッセージとしては、システム操作員メッセージ待ち行列(QSYSOPR)がある。
図表2にNavigator for iのSYSOPRメッセージ待ち行列画面を紹介する。
QSYSOPRのMSGQには、システムにおいて主要なイベントが発生したときや、障害が発生したときなどにメッセージが出力される。メッセージによっては、応答が必要なものもある。QSYSOPRのMSGQはIBM iの管理者にとって基本となるメッセージ監視対象であり、重要なメッセージを見落とさないように注意したい。
IBM i 7.5 TR1およびIBM i 7.4 TR7ではQSYSOPRでメッセージを表示する場合、返信が必要なメッセージのみを表示できるように機能改善されている。
メッセージ待ち行列はQSYSOPRのようにシステム提供されるものもあるが、ユーザーが作成することも可能である。たとえば業務アプリケーションごとに専用のメッセージ待ち行列を作成し、監視することもできる。
障害監視
障害監視ではハードウェアやソフトウェアの障害を監視するが、IBM iではこれらの障害や警告についてもQSYSOPRメッセージ待ち行列に出力されるので、まずはここを監視することとなる。
このほかに、IBMではユーザーのシステム運用の負担を減らすために「ESA」と呼ばれるを提供している。ESAはエレクトロニック・サービス・エージェントの略で(Electronic Service Agent)、IBM iやHMCがハードウェア障害時に問題をIBMに自動発報する機能である。必要に応じて、これらのサービスの利用も検討してほしい。
統合監視ツール
ここまでNavigator for iを中心に監視方法について説明してきたが、Navigator for iはIBM iに特化したツールである。そのためIBM i以外に、オンプレミス環境やクラウド環境に複数のシステムをもつ場合は、運用監視業務の効率化のために、IBM iを監視対象の一部として含めることのできる統合監視ツールを求められることが多い。
IBM iも監視対象とする統合監視ツールとしては、Tivoli Monitoringやサードベンダー製品があるが、今回はIBM Instana Observability(以下、Instana)を紹介したい。
Instanaは、AIを活用したシステムを高度に可視化するAPM(Application Performance Management)製品である。シングル・ダッシュボード上でリアルタイムに複数のアプリケーションやシステム・リソースを可視化できることはもちろん、AI機能により障害となる問題の原因を迅速に自動的に特定できる。
詳細は、以下の記事(IBM Instanaを使ってIBM Powerを可視化する)を参考にされたい。昨今のAIの進歩のスピードを踏まえ、今後も機能強化されていくであろうInstanaについても注目しておきたい。

著者
松川 真由美氏
日本アイ・ビー・エム システムズ・エンジニアリング株式会社
オープン・コンピテンシー・センター
新・IBM i入門ガイド[操作・運用編]
01 IBM iの実行環境
02 IBM iのストレージ管理
03 IBM iのログ
04 IBM iのユーザー管理
05 IBM iのセキュリティ
06 IBM iの印刷機能
07 IBM iの保管/復元
08 IBM iの基本操作 [コマンド編]
09 IBM iの基本操作 [ツール編]
10 IBM iの監視 基本
11 IBM iサービス
12 IBM iのトラブルシューティング
13 操作・運用編 FAQ
[i Magazine 2024 Winter号掲載]