サーバー監視(サーバーモニタリング)とは、物理サーバーや仮想サーバーのアクティビティを可視化するプロセスです。サーバーは、デバイスを指すこともあれば、最近では「アプリケーション」を指すことも多くなりました。サーバーは、他のデバイスやアプリケーションに提供する情報、またはオンデマンドでユーザーに提供する情報を保存して処理します。1台のサーバーが数百、あるいは数千ものリクエストを同時に処理することもあり、組織内の全サーバーが期待どおり動作しているか監視していくことは、ITインフラ管理においてきわめて重要です。
ご存じの方もいらっしゃると思いますが、Splunkを使用すると、サーバー監視がもっと簡単になります。
Splunk Infrastructure Monitoringなら、お使いのすべてのサーバー、コンテナ、アプリケーションのパフォーマンスをリアルタイムで監視できます。
ただし、サーバーには非常に多くの種類があり、「サーバーの監視」と一口に言っても実際はそれほど単純ではありません。Webサーバーは物理デバイスであることもありますが、最近では仮想サーバーが増えています。仮想サーバーは多数のクライアントが共用する物理マシンに収容されており、そこでそれぞれのクライアントが独立したWebサーバーシステムを運用しています。メールサーバー、プリントサーバー、データベースサーバーは、多種多様なサーバーデバイスやソフトウェアのほんの一部です。
このように多様なサーバーについて、問題を監視してアラートをあげるには、それぞれに応じた監視技術が必要です。一般的に使用されているような既製のサーバー監視ツールですべてに対応することは難しいでしょう。この記事では、各種サーバー監視ツールや監視サービスがどのように動作し、どのような価値を企業にもたらすか、そして組織にとって最も適したシステムを選択・導入する方法について説明していきます。
サーバーはITインフラにおいて最も重要な要素の1つです。IT環境の健全性を確保するには、サーバーのパフォーマンスとアップタイムを監視することが欠かせません。Webサーバーが障害やパフォーマンスの問題を起こし、オフラインになったり、動作が遅くなると、顧客が別のサイトへ移動してしまう可能性があります。また、社内のファイルサーバーにエラーがあると、会計ファイルや顧客記録などの重要なビジネスデータが破損しかねません。
サーバー監視は、システムを監視してシステムの稼動状況に関する複数の重要なメトリクスをIT管理者に提供するように設計されています。一般的に、サーバー監視ツールはアクセス性(サーバーが稼動しており、アクセス可能かどうか)をテストします。そして、応答時間(ユーザーの期待に沿った速度が出ているか)を測定して、エラー(ファイルの損失や破損、セキュリティ違反、その他の問題)を知らせます。さらに、十分なディスク容量が残っているか、メモリやCPUの使用率が高く、逼迫しそうかなどについての予測も行います。サーバー監視は主にリアルタイムのデータ処理に使用されますが、履歴データを評価するという観点でも価値があります。過去数週間または数カ月分のデータを分析することでサーバーのパフォーマンスの劣化状況を判断し、場合によっては完全にクラッシュする時期を予測できることもあります。
サーバー管理とは、サーバーのアップタイムと信頼性を確保して高パフォーマンスかつエラーのない稼動を維持していくための、継続的なサーバー運用プロセスです。より具体的には、サーバーを管理して稼動させ続けるために日々行うアクティビティを指します。常にサーバーを利用可能な状態に保って最適なユーザーエクスペリエンスを提供することを主な目的としています。
サーバー管理は組織やそのIT構成、運用しているサーバーの種類や数に応じて、さまざまな機能から構成されます。一般的な組織の場合、サーバー管理には毎日の監視、ソフトウェアアップデートのインストール、新しい機器のインストールと設定、トラブルシューティングと優先順位付けが含まれます。また、組織のニーズに合った十分なシステムリソースを確保するためのプロビジョニングやキャパシティプランニングが含まれることもあります。たとえば、ある企業のWebサーバーで、10,000人の同時接続ユーザーをサポートし、かつ12,000ユーザーまでのバーストを許容する必要がある場合、サーバー管理者はこのキャパシティをオンデマンドで確保しようとするでしょう。
仮想環境のサーバー管理では、サーバーに問題がないか実際にそのハードウェアまで行って確認するということができません。そのため、特有の課題が生じます。とはいえ、サーバーが物理的なハードウェアデバイスである場合にも、やはり別の課題があります。いずれの環境であっても、スペース、電力、ネットワーク帯域幅、そしてそれらに対応する冷却能力という要素がある以上、サーバーはソフトウェアとハードウェアの両観点から管理していく必要があります。
サーバー管理システムは、ITプロフェッショナルが(多くの場合、複数台の)サーバーを管理するためのソフトウェアツールで、通常、運用データ(CPU使用率、メモリ、ディスク領域などのディスク使用のメトリクス、ログファイル、OS監視の統計情報、ユーザーアクセスおよびセキュリティ情報など)を収集し、それを管理ダッシュボードにリアルタイムで表示します。また、履歴データの収集も可能で、IT管理者はこれらのメトリクスの推移を監視できます。
仮想環境では、サーバー管理システムとハイパーバイザー(仮想マシンモニターとも呼ばれます)を区別する必要があります。ハイパーバイザーは仮想マシン(または仮想サーバー)の作成と運用を行うシステムで、その役割は複数の仮想マシンを運用者の仕様に従って稼動し続けることにあり、必ずしもパフォーマンス情報を監視するわけではありません。
「サーバーパフォーマンス監視」とは、サーバーのパフォーマンスメトリクスのみを対象としたサーバー監視です。物理サーバーでは、メモリとCPUの使用率、ディスクI/O、ネットワークパフォーマンスが基本的なメトリクスです。仮想サーバーでは、サーバーの種類にもよりますが、データベースやWebサーバーの応答時間、ネットワーク帯域幅の使用率、リソース使用率に関する各種の測定値がパフォーマンスメトリクスとなる可能性があります。
サーバーパフォーマンス監視は、さまざまな理由から重要です。第一に、速度の低下やその他のパフォーマンスの問題が、発生しつつある障害を特定する手がかりになるといったように、予測として機能することがよくあります。ボトルネックの特定はどのコンポーネントやサービスのアップグレードが必要かを知るために役立ち、キャパシティ管理ツールは新しいアプリケーションやその他の新規ワークロードをサポートするために必要なリソースを見積もる際に利用することができます。
さらに、サーバーパフォーマンス監視の情報が有用となるもう1つの要素として「契約の遵守」があります。多くの企業では一定レベルのアップタイムやパフォーマンスの提供を保障していますが、金融取引、SaaSサービス、ストリーミングメディアなどの負荷の高い環境では、保障されたアップタイムやパフォーマンスの維持が重大な意味を持ちます。パフォーマンスが一定レベルを下回った場合、非常に厳しいペナルティが科されることさえあります。
サーバー監視システムは、オンプレミス/従来型のソフトウェアベースシステム、クラウドベース/SaaSシステム、モバイルシステムの3つの基本タイプに分かれます。さらに、オンプレミスとクラウドの技術を組み合わせて独自のカスタムソリューションを提供するハイブリッドシステムもあります。各アプローチの長所と短所は以下のとおりです。
オンプレミス/従来型のソフトウェアベースシステムは、自社所有の社内ハードウェアにインストールされたソフトウェアを中心に構築されます。これは従来型のソフトウェアモデルであり、一般に初期費用が高額で、ベンダーから継続的なサポートを受けるための保守プランにも費用がかさみます。加えて、インストール環境がそれぞれに異なるため、オンプレミスのソフトウェアインストールは複雑で時間がかかり、トラブルが起こりがちです。とはいえ、オンプレミスのソフトウェアはカスタマイズオプションが豊富であり、また、データの保管場所についても制御しやすいことが多く、規制機関への報告時に便利です。しかしながら、一般的にオンプレミスのソフトウェアはクラウドベースと比較して高額です。
クラウド/SaaSシステムは、インストールと管理をすべてWeb経由で行う監視システムです。ユーザーのインフラ内にソフトウェアをインストールする必要がないため、システムの導入と立ち上げが迅速で、わずか数時間で済むことさえあります。クラウドサービスは柔軟性に富んでいますが、多くの場合、カスタマイズやパーソナライズを直接制御できません。クラウドベースの監視ソフトウェアはサブスクリプションとして販売されており、クラウド監視プロバイダーの多くは長期契約を必要としないため、オンプレミスのソリューションに比べて導入が簡単で、リスクも低く抑えることができます。
モバイルシステムはサーバー監視システムとしては主流ではありませんが、多くのオンプレミスやクラウドのプロバイダーがオプションとしてモバイル版システムもサポートしています。その名が示すとおりスマートフォンやタブレット上で実行され、移動中でもサーバー監視データにアクセスできます。ただし、PC版のシステムに比べ、モバイル版では機能が限られている場合があります。モバイル監視オプションはほとんどのクラウドベースシステムで提供されており、オンプレミスシステムの一部でも提供されています。
それぞれ環境が異なる場合でも、サーバー監視ソリューションへの投資から最大限の効果を得るために役立つ基本的なベストプラクティスがあります。
サーバー監視ツールを検討する際には、以下のような主要なサーバー監視機能を評価することをおすすめします。
サーバーは企業にとって必須の技術であり、最大限のサーバーパフォーマンスを得るためにIT管理者があらゆる手を尽くすのも、当然と言えます。そして、それを可能にするための鍵となるのが、優れたサーバー監視および管理システムです。ここで忘れてはならないのは、問題が発生した後にその問題を知らせるだけのツールは、最高のサーバー監視ツールとは言えないということです。優れたツールとは、潜在的な問題を、それが重大な障害を引き起こす前に知らせ、事前に解決策を講じることを可能にするようなツールです。
このブログはこちらの英語ブログの翻訳です。
この記事について誤りがある場合やご提案がございましたら、ssg-blogs@splunk.comまでメールでお知らせください。
この記事は必ずしもSplunkの姿勢、戦略、見解を代弁するものではなく、いただいたご連絡に必ず返信をさせていただくものではございません。
Splunkプラットフォームは、データを行動へとつなげる際に立ちはだかる障壁を取り除いて、オブザーバビリティチーム、IT運用チーム、セキュリティチームの能力を引き出し、組織のセキュリティ、レジリエンス(回復力)、イノベーションを強化します。
Splunkは、2003年に設立され、世界の21の地域で事業を展開し、7,500人以上の従業員が働くグローバル企業です。取得した特許数は1,020を超え、あらゆる環境間でデータを共有できるオープンで拡張性の高いプラットフォームを提供しています。Splunkプラットフォームを使用すれば、組織内のすべてのサービス間通信やビジネスプロセスをエンドツーエンドで可視化し、コンテキストに基づいて状況を把握できます。Splunkなら、強力なデータ基盤の構築が可能です。