あなたやあなたが働く会社には、下のような状況(または課題)のいくつかが当てはまるのではないでしょうか。実際にこのような発言をしたり、耳にしたりした覚えがあるのでは?
Splunkはさまざまな方法でこれらの課題を支援できます。今日は、特にContent Pack for Splunk Observability Cloudを利用して上記のような状況に取り組む方法をご紹介しましょう。
このコンテンツパックを利用することで、Splunk Synthetic Monitoring、Splunk Infrastructure Monitoring、Splunk Application Performance Monitoringのすべてを、Splunk IT Essential Work (ITE Work)およびSplunk IT Service Intelligence (ITSI)の単一のビューから利用できるようになります。わずか数回のクリックで結果をドリルダウンできるほか、コンテキストに沿ったSplunk Observability Cloudへのディープリンクも提供されます。
さらに、このコンテンツパックにはサービスアナライザーが1つ、サービスが25以上、主要業績指標(KPI)が70以上、ダッシュボードが15以上、グラステーブルが5つ、テクノロジーアドオン(TA)が2つ、それぞれ含まれています。これらを活用して、日単位ではなく分単位で結果を取得してオブザーバビリティデータを可視化できるので、IT運用担当者、DevOps担当者、ビジネスやITのエグゼクティブはその情報を基に状況を理解し、迅速にアクションを起こすことができます。
ITE WorkとITSIに無料で付属しますが、その点については、Microsoft Exchange、Microsoft 365、サードパーティ製APM向けのコンテンツパックに関する私のブログで、すでにお読みになった方もおられるかもしれません。
図1-1. オブザーバビリティコンテンツパック:Executive Glass Table (エグゼクティブグラステーブル)
Content Pack for Splunk Observability Cloudから得られる大きなメリットの1つは、ITSIからSplunk Observability Cloudへのディープリンクによって、完全なコンテキストに沿ってソースシステム内の根本原因の情報を5秒以内で取得できることです。
これについてできるだけシンプルにお伝えするため、簡単な4つのステップでスクリーンショットを交えながらご説明しましょう。
ステップ1:
まず、サービスアナライザーから2回のクリックで目的のエンティティにたどり着きます。下のスクリーンショットの例では、APM内の「checkoutservice」にドリルダウンして、期間メトリクスを見ています。
ステップ2:
目的のエンティティをクリックすると、[Entity Detail] (エンティティの健全性)ビューが開きます。Splunk APMの概要として、このエンティティについての詳細、具体的にはRED (Rate:リクエスト数、Error:失敗数、Duration:処理時間)メトリクスが表示されています。
ステップ3:
次に、エンティティ情報のパネルを開くためのアイコンをクリックすると、追加の詳細情報が右側からフライインで表示されます。ここには、ディープリンクをはじめ、さまざまな情報やコンテキストが表示されています。では、[Splunk APM Tag Spotlight - Errors]リンクをクリックしてみましょう。
ステップ4:
クリックすると、「Splunk APM Tag Spotlight - Errors」というコンテキストに沿ってSplunk Observability Cloudへ移動し、「checkoutservice」の詳細が表示されました。
グラステーブルを使用すると、ITサービスとビジネスサービス間の関係や依存関係を可視化して監視できます。グラステーブルでは、ITトポロジーやビジネスプロセスの動的なコンテキストビューを作成し、それらをリアルタイムで監視することができます。自分で設計したバックグラウンドに、KPIなどのメトリクスやアドホックサーチ、サービス健全性スコアなどを追加して配置できます。KPIやサービスから生成されるデータはリアルタイムに更新されて、グラステーブルに表示されます。
Content Pack for Splunk Observability Cloudには5つの事前設定済みのグラステーブルが含まれており、これらを使って主要なサービス、KPI、エンティティ全体にわたるインサイトを取得できます。これは、さまざまな役職にある人々にとって非常に役立ちます。たとえば、どういった人々にとって有用なのか、その理由も含め以下にご紹介します。
1. IT運用担当者:IT運用チームのメンバーまたはリーダーは、すべての顧客に途切れることなく確実にサービスを提供し続けるために、アプリケーションやインフラのパフォーマンスや可用性を可視化し、問題を迅速に解決したり、修復のために報告する必要があります。
2. CIO/CTO:CIOやCTO、または彼らのオフィスのメンバーは、主要なシステムとアプリケーションの状態を完全に可視化して把握している必要があります。これは、ビジネスリーダーがサービスの中断やインシデントに煩わされることなくビジネスを遂行する上でとても重要です。
3. ビジネスリーダー:ビジネスリーダーやビジネスチームのメンバーは、ビジネスを効果的に遂行し、サービスを迅速かつ効率よく顧客に提供するため、エンドユーザーエクスペリエンスや、アプリケーションおよびインフラのパフォーマンスを把握している必要があります。
4. サポートアナリスト:カスタマーサポートチームや運用サポートチームのメンバーまたはリーダーは、ビジネス全体にわたり、すべての主要なサービスの状況についてリアルタイムインサイトを得る必要があります。それにより、Webサイトの訪問者に最善かつ迅速なエクスペリエンスを確保し、正確な情報を提供できます。
5. DevOps/SRE:エンジニアリングチームのメンバーやリーダーは、すべての顧客に途切れることなくサービスを提供する責任があります。そのため、アプリケーションやインフラのパフォーマンスと可用性を一目で把握し、常に必要な情報を保持している必要があります。
6. DevSecOps:DevSecOpsのチームのメンバーやリーダーは、下流の本番環境にインサイトを提供して、セキュリティの説明責任を強化する必要があり、それによってビジネスと顧客のリスクを減らし、安全なサービスを迅速に提供しなければなりません。
Content Pack for Splunk Observability Cloudには以下の5つのグラステーブルが含まれています。これらのサンプルを複製して独自のグラステーブルを作成するのは非常に簡単で、たいていは数分しかかかりません。
1. Executive Glass Table (エグゼクティブグラステーブル)
2. Overview [Columns] (概要[列])
3. Overview [Layered with Radio Gauges] (概要[ゲージとレイヤー])
4. NOC Glass Table [Layered] (NOCグラステーブル[レイヤー])
5. DevOps SRE Detailed View (DevOps SRE詳細ビュー)
エグゼクティブグラステーブルは、オブザーバビリティの3つの主要領域(外形監視、インフラ監視、アプリケーションパフォーマンス監視)すべてにわたる、総合的なインサイトを提供します。
環境全体で何が起こっているのかについて、単一のビューに最新の情報がリアルタイムで表示され、1回クリックするだけで詳細情報を確認できます。
このテーブルから、何が起こっているのか、なぜ起こっているのかという質問への答えが得られ、Splunk Observability Cloud内のソースシステムへの(コンテキストに沿った)ディープリンクが提供されます。このように干し草の山から1本の針を見つけるような非常に煩雑なプロセスが簡素化され、根本の原因である問題を迅速に解決できるため、MTTI/MTTD/MTTRが大幅に改善します。
左下には、総合情報、外形監視、インフラ監視、アプリケーションパフォーマンス監視のすべてについての主要トレンドが表示され、ここを一目見るだけで、アプリケーションとインフラ全体の履歴やカスタマーエクスペリエンスを把握できます。
これらのインサイトを得るための新しい手段
図1-2. オブザーバビリティ:Executive Glass Table (エグゼクティブグラステーブル)
このグラステーブルでは、3つの主要要素である外形監視、アプリケーションパフォーマンス監視、インフラ監視の概要を確認できます。
1回のクリックで一段掘り下げた詳細情報が表示され、全環境内のすべてのスタックにわたる概要について、リアルタイムのインサイトを得ることができます。
クリックして詳細を確認した後、もう1度クリックすると、Splunk Observability Cloudに移動し、そこにディープリンクが表示されています。このディープリンクから、コンテキストに沿ったソースシステム側の分析結果が得られます。つまり、たった2回のクリックで数秒のうちに根本原因にたどり着けるのです。
図1-3. オブザーバビリティ:Overview [Columns] (概要[列])
このグラステーブルではインサイトと分析結果を、遠くからでも理解できるような直感的な形式で表示します。左側の「ゲージ」では、環境全体について外形監視、インフラ監視、アプリケーションパフォーマンス監視の健全性が一目で分かります。
こうしたタイプのインサイトは、さまざまなチームや多くの関係者にとって、すぐに役立ちます。どのKPIでも、クリックすると詳細が表示され、もう1度クリックすると、完全なコンテキストに沿ってSplunk Observability Cloud内のソースシステム側の結果が表示されます。
このグラステーブルを見ていると、何が起こっているのか知りたくてすぐに外形監視の結果をクリックしたくなりますが、インフラ監視の健全性サマリーを見ると、アマゾン ウェブ サービス(AWS)でも何か起こっているようです。根本原因はここにありそうなので、まずこちらをクリックしてみましょう。
すぐに対処できそうでしょうか?
図1-4. オブザーバビリティ:Overview [Layered with Radio Gauges] (概要[ゲージとレイヤー])
最新のNOC(ネットワークオペレーションセンター)では、ユーザーやインフラ、重要なビジネスフロー、アプリケーションのすべてのスタックについて何が起こっているかを把握する能力を高めるために、オブザーバビリティの導入が進んでいます。
対話式のグラステーブルは、管理者がこれらについての結果をリアルタイムで取得して、状況やエピソードの発生に先んじてプロアクティブに対処し、問題を特定して解決するのに役立ちます。
約12メートルの壁面または廊下のモニターでの表示を想定してシンプルに設計された、視認性と周知力に優れたこのビューは、重要なKPIについての総合的な現況とともにトレンドと履歴を表示します。
図1-5. オブザーバビリティ:NOC Glass Table [Layered] (NOCグラステーブル[レイヤー])
これは私のお気に入りのグラステーブルで、組織にとって非常に大きな価値があります。
このグラステーブルでは、外形監視、アプリケーションパフォーマンス管理、インフラ監視のすべてにわたるインサイトを、サマリーレベルだけでなく、さらに2段階掘り下げたかたちで取得できます。そして、それぞれもう1回クリックすると、さらに詳しい情報が得られます。
下の画面で外形監視のブラウザを見ると、[Health]が20で赤になっており、[500+ Code]がレポートされています。[500+ Code]を1回クリックすると、そのコードの発生元であるブラウザ/サイトと、コード発生の理由が表示されます。そしてもう1度クリックすると、コンテキストに基づいてSplunk Observability Cloud内の結果を表示できます。わずか2回のクリック、つまり2秒で問題の根本原因にたどり着けましたね。
図1-6. オブザーバビリティ:DevOps SRE Detailed View (DevOps SRE詳細ビュー)
グラステーブルについてもっと詳しく知りたい方は、「Overview of the glass table editor in ITSI (ITSIのグラステーブルエディターの概要)」をお読みいただくか、「Getting started with Splunk ITSI Glass Tables (Splunk ITSIグラステーブルを使い始める)」のビデオをご覧ください。
オブザーバビリティ向けコンテンツパックには、サービスアナライザーが1つと、サービスが25以上、KPIが70以上含まれています。ここでは、これらについて説明していきます。
サービスアナライザーはSplunk IT Service Intelligence (ITSI)のホームページであり、IT運用の監視の開始地点です。サービスアナライザーを一目見るだけで、IT環境の健全性をリアルタイムに確認できます。
サービスアナライザーには、ITSIサービスの健全性スコアの概要と、その時点で最も高い重大度で推移しているKPIの検索結果が表示されます。そのため、IT運用のステータスをすばやく確認し、期待される標準値から逸脱しているサービスやKPIを特定できます。サービスアナライザーのいずれのタイルもクリックすると深い階層までドリルダウンし、より詳細な分析や経時的な検索結果の比較を行うことができます。
サービスアナライザーはタイルビューとツリービューの2つのビューで構成されており、それぞれのビューからより詳細な情報にドリルダウンして、健全性スコアの低いサービスを調査することができます。
これはサービスアナライザーのツリービューです。3つの主要なサービスが、基盤となるKPIのレポート状況とともに、明確に示されています。
図1-7. オブザーバビリティ:サービスアナライザー-ツリービュー
サービスは、ビジネス目標に相当するITオブジェクトの論理マッピングです。サービスの定義にはかなり幅があります。環境内のビジネスや技術をモデル化したビジネスサービスや技術サービスを作成してみましょう。他のサービスに依存しているサービスもあるはずです。サービスには、サービスの健全性を監視し、根本原因分析を実施し、アラートを受信し、IT運用がビジネスのサービスレベル契約(SLA)を確実に遵守するためのKPIが含まれます。
下の図は、サービスアナライザーで表示したコンテンツパックのタイルビューです。25以上のサービスすべてについて、選択した期間のステータスとインサイトが表示されているのが分かります。どのサービスもワンクリックで詳細情報にドリルダウンし、KPIやエンティティなどを確認できます。
図1-8. オブザーバビリティ:サービスアナライザー-タイルビュー
KPIは、保存済みのサーチにより、CPUの負荷状況、メモリー使用率、応答時間などのITパフォーマンス指標値を繰り返し取得する手法で、サービスの健全性の監視に使用されます。
KPIは個々のサービス内に作成します。KPIでは、基盤にあるデータを理解する目的で、データにどのようにアクセスし、集計し、しきい値で条件付けるかなど、サーチの生成に必要なすべての情報を定義します。そして、これらのサーチの結果値に基づいて、サービスの健全性を監視したり、ITコンポーネントのステータスをチェックしたり、ITシステムの潜在的な問題を示すトレンドをトラブルシューティングしたりできます。
Content Pack for Splunk Observability Cloudには70を超えるKPIが含まれており、オブザーバビリティの結果に関する深いインサイトを得ることができます。下のスクリーンショットにあるように、結果はワンクリックで表示され、結果を構成するエンティティと、各エンティティのレポート内容を確認できます。
図1-9. オブザーバビリティ:サービスアナライザー- KPI -エンティティ
Content Pack for Splunk Observability Cloudにはカスタムエンティティタイプが含まれており、関連付けを利用して、さまざまなエンティティを可視化したり、トラブルシューティングを行ったりできます。たとえば、このコンテンツパックには「AWS EC2」というエンティティタイプがあり、これを使ってAWS EC2サービスをエンティティとしてインポートできます。また、インフラの概要画面でエンティティをエンティティタイプごとにグループ化して、AWS EC2エンティティ(サービス)の健全性に関連する主要メトリクスを可視化することもできます。
コンテンツパックには以下の15のカスタムエンティティタイプが含まれています。内訳は、Splunk Infrastructure Monitoringアドオンからの各メトリクス用に複数、Splunk APM用に1つ、Splunk Synthetic Monitoringアドオンからの各メトリクス用に複数です。
1. AWS EC2
2. Azure Lambda
3. Azure Functions
4. Azure VM
5. GCP Cloud Functions
6. GCP Compute Engine
7. Kubernetes Pods
8. OS Hosts (OSホスト)
9. Splunk Infrastructure Monitoring
10. Splunk APM
11. Synthetic API
12. Synthetic Benchmark (Syntheticベンチマーク)
13. Synthetic Content (Syntheticコンテンツ)
14. Synthetic HTTP
15. Synthetic Real Browser (Syntheticリアルブラウザ)
図1-10. オブザーバビリティ:インフラの概要-エンティティタイプ
さらに、Content Pack for Splunk Observability Cloudには、そのまま使える34の重要なメトリクスが含まれています。一連の重要なメトリクスに基づいて、エンティティタイプについての重要なサマリーが生成されます。このサマリーは特定のタイプに属するエンティティの全体的な健全性を示すもので、具体的にはCPU使用率、ネットワーク入力、ネットワーク出力、読み込み操作、書き込み操作などの要素が含まれます。これらのメトリクスは[Entity Health] (エンティティの健全性)ページに表示され、そこから個々のExchangeエンティティにドリルダウンできます。
図1-11. オブザーバビリティ:インフラの概要-重要なメトリクス
事前定義済みのエンティティタイプは追加、変更、削除できます。エンティティタイプの作成および編集手順については、「Create custom entity types in ITSI (ITSIでのカスタムエンティティタイプの作成)」をご覧ください。
ダッシュボードはパネルの集まりで、ビジネスに関連するテーブルやグラフを表示するのに使用します。ダッシュボード内の各パネルには、視覚に訴えるかたちでグラフやサマリーデータが表示されます。パネルは複数追加できるので、さまざまなレポートやグラフを1つのダッシュボードにまとめることができます。
Content Pack for Splunk Observability Cloudには以下の13のダッシュボードが用意されています。これらを活用することで、価値ある情報に迅速かつ簡単にアクセスできます。
1. SIM - Infrastructure Metrics and Logging (SIM -インフラメトリクスおよびログ)
2. Splunk APM Overview (Splunk APMの概要)
3. Splunk Infrastructure Monitoring Command Health Check (Splunk Infrastructure Monitoringコマンド健全性チェック)
4. Splunk Infrastructure Monitoring Modular Input Health Check (Splunk Infrastructure Monitoringモジュール入力健全性チェック)
5. Synthetic API Check Detail (SyntheticAPIチェック詳細)
6. Synthetic Benchmark Check Detail (Syntheticベンチマークチェック詳細)
7. Synthetic Content Check Detail (Syntheticコンテンツチェック詳細)
8. Synthetic HTTP Check Detail (Synthetic HTTPチェック詳細)
9. Synthetic Monitoring KPI Browser (Synthetic Monitoring KPIブラウザ)
10. Synthetic Monitoring KPI Comparison (Synthetic Monitoring KPI比較)
11. Synthetic Real Browser Check Detail (Syntheticリアルブラウザチェック詳細)
12. Welcome to Splunk Synthetic Monitoring Add-on (Splunk Synthetic Monitoringアドオンへようこそ)
13. SIM Navigation (SIMナビゲーション)
下のスクリーンショットは[Splunk APM Overview] (Splunk APMの概要)ダッシュボードで、指定したサービスのREDメトリクスのサマリーが表示されています。ここでは「checkout」サービスについて見ていますね。
図1-12. オブザーバビリティ:[Splunk APM Overview] (Splunk APMの概要)ダッシュボード
ここまでお付き合いいただき、ありがとうございました。今日お伝えしようと思っていた内容はこれですべてですが、いかがでしたでしょうか?スクリーンショットがお役に立ったようであればよいのですが...。もし、ビデオで学びたい、あるいは単純にもっと詳しく知りたいという方がいらっしゃるようでしたら、Content Pack for Splunk Observability Cloudの解説ビデオ (英語)をぜひご覧ください。
Content Pack for Splunk Observability Cloudについて理解したら、あとはインストールするだけです。今すぐその価値を実感してください!
インストール手順の詳細は、「Install and configure the Content Pack for Splunk Observability Cloud (Content Pack for Splunk Observability Cloudのインストールと設定)」を参照してください。
このブログの著者は、SplunkのITおよびオブザービリティ分野のフィールドソリューションエンジニアであるTodd DeCapuaです。また、以下の方々にもお手伝いいただきました:Tom Martin、Marie Duran、Adam Schalock、Jeremy Hicks、Joel Schoenberg(以上、全員Splunk)。
このブログはこちらの英語ブログの翻訳です。
Splunkプラットフォームは、データを行動へとつなげる際に立ちはだかる障壁を取り除いて、オブザーバビリティチーム、IT運用チーム、セキュリティチームの能力を引き出し、組織のセキュリティ、レジリエンス(回復力)、イノベーションを強化します。
Splunkは、2003年に設立され、世界の21の地域で事業を展開し、7,500人以上の従業員が働くグローバル企業です。取得した特許数は1,020を超え、あらゆる環境間でデータを共有できるオープンで拡張性の高いプラットフォームを提供しています。Splunkプラットフォームを使用すれば、組織内のすべてのサービス間通信やビジネスプロセスをエンドツーエンドで可視化し、コンテキストに基づいて状況を把握できます。Splunkなら、強力なデータ基盤の構築が可能です。