先進的なサイバーセキュリティ対策を推進する組織がどのように課題を克服し、AIを活用してイノベーションを推進し、デジタルレジリエンスを強化しているかをご紹介します。
システムの問題は1分単位で売上に影響します。環境を最適化してインシデント対応を改善する機会を見つけるためにSplunkの指定エキスパートは真摯に貢献してくれました
監視、ログの収集、ダッシュボードでの情報表示、アラートの生成に異なるツールを使用する複雑なエコシステムをシンプル化し、インフラ、アプリケーション、APIの状況を包括的に把握できるようにすることで、フルスタックのオブザーバビリティを実現し、MTTDを短縮したいと考えていました。
Splunk Observability Cloudを導入し、指定エキスパートサービスを利用することで、環境全体を完全に可視化しました。重要なアプリケーションやサービスの状況を包括的に把握できるようになり、カスタマーエクスペリエンスが最大限に向上しました。
世界中の数十万の旅行サプライヤーに予約サービスを提供するTravelport社は、観光業界の好景気を支える存在です。Delta社、British Airways社、KLM社をはじめとする400社以上の航空会社、4万8,000社以上のレンタカー会社、数十万の宿泊施設と連携しながら、複雑な旅行サービスエコシステムをシンプル化するためのイノベーションを推進し、次世代マーケットプレイス「Travelport+」を通じて旅行サービスの利用者と提供者をつないでいます。
165以上の国で事業を展開し、1日あたり最大2,010億件の旅費計算を処理するTravelport社では、当初、プロダクトの健全性とパフォーマンスを監視するために多数のオブザーバビリティツールを複雑に組み合わせていました。しかし、状況を包括的に把握することができなかったため、インシデントの検出、アラート、トラブルシューティング、修復に時間がかかり、顧客向けの主要プロダクトに大きな影響が出ていました。また、データの相関付けも課題でした。ツール間の連携がなく、問題の根本原因を特定するために複数のツールのデータを手動で関連付ける必要があったため、MTTDが長引き、顧客へのサービス提供に悪影響を及ぼしていました。
さらに、当時使用していたレガシーITソリューションでは、すべてのイベントが重大なアラートとして表示されていたため、1日だけで最大2万件のアラートが発生し、サービスデスクでの処理が追い付かない状況でした。しかも、どのイベントが本当に重大であるかの手掛かりとなる情報もなかったため、重大なイベントへの対応が遅れ、サービスの可用性に影響することもありました。
Travelport社は、この状況を改善し、監視を効率化するために、Splunk Observability Cloudの導入を決めました。また、同社独自の技術要件に合わせてSplunkスタックをカスタマイズするために、Splunkの指定エキスパートサービスも利用することにしました。エキスパートから戦略的なガイダンスを得ることで、顧客向けの主要プロダクトを改善する狙いもありました。
Travelport社は、分析機能も一元的なログ管理機能もないツールを頼りに、ビジネスに関するインサイトはもちろん技術的なインサイトすら得られないまま乱気流を通過しているような状態でしたが、Splunkの導入によって視界が開けました。「Splunk Observability Cloudなら、すべてを1カ所で監視できます」と、Travelport社でアクセスUI部門のエンジニアリング担当ディレクターを務めるAshok Uppalapati氏は評価します。同氏とそのチームは、フルスタックのオブザーバビリティを実現するSplunkソリューションを使って、クラウドで運用しているすべてのアプリケーション、サービス、インフラ、Kubernetes環境を包括的に可視化しています。「スタック全体でデータを相関付けることができるため、問題の特定が大幅に容易になり、MTTDが劇的に改善されました」とUppalapati氏は言います。Splunkの導入以来、MTTDが75%短縮され、主要プロダクトの稼働時間が目標を上回ったことで、ユーザーエクスペリエンスが向上し、競合他社の優位に立てるようになりました。
Travelport社は、Splunk Observability CloudのApplication Performance Monitoring (APM)機能を利用して、アプリケーションとKubernetesのエコシステム全体の状況をグラフィカルに表示しています。「APMのおかげで、すべてのマイクロサービスとその通信、パフォーマンス、依存関係、リクエストのネットワーク遅延など、アプリケーションのエコシステムに関する詳細なインサイトを得られるようになりました」とUppalapati氏は説明します。「APMによって、APIコールを含むプロセス全体と相関関係を含むすべてのエラーがグラフィカルに表示されるため、運用チームは、開発チームにデバッグを依頼しなくても、アプリケーションの問題を自分たちだけですばやく特定できます」
さらに大きなメリットとして、重要なアプリケーションやサービスがビジネスに及ぼす影響をより明確に理解できるようになりました。「Splunk Observability CloudのAPM、Log Observer、Real User Monitoring (RUM)機能のデータを使って、影響評価のためのダッシュボードを作成しました。すべてのデータを1カ所に集約することで、コールの件数、収益の損失、予約やセグメントの損失などの指標への影響を分析できます」とUppalapati氏は説明します。このデータは、運用チームだけでなくシニアリーダーシップチームにも重宝されています。どちらもアプリケーションの全体的な健全性を維持することでカスタマーエクスペリエンスを最大限に向上させることに深い関心を寄せているからです。
さらにTravelport社では、Splunk Observability CloudのSynthetic Monitoringを利用して、以前は捕捉できなかった問題も検出しています。「グローバルな可用性テストによって、特定の地域で定期的に発生するネットワークとDNSの問題を発見しました。以前はこれを見落としていました」とUppalapati氏は言います。こうした取り組みを通じて、世界中のカスタマーエクスペリエンスに関する有益なインサイトを獲得し、エンドユーザーから報告を受ける前に問題に対処しています。
ここまでのことは、Splunkと歩むジャーニーのほんの始まりにすぎません。Travelport社は、Splunkの指定エキスパートサービスを利用し、Splunkスタックについて豊富な製品知識を持つ戦略アドバイザーのサポートを得て、環境のさらなる最適化を目指したのです。主な目標が3つありました。
「すべてのイベントがアラート」の状態を脱却し、少数の実用的なアラートに絞り込むには、メインフレーム環境のプレゼンテーションと相関付けのレイヤーを新しいSplunkクラウド環境に移行するという、新旧システムでのコラボレーション作業が必要でした。「そこで重要な役割を果たしたのが指定エキスパートです」と、Travelport社のサイトリライアビリティおよび監視担当ディレクターであるEd Hubbard氏は振り返ります。「複雑化した旧システムの仕組みを解明し、当社の技術環境と技術要件に合わせてSplunkスタックでその仕組みを作り直す必要がありました。指定エキスパートの深い知識と優れた技能がなければ、アラートをプロダクトの健全性と相関付け、それによって誤検知を95%削減することはできなかったでしょう」
「誤検知とアラートの総数を大幅に削減できただけでなく、アラートを行動に直接つなげられるようになりました」とHubbard氏は続けます。「今では、届いたアラートを見れば、問題に対処するために何をすべきかが正確にわかります」。このようにアラートの忠実度が大幅に向上したことで、問題の根本原因の特定に何時間も費やすことなく、顧客に影響を及ぼす重大なアラートにすばやく対応できるようになり、デジタルレジリエンスと顧客満足度が向上しました。
システムの問題は1分単位で売上に影響します。環境を最適化してインシデント対応を改善する機会を見つけるためにSplunkの指定エキスパートは真摯に貢献してくれました
日常の運用では、単一の画面ですべてのプロダクトの健全性を監視し、赤/黄/緑のランプでデータセンター、コマンドセンター、サービスデスクのチームに状況を伝えています。こうした仕組みを確立したことで、顧客はTravelport社のサービスを24時間利用できるようになりました。「システムの稼働時間の改善は、当社の優先事項の1つであるすべてのユーザーのカスタマーエクスペリエンス向上に直接つながっています。いずれも、Splunkのソリューションと指定エキスパートなしには実現できませんでした。Splunkは、イベントの集約と相関付けにおいて最高の製品です」とHubbard氏は評価します。
Travelport社の今後の目標は、オブザーバビリティの実装範囲をポートフォリオの他のプロダクトに拡大することです。「難しいことではありません。当社の実装はすべてTerraformで行っているため、同じコードをプロダクト間で複製するだけです」とUppalapati氏は言います。
Splunkとの関係も続けていく考えです。「Splunkの指定エキスパートがいないプロジェクトは想像できません。指定エキスパートは今やチームの一員です」とHubbard氏は期待を寄せます。