新たな規制の施行、生成AIの普及、国際情勢の緊迫化がサイバーセキュリティに与える影響を考察します。
Progressiveのように年間収益が650億ドルに迫る規模の企業では、障害が10分、1時間、2時間と長引くにつれて損失が一気に膨れ上がります。そのため、監視によってサービス障害を未然に検出できていることを示せれば、監視ツールへの投資がビジネス価値を生み出していることを証明できます
セキュリティ環境、IT環境、エンジニアリング環境、それぞれの可視性を向上させ、コストのかかる障害を防止し、緊急時に顧客が重要な情報に常にアクセスできるようにする必要がありました。
完全忠実なセキュリティとオブザーバビリティを実現したことで、監視能力が強化され、脅威の検出、サービスの遅延およびダウンタイムの解決が迅速化されました。
Progressive Insurance社は世界中で3,000万件以上の保険契約を保有しており、自動車事故、住宅火災、自然災害に遭遇した顧客の多くは真っ先に同社に電話をかけます。危機的状況から立ち直るのを助けてくれると頼りにしているのです。Progressive社にとって、混乱している顧客を落ち着かせることは日常茶飯事です。
「信頼関係の問題です。お客様は人生で最悪の瞬間でも私たちがついていることを心強く感じています。そのため、財産、家、車が損害を受けたり、重大な出来事に巻き込まれたりしたときに、多くのお客様はまず保険会社に相談します」- Jon Moore氏、Progressive Insurance社ドメインアーキテクト
Progressive社は、自動車や家屋からRVやバイクまで、幅広い保険を取り扱っています。顧客が自宅や家財の損害や損失といった被害に遭うと、同社が対応に出ます。一方で、毎日数百万ドルの資金が動くため、処理が一瞬でも遅れると多大な経済的損失につながる可能性があります。
Progressive社では、エッジでの障害や遅延が大きなコストを生んでいました。既存のツールではリクエストエラーの取りこぼしも発生しており、クラウドプラットフォームに特化したソリューションの導入が必要と考えていました。そこで、Splunk Observability SuiteとSplunk Enterprise Securityを導入してセキュリティ環境、IT環境、エンジニアリング環境の包括的な可視化を図り、コストのかかる障害を防止するとともに、緊急時に顧客が重要な情報にアクセスして適切な支援をすばやく受けられるようにすることにしました。
Progressive社にとってIT環境を包括的に可視化することは、特に組織を攻撃から守るために重要です。多くのセキュリティオペレーションセンター(SOC)がそうであるように、同社のSOCにも大量のセキュリティアラートが届き、アナリストは対応に追われ、現場は疲弊していました。
現在は、Splunk Enterprise Securityのリスクベースアラート(RBA)のおかげで、ノイズをすばやく排除してアラートの量を減らし、重大な脅威に優先的に対応するとともに、セキュリティイベントを適切なタイミングで検出できるようになりました。「検出のタイミングが早すぎるとノイズだらけになり、遅すぎると問題が起きてしまいます」と、Progressive社のDevOpsリードエンジニアであるDru Streicher氏は説明します。「RBAがあれば、ノイズがあっても問題ありません。最終的にノイズを排除すると同時に、ノイズからインサイトを引き出すことができるからです」
また、Splunkによってデータを詳細に可視化したことで、各イベントに関するさまざまな要因を相関付け、コンテキストを抽出できるようになりました。これにより、個々のインシデントを検証するのではなく、リスク環境全体でストーリーを組み立てることができます。
「すべてのデータをまとめるとストーリーが浮かび上がってきます。セキュリティは常にストーリーで考えるべきです。セキュリティについてストーリーを語れない場合は、やり方が間違っています。RBAがあれば、大量のイベントをつなぎ合わせて、環境に対するリスクのストーリーを作ることができます」とStreicher氏は言います。
Progressive社が管理するデータの量は膨大で、そのすべてを包括的に可視化する必要があります。特に重視するのは継続性です。処理が30秒遅れると、顧客が今まさに必要とする重要情報にアクセスできなくなるだけでなく、時間と収益の損失によって数百万ドルものコストが発生します。
顧客が災害や事故に巻き込まれたときは、Progressive社の保険金申請プロセスが命綱になります。同社は、1日あたり約1,500万件のWebリクエストを処理し、常に時価総額1,200億ドル以上を維持しています。Splunk APMの完全忠実なトレース機能では、申請処理の800万のトレース(スパン数で合計最大5,000万)を捕捉したときも、処理パフォーマンスにほとんど影響しませんでした。データ量がこれだけ膨大でも、Splunkの処理によるページ応答への影響はわずか10ミリ秒、CPUとメモリのパフォーマンスへの影響はいずれも1%未満にとどまりました。
Progressive社は、現代の保険会社らしく、あらゆる面でデータとテクノロジーを活用しています。それでも、ビジネスの根底にあるのは人を思いやる気持ちであり、必要なときにいつでも支援を提供する姿勢です。「私たちの目標は、お客様ができるだけ速やかに保険金申請プロセスを済ませて元の生活に戻れるようにすること、申請した保険金で車を修理し、仕事に戻って、事故のことは忘れてしまえるようにすることです」と、Progressive社の保険金申請監視機能リーダーであるKyle Sickels氏は言います。
保険金申請機能の担当チームは、Splunk Observability Cloudのリアルユーザー監視(RUM)機能を使用することで、ユーザーエクスペリエンスへの理解を深め、Webアプリケーションの問題点を特定して、いつどの部分から改善すべきかを判断できるようになりました。また、Splunk Observability Cloudで提供されるリアルタイムのインサイトを活用して、異常を特定、解決し、障害や遅延などの重大な問題を未然に防いでいます。
Splunkのアプリケーションパフォーマンス監視(APM)機能も収益の最大化に欠かせない存在です。APMによって事業継続性が向上し、重要なサービスを中断なく円滑に提供できるようになりました。現在は、APMを使って、アプリケーションのエラー率、発生しているエラーの内容、未知のエラーかどうか、アプリケーション全体の健全性を監視しています。ビジネスリーダーも、APMを活用して、提供しているアプリケーションの品質を測定しています。
「Progressiveのように年間収益が650億ドルに迫る規模の企業では、障害が10分、1時間、2時間と長引くにつれて損失が一気に膨れ上がります」と、Progressive社のドメインアーキテクトであるJon Moore氏は説明します。「そのため、監視によってサービス障害を未然に検出できていることを示せれば、監視ツールへの投資がビジネス価値を生み出していることを証明できます」
Progressive社は今後、Splunk Observability Cloudの導入を拡大し、OpenTelemetry、インフラ監視、外形監視を幅広く活用して、使いやすさと効果を向上させる計画です。