
CISOレポート
デジタルレジリエンスへの道を取締役会と共に歩む
CISOと取締役会はかつてないほど緊密に連携しています。それぞれが果たすべき役割はまったく異なるため、成功指標に対する認識にずれがあります。
SOC (セキュリティオペレーションセンター)は、あらゆる組織の全体的なセキュリティ態勢を管理する中心的な部門です。セキュリティチームが運用の効果を測定できるようにするには、SOCのパフォーマンスを把握することが非常に重要になります。
この記事では、SOCメトリクスの重要性、一般的なSOCメトリクス、SOCチームがメトリクスを改善するために実行できる手順などを説明します。
SOC (ソックと発音)は、組織の安全に関わる非常に重要な部門であり、次のような役割を担っています。
SOCの主な目標は、効果的なセキュリティコントロールとポリシーの実装を通じて、組織の全体的なサイバーセキュリティ態勢を維持することにあります。
SOCのメトリクスとKPIは、SOCがセキュリティ運用のパフォーマンス、有効性、効率性を測定するのに役立つ重要な指標です。メトリクスの中には、多くの組織でよく使用されているものもあり、組織は次のような要素に基づいてメトリクスを選択できます。
(Splunkの包括的な可視化とセキュリティ監視によるSOCの強化については、こちらをご覧ください。)
SOCメトリクスは、SOCチームと組織全体にとって、多くの面で重要な役割を果たします。また、SOCメトリクスは、改良すべき点に関するインサイトを提供するだけでなく、組織のセキュリティ態勢を競合他社と比較して評価できる貴重な指標としても機能します。(このセクションで出てくる用語については、記事の後半で説明いたしますのでご安心ください。)
現在、インシデント対応に関連するメトリクスには、世界中の多くのSOCチームでよく使用されているものがいくつか存在します。このセクションでは、一般的なメトリクスの概要、重要性、および改善方法について見ていきます。
MTTDは、SOCチームが1件のインシデントまたはセキュリティ違反を検出するまでにかかる平均時間を指します。MTTDが短いほど、チームのパフォーマンスが優れていると言えます。MTTDは、インシデントを迅速に検出して対応を開始し、顧客への影響を最小限に抑える能力を評価する指標として使われます。
また、MTTDは監視ツールの有効性と検出機能の効率性を評価するのに役立ちます。
MTTIは、障害が検出されてからITチームが調査を始めるまでの平均時間を指します。具体的には、MTTDの終了時点からMTTRの初期対応フェーズが終了するまでの時間にあたります。
MTTRは、SOCチームが1件のインシデントを検出してから完全に解決するまでにかかる平均時間を指します。MTTRが短いほど、インシデント対応が迅速で効果的であることを示します。通常、MTTRには次の作業にかかる時間が含まれます。
この指標により、組織は重点的に取り組むべき領域を特定し、インシデント対応戦略を改善できます。
MTRSは、障害が検出されてからサービスが完全に回復するまでの平均時間を算出した指標です。これにより、修復後にユーザーがサービスを再び利用できるようになるまでの時間がわかります。MTTRが修復に要した時間であるのに対し、MTRSはサービスを再び稼働させるまでのプロセス全体にかかった時間であるという点で、MTTRと異なっています。
MTBFは、障害が発生する頻度を測定します。この指標は、ある障害が解決してから次の障害が発生するまでの平均時間を表すため、新たな障害が発生するまでの間隔を予測するのに役立ちます。このメトリクスは汎用性が高く、個々のコンポーネントにもシステム全体にも適用できるため、システム全体の信頼性とパフォーマンスに関するインサイトを得られます。MTBFはMTTRとともに、システムの稼働時間を判断する上で重要な役割を果たします。MTTRは、故障後にシステムをどれだけ早く復旧できるかを評価する指標ですが、MTTRを短く、MTBFを長くして理想的なシナリオを実現すれば、ダウンタイムを最小限に抑えて効率的に復旧できる能力を強調できます。
MTBSIはMTBFとMTRSを足したもので、あるインシデントが検出されてから次のインシデントが発生するまでの平均時間を示します。これにより、長期にわたるシステムの安定性と運用の継続性を包括的に把握できます。
MTTAは、SOCチームがインシデントに対応して分析するのにかかった平均時間を測定した指標です。インシデントが検出された時点から、チームがその優先度、影響、および実行可能な解決策を認識し、適切に分析した時点までを測定します。
したがって、このメトリクスは、インシデント対応プロセスの効率性と有効性を評価するのに役立ちます。
MTTA&Aでは、インシデントが検出または報告された時点が起点となり、インシデント対応チームがインシデントを認識、評価、分析し、その範囲、影響、実行可能な修復作業を決定した時点が終点となります。このメトリクスは、インシデント対応プロセスの効率性と有効性を反映するという点で、非常に重要なものと言えます。
このメトリクスは、特定の期間内に検出および報告されたセキュリティインシデントの件数を測定します。そのため、組織がセキュリティインシデントのパターンや傾向に関するインサイトを得るのに役立ちます。
たとえば、いくつかのインシデントが増加傾向にある場合は、既存のセキュリティコントロールを改善する必要があることを示している可能性があります。さらに、セキュリティインシデントの件数を追跡することで、頻度が高く注意が必要なインシデントのタイプを簡単に特定して、優先的に対応できます。
(インシデント管理について詳しくは、こちらをご覧ください。)
誤検知率(または偽陽性率)は、実際には脅威ではないにもかかわらず、サイバーセキュリティインシデントと誤って分類されたインシデントの割合を測定した指標です。誤検知率が高い場合、システムが誤ってアラートを生成する可能性が高くなります。
見逃し率(または偽陰性率)は、実際のサイバー脅威であるにもかかわらず、サイバー脅威ではないと誤って分類されたインシデントの割合です。見逃し率が高い場合、システムが実際のセキュリティ脅威を見逃す可能性が高くなります。
このメトリクスを使用すると、組織はインシデントの直接的および間接的なコストを測定できます。
では、いくつかのSOCメトリクスを追跡したところ、その結果が望ましくないものだったとしましょう。メトリクスの改善に取り掛かるのは、まさにそのようなタイミングです。実際は、メトリクスは単なる出力結果に過ぎないため、メトリクスを改善するには運用を改善する必要があります。
では、さっそく見てみましょう。
問題を迅速に特定するために、強力な監視システムやアラートシステムを導入します。これらのツールは、関係する個人やチームにインシデントを通知し、包括的なインシデント情報を提供できるものでなければなりません。
さらに、下位レベルでインシデント対応が何も行われていない場合に、そのインシデントを上位レベルにエスカレーションできる機能を備えている必要もあります。
既知の問題、解決策、およびトラブルシューティングの手順を記録して、ドキュメントを改善します。これにより、SOCチームはインシデントを効率的に解決できるようになります。
(脅威ハンティングについては、こちらをご覧ください。)
インシデントの全体的なコストを削減するには、プロアクティブな監視、迅速なインシデント対応、および修復が重要になります。ウイルス対策ソフトウェア、厳格なアクセス制御、定期的なソフトウェアアップデートといった強力なセキュリティ対策を導入して、サイバーインシデントの発生を未然に防ぎましょう。
また、セキュリティ脆弱性評価の継続的な実施により、潜在的な脆弱性を特定して事前に修復することができます。
SOCメトリクスは、SOCチームがインシデント対応を含むセキュリティ運用の有効性、効率性、および全体的なパフォーマンスを評価するための測定可能な指標です。
この記事で説明したように、SOCメトリクスには複数のタイプが存在し、組織は自社の要件に合ったメトリクスを使用できます。
このブログはこちらの英語ブログの翻訳です。
この記事について誤りがある場合やご提案がございましたら、ssg-blogs@splunk.comまでメールでお知らせください。
この記事は必ずしもSplunkの姿勢、戦略、見解を代弁するものではなく、いただいたご連絡に必ず返信をさせていただくものではございません。
Splunkプラットフォームは、データを行動へとつなげる際に立ちはだかる障壁を取り除いて、オブザーバビリティチーム、IT運用チーム、セキュリティチームの能力を引き出し、組織のセキュリティ、レジリエンス(回復力)、イノベーションを強化します。
Splunkは、2003年に設立され、世界の21の地域で事業を展開し、7,500人以上の従業員が働くグローバル企業です。取得した特許数は1,020を超え、あらゆる環境間でデータを共有できるオープンで拡張性の高いプラットフォームを提供しています。Splunkプラットフォームを使用すれば、組織内のすべてのサービス間通信やビジネスプロセスをエンドツーエンドで可視化し、コンテキストに基づいて状況を把握できます。Splunkなら、強力なデータ基盤の構築が可能です。