2024年になり、オブザーバビリティプラクティスの実践は当たり前のことになりました。このような時代にリーダー的組織は、その実践レベルの高さで他の組織を凌いでいます。
先進的なオブザーバビリティプラクティスを実践している組織は、問題を解決するためにオンライン会議に大勢の関係者を招集したり、根本原因を突き止めるために新しいSlackチャネルを立ち上げてメッセージを慌ただしくやり取りしたりはしません。また、開発プラクティスの早い段階からオブザーバビリティを組み込んでいるため、機能のリリース時に問題が起きて大騒ぎになるようなこともありません。アラートの精度が高く、チーム間の連携が密であるため、インシデントはすばやく解決され、静穏のうちに収束して、類似の問題を防ぐための対策が速やかに取られます。オブザーバビリティは、それ自体が成果なのではなく、成果をあげるための優れた手段だということを、リーダー的組織はよく理解しています。
Splunkが毎年公開している調査レポートの最新版『2024年のオブザーバビリティの現状:成功への道筋を描く』では、10カ国の16業種の組織に所属する1,850人のIT運用担当者とエンジニアにアンケートを行いました。その結果、リーダー的組織のチームは、システム障害に煩わされることなく、レジリエンスの強化とイノベーションの推進に集中していることがわかりました。これらのチームは、高品質のコードを開発し(リリースサイクルも短く)、イノベーションに注力し、AIやOpenTelemetryなどの最新のテクノロジーとプラットフォームエンジニアリングを積極的に取り入れて効率を向上させています。さらに、こうした強みのすべてが収益に直接つながっています。リーダー的組織は、他の組織よりも生産性が高く、多くの価値を創造しており、オブザーバビリティソリューションの導入によって得られた年間利益は支出の2.67倍にのぼります。
顧客の期待が高まり続け、データの複雑化が進む中で、先進的なオブザーバビリティプラクティスを実践することは競争力の強化につながります。調査では、複数の領域で、リーダー的組織のパフォーマンスが他の組織を一貫して上回っていることがわかりました。
ダウンタイムのコストは膨大です。実際、フォーブスグローバル2000にランクインした企業ではそのコストが年間4,000億ドルに達します。リーダー的組織は、問題をすばやく解決することでダウンタイムの影響を緩和しています。ビギナー組織の多くでは、MTTR (平均解決時間)が数日、数週間、さらには数カ月に及ぶのに対して、リーダー的組織では、数分または数時間と回答した割合がビギナー組織の2.3倍にのぼりました。これほど速く問題を解決できるのは、誤検知のアラートの調査に時間を浪費していないためだと考えられます。リーダー的組織では、アラートの真陽性率が80%に達します。また、リーダー的組織の73%がMTTRを短縮できた要因として、ツールやワークフローをセキュリティチームと共有することで問題に関する詳細なコンテキストを獲得していることを挙げています。
リーダー的組織は開発者の生産性の高さでも秀でています。これはおそらく、問題への対応やミスの修正に費やす時間が少ないためだと考えられます。コードの大半をオンデマンドでプッシュしていると回答したリーダー的組織の割合はビギナー組織の2.6倍です。これは、開発チームがより多くのサービスや製品をより短期間でリリースして、顧客の満足度向上につなげていることになります。コードプッシュが確実に行われるため、コードの変更成功率もビギナー組織を22%上回っています。
これらのすべての優位性が、オブザーバビリティソリューションから得る価値の大きさにつながっています。オブザーバビリティソリューションによって開発期間が短縮され、より短いサイクルで製品を市場に投入できるようになったと回答したリーダー的組織は、92%にのぼります。
リーダー的組織でソフトウェアの開発とデプロイの成功率が高い要因の1つとして、プラットフォームエンジニアリングを積極的に取り入れていることが挙げられます。専任のチームが開発環境を整備することで、ソフトウェアエンジニアはツールチェーンの管理に時間を取られることなく、収益を生む新しい製品を市場に投入するというエンジニア本来の仕事に集中できます。全体で73%の組織がプラットフォームエンジニアリングを導入しており、中でもリーダー的組織は、専任のプラットフォームエンジニアリングチームを設置している割合が高いことがわかりました。
プラットフォームエンジニアリングの専任チームを置いている組織は大きな成果をあげており、55%の組織が、最大の成果としてIT運用の効率向上を挙げています。標準化はプラットフォームエンジニアリングがもたらす代表的なメリットで、プラットフォームエンジニアによる運用の標準化の取り組みが成果をあげていると回答した組織は90%にのぼります。プラットフォームエンジニアリングチームは、セキュリティとコンプライアンスの強化にも大きく貢献し、FedRAMPのような需要の高い認定の取得につながっています。さらに、リーダー的組織の58%が、開発チームがプラットフォームエンジニアリングを競争上の差別化要因だと考えていると回答しています。
普及が進んでいるのはプラットフォームエンジニアリングだけではありません。OpenTelemetryもまた、今日の組織に求められるデータ管理の柔軟性と統制のニーズが高まる中で、アプリケーション、インフラ、エンドユーザーエクスペリエンスのテレメトリデータを収集するための業界標準になりつつあり、全体の半数以上(53%)の組織がすでに導入しています。OpenTelemetryを導入すれば、ベンダーロックインやベンダー独自のエージェントの導入を回避できます。実際、約4分の3(73%)の組織が、OpenTelemetryの主なメリットとして、より広範なテクノロジーエコシステムを活用できる点を挙げています。
従来型のAIと機械学習の活用はすでにオブザーバビリティ領域で定着しており、全体の97%の組織が、これらのテクノロジーを使ってオブザーバビリティの運用を強化しています。具体的には、56%の組織がイベントの相関付けとアラートの優先順位付けにAIと機械学習を利用しています。一方で、生成AIの活用はまだ手探りの状況です。84%の組織が、オブザーバビリティプラットフォームに組み込まれた生成AIの活用を検討している一方で、実務に導入している組織は13%にとどまりました。
OpenTelemetry、AI、プラットフォームエンジニアリングなどのトレンドに関する調査結果と、先進的なオブザーバビリティプラクティスを構築する方法に関するSplunkのエキスパートの推奨事項については、レポート全文をご覧ください。
このブログはこちらの英語ブログの翻訳、高山 慶子によるレビューです。
Splunkプラットフォームは、データを行動へとつなげる際に立ちはだかる障壁を取り除いて、オブザーバビリティチーム、IT運用チーム、セキュリティチームの能力を引き出し、組織のセキュリティ、レジリエンス(回復力)、イノベーションを強化します。
Splunkは、2003年に設立され、世界の21の地域で事業を展開し、7,500人以上の従業員が働くグローバル企業です。取得した特許数は1,020を超え、あらゆる環境間でデータを共有できるオープンで拡張性の高いプラットフォームを提供しています。Splunkプラットフォームを使用すれば、組織内のすべてのサービス間通信やビジネスプロセスをエンドツーエンドで可視化し、コンテキストに基づいて状況を把握できます。Splunkなら、強力なデータ基盤の構築が可能です。