1年間システム停止ゼロを達成してシームレスな従業員エクスペリエンスを実現
2020年に世界中がリモートワークに移行した際、従業員が生産的に働くために必要なツールはすべて提供できるものの、そのツールの信頼性が高くなければ、在宅勤務はうまく機能しないことがすぐに判明しました。サードパーティ製のコラボレーションアプリケーションが頻繁に停止するようになり、Splunkの従業員の生産性に影響を及ぼす恐れが生じたため、従業員コラボレーションエンジニアリングチームはSplunk Observability Cloudの機能を使って調査に取りかかりました。
「私が入社した当時は、システム停止が何時間も続くことは珍しくありませんでした」と、生産性およびプラットフォーム部門のシニアマネージャーであるGreg Warnerは話します。システム停止には高額なコストが伴い、このサードパーティ製のコラボレーションアプリケーションがダウンするたびに、1時間あたり平均60万ドルというコストが発生していました。そこでチームはSplunk Observability Cloudを使用して、メモリー管理などのログの重要な変数を追跡し、障害が発生する前に根本原因を特定できるようになりました。
こうした問題を解消することで、従業員コラボレーションエンジニアリングチームは、リリース更新などの脆弱なタイミングであっても、障害を事前に予測し防止できるようになりました。「Splunk Observability CloudとSplunk独自のフォワーダー、ダッシュボードを使用することで問題の原因を突き止め、1週間、1カ月、そして最終的には1年間、システム停止ゼロを達成できました」。