Splunkのおかげで、問題解決プロセスの効率が向上し、開発チームとインフラ運用チームが組織にとってより付加価値の高い業務に集中できるようになりました
継続的な事業拡大によってIT環境と部門横断的なプロセスが複雑化し、エラーの効果的な追跡と問題の効率的な解決が難しくなっていました。
データ主導のオブザーバビリティを確立して、複雑なシステムを可視化したことで、DevOpsでのコラボレーションが促進され、大規模な自動化、トラブルシューティングとインフラ導入の迅速化が実現しました。
東南アジアを拠点とする先進的な金融テクノロジー企業であるHyphen Group社は、DevOpsパイプラインを強化してソフトウェア開発とIT運用間の溝を埋めたいと考えていました。その目標を達成するには、エンジニアリングとインフラ運用という異なる部門のチーム間のコミュニケーションとコラボレーションを促進する効果的な方法が必要でした。
特に、個人向けの金融コミュニティプラットフォーム「Seedly」を買収して以来、新しい商品をリリースするたびにコードとインフラの追加が必要になることが大きな問題でした。しかし、DevOpsプロセスが可視化されていなかったため、IT環境がこれ以上複雑になることは避けなければなりません。そこでHyphen Group社は、問題解決を効率化してチームの負担を軽減するために、フロントエンドとバックエンドのスタック全体で問題をプロアクティブに検出すると同時に、トラブルシューティングプロセスを改善できるオブザーバビリティプラットフォームが必要だと判断しました。その結果として選択したのがSplunk Observability Cloudです。
Splunkの導入前は、環境が複雑化していたために、問題の診断と解決作業の負担が大きくなっていました。「エラーログの調査方法を知っているのはエンジニアリングチームだけだったので、メンバーは午前2時や3時に出社を要請されることもありました」と、Hyphen Group社でCTO (最高技術責任者)を務めるShannon Murphy氏は振り返ります。環境が複雑であるため、大規模なインフラ障害などの深刻な問題になると、トラブルシューティングに数時間かかることも珍しくありませんでした。
Splunk Observability Cloudを導入した今日では、さまざまなデータソースからメトリクス、ログ、トレースを収集、監視できる統合的なエクスペリエンスで、組織のITインフラをフルスタックかつエンドツーエンドで瞬時に可視化しています。負担の大きいエラー監視と分析プロセスの自動化も実現しました。これに加えて、チームメンバーが以前よりも自信を持ってデータに基づいた行動ができるようになったことが、Splunkのもうひとつの導入効果です。たとえば、エラーレポートから有意なパターンを抽出することで、類似の問題を追跡するための自動スクリプトを3分以内に生成することもできます。
問題の解決時間が数時間から数分に短縮されたことで余裕が生まれ、分散システム内の未知のイベントに的確に対応し、問題の発生を予測して、システムの健全性を一目で確認できるようになりました。
Splunkプラットフォームではさまざまなタイプのエラーが自動的に検出、分類されるため、問題解決プロセスを効率化できます。また、IT環境全体の状況が1つの画面に表示されるため、Hyphen Group社のエンジニアリングチームとインフラ運用チームは以前よりも円滑に連携できるようになりました。現在では、こうした効率化によって節約した時間を有効活用して、既存のソフトウェアのアップデートや新商品のリリースといった戦略的なビジネスイニシアチブに力を注いでいます。
新しいオブザーバビリティ機能の活用によって、Hyphen Group社ではインフラ導入のスピードが8倍向上しました。たとえば、新しい保険商品向けのプラットフォームの導入はわずか45日で完了しました。これは、以前であれば丸1年かかっていたような作業です。今後は、この導入期間の短縮を、新しい商品やサービスのリリースの時間短縮と効率化につなげる予定です。
新しいオブザーバビリティ機能は、可用性と安定性の向上という形でHyphen Group社の顧客にもメリットをもたらしています。たとえば、以前にHyphen Group社のコンテンツ管理プラットフォームでWebページが表示されなくなるといった顧客側でのエラーが発生した際には、Splunk Observability Cloudでバックエンド側の問題を特定、分析し、その結果に基づいて、今後同じような問題が発生した場合には自動的に解決されるようにしました。Observability Cloudではユーザーエクスペリエンス、コンテキスト、ワークフローがシームレスに統合されているため、データに基づいてすばやく簡単にアクションを実行して、優れたサービスを提供することができたのです。
自動化は、負担の軽減と生産性の向上というメリットだけでなく、Hyphen Group社に新しい機会をもたらしています。Murphy氏のチームは、Splunkを活用して、エラー監視とオブザーバビリティを既存の商品やサービスの新しいソフトウェアアップデートに組み込むことで、自律的な安定稼動を実現しています。今日までに、275件のアップデートをエラーなしでリリースしています。
これまでの実績を受けて、Hyphen Group社は今後、Splunk Observability Cloudを社内のアプリケーションに統合して、自動化の適用範囲を拡大し、業務の安全性、拡張性、効率を高めることでビジネスを促進することを検討しています。Murphy氏は、同時に組織の競争力を強化することも目指しています。「すべてのビジネスイベント、システムイベント、インフラの運用状況を一貫して統合的に把握すれば、それは真の差別化要因になるはずです」とMurphy氏は言います。Splunkは、この新しいイニシアチブに必要なアプリケーションとインフラを提供しながら、Hyphen Group社のさらなるデジタルトランスフォーメーションジャーニーで引き続き重要な役割を果たしていくでしょう。