Splunkがあるからこそ状況がすぐに把握でき、迅速な改善活動につながりました。メンバーにもこの危機感が素早く共有できるようになったことも大きなメリット
ECサイトのリニューアルに伴い、サービスの死活監視やWebサイトの表示速度の把握などを継続的に実施できる環境が必要に。機能をマイクロサービス化していたことで、マルチクラウド環境で全体を俯瞰して監視、計測できるソリューションが必要だった。
検討開始からわずか1か月でPoCを実施し、ECサイトにおいて継続的な監視業務とWebサイトの表示速度などの計測作業が可能に。パフォーマンスの悪化していた既存サービスサイトの課題を発見するなど、Webサイトの改善活動にも貢献。各担当者の意識改革にも寄与。
流通企業グループとして物販チェーン6社を中心に28社で構成するベイシアグループにおいて、全国に220を越えるホームセンターを展開している株式会社カインズ。「世界を、日常から変える。」を企業ビジョンに据え、地域の皆様のくらしに寄り添いながら事業活動を推進しています。2019年に策定した3カ年中期経営計画「PROJECT KINDNESS」における4つの戦略の1つにデジタル戦略が据えられており、「煩わしさの解消からエモーショナルな体験の創造」を目指して「次のカインズを創る」ためのデジタル戦略を強力に推し進めています。
そんな同社では、これまで外部に委託していたシステム開発から脱却し、同社が目指すデジタル戦略に沿って内製化に向けた環境整備を進めています。なかでも顧客のデジタル体験を最適化するための環境づくりをスピーディに行うべく、アジャイル概念を念頭にスクラム開発を積極的に取り入れており、そのための基盤としてSalesforceをはじめとしたマルチクラウド環境でECサイトや各種Webサービスを展開しています。このなかでECサイトを中心とした監視業務に必要不可欠なソリューションとして、Splunkが提供するSplunk Observability CloudのSynthetic MonitoringおよびReal User Monitoring (RUM) を採用しています。
これまで同社が運用する基幹システムでは、システム監視の仕組みが整備されていましたが、新たにデジタル戦略本部が担当するフロントのWebサービス領域に関しては、サービス開発を優先していたことでインフラエンジニアが不足気味で、運用に欠かせないサービス監視などの仕組みが効率化できていない状況でした。「Salesforceをはじめ、GCPやAWSも含めたマルチクラウド環境で20を超えるサービスを運営しており、横断的に運用できる十分な監視環境が整備できていませんでした」とデジタル戦略本部 デジタルソリューション プロダクト開発部 部長 菅 武彦氏は説明します。そんな折、ECサイトのリニューアルプロジェクトにおいて、新たにサービス監視の仕組みづくりが急務となったと菅氏は当時を振り返ります。
特に重要なのは、SEO的な観点で重視されるWebサイトの表示速度でした。「Webサービスの状況が迅速に把握できる監視の仕組みはもちろんですが、Webサイトの継続的な速度計測が可能な環境づくりが求められたのです」と菅氏。実はECサイトリニューアルの3か月前に新たな担当として菅氏が関わったことで、より喫緊の課題として迅速な対応が求められたのです。「売上に直結するECサイトが停止してしまうと影響が大きい。担当になった段階でこれまで以上に危機感を持ったのです」。そこで、Webサイトの継続的な監視と計測の両面を満たせるソリューションを急遽検討することになったと説明します。
マルチクラウド環境でマイクロサービス化を進めていく上で、複合的に監視できる環境としてSplunkが最適でした
当初は社内で活用している監視システムを活用することを検討したものの、フロントエンドサービスを監視する基盤としてはECサイトだけに限った話ではありません。「今後も考えると、我々としてフロントエンドサービスを監視する基盤が必要だと判断しました。短期間で環境整備が必要だったこともあり、導入スピードを重視するなかでクラウド型の監視サービスを導入することにしたのです」と菅氏。サービスの死活監視は絶対条件として、Webサイトの計測やその原因分析まで実施できるような環境を希望したと言います。
実際の環境については、共通機能をマイクロサービス化してサービス開発を行っており、APIにてマルチクラウド上に展開している各サービスを呼び出す構成となっています。「バックエンド部分はSalesforceのCommerce Cloudにて構築し、決済機能や在庫情報、会員情報などを呼び出すAPI開発はGCPやAWSが活用されています。マルチクラウドの中で今最も活用しているGCPが持つモニタリングの仕組みを使うことも考えましたが、他のクラウドサービスの監視が難しい。これらマルチクラウド環境を複合的に監視できる環境が我々には必要だったのです」と語るのはデジタル戦略本部 データ経営推進 データプラットフォーム部 需要予測G グループマネージャー 矢口 未知彦氏です。
そこで注目したのが、Splunkが提供するSplunk Observability Cloudでした。「Splunkは個別のソリューションに分けて利用できますし、事前のPoCにも快く応じていただけました。我々にとっては必要な機能だけを柔軟に選択できる点が大きかった」と矢口氏は評価します。菅氏も「Webサイトの計測に使っているGoogle Chrome のディベロッパーツールと同じような機能がSplunkで実現できることに正直感動しました。ウォーターフォール形式で画面内のスクリプトによる処理速度を可視化できますし、複数サイトの状況が一括で把握できるダッシュボード機能も非常によかった」と評価します。アプリケーションの性能評価が可能なAPMなども含め、今後の運用に役立つ機能が豊富にラインナップされている点も菅氏にとっては魅力的だったと語ります。
当初の打ち合わせからわずか 1月後、Synthetic Monitoringを使って ECサイトとは別のサービスサイトで計測をスタートさせたところ 、Webサイトの表示速度に課題があることが判明。その結果を開発側にフィードバックすることで、サイト改善に大きく貢献することができたと菅氏。その実績も踏まえたうえで、Splunk Observability Cloudを ECサイトの監視、計測基盤として採用することになったのです。
障害対応の第一歩が早く踏み出せるようになり、お客さまの体験を損なうことを未然に防ぐことができています
現在は、サービス担当だけでなく、インフラ担当やSEO担当なども含め50ほどのアカウントでSplunkを活用しています。具体的にはSplunk Observability Cloudが持つ Synthetic MonitoringのUptime Checkを利用し 、同社が運用する20ほどのサービスを1分間隔で監視しています。また、Real Browser Check を活用してWebサイトの表示速度に関する原因分析を実施しており、アプリケーション担当者やSEO担当者が日常的に利用しています。Splunk Observability CloudのReal User Monitoring (RUM)も一部サービスに適用しており、Webブラウザのパフォーマンスの可視化やトラブルシューティングの実施、双方の機能を柔軟に活用しながらWebサイトの死活監視やパフォーマンスチェック、そして原因分析に活用しています。「これまではアプリケーションの開発チームがそのまま運用まで手掛けていましたが、今は我々の方でSplunkも活用しながら運用を統合的に実施できるフレームワークの標準化などを進めています」とデジタル戦略本部 システム開発 ソリューションアーキテクチャ部 システム運用G グループマネージャー 西山 裕二氏は説明します。
Splunk Observability Cloudについては、PoCの段階でこれまで気づいていなかったパフォーマンスの悪化したサービスサイトを劇的に改善、10点台のパフォーマンススコアを80点台にまで改善するなど、PDCAを繰り返しながら使い勝手の良い環境に改善できた点を高く評価します。「本番のECサイトでもリニューアル後にパフォーマンスが悪化した時期があり、その状況がすぐに可視化できていたことで迅速に改善活動につながりました。メンバーにもこの危機感が素早く共有できることも大きなメリット」と菅氏は評価します。
運用においては、保守を行うメンバーがいち早く状況の変化に気づけるようになったことが最大の効果だと西山氏は説明します。「以前はお客さまや店舗スタッフからの問い合わせで状況を察知していましたが、今はSplunkでの検知で迅速に把握し、原因特定から問題解決につなげていけるようになりました。障害対応の第一歩が早く踏み出せるようになり、お客さまの体験を損なうことを未然に防ぐことができています」と高く評価します。「また、人による曖昧な情報伝達ではなく、Splunkから得られるエラー時の様々なシステム情報を元に障害調査を行えるため、原因の特定が早まり、結果、工数削減にも大きく役立っている」と西山氏は評価します。
Splunkの使い勝手については、機能がシンプルで使い勝手が高いと矢口氏。「直感的に操作できますし、監視の設定など条件も詳細に設定できるなど使い勝手が非常にいい」と評価します。Splunkのサポートについても「パフォーマンススコアの数字の裏側について調査いただいたり、実績の少ないCommerce Cloudでの活用事例を調査して提案いただいたりなど、本当に手厚く支援いただきました」と矢口氏は高く評価します。
同社では、フロントシステムと基幹システムを分離してシステム環境を作り出すヘッドレスアーキテクチャを目指しており、それらを柔軟に連携させるAPIプラットフォームを整備しています。「サーバ間の通信も含めたボトルネックの発見や監視はもちろん、セキュリティ対策も含めて通信部分の可視化にも積極的に取り組んでいきたい。その意味では、Synthetic Monitoringが持つAPI CheckやAPMによるアプリケーションのパフォーマンス監視などにも期待しています」と西山氏。Splunk Observability Cloud以外にも、セキュリティ運用の効率化、高度化を実現するセキュリティ領域のソリューションにも興味を持っていると菅氏。
また、現在利用している範囲を広げていくなかで、社内メンバーに随時開放していき、自分が担当するサービスサイトのチェックに活用していける環境として拡張していきたいと語ります。「自分が担当する領域をしっかり計測したうえで問題ないか確認してからリリースするなど、チェックツールとしても使ってもらいたい。その意味では開発プロセスや業務プロセスがSplunkによって変わってくることになります。プロセス変革の結果がサイトの品質向上につながり、ひいてはお客さまの満足度に貢献します。メンバーの意識改革にもSplunkが役立つことでしょう」と菅氏に語っていただきました。