従来はログを見ながら原因を推測していたのが、一発でわかるようになり、プログラム修正も素早い対応ができるようになりました
提供しているSaaSに対して顧客から寄せられる「レスポンスが悪い」などの問い合わせに対して原因特定の方法が煩雑であり、解決までに多くの時間や工数を費やしていた。
アプリケーションレベルで詳細を把握できるメリットのほか、SRE、開発、コンサルタント間でのコミュニケーションにもAppDynamicsは効果を発揮。SaaSの性能問題の対処を効率化、迅速化した。
統合人事システム「COMPANY®」を中心に、HR関連のITソリューションを提供するWorks Human Intelligenceでは、同製品のSaaS版の安定稼働や品質向上を目指し、アプリケーションパフォーマンス管理(APM)ソリューションAppDynamicsを導入しました。パフォーマンス低下の原因特定が容易になっただけでなく、SRE、開発者、コンサルタントの全部門が参照できる共通のツールとして、問題対処時の社内の連携性やスピードが向上しています。
統合人事システム「COMPANY®」の開発・販売・サポートを中心に、HR関連サービスの提供を行うWorks Human Intelligence。「COMPANY®」は、人事、給与、勤怠、要員分析、雇用手続、ID管理など、人事労務に関する業務の多くを網羅した製品として、25年以上にわたって大手企業を中心に多数の導入実績を挙げています。2019年からはオンプレミス製品に加えてクラウドサービスとしての提供も開始しており、お客様側でサーバやミドルウェアの調達、ネットワークの整備などが不要なことに加えて、あとから機能を拡張しても追加費用が不要という定額コストによる長期利用メリットが顧客から支持されています。
「オンプレミス版「COMPANY®」の時代から掲げている製品コンセプトは『ノンカスタマイズ』です。企業ごとに業務フローが異なっていても、設定を変えることで顧客がやりたいことを実現できる機能の網羅性を追求して開発を続けてきました」と語るのは、同社のProduct Div.SRE Dept. Department Managerを務める加藤文章氏です。
運用の土台が固まったので、さらに良いオペレーションを考えることに注力できるようになりました。今後はAppDynamicsを使って、顧客に対する新たな価値創出ができるようにしていきたいと思います
クラウド版「COMPANY®」の安定運用を支えているのが、同社のSRE(Site Reliability Engineering)部門です。インフラ部分に関するシステムアップデートや障害の検知・復旧、基盤強化のための運用可視化体制の構築など総合的に担当しています。
しかし、従来の監視環境には課題がありました。これまで利用していたサーバ監視ツールでは、CPUやメモリなどの情報を見ることができても、サービスに問題が生じた際にアプリケーションの切り口から詳細な分析を行うことができませんでした。Product Div.SRE Dept. Architecture & Platform Grp. Group Managerの小林賢大氏はこう語ります。
「お客様と対面する当社のコンサルタント部門から、お客様環境で生じているパフォーマンス低下に関する問い合わせを受け、その原因究明をしようとしても、アプリケーションのどの処理に問題があるのかをすぐに特定できませんでした。原因究明には監視ツールの情報やログを手がかりに仮説検証を行いながら進めるために時間がかかるほか、経験に基づく当て推量が多かったため、トラブルシューティングをより正確に行える仕組みが求められました」
従来はログを見ながら原因を推測していたのが、一発でわかるようになり、プログラム修正も素早い対応ができるようになりました
経験に基づく当て推量に頼らず、トラブルシューティングをより正確に行える仕組みが求められました
Works Human Intelligence では、監視だけでなくアプリケーションを可視化したいという課題を受け、具体的に新たなソリューションの導入検討に踏み出します。この決断に至ったもう1つの背景にあったのが、2019年にクラウドプラットフォームに発生したトラブルでした。
このトラブルでは、サービス停止を防ぐために導入しているサーバ監視ツール本体にも影響が及んだといいます。今後このような事態を防ぐためには、監視ツールそのものの冗長化が必要になってしまいます。そこで改めて監視ツールに求める機能を確認したうえで、クラウド型サービスにも対応し、アプリケーション全体のパフォーマンスを可視化できる新たな可視化ソリューションの導入を決定しました。その際に候補として上がったのが、同社がすでに一部の顧客向けに試験的に導入していたAppDynamicsでした。
AppDynamicsの全社導入までには、もちろん他社製品の比較検討もありました。最終的にAppDynamicsに決めた理由を、小林氏はこう説明します。
「AppDynamicsでは、各種指標をドリルダウンして詳細を確認できるのに対して、他社の製品では、必要な情報を収集するために設定に工数がかかってしまう、また得られる情報の粒度が粗いということがわかりました。アプリケーション可視化のために、わざわざプログラムに改修を加えるなどしてメンテナンスの負荷が増大しては本末転倒です。その点、既存のプログラムに手を加えることなく、ソースコードの詳細な部分まで分析できるAppDynamicsに魅力を感じました」
製品自体の価格が安くても、運用に膨大な手間がかかるようでは全体のコストは膨らみます。例えば、「社員情報検索の処理が遅い」と顧客から相談が来た際、このような原因を究明するには、プログラムが検索の際にどんなデータベースにアクセスして、どのような処理が行われているかなど、アプリケーションロジックをつぶさに精査する必要があります。しかし、AppDynamics以外の製品でそれを実現するには、アプリケーションの改修が必要になることがわかりました。
こうして3カ月ほどの比較検討や検証を経て、2019年の年末にはAppDynamicsの採用を決定しました。「導入後は、AppDynamicsによる『プロフェッショナルサービス』を活用し、AppDynamicsの技術者とともに、どのように活用していくかなどを議論しながら、実際にSRE部門がAppDynamicsを適切に運用していける体制づくりを進めていきました」と小林氏は語ります。
こうした入念な導入作業を経て、2020年3月からの「COMPANY®」のバージョンアップのタイミングに合わせて全社的に正式な利用が開始されました。
複数部門が一丸となってトラブルシューティングできる土台ができたのはすごく良い効果だと感じています。SRE部門に問い合わせる前に、自らAppDynamicsを使って情報を整理するコンサルタントもおり、問題解決に向けたスムーズなコミュニケーションに役立っています
アプリケーションレベルでパフォーマンスを可視化できるAppDynamics機能は、トラブル対処に大きく貢献しています。例えばパフォーマンス劣化が判明した際に、Database Visibility機能によって、処理が遅いデータベースへのクエリなどの原因がすぐにわかるようになりました。「パフォーマンス低下の原因が一発でわかるようになり、プログラムの修正などの素早い対応が可能になりました。データに基づいて根本原因の対処ができるようになったのは大きな効果だと感じています」(小林氏)
加えてAppDynamicsは、関係部門間の「共通言語」を提供するプラットフォームとしても役立っています。何か問題が発生した際にAppDynamicsが発行する共有リンクをチャット上で共有して、全員が同じ情報を見ながら議論できます。「SRE部門に問い合わせる前に、自らAppDynamicsを使って情報を整理するコンサルタントもおり、問題解決に向けたスムーズなコミュニケーションに役立っています」(小林氏)
2021年3月からは「カスタマーサクセス サービス」が日本でも利用可能になったことから、同社でもこれを活用し、運用面での技術サポートを強化しました。この導入後のサービスについて加藤氏は「カスタマーサクセス担当者には無理なお願いをしましたが、実現いただき非常に感謝しています」と、継続的な関係によって安心してサービスを利用できる点を高く評価しました。
今後同社では、AppDynamicsを活かして、不具合や問題が起きて顧客から指摘がある前にその徴候を察知し、先手を打って対処できるような運用を目指していくとしています。「運用の土台が固まったので、さらに良い運用を考えることに注力できるようになりました。今後は顧客に対する新たな価値創出を考えていきます。」(加藤氏)
また小林氏は今後のSRE部門の業務とAppDynamicsに対する期待についてこう語ります。「AppDynamicsがいろいろなAPIをサポートし、運用を自動化できる割合を高めていければと考えています。自動化によって運用コストを抑え、より理想的な運用体制を目指していきたいと思います」