Splunkはこのたび、Google Cloudとの戦略的パートナーシップを発表しました。このパートナーシップによって、両社のお客様が利用するGoogle Cloudサービスと最新アプリケーションのリアルタイムのオブザーバビリティ(可観測性)を向上させることができます。クラウドは今日、IT環境の最新化に欠かせない要素であり、規模を問わず組織のデジタル化を促進します。クラウド導入を含むITの最新化の目的は、一般的に、イノベーションを加速させ、運用効率を向上させると同時に、IT支出を最適化することです。ガートナー社の調査によると1、この10年ほどの間、デジタルトランスフォーメーションや最新化を目的とするクラウド導入では、クラウドファーストのアプローチが主流になっています。一方で、McKinsey社の調査では、80%のCIOが、クラウドに移行したにもかかわらず俊敏性が目標のレベルに達しておらず、最新化によるビジネスメリットが得られていないと回答しています。
大規模なクラウド移行では、アプリケーションやデータをオンプレミスサービスからクラウドプラットフォームに移動しただけでは、クラウドの潜在能力を最大限に引き出すことはできません。クラウドを活用するには、プラットフォームの見直しも必要です。たとえば、クラウドでNoSQLデータベースを自己管理する代わりに、Google Datastoreのようなマネージドクラウドサービスを利用すれば、目立たない雑務に費やすリソースを節約できます。また、組織内にクラウドが浸透した時点で、アプリケーションのアーキテクチャを見直してマイクロサービス化したり、コンテナ、Kubernetes、サーバーレスなどの最新インフラを導入したりすれば、さらに大きなメリットを得ることができます。
最新のクラウドネイティブ環境では、俊敏性と効率の向上というメリットが得られる一方で、複雑化というデメリットも生まれています。クラウドネイティブ化を進めるにつれて、管理すべき運用データが飛躍的に増大します。また、エフェメラル(一時的)なインフラの使用やクラウドネイティブアプリケーションの分散特性により、見るべきパフォーマンスメトリクスの種類も大幅に増えていきます。
加えて、エンドユーザーの期待がかつてないほど高まっていることが状況をさらに悪化させています。負荷の変動、トラフィックパターンの急変、デバイスや地域などの違いに基づく不確定要素の影響によってシステムにどれだけ負担がかかっても、アプリケーションでは円滑なエンドユーザーエクスペリエンスを提供することを求められます。Akamai社の最新調査では、わずか100ミリ秒の遅延でコンバージョン率が7%低下することが明らかになっています。よくある失敗が、最新のクラウド環境に従来の監視ツールや監視戦略を持ち込むことです。クラウドのメリットを引き出すには、リアルタイムの観測によってシステムのパフォーマンスに関するインサイトを取得し、エンドユーザーに影響が及ぶ前に問題を解消する必要があります。
オブザーバビリティを向上させることで、DevOpsチームは分散したクラウドシステムでパフォーマンスの低下や故障を把握し、さらに重要なその原因とパフォーマンスの改善策を突き止めることができます。一般的に、メトリクス、トレース、ログは、オブザーバビリティの3つの柱と呼ばれます。メトリクスは問題の検出、トレースは分散システム内での問題の発生個所の発見、ログは問題の根本原因の特定に役立ちます。Splunkの業界最高レベルのオブザーバビリティソリューションであるSignalFx Infrastructure Monitoring、SignalFx Microservices APM、Splunk Cloudを使用すれば、データ主導型の実用的なインサイトをリアルタイムで取得して、問題解決、意思決定、すべての行動に活用できます。以下のセクションでは、メトリクスとトレースを監視するためのSplunkソリューションがGoogle Cloudでお客様にどのような価値をもたらすかをご紹介します。ログをエンドツーエンドで可視化するために、Google CloudソースからSplunk Cloudにデータを取り込む方法について詳しくは、こちらの関連ブログをご覧ください。
SignalFx Infrastructure Monitoringは、大規模でカーディナリティの高いエフェメラルなクラウド、コンテナ、サーバーレス環境のニーズに対応するリアルタイムメトリクスソリューションです。Splunkが特許を取得したストリーミングアーキテクチャによるデータの取り込み、保存、取得アプローチは、従来のバッチソリューションやクエリー方式のソリューションとは一線を画します。
メトリクスデータのストリームがSignalFxに届くと同時に、メタデータとメトリクス値データが切り離され、別々のユースケースに使用されます。人間が読める形式のメタデータは、クラウドネイティブ環境のサーチ、フィルタリング、並べ替え、グループ化で中心的な役割を果たします。一方、メトリクス値はSignalFlow™エンジンによって分析され、ダッシュボード、アラート、自動化など、その結果を使用するコンポーネントに直接ストリーミングされます。このストリーミングアーキテクチャにより、ユーザーはリアルタイムでインサイトを取得して行動につなげることができます。たとえば、ダッシュボードの更新、アラートの生成、自動タスクの実行など、他のソリューションであれば数分かかる処理が数秒以内に開始されます。
データの測定と取り込み方法は柔軟に設定できます。通常は以下の組み合わせを使用します。
SignalFxスマートエージェント:collectdをベースにしたオープンソースの軽量ノードエージェントです。これにより、ホスト、コンテナ、Kubernetes、導入済みアプリケーション、サービスのパフォーマンスメトリクスを自動的に検出します。スマートエージェントでは、Kubernetes、Google Cloud Run、カスタムアプリケーションなど、Prometheusメトリクスを生成するサービスからメトリクスを自動的に収集して取り込むことができます。
Googleオペレーションスイート(旧称Stackdriver):Google Cloud Monitoring (旧称Stackdriver)と密接に連携してGoogle Cloudサービスのメトリクスを収集できます。
Istio on GKEとAnthos:Istioサービスメッシュ向けのオープンソースのテレメトリアダプターを使用して、環境を即座に可視化できます。
ラッパー関数:SignalFxでは、エージェントベースのアプローチを使用できないGoogle Cloud Functionsなどのサービスに対して、実行、エラー、スロットル、コールドスタート、継続時間、リソース使用率をリアルタイムで可視化するラッパー関数を使用できます。
SignalFxには、Google Cloudサービス向けに事前に構築されたダッシュボードが用意されているため、すぐに価値を実感することができます。対象となるサービスには、Compute Engine、App Engine、GKE、Cloud Bigtable、Cloud Functions、Cloud Spanner、Cloud Storage、Cloud Pub/Subサブスクリプション、Cloud Pub/Subトピックなどが含まれます。
ダッシュボードにカスタムグラフを追加して複合メトリクスを作成する際も、数回のクリックで簡単に実行できます。
新しいツール、Kubernetes Navigatorを使用すれば、DevOpsチームやSREチームは、直感的ですぐに使えるUIでGKE環境内を自由に移動し、コンテナ化されたアプリケーションのパフォーマンスを監視および管理できます。さらに、AI主導の分析によって、パフォーマンスの異常値に関するフィルタが自動的に提案されるため、トラブルシューティングを迅速に行うことができます。
SignalFx Microservices APMでは、NoSample™による正確な分散トレーシングにより、すべてのトランザクションを1件ずつ観測および分析して、外れ値や異常値を見逃すことなく捕捉できます。AI主導の分析と指示ありトラブルシューティングにより、DevOpsチームはパフォーマンスの異常値をすばやく特定して解決することもできます。さらに、SignalFx Microservices APMの高精度な分析機能により、無制限のカーディナリティ調査が可能です。ユーザーはあらゆるデータの詳細分析を実行できます。
ガートナー社が最新のマジック・クアドラントのAPM部門でビジョナリーと評価したSignalFx Microservices APMでは、従来のソリューションで使用されるベンダー固有の重量なエージェントベースアプローチを排除して、OpenTracingとOpenTelemetryをベースにしたベンダーに依存しない軽量インストルメンテーションを使用できます。
Splunkのオブザーバビリティソリューションは、Google Cloud上に展開されたSaaSサービスとして、Google Cloud内のオブザーバビリティデータを柔軟に記録できます。SplunkとGoogle Cloudの戦略的パートナーシップはクラウドでの成功を加速させます。あらゆる規模の高度なユースケースで実績をあげ、多くの企業に信頼されているエンタープライズレベルのソリューションによって、オブザーバビリティに対する投資を将来の成功につなげることができます。
14日間の無料トライアル版をぜひご利用ください。これらのソリューションの機能をウィークリーライブデモで実際にご覧いただくこともできます。
また、以下の動画では、PlanetチームがどのようにしてGoogle Cloudへの移行を成功させ、クラウドとKubernetesでのコンテナオーケストレーションにSignalFxを活用して、どのように運用の一貫性と信頼性を確保したかをご確認いただけます。
.
1. ガートナー社、『Move From Cloud First to Cloud Smart to Improve Cloud Journey Success(クラウド導入を成功させるためのクラウドファーストからクラウドスマートへの移行)』、Henrique Cecci氏、2020年2月25日
Splunkプラットフォームは、データを行動へとつなげる際に立ちはだかる障壁を取り除いて、オブザーバビリティチーム、IT運用チーム、セキュリティチームの能力を引き出し、組織のセキュリティ、レジリエンス(回復力)、イノベーションを強化します。
Splunkは、2003年に設立され、世界の21の地域で事業を展開し、7,500人以上の従業員が働くグローバル企業です。取得した特許数は1,020を超え、あらゆる環境間でデータを共有できるオープンで拡張性の高いプラットフォームを提供しています。Splunkプラットフォームを使用すれば、組織内のすべてのサービス間通信やビジネスプロセスをエンドツーエンドで可視化し、コンテキストに基づいて状況を把握できます。Splunkなら、強力なデータ基盤の構築が可能です。