デジタルレジリエンスを強化するAIの理念
今後の製品戦略にAIを取り入れてサイバーセキュリティとオブザーバビリティの成果を向上させるための、Splunkの3つの戦略をご紹介します。
AIOps (AIによるIT運用)とは、ビッグデータ、分析、機械学習を使用してIT運用(ITOps)を自動化および改善する手法です。AIは、大量のネットワークデータやマシンデータを分析することで、パターンを検出したり、既存の問題の原因を特定したり、将来の問題を予測して防止する方法を判断したりできます。そのため、異常検出やイベントの相関付けなどのITOps機能では、AIがとりわけ重要となります。
この記事の内容
Splunk IT Service Intelligence (ITSI)は、顧客に影響が及ぶ前にインシデントを予測して対応するための、AIOps、分析、IT管理ソリューションです。
AIと機械学習を活用して、監視対象のさまざまなソースから収集したデータを相関付け、関連するITサービスやビジネスサービスの状況を1つの画面にリアルタイムで表示します。これにより、アラートのノイズを低減し、障害を未然に防ぐことができます。
今日のデータ環境は、マイクロサービス、マルチクラウドアーキテクチャ、ハイブリッドクラウドアーキテクチャ、コンテナなどで構成され、複雑化しているのに加え、分散システムが普及したことで、ログデータやパフォーマンスデータが大量に発生して管理が難しくなっています。こうしたデータは、あっという間にITアナリストの手に負えなくなり、ネットワークの健全性と安全性の可視化が妨げられる可能性があります。AIOpsソリューションは、IT担当者がこのような問題を解決するのに役立ちます。つまり、人間の介在なしで資産を効果的に監視し、ITシステムの内部と外部の両方で依存関係を可視化します。
この記事では、AIOpsの仕組み、さまざまなユースケースとメリット、そして組織でAIOpsを効果的に導入する方法について説明します。
2016年、ガートナー社は「Algorithmic IT Operations」(アルゴリズムIT運用)の略語として、「AIOps」という用語を作り出しました。その意図は、AIOpsを次世代のIT運用分析(ITOA)と位置付けることでした。しかし、その後1年ほどで、ガートナー社はこの用語を、「Artificial Intelligence for IT Operations」(人工知能によるIT運用)に変更しました。これはわずかな変更でしたが、AIOpsというコンセプトを広めるうえで、非常に大きな変化をもたらしました。
AIOpsの目的は、AIの特徴である処理の速さと正確さをIT運用に取り入れることです。ネットワークの拡大と複雑化が進む今日、IT運用管理は一段と難しいものになってきています。従来の運用管理ツールや手法ではもはや、多様化した複雑なネットワーク内のさまざまなソースから発生する未曾有の量のデータに対応できません。AIOpsツールは、以下の機能によってこの課題を解消します。
機械学習とビッグデータを活用するAIプラットフォームは、IT運用で大きなビジネス価値を生み出す一助となります。
ガートナー社は次のように説明しています。「AIOpsプラットフォームとは、ビッグデータと機械学習を組み合わせて、生成されるデータをスケーラブルに取り込み、分析することにより、IT運用を支援します。AIOpsプラットフォームでは、複数のデータソース、データ収集方法、分析技法、表示方法を同時に使用できます」
AIOpsプラットフォームで何よりも求められるのは、保存されたデータの分析と、データの取り込み時点でのリアルタイム分析の両方の機能を備えていることです。ガートナー社は、AIOpsプラットフォームの主要機能を以下のように定義しています。
AIOpsプラットフォームは、複雑なデータエコシステムの管理にまつわる課題の急増に対処します。ガートナー社は『AIOpsプラットフォームのマーケットガイド』(2022年版)の中で、「AIOpsプラットフォームを導入した企業は、その利用を拡大する中でデータ管理のコストと複雑さの問題に直面している」としながらも、「AIOpsプラットフォームの導入が企業の間で急速に進んでいる」と指摘しました。
このことから、クラウドコンピューティングやデータ環境を効率化し、費用対効果と管理性を高めたいと考えている組織にとって、AIOpsプラットフォームは今後も魅力的なソリューションとなるでしょう。
ガートナー社によると、AIOpsの主なユースケースには以下の5つがあります。
ガートナー社によると、AIOpsの主なユースケースは、ビッグデータ管理、パフォーマンス分析、異常検出、イベントの相関付け、ITサービス管理の5つです。
AIOpsでIT運用業務を自動化し、AIを活用してシステムのパフォーマンスを向上させることにより、企業はビジネス面で大きなメリットを得ることができます。以下に例を示します。
AIOpsは、ダウンタイムの回避、データの相関付け、根本原因分析の迅速化、エラーの発見と修正など、数え切れないほどのメリットを組織にもたらすため、各部門のリーダーはコラボレーションする時間を増やすことができます。
クラウドコンピューティングとオンプレミスの両方でITインフラとアプリケーションのパフォーマンスを改善することで、AIOpsはビジネスの成功を評価するKPIを高めます。
AIOpsで解決できるIT運用課題の多くは、すべての業界に共通です。ただし、医療、製造、金融サービスなどの業界では、他の業界と比べて問題が蔓延し、脅威が深刻化しています。それでも、AIOpsでIT運用を自動化し、AIを活用してシステムのパフォーマンスを向上させることにより、企業はビジネス面で大きなメリットを得ることができます。以下に例を示します。
近年、AIOpsプラットフォームは企業で大きな人気を博しています。実際、さまざまな業界の企業がAIOpsをデータ環境の管理に欠かせないツールと見なし、IT運用管理(ITOM)業務全体に利用を拡大しています。そのため、AIOps市場は大きな成長が見込まれており、減速する兆しはありません。ガートナー社は、AIOps市場の規模が2025年までに約21億ドルに達し、年平均成長率(CAGR)が約19%になると予想しています。同じように、Future Market Insights社は、AIOpsプラットフォーム市場の規模が2032年までに802億ドルに達し、2022年と比較して2032年のCAGRが25.4%増加する可能性が高いと見ています。
また、ChatGPTの爆発的な成長に伴い、生成AIがAIOpsの開発と進化に一定の役割を果たすことが考えられます。TechTarget社は記事の中で、生成AIがアプリケーションコードの開発や、テスト生成などの日常的なエンジニアリングタスクで使われる可能性があることを示唆しています。オブザーバビリティ機能や、レジリエンスワークフロー(侵入テストなど)の自動化にも、生成AIの波が押し寄せるかもしれません。オーディオファイルやチャットファイルのような非構造化データセットの分析でも、生成AIが使われる可能性があります。
生成AIがこうした機能にどのような影響を与えるのか、確かなことはまだわかっていません。しかし、デジタルトランスフォーメーションの取り組みにAIOpsが組み込まれるようになると、生成AIの果たす役割はますます大きく、かつ重要になる可能性があります。
AIOpsの将来の役割をさらに深く理解するため、NETSCOUT社で副最高執行責任者を務めるSanjay Munshi氏に、AIOpsの重要性と将来に関する見解を伺いました。
「経営幹部は、AIに大きな信頼を寄せて大規模な投資を行い、期待どおりの革新的な成果が得られることを望んでいます。しかし、すべてのAIシステムやプラットフォームが、ビジネス成果の向上に適したデータ基盤を備えているわけではありません。AIの成果は、受け取ったデータの質に左右されます。つまり、質の低いデータからは、低い成果しか出せません。不完全なデータや抽象化されたデータで構築されたモデルは、十分なパフォーマンスを発揮できないばかりか、誤った情報に基づいてビジネス上の意思決定を下すリスクをもたらします。
AIやAIOpsシステムを適切に機能させるには、データ戦略を根本的に変えなければなりません。そのためには、インフラ構成の静的な要素に依存せず、ハッカーの活動を可視化する堅牢な分散型センサーフレームワークが必要です。センサーソフトウェアは、データインテリジェンスをソース側で収集、分析、整理して、忠実度の高いデータを提供します。それだけでなく、メトリクス、ログ、またはトレースのみに基づいて構築されたデータモデルを補完する役割も果たします。
修復の迅速化、対応の自動化、信頼性の高い結果によるユーザーエクスペリエンスの向上など、期待されている成果を達成するには、企業全体から収集され、整理および補強された高品質で実用的なデータを基盤として、高性能なAIを構築することが欠かせません」
AIOpsを使い始める最善の方法は、段階的に導入することです。ITドメインをデータソースごとに再編して、スモールスタートで着手するのがベストプラクティスです。各種のソースから取り込まれる大規模で持続的なデータセットの処理方法を学んで、IT運用チームに、AIOpsでのビッグデータの扱いに慣れてもらいましょう。履歴データから始めて、新しいデータソースを徐々に追加しながら、適用範囲を広げていくことをお勧めします。
まずはデータの取り込みに重点を置く:取り込みと分析をすばやく効果的に行うには、いきなりすべてのデータを対象にしないことです。まずは、過去の未加工(Raw)のマシンデータやメトリクスデータを取り込み、分析して、基本を理解し、クラスタリングアルゴリズムとクラスター分析を用いて、トレンドやパターンを特定してみましょう。リアルタイム検出を実現するには、Rawデータが最適なデータタイプです。その後、ストリーミングデータを分析対象に加え、機械学習によるAIを取り入れて、検出したパターンとどのように適合するのか調べることで、自動化を実現し、最終的に予測分析につなげることができます。
できるだけ多くのタイプのデータを取り込んで分析する:システムの過去の状態を分析し、理解すれば、現在の状態と相関付けて状況を把握できます。そのためには、履歴データとストリーミングデータを広範囲に取り込み、これらのデータへのアクセスを可能にする必要があります。ログ、メトリクス、テキスト、ワイヤー、ソーシャルメディアなど、どのタイプのデータを取り込むかは、解決したい課題によります。たとえば、インフラストラクチャの容量を監視したい場合は、そのメトリクスデータを取り込み、カスタマーエクスペリエンスを向上させたい場合は、アプリケーションログを取り込みます。最終的にAIOpsプラットフォームを選定する際には、複数のソースからデータを取り込んで分析できるかどうかを確認することをお勧めします。
すべてを一度にやろうとしない:まずは、優先度が最も高い課題について、その根本原因を見つけることに集中しましょう。その後、データの監視を開始します。それからがAIの出番です。さらにそこでも、以下の段階を踏むことが重要です。
ITやネットワークの担当者であれば、データは企業にとって最も重要な資産であり、世界を一変させるほどの可能性を持つという話を繰り返し耳にしているでしょう。AIは革新的なテクノロジーであり、すでに普及段階にあります。そしてAIOpsは、AIやビッグデータに対する期待が高まる中、ビジネスイニシアチブを実現するための具体的な方法を提供します。セキュリティの強化から、業務の効率化や生産性の向上まで、AIOpsは、IT運用を成長、発展させて、将来の課題に対応できる体制を整え、IT部門の役割を事業拡大の戦略的促進要因として定着させるための実践的な手段を目の前に提示しているのです。
このブログはこちらの英語ブログの翻訳です。
このE-bookでは、AIOpsの取り組みを始める方法として以下の内容をご紹介しています。
この記事について誤りがある場合やご提案がございましたら、ssg-blogs@splunk.comまでメールでお知らせください。
この記事は必ずしもSplunkの姿勢、戦略、見解を代弁するものではなく、いただいたご連絡に必ず返信をさせていただくものではございません。
Splunkプラットフォームは、データを行動へとつなげる際に立ちはだかる障壁を取り除いて、オブザーバビリティチーム、IT運用チーム、セキュリティチームの能力を引き出し、組織のセキュリティ、レジリエンス(回復力)、イノベーションを強化します。
Splunkは、2003年に設立され、世界の21の地域で事業を展開し、7,500人以上の従業員が働くグローバル企業です。取得した特許数は1,020を超え、あらゆる環境間でデータを共有できるオープンで拡張性の高いプラットフォームを提供しています。Splunkプラットフォームを使用すれば、組織内のすべてのサービス間通信やビジネスプロセスをエンドツーエンドで可視化し、コンテキストに基づいて状況を把握できます。Splunkなら、強力なデータ基盤の構築が可能です。