Splunkは、お客様がデータの価値を最大限に引き出せるようサポートすることに力を注いでいます。最近の記事で、Lila Fridleyが機械学習を適用する際の最適なワークフローの選び方について、またVinay SridharがSMLEでの異常検出の例についてご紹介しましたが、このブログシリーズでは、それらに関連して、Smart ITSI Insights App for Splunkについて詳しく書いていきたいと思います。このAppは、ITオペレーターが機械学習を使ってITSIからさらにインサイトを得られるようにするために開発されたもので、データサイエンティストでなくても使いこなせる優れものです。
IT Service Intelligence (ITSI)導入環境の価値を最大限引き出せるようにお客様をサポートするにはどうしたらいいかと聞かれることがよくあるので、このシリーズでは、ITSIを最大限活用するための機械学習を用いた実用的なテクニックをご紹介したいと思います。
ほとんどのテクニックはSmart ITSI Insights App for Splunkに再利用可能なコンテンツとして搭載されていますので、ぜひAppをチェックして、以下にリンクしたブログ記事を読みながら各機能を試してみてください。
ITSIの予測分析についてはよくご存知の方も多くいらっしゃるでしょう(予測分析の詳細はこちらで確認できます)。この予測分析はたしかに強力な機能ですが、お客様から、どのアルゴリズムを適用したらいいかわからない、あるいは予測対象のサービスとそのサービスの健全性スコアの算出に用いられるKPIとの関連性が予測できていないように感じる、といった声をいただくことが多いのも事実です。
こうした声に応えるため、SplunkはITSIで予測を行うための新しいワークフローを開発しました。このワークフローでは、サービス健全性スコアとKPIの関連性を調べるだけでなく、統計分析を実行してこれらのデータ間に高い相関があるかどうかを確かめることができます。相関が高いかどうかは非常に重要なポイントで、精度よく予測するにはデータ間の強い結びつきが欠かせないのです。
このあたりのことについては、ブログ記事「ITSIの予測をさらにスマートに」で詳しく説明します。
ITSIには機械学習を利用してアラートをグループ化する優れた機能、スマートモードがありますが、多くのお客様はこうしたグループ化機能に加えて、エピソードの定義方法にさらなる柔軟性を求めています。現在、スマートモードではデータのパターンだけでなく、エピソードの集約ポリシーも定義可能です。
最近Splunkで取り上げることが多くなってきたグラフ分析は、ITSIの場合、教師なしコミュニティ検出を利用して「スマートな」エピソードを作成する際に最適です。グラフ分析については、ブログ記事「コミュニティ検出アルゴリズムでITSIのエピソードをさらにスマートに」で詳しく説明します。
ITSIには、エピソードレビュー、ディープダイブ、さらにはサービスアナライザーによって根本原因を突き止める優れた方法が用意されています。最近では、データポイント間の因果関係を特定する技術である因果推論に関連した開発に取り組みました。ブログ記事「根本原因分析をさらにスマートに:ITSIのKPIから因果関係を特定する」では、因果推論を使ってKPIから根本原因を特定する方法について説明します。
このシリーズで取り上げる最後のトピックは、IT環境の異常なアクティビティの見つけ方です。
アラートやエピソードは、厄介なネットワーク遅延やハードドライブの容量逼迫といった既知のパターンを特定する場合には有効ですが、IT環境全体から届くアラートの中からまったく予想だにしない異常なパターンを見つけ出すのには向いていないことがほとんどです。最後のブログ記事「ITSIのノイズ低減をさらにスマートに」では、異常検出とテキスト分析によって異常なイベントの大量発生を特定する方法について説明します。
Smart ITSI Insights App for Splunkとこのブログシリーズでご紹介するテクニックが、ITSI導入環境からのさらなるインサイトの獲得につながれば幸いです。今後は、以上のテクニックをさらに前進させるSMLEの活用方法について詳しくご紹介する予定ですので、そちらの記事もご期待ください。
それではこの辺で失礼します。機械学習でITシステムの円滑な運用を実現しましょう。
Splunkのメリットをどうぞお試しください。
このブログはこちらの英語ブログの翻訳、沼本 尚明によるレビューです。
Splunkプラットフォームは、データを行動へとつなげる際に立ちはだかる障壁を取り除いて、オブザーバビリティチーム、IT運用チーム、セキュリティチームの能力を引き出し、組織のセキュリティ、レジリエンス(回復力)、イノベーションを強化します。
Splunkは、2003年に設立され、世界の21の地域で事業を展開し、7,500人以上の従業員が働くグローバル企業です。取得した特許数は1,020を超え、あらゆる環境間でデータを共有できるオープンで拡張性の高いプラットフォームを提供しています。Splunkプラットフォームを使用すれば、組織内のすべてのサービス間通信やビジネスプロセスをエンドツーエンドで可視化し、コンテキストに基づいて状況を把握できます。Splunkなら、強力なデータ基盤の構築が可能です。