リアルタイムデータとは、生成直後に収集され、利用可能なデータを指します。収集後、保存せず、ただちにユーザーに転送されるため、タイムラグなしで利用できます。この即時性は、目の前の状況に対して瞬時に判断を下すために重要です。
リアルタイムデータは、銀行取引やGPS、災害発生時に作成される緊急地図など、私たちの生活のさまざまな場面で利用されています。
リアルタイムデータは特にビジネスの場で大きな価値をもたらします。ビッグデータの収集と分析が以前よりも簡単かつ安価に行えるようになってきたことで、各組織はこのプロセスを加速させることにますます力を入れています。以下の用途でリアルタイムデータが組織全体で活用されています。
そして、さらに重要な用途がITインフラの監視と管理です。リアルタイムデータを使用すれば、複雑化した社内ネットワークを包括的に可視化し、パフォーマンスに関するインサイトを獲得できます。
以下のセクションでは、リアルタイムデータの収集および処理方法、リアルタイムデータから得られるインサイト、強力なツールを使用することで達成できる成果について説明し、インフラ監視におけるリアルタイムデータのメリットを明らかにします。
リアルタイムデータ処理(別名:データストリーミング)とは、データを収集と同時に処理し、ほぼ即時に出力を生成する処理方式を指します。
そのメリットを理解するには、データ処理の仕組みに注目し、リアルタイムデータ処理と、もう1つの一般的な方式であるバッチデータ処理とを比較することが重要です。データ処理の目的は、ソーシャルメディア、販売キャンペーン、その他のデータソースから収集した生データを有意義な情報に変換し、最終的に意思決定に役立てられるようにすることです。
かつては、この作業をデータエンジニアやデータサイエンティストが手動で行っていました。しかし今日では、多くのデータ処理をAIや機械学習アルゴリズムで自動的に実行できます。処理の性質上、多少の時間的遅延は避けられませんが、高速であるため(つまり、重い処理がない、または並列処理に近い処理を実行できる)、より迅速かつ複雑な分析が可能です。
生データを実用的なインサイトに変えるには6つのステップがあり、このサイクルが何度も繰り返されます。
バッチ処理とリアルタイム処理はどちらもこのステップに従いますが、実行方法が異なり、そのため、適した用途も異なります。
バッチデータ処理は、大量のデータを処理するためによく使用されます。この処理のステップは次のとおりです。
バッチデータ処理にはいくつかの利点があります。その1つは、大量データの処理に適していることです。処理期限がなければ、収集とは切り離して任意のタイミングでデータを処理できます。また、データをまとめて処理するため、効率が良く、コスト効果に優れています。一方、唯一の大きな欠点は、データを収集してから処理結果が生成されるまでに時間がかかることです。そのため、バッチデータ処理は、給与計算や請求処理など、経理/会計データの処理に適しています。
リアルタイム処理では、データがごく短時間のうちに処理され、出力がほぼ瞬時に生成されます。データが入力と同時に処理されるため、出力を継続的に得るにはデータを継続的に入力し続ける必要があります。
遅延はバッチ処理よりもはるかに小さく、秒またはミリ秒単位です。処理の遅延は、ネットワークI/O、ディスクI/O、運用環境、コードでどれだけ遅延を排除できるかによっても変わります。一方で、入力データに特定の形式が求められるため、ユーザーや顧客にとっては手間や面倒に感じることがあります。それでも、リアルタイムデータ処理は、以下のように日常のさまざまな場面で活用されています。
リアルタイムデータ処理の大きな利点の1つはスピードです。データの入力から出力の生成まで、遅延はほぼありません。また、情報が常に最新であることも大きなメリットです。これらの特性から、リアルタイムデータ処理を導入すれば、正確な情報に基づいてすばやく判断を下し、行動に移すことができます。
欠点は、ビッグデータ分析と高い処理能力が必要になることです。その関連コストと複雑さが妨げになって、独自のリアルタイムデータ処理システムの導入を断念する組織もあります。
さまざまなタイプの情報をグラフ化または符号化して、わかりやすく操作しやすい形で視覚化すれば、データをより深く理解し、活用して、判断やアクションに役立てることができます。視覚化の方法は、シンプルな棒グラフから複雑なグラフィックまでさまざまです。インフラデータを表示するためのリアルタイムデータの代表的な視覚化方法をいくつかご紹介します。
例:リアルタイムデータの視覚化
リアルタイムデータは、組織の規模に関係なく幅広いメリットをもたらします。そのいくつかをここでご紹介します。
リアルタイムデータがもたらすメリットには、プロアクティブなアプローチ、可視性の向上、ダウンタイムの削減、コスト削減などがあります。
では、リアルタイムデータは何に使用できるのでしょうか?リアルタイムデータは主に、リアルタイム分析に使用されます。リアルタイム分析では、生データの収集後すぐにインサイトが得られます。
分析により、迅速な対応に役立つインサイトが即座に得られます。リアルタイム分析では、データがストリームとして入力され、機械学習アルゴリズムやその他の自動化テクノロジーによって処理されて、実用的な情報に変換されます。ストリーム分析では、特定時点の値を表示したり、値を時系列で表示して過去からの傾向がわかるようにしたりなど、データのタイプによって情報の表示方法を変えることもできます。
このプロセスは「ビジネスインテリジェンス」や「オペレーショナルインテリジェンス」とも呼ばれ、業種を問わず、すばやい対応が不可欠な場面で用いられます。リアルタイムのユースケースには以下のものがあります。
リアルタイム分析には2種類あります。
モバイルデバイス、IoTエンドポイント、センサーなどのソースから大量のデータが高頻度で生成される今日、データを保存せずに入力と同時に処理するリアルタイム分析は欠かせない存在になっています。
リアルタイムデータを分析すれば、顧客の行動から、カスタマーエクスペリエンスの応答時間、競争優位性を確立する方法まで、さまざまなタイプのインサイトを導き出すことができます。分析はあくまで、定められた領域内で何が起きているかを明らかにするだけであり、その結果をどのように活用するかが分析の「種類」に該当します。つまり、分析ツールは特定のアクションを実行するわけではなく、限られた入力に基づいてインサイトを提供するだけです。データ分析には、4つの基本的な種類があります。
問題を特定したり何が起きたかを明らかにしたりするための分析手法です。この手法では問題を正確に把握できますが、問題の原因まではわからないため、通常は他の種類の分析と併用します。
記述的分析よりも一歩踏み込んでデータを調査し、相関付けを行って、問題の原因を明らかにするための分析手法です。たとえば、システム障害を引き起こした要因や、セキュリティ脅威が社内環境に侵入した方法を解明できます。根本原因分析と共通している部分があると言えるでしょう。
記述的分析と診断的分析から得られる履歴データに基づいて、特徴的なパターンや傾向を特定し、将来起こり得る問題を予測するための分析手法です。たとえばインフラの監視では、予測分析によってシステム障害を予測し、管理者にアラートを送信することで、システムの可用性を維持することができます。
処方的分析は、最も高度なデータ分析です。その名のとおり問題を防ぐために取るべき対策を推奨します。この手法では、機械学習やその他のアルゴリズムを使用し、以下に基づいて出力が行われます。
処方的分析は、インフラの耐久性や回復力を高めるための最適な方法を割り出して、インフラを継続的に改善するために役立ちます。
多くの企業はまず、稼働時間の向上を目的としてリアルタイムデータ分析を始めています。稼働時間は収益に直結するためです。インフラデータをリアルタイムで処理することで、IT管理者は次のことが可能になります。
このようにリアルタイムデータを活用すれば、現状をただちに把握して、問題があるときは、後手に回ることなく発生と同時に対応できます。
結局のところ、リアルタイムデータがもたらす最大の価値は、インフラの強化といってよいでしょう。問題を検出して診断するリアクティブな体制から、イベントを予測して推奨される対策を導き出し、問題を未然に防ぐプロアクティブな体制に移行することによって、インフラの耐久性と回復力を向上できます。
これらのリアルタイム分析手法はいずれもITインフラの監視と管理に役立ちますが、目標とする成果を達成するにはいくつかのベストプラクティスがあります。
まずは、測定対象を決めることが重要です。「とりあえずすべてを追跡しよう」という考えでは、インサイトの導出よりもデータの管理に時間がかかってしまいます。「何を知りたいか」、「どのような問題を解決したいか」を関係者から聞き取り、必要な情報だけを追跡しましょう。
測定するインフラデータが決まったら、分析ツールを用意します。さまざまなソースから関連データを収集し、事前学習済みの機械学習モデルまたはカスタマイズされた機械学習モデルを使ってデータを処理するという面倒な作業は、分析ツールに任せましょう。
次に、生データにコンテキストを付加し、目的の成果と関連付けて、実用的なインサイトを導出します。この作業も分析ツールに任せることができます。適切なツールを使用すれば、生データを有意義な情報に変換し、複数の観点から理解できるようにして、データを視覚化したりアイデアを伝えたりできます。もちろん、データの視覚化は便利であっても、あくまで伝達手段の1つであり、相手を説得したり意思決定を支援したりするためにそれをどのように使用するかは人間が決めることです。たとえば、関係者やメンバーの気持ちがまとまっていないと感じたときは、分析ツールでデータを視覚化すれば、全員で目標と目指す成果を共有するのに効果的です。
最後に、得られたインサイトを評価し、結論を出して、今後のアクションを決めます。データから導き出したインサイトを活用すれば、発生した問題にすばやく対応するだけでなく、問題の発生を防いだり、望ましい状態やイベントを把握したりすることもできます。
リアルタイムデータの即時性は、幅広い業種や用途にメリットをもたらしています。たとえば建築業では、リアルタイムデータを活用することで、サプライチェーンやその他のトレンドをより深く理解できます。また、ヘルスケア分野では、患者のバイタル監視、診断、治療において、調査結果を待たずにその場で問題を見つけることができます。さらに、電力/ガス/水道会社であれば、負荷と需要を踏まえて供給を調整することで、予期しない問題を防ぐことができます。
リアルタイムデータは、日常生活の情報を提供するアプリやサービスでも活躍しています。特に、天気予報アプリや、ハリケーンや地震などの災害監視システムでは、予測の精度を向上させるために欠かせません。ほかにも、選挙結果速報、最新の交通情報、新型コロナウイルスの地域別の感染状況などの提供に役立てられています。
このように、リアルタイムデータは、情報に基づく迅速な判断が必要なあらゆる場面で利用されています。
リアルタイムデータウェアハウスも存在します。リアルタイムデータウェアハウスは、リアルタイムデータを保存および分析するためのストレージシステムです。データが利用可能になると同時に自動的に取り込まれ、ただちに分析されて、ウェアハウスに保存された履歴データと相関付けられます。
そのため、データをすばやく用意すれば、その分すばやく可視化して分析できます。その後、問題や傾向を示す出力が生成され、これから取るべきアクションの判断に役立てることができます。データウェアハウスには、テンプレート化されたレポート形式が含まれることが多く、そこから構造化データと非構造化データを取り出すこともできます。
リアルタイムデータウェアハウスには、従来のデータウェアハウスを上回るメリットがいくつかあります。最大のメリットは、意思決定を迅速化できることです。データがリアルタイムで自動的に処理されるため、重要な判断をその場で下すことができます。また、必要なインサイトを必要なときに取得できます。データを日単位や週単位で取り込む従来のデータウェアハウスとは異なり、リアルタイムデータウェアハウスではデータがストリームとして継続的に取り込まれます。そのため、古い情報に基づいて判断するリスクがありません。常に最新のデータを利用できます。
リアルタイムデータウェアハウスの構築にはいくつかの課題もあります。特に問題になるのが、ETLツールのパフォーマンスです。ETLツールは通常、バッチモードで動作します。バッチ処理には時間がかかり、ウェアハウスの機能を停止する必要があるため、その間、データを利用できなくなります。しかし最近では、リアルタイムETLツールを使用したり、ETLシステムの設定を変更したりすることで、この制限を回避できるようになっています。
リアルタイムデータは、IT環境の現状を理解し、その能力を最大限に発揮させるために重要です。リアルタイム分析ソリューションを導入すれば、環境内で生成される大量のデータから、インフラの強化に役立つインサイトを引き出すことができます。そして、インフラの健全性を保つことは、顧客満足度とビジネス成果の向上につながります。
このブログはこちらの英語ブログの翻訳です。
この記事について誤りがある場合やご提案がございましたら、ssg-blogs@splunk.comまでメールでお知らせください。
この記事は必ずしもSplunkの姿勢、戦略、見解を代弁するものではなく、いただいたご連絡に必ず返信をさせていただくものではございません。
Splunkプラットフォームは、データを行動へとつなげる際に立ちはだかる障壁を取り除いて、オブザーバビリティチーム、IT運用チーム、セキュリティチームの能力を引き出し、組織のセキュリティ、レジリエンス(回復力)、イノベーションを強化します。
Splunkは、2003年に設立され、世界の21の地域で事業を展開し、7,500人以上の従業員が働くグローバル企業です。取得した特許数は1,020を超え、あらゆる環境間でデータを共有できるオープンで拡張性の高いプラットフォームを提供しています。Splunkプラットフォームを使用すれば、組織内のすべてのサービス間通信やビジネスプロセスをエンドツーエンドで可視化し、コンテキストに基づいて状況を把握できます。Splunkなら、強力なデータ基盤の構築が可能です。