データメッシュの主要な価値は、組織が特定のビジネスの成果を念頭に置いてデータを使用できる点にあります。データメッシュを使用すると、組織はネットワーク上のあらゆる場所にある、類似した複数のユースケースから収集したデータを見つけ、それらを組み合わせて、特定のトピックに関連する具体的なインサイトや結果を提供できるようになります。このようなユースケースに焦点を当てたデータの組み合わせは、多くの場合「データプロダクト」と呼ばれます。
つまり、データメッシュは特定のユースケースに対応するために必要なデータをすべて見つけられるよう設計されています。データレイクが大規模かつ複雑になったために慎重に検索しなければならない場合でも、データメッシュはすべてのデータを網羅しているため、求める結果を得るために必要なデータをすばやく特定できます。
ハイブリッドデータ環境の拡大に伴い、データへの公平なアクセスを可能にしつつ、データのセキュリティを確保しながらアクセス制御を実装するというデータの民主化の課題も、非常に複雑化しています。データメッシュは、拡張性を確保し、必要なときにデータをすぐに利用できるようにしながら、一貫性のあるデータ所有権を提供する包括的なワークフローを実現します。
データメッシュの導入には以下のようなメリットがあります。
- データの管理や使用に関する意思決定を行うデータ関係者の自律性を強化
- ポリシーを適用することで複製データセットではなく共有データセットを使用可能
- 部門間のサイロにおけるデータ使用に透明性と可視性を提供
データメッシュは、2019年にZhamak Dehghani氏によって提唱された概念です。データメッシュは概念やプロトコルだけでなく、それに使用される機器も含まれるデータプラットフォームだと同氏は唱えています。さらに同氏は、データメッシュアーキテクチャを、速さ、効率、特異性という強みが新たに備わった、データレイクを超える次世代のデータストレージであると考えています。2019年5月のブログ記事で、Dehghani氏は次のように述べています。
「モノリシックで一元的なデータレイクから一歩先へ進み、意図的に分散されたデータメッシュアーキテクチャに移行する可能性について考えてみてください。常に至るところに存在し、分散しているというデータ本来の性質を積極的に受け入れるのです」