L’année 2024 a plus que jamais été placée sous le signe de l’observabilité, une approche largement adoptée par les entreprises leaders pour se démarquer de la concurrence. De quoi s’agit-il ? Pourquoi est-elle devenue incontournable ? Comment mettre en place des solutions efficaces dans des environnements de plus en plus complexes et distribués ? L’équipe de La place de la Républik IT m’a invité à éclairer ce sujet « que tout le monde subit, mais personne ne connaît » aux côtés de quatre experts de l’expérience numérique.
Au commencement était une pastèque… ou plutôt des cellules de crise qui devaient s’appuyer sur des outils ayant tout d’une pastèque : vus de l’extérieur, tous les voyants étaient au vert, mais lorsque l’on jetait un œil à l’intérieur du système, la situation pouvait se révéler catastrophique. Les dysfonctionnements étaient par ailleurs souvent signalés par les utilisateurs eux-mêmes, et en trouver la source relevait parfois d’un véritable casse-tête.
Dans ce contexte, Splunk s’est donné pour mission de fournir aux experts l’outillage dont ils avaient vraiment besoin pour éteindre rapidement les incendies. Mais, pour y parvenir, nous devions trouver un moyen de leur donner facilement accès à toutes les informations leur permettant d’identifier l’origine d’une panne ou d’un ralentissement, avant même que les utilisateurs n’en subissent les conséquences. Et, à une époque où le volume de données croît de manière exponentielle, la tâche était loin d’être simple.
C’est de ce constat qu’est née l’observabilité. C’est en tout cas ma manière de voir les choses, car il n’existe malheureusement pas encore de définition officielle de cette approche qui s’est pourtant rapidement imposée comme une évidence. Mais alors, c’est quoi exactement l’observabilité ? Pour moi, il s’agit avant tout d’un état d’esprit qui nous pousse à chercher continuellement les inconnues inconnues (ou à identifier nos biais du survivant), des éléments dont on ignore l’existence, mais qui peuvent se révéler essentiels pour la résilience de nos systèmes.
Si les définitions de l’observabilité peuvent fluctuer, les experts s’accordent toutefois sur certains points essentiels. Un système observable doit ainsi disposer d’au moins trois types de données (logs, métriques et traces), et toutes les informations doivent pouvoir être facilement corrélées dans une plateforme unifiée afin de vous aider à comprendre le comportement de votre système et à en assurer la disponibilité.
Vous me répondrez peut-être que le suivi du parcours de l’utilisateur n’a rien d’une nouveauté, mais depuis les débuts du commerce électronique, les environnements ont beaucoup évolué. Les petits data centers que l’on pouvait organiser comme on le souhaitait ont laissé la place à des environnements de plus en plus complexes et distribués, et le volume de données disponibles a littéralement explosé.
Comme le montre notre rapport sur l’État de l’observabilité en 2024, les équipes techniques déploient désormais en moyenne 23 outils d’observabilité différents qui ne communiquent pas nécessairement entre eux. Mal maîtrisée, l’observabilité peut donc se traduire par un déluge d’alertes et une grande difficulté à corréler des données provenant de sources différentes.
Heureusement, des solutions existent pour simplifier le monitoring à l’ère du cloud. On pense bien évidemment à l’IA, mais pour que ces outils trouvent les bonnes aiguilles dans des milliards de bottes de foin, encore faut-il que toutes les données collectées parlent la même langue. C’est là qu’OpenTelemetry entre en jeu ! Cet ensemble de frameworks open source permet en effet de collecter, traiter et exploiter vos données dans le format de votre choix, en toute indépendance vis-à-vis des fournisseurs et des agents propriétaires. Vous pouvez ainsi établir une source de vérité unique et complète pour l’ensemble de la data de votre entreprise, tout en gardant le contrôle sur la manière dont vos informations critiques sont utilisées : une des nombreuses raisons pour lesquelles l’observabilité sans OpenTelemetry n’a pas de sens.
Vous voulez en savoir plus sur les bonnes pratiques permettant de garantir la qualité opérationnelle de votre SI ? Visionnez l’intégralité de l’émission Observer le SI pour en maîtriser la qualité perçue. Et pour comprendre comment tout cela se traduit en résultats financiers concrets, ne manquez pas de télécharger notre étude sur Les coûts cachés des temps d’arrêt.
The Splunk platform removes the barriers between data and action, empowering observability, IT and security teams to ensure their organizations are secure, resilient and innovative.
Founded in 2003, Splunk is a global company — with over 7,500 employees, Splunkers have received over 1,020 patents to date and availability in 21 regions around the world — and offers an open, extensible data platform that supports shared data across any environment so that all teams in an organization can get end-to-end visibility, with context, for every interaction and business process. Build a strong data foundation with Splunk.