Aujourd’hui, l’observabilité est plébiscitée par de nombreux vendeurs et de plus en plus d’entreprises tendent vers sa mise en place.
Avec notre partenaire Accenture, nous avons tenté d’apporter quelques éléments de réponses sur la mise en place de l’observabilité et l’apport des principes du Site Reliability Engineering (SRE) lors de l’événement S-Day 2023 qui s’est tenu en septembre dernier à Clermont-Ferrand au stade Marcel-Michelin.
À l’ordre du jour, des conférences autour du rôle du SRE et de l’observabilité, et des tables rondes afin de réfléchir ensemble sur des thématiques précises, notamment sur la définition de l’observabilité et comment commencer à la mettre en œuvre.
Pour démarrer cette journée de travail dans un contexte de coupe du monde de rugby, quoi de mieux qu’un parallèle enrichissant entre le SRE, l’observabilité et la performance dans le sport de haut niveau présenté par Didier RETIÈRE, Directeur du développement sportif de l’équipe de rugby de l’ASM ?
Dans l’article Pourquoi l’observabilité sans OpenTelemetry n’a pas de sens, Stéphane ESTEVEZ, EMEA Director of Product Marketing Observability & IT chez Splunk, nous parle des « inconnues inconnues » et fait le parallèle entre observabilité et le biais du survivant où depuis de nombreuses années nous supervisons des éléments bien connus de nos systèmes, sans prendre en compte que des éléments pourraient nous éclairer davantage sur le contexte d’un incident, voire nous permettre d’être proactifs dans sa détection.
L’observabilité fait donc référence à la capacité de comprendre le fonctionnement d’un système ou d’un processus à partir de l’ensemble des données qu’il génère. Cela implique de collecter et d’analyser des données telles que des logs, des métriques, des traces et des événements pour analyser l’état d’un système, identifier des comportements, détecter les incidents et pouvoir les résoudre.
D’après le rapport Prévisions 2023 pour l’IT et l’observabilité, l’observabilité est le nouveau visage de la transformation numérique, mais aussi de l’expérience numérique puisque son déploiement doit permettre d’améliorer jusqu’à l’expérience utilisateur.
Lorsque nous parlons d’observabilité, nous faisons souvent l’analogie (trop) rapide avec un outil.
Bien entendu, l’observabilité met en œuvre des outils dans le but de servir un objectif qui est souvent l’amélioration de la qualité du service rendu aux clients, internes ou externes. Mais l’observabilité représente bien plus que cela. Elle implique un changement d’état d’esprit au sein des organisations. Elle implique des changements de processus, voire une évolution des organisations et de la collaboration.
Forts de ce retour d’expérience de l’événement S-DAY 2023 avec Accenture, nous tenterons dans cet article de donner des pistes (peut-être parfois pleines de bon sens) sur la manière de démarrer la mise en place de l’observabilité.
Comme dans tout projet, il faut se poser la question du « pourquoi ». Pourquoi déployer l’observabilité quand vous avez déjà du monitoring en place ?
Définissez pourquoi vous souhaitez mettre en œuvre l’observabilité et les objectifs à atteindre.
L’observabilité peut vous apporter des gains significatifs en termes d’amélioration des performances, de fiabilité et d’efficacité opérationnelle mais pour cela, il faudra définir les objectifs qui font sens pour votre entreprise. En voici quelques exemples :
Pour atteindre vos objectifs, vous n’y arriverez vraisemblablement pas seuls ni par une méthode big bang.
Il faudra identifier les « clients » les plus éligibles à l’observabilité et qui vous permettront d’atteindre aussi rapidement que possible vos objectifs (dans un premier temps, de manière à itérer sur d’autres « clients » par la suite).
Déterminez quels systèmes ou composants sont essentiels aux opérations de votre organisation. Commencez par vous concentrer sur un sous-ensemble de systèmes plutôt que d’essayer de tout observer en même temps. Vous procéderez ensuite de manière itérative pour faire évoluer vos outils et vos processus en place, pour ensuite étendre l’observabilité à d’autres périmètres. Voici quelques exemples de périmètres :
L’objectif étant de pouvoir valider rapidement l’intérêt de l’observabilité sur le périmètre choisi.
Maintenant que vous savez quel périmètre traiter, il faudra identifier des indicateurs quantifiables et mesurables pour mesurer les gains que vous souhaitez obtenir et déterminer si vous atteignez vos objectifs, parmi lesquels :
L’objectif sera ensuite de mesurer l’évolution de ces indicateurs avant et après la mise en place de l’observabilité pour en mesurer l’apport.
Planifiez la manière dont vous souhaitez instrumenter vos systèmes pour collecter les données nécessaires à l’observabilité. Vous disposez vraisemblablement de nombreux outils de supervision et vous allez peut-être vous diriger vers une plateforme d’observabilité. Et chacun de vos outils dispose de ses propres moyens de collecte.
Chez Splunk, nous sommes convaincus de l’apport de l’OpenTelemetry dans un contexte d’observabilité. En effet, il fournit un moyen standardisé et neutre de collecter, traiter et exporter les données nécessaires à l’observabilité. C’est pourquoi nous contribuons fortement à ce projet et développons des solutions compatibles avec cette solution open source.
OpenTelemetry prend en charge la collecte de métriques, de traces, de logs et d’événements. Elle offre des capacités de :
OpenTelemetry offre un moyen standardisé d’instrumenter le code et de collecter des données quel que soit l’écosystème. Cela permet de faciliter l’adoption et l’utilisation d’outils d’observabilité dans des environnements hybrides et de donner une vision globale du fonctionnement d’une application.
Le marché fourmille d’outils incluant des plateformes de collecte de logs, de collecte de métriques et de traçage distribué.
Splunk a été désigné leader du Gartner® Magic Quadrant™ 2023 pour l’observabilité et la supervision des performances des applications grâce notamment à des capacités uniques au sein de plateformes unifiées :
Recherchez, testez et choisissez les outils d’observabilité qui correspondent à vos objectifs.
La mise en œuvre de l’observabilité est un processus continu. Il ne s’agit pas seulement de mettre en œuvre de l’outillage. Il s’agit de développer un état d’esprit de compréhension et d’amélioration de vos systèmes en fonction des informations tirées des données d’observabilité.
Cela passe notamment par la sensibilisation des équipes pour leur faire comprendre ce qu’est l’observabilité et en quoi elle va les aider. D’où l’importance de bien choisir les premiers périmètres à traiter pour obtenir des quick wins et communiquer autour des gains obtenus.
Dans le déploiement de l’observabilité, on retrouvera des équipes en charge de l’observabilité dans des organisations matricielles comprenant notamment :
La mise en place de l’observabilité est un véritable projet d’entreprise, qui ne se limite pas au déploiement d’outils (même s’ils sont importants).
Il est important de commencer par une approche ciblée, de tester, d’apprendre de vos expériences et de répéter pour vous améliorer au fil du temps : mettez en place vos processus, documentez, déployez, mesurez, améliorez, étendez, itérez et surtout, communiquez…
La plateforme Splunk élimine les obstacles qui séparent les données de l'action, pour donner aux équipes d'observabilité, d'IT et de sécurité les moyens de préserver la sécurité, la résilience et le pouvoir d'innovation de leur organisation.
Fondée en 2003, Splunk est une entreprise internationale. Ses plus de 7 500 employés, les Splunkers, ont déjà obtenu plus de 1 020 brevets à ce jour, et ses solutions sont disponibles dans 21 régions du monde. Ouverte et extensible, la plateforme de données Splunk prend en charge les données de tous les environnements pour donner à toutes les équipes d'une entreprise une visibilité complète et contextualisée sur l'ensemble des interactions et des processus métier. Splunk, une base solide pour vos données.