IT

Le monitoring à l’ère du cloud : l’observabilité

If This Then Dev (IFTTD) est un podcast D.E.V. (Différent, Extraordinaire et Visionnaire) qui décode les sujets et les tendances dans l’univers de l’innovation et des technologies. Chaque semaine, Bruno Soulez reçoit un expert pour tenter de comprendre les enjeux d’une problématique IT avant de passer au développement. J’ai eu la chance d’être l’invité d’un épisode spécial dédié à l’observabilité et au monitoring à l’ère du cloud. Voici un avant-goût des nombreuses questions que nous avons abordées au cours de cet échange. 

Comprendre l’observabilité à l’ère du cloud et du DevOps

L’observabilité est vite devenue incontournable dans le domaine de la data. Pourtant, malgré sa popularité, il est bien difficile de s’accorder sur une définition commune. Pour ma part, je considère cette approche comme un état d’esprit, qui consiste à chercher toutes les inconnues-inconnues (ces données qui existent mais qui nous sont inconnues, c’est le principe de la fenêtre de Johari mais appliqué à l'IT) permettant de comprendre une infrastructure, une application ou tout simplement une transaction. C’est, en quelque sorte, notre manière d’éviter le fameux biais du survivant dans le monde ultra connecté où nous évoluons. Et pour cela, nous nous appuyons sur trois piliers pour répondre aux questions fondamentales : les métriques (ai-je un problème ?), les traces (où se trouve le problème ?) et les logs (quelle en est la cause ?).

Mais pour mieux saisir toute la complexité de leurs nouvelles architectures microservices, les équipes IT ne peuvent plus se contenter de s’intéresser à ce qu’il se passe entre les quatre murs de leur organisation trop souvent silotée en termes d’outils voire de process. Elles ont besoin d’aller davantage dans le détail pour analyser et gérer des systèmes distribués, qui reposent aussi sur des outils cloud parfois très sophistiqués et nébuleux. Et ces détails doivent être partagés entre les équipes de développement, d’opérations et de sécurité (vous avez dit DevSecOps ?)

Tirer pleinement parti de l’AIOps

Les solutions d’observabilité actuelles permettent donc de recueillir toutes les données disponibles pour transformer les inconnues-inconnues en informations connues. On redécouvre notamment le real user monitoring et tous les dispositifs qui nous offrent la possibilité de garder un œil sur les éléments qui sont hors de contrôle de l’entreprise pour aller chercher des informations sur le monde extérieur (les CDN, les DNS, la connectivité des utilisateurs etc).

Pour gérer cette quantité de données et d’événements, les professionnels de l’IT n’ont d’autre choix que de s’appuyer sur l’IA et le machine learning. Une bonne pratique de l’observabilité va donc permettre de collecter encore plus de données, de fournir plus de « carburant » aux algorithmes de machine learning afin de les rendre encore plus pertinents pour assister les équipes dans leur démarche de troubleshooting. Qu’il s’agisse de définir des seuils dynamiques adaptés au comportement « normal » de l’application, de détecter des comportements inhabituels d’une infrastructure, de mieux comprendre l’architecture ou même de s’adonner à l’analyse prédictive des incidents « à venir », ces algorithmes sont aujourd’hui essentiels pour changer la manière de prioriser les événements et décharger les équipes d’exploitation.

S’appuyer sur les bons outils pour moderniser son infrastructure

Heureusement, les outils qui permettent aux entreprises d’implémenter l’observabilité dans leur environnement IT ont également évolué. Dorénavant, elles ne partent plus d’une feuille blanche et peuvent compter sur un certain nombre de ressources, comme le projet open source Open Telemetry pour simplifier la collecte de ces inconnues (et des connues of course) et les plateformes Splunk pour les transformer en alertes, les analyser et les rendre exploitables. Mais encore faut-il s’appuyer sur les bonnes données. Par exemple, seule une minorité d’organisations dispose d’un outil de real user monitoring et profite donc d’informations sur les événements survenus en amont de l’utilisation de leur application. Il en va de même pour les outils de synthetic monitoring (deux « classiques » qui redeviennent à la mode) ou même les outils de tracing distribués pour les environnements microservices.

L’étude mondiale sur l’État de l’observabilité en 2022 montre ainsi que, pour améliorer leur visibilité, les entreprises les plus matures en matière d’observabilité ont tendance à multiplier leurs outils, tout en limitant le nombre de fournisseurs auxquels elles font appel. Cette approche a l’avantage de simplifier le travail des équipes DevOps.

Faire évoluer les mentalités et attirer les talents

Si les solutions existent, comment expliquer les réticences de certaines entreprises à opérer cette transformation vers l’observabilité, dans une Europe où 55 % des interactions avec les clients sont désormais digitales ? Et nous sommes particulièrement en retard sur ce point. D’après l’étude sur l’État de l’observabilité en 2022, seules 19 % des sociétés françaises déclarent en effet utiliser largement l’IA et le machine learning, contre 28 % dans les autres pays.

Les difficultés de recrutement font sans doute partie du problème, mais la culture d’entreprise est peut-être le principal frein à l’impulsion dont le secteur a besoin pour évoluer. Notre rôle est donc de faciliter cette transition en accompagnant les organisations, en les aidant à choisir et à mettre en place les outils pertinents et en participant à la formation de leurs collaborateurs. Nous devons également leur expliquer tout l’intérêt qu’elles ont à moderniser leur infrastructure, que ce soit pour mieux comprendre l’utilisateur final, simplifier leurs opérations ou recruter de nouveaux talents grâce à des technologies tout aussi efficaces qu’attractives.


Vous voulez en savoir plus sur la manière de moderniser votre infrastructure et d’adapter votre monitoring à l’ère du cloud ? Regardez l’intégralité de la vidéo et téléchargez le rapport complet sur l’État de l’observabilité en 2022.

 

Vingt ans de Product Management et Product Marketing, dans des startups de 150 personnes et des grands groupes de 180 000 personnes, 20 ans c'est long, mais c'est bien :)