En 2024, la question de mettre en place une pratique d’observabilité ne se pose même plus, c’est un impératif. Aujourd’hui, une équipe d’observabilité performante permet aux entreprises leaders de se démarquer de leurs pairs.
Les pratiques d’observabilité de pointe ne consistent pas à résoudre les problèmes en réunissant en urgence des centaines de personnes dans des salons virtuels ou à envoyer des messages en panique dans un canal Slack temporaire pour déterminer les causes profondes des incidents. Comme les leaders intègrent l’observabilité très tôt dans leurs cycles de développement, le lancement d’une nouvelle fonctionnalité est un non-événement. Les incidents éventuels sont résolus sereinement et rapidement, et l’organisation prend des mesures pour éviter des problèmes similaires à l’avenir grâce à des alertes plus précises et une collaboration étroite entre les équipes. Les leaders sont conscients que l’observabilité n’est pas un simple outil de plus dans leur arsenal à utiliser en cas de besoin, c’est une pratique à intégrer à chaque étape.
Dans le cadre de la nouvelle édition de notre rapport annuel, État de l’observabilité en 2024 : construire sa réussite, nous avons interrogé 1 850 experts de l’ITOps et de l’ingénierie issus de 10 pays (dont la France) et de 16 secteurs d’activité. Nous avons constaté que lorsque les équipes n’ont pas à craindre de défaillance de leurs systèmes, elles peuvent se concentrer sur la résilience et l’innovation. Elles développent davantage de code de qualité (et le livrent plus vite), innovent plus et exploitent des technologies telles que l’IA, l’ingénierie de plateforme et OpenTelemetry pour gagner en efficacité et trier leurs données de télémétrie. Tout cela se répercute directement sur les résultats financiers des organisations leaders, avec un retour annuel équivalent à 2,67 fois leurs dépenses.
Alors que les attentes des clients et la complexité des données augmentent, les pratiques d’observabilité de pointe confèrent un avantage concurrentiel. Notre étude montre que les leaders surpassent systématiquement leurs concurrents dans plusieurs domaines.
Les leaders résolvent rapidement les incidents pour minimiser les conséquences des temps d’arrêts, qui coûtent chaque année 400 milliards de dollars aux entreprises du Global 2000. Les entreprises leaders sont 2,3 fois plus nombreuses à mesurer leur MTTR en minutes ou en heures, par rapport aux entreprises débutantes qui le mesurent en jours, en semaines, voire en mois. Selon toute vraisemblance, les leaders atteignent cette vitesse impressionnante parce qu’ils ne perdent pas de temps à investiguer des alertes inexactes : 80 % de leurs alertes sont légitimes. En faisant converger les outils et les workflows de sécurité pour offrir davantage de contexte sur les incidents, 73 % affirment avoir amélioré leur MTTR.
Les développeurs des organisations leaders sont plus productifs, probablement parce qu’ils n’ont pas à passer leur temps à éteindre des incendies ou à réparer des erreurs. La majorité des leaders poussent leur code à la demande 2,6 fois plus souvent que les entreprises débutantes. Leurs équipes peuvent ainsi publier de nouveaux services et produits plus rapidement. Ces poussées de code ont par ailleurs un taux de réussite 22 % plus élevé que celui de leurs pairs.
Grâce à ces bonnes pratiques, leur solution d’observabilité leur apporte une plus grande valeur ajoutée : 92 % affirment que leur solution réduit le temps de développement des applications, ce qui leur permet de commercialiser leurs produits plus rapidement. Et surtout, les leaders indiquent obtenir un retour annuel 2,67 fois supérieur à leurs dépenses d’observabilité.
Le succès des leaders en matière de développement et de déploiement de logiciels est en partie dû à leur adoption de l’ingénierie de plateforme (platform engineering), une discipline qui soulage les ingénieurs logiciels de la gestion des chaînes d’outils afin qu’ils puissent se consacrer à leur spécialité : mettre sur le marché de nouveaux produits sources de revenus. Les leaders adoptent de plus en plus l’ingénierie de plateforme, qui est en train de s’imposer sur le marché, 73 % de l’ensemble des participants indiquant l’avoir adoptée.
Les organisations disposant d’équipes d’ingénierie de plateforme en voient les bénéfices, 55 % d’entre elles déclarant que leur principale réussite est l’amélioration de l’efficacité des opérations IT. L’ingénierie de plateforme excelle notamment dans la normalisation des opérations : 90 % des participants affirment que les efforts fournis par leurs ingénieurs de plateforme pour normaliser les opérations sont fructueux. Les équipes de plateforme réussissent notamment à appliquer et à respecter les normes de sécurité et de conformité indispensables pour obtenir des certifications très demandées comme HIPAA et FedRAMP aux États-Unis, ou NIS2 en France. De plus, 58 % des leaders indiquent que leurs équipes de développement voient l’ingénierie de plateforme comme un facteur essentiel de différenciation par rapport à la concurrence.
L’ingénierie de plateforme n’est pas la seule tendance amenée à s’installer sur la durée : le framework OpenTelemetry s’impose comme la nouvelle norme pour collecter les données d’observabilité, notamment grâce à la flexibilité et au contrôle qu’il offre, 53 % des participants l’ayant adopté. OpenTelemetry permet aux organisations d’être indépendantes vis-à-vis des fournisseurs et des agents propriétaires, 73 % des participants affirmant que son principal avantage est l’accès à un écosystème de technologies plus large.
L’IA et le ML traditionnels restent des incontournables de l’observabilité, 97 % des participants utilisant ces outils pour améliorer leurs opérations d’observabilité. Plus spécifiquement, 56 % utilisent l’IA et le ML pour corréler les événements et hiérarchiser les alertes. Cependant, l’IA générative suscite encore beaucoup de curiosité. Même si 84 % des participants expliquent s’être penchés sur ses fonctionnalités au sein des plateformes d’observabilité, seulement 13 % l’ont effectivement adoptée.
La moitié des entreprises françaises interrogées sont encore débutantes dans le domaine de l’observabilité. Ce chiffre concorde avec le fait que 36 % d’entre elles n’ont pas encore mis en œuvre d’approche formelle de la résilience numérique. La valeur totale moyenne que les entreprises françaises interrogées retirent de leurs solutions d’observabilité est par ailleurs la plus basse de l’étude avec 2,6 millions de dollars par an contre 3,4 millions de dollars en moyenne dans les pays de l’étude.
Pour améliorer leurs pratiques d’observabilité, les entreprises françaises doivent relever plusieurs défis concernant le volume et la corrélation des données : 31 % des participants français estimant que la quantité de données collectées dépasse la capacité humaine à les assimiler et que la corrélation des données issues de différentes sources prend trop de temps.
OpenTelemetry pourrait ainsi représenter une bonne solution. Actuellement, plus de la moitié des entreprises françaises interrogées (56 %) n’utilisent pas ce framework, mais sa valeur fait indéniablement consensus : elles sont 92 % à affirmer qu’il est important ou essentiel que leur fournisseur d’observabilité contribue au code d’OpenTelemetry.
Lisez le rapport complet pour tout savoir sur les tendances telles que l’IA, OpenTelemetry et l’ingénierie de plateforme, et pour découvrir les recommandations des experts Splunk expliquant comment mettre en place une pratique d’observabilité de pointe.
The Splunk platform removes the barriers between data and action, empowering observability, IT and security teams to ensure their organizations are secure, resilient and innovative.
Founded in 2003, Splunk is a global company — with over 7,500 employees, Splunkers have received over 1,020 patents to date and availability in 21 regions around the world — and offers an open, extensible data platform that supports shared data across any environment so that all teams in an organization can get end-to-end visibility, with context, for every interaction and business process. Build a strong data foundation with Splunk.