Qu’est-ce que l’AIOps ? Le terme « AIOps » désigne la pratique consistant à utiliser le big data, l’analyse et le machine learning pour automatiser et améliorer les opérations IT (ITOps). L’IA joue un rôle particulièrement important dans des fonctions ITOps telles que la détection des anomalies et la corrélation des événements, en raison de sa capacité à analyser de grandes quantités de données réseau et machine pour y reconnaître des tendances, identifier la cause des problèmes existants et trouver des moyens de prédire et prévenir les problèmes à venir.
Dans cet article :
Splunk IT Service Intelligence (ITSI) est une solution d’AIOps, d’analytique et de gestion IT qui aide les équipes à anticiper les incidents avant qu’ils n’affectent les clients.
ITSI utilise l’IA et le machine learning pour corréler les données collectées auprès de nombreuses sources de supervision et offrir une vue unifiée des services IT et métiers pertinents. La solution a un double avantage : elle réduit les déluges d’alertes et permet la prévention des interruptions de service.
La complexité des environnements de données modernes, qui englobent des microservices, des architectures multicloud et hybrides ainsi que des conteneurs, parallèlement à la prolifération des systèmes distribués, crée des quantités massives et encombrantes de données de log et de performances. Ces données tendent à submerger les analystes IT et les empêchent d’avoir une bonne visibilité sur l’état et la sécurité du réseau. Les solutions AIOps aident les professionnels de l’informatique à résoudre ces problèmes en supervisant les actifs et en donnant de la visibilité sur les dépendances aussi bien internes qu’externes, sans aucune intervention humaine.
Dans cet article, nous nous intéressons au fonctionnement de l’AIOps, à ses innombrables scénarios d’utilisation et ses multiples avantages. Vous découvrirez également comment bien aborder l’adoption de l’AIOps dans votre entreprise.
En 2016, Gartner a inventé le terme « AIOps », abréviation d’« opérations IT algorithmiques ». Ce concept était censé incarner la nouvelle itération de l’analyse des opérations informatiques (ITOA). Au bout d’un an environ, Gartner a fait évoluer le sens de l’abréviation, qui signifie aujourd’hui « IA au service des opérations informatiques » : un changement subtil mais puissant pour la diffusion du concept.
L’AIOps est conçue pour mettre la vitesse et la précision de l’IA au service des opérations IT. La gestion des opérations informatiques est une tâche de plus en plus ardue en raison des dimensions et de la complexité croissantes des réseaux. Les outils et pratiques traditionnels de gestion des opérations parviennent difficilement à faire face aux volumes croissants de données issues de nombreuses sources, dans des environnements de réseau complexes et variés. Pour relever ces défis, les outils AIOps :
Une plateforme d’IA exploite le machine learning et le big data pour aider les opérations IT à produire davantage de valeur.
Selon Gartner, « une plateforme AIOps rassemble big data et machine learning pour appuyer les opérations IT grâce à l’assimilation et l’analyse des données générées et sa capacité à s’adapter à des volumes croissants de données. La plateforme permet d’utiliser simultanément de nombreuses sources de données, méthodes de collecte et technologies d’analyse et de présentation. »
Entre autres choses, une plateforme AIOps doit pouvoir à la fois analyser les données stockées et fournir une analyse en temps réel au point d’assimilation. Les fonctions centrales d’une plateforme AIOps telle que définie par Gartner comprennent :
Les plateformes AIOps s’attaquent aux défis croissants qui affectent la gestion des écosystèmes de données complexes. Le Guide Gartner 2022 du marché des plateformes AIOps souligne que « les coûts et la complexité de la gestion des données deviennent une source de préoccupation pour beaucoup d’entreprises qui ont adopté une plateforme AIOps et élargissent son utilisation. ». Il souligne également que « l’adoption des plateformes AIOps augmente rapidement dans l’entreprise. »
Dans ce contexte, il semble logique que les plateformes d’IA restent une solution intéressante pour les entreprises qui tiennent à rendre leur cloud et leur environnement de données plus efficaces, économiques et faciles à gérer.
Gartner recense cinq scénarios d’utilisation principaux pour l’AIOps :
Gartner recense cinq scénarios d’utilisation principaux pour l’AIOps : gestion des big data, analyse des performances, détection des anomalies, corrélation des événements et gestion des services IT.
En automatisant les fonctions des opérations IT et en utilisant l’IA pour améliorer les performances du système, l’AIOps apporte des avantages significatifs à une entreprise. Par exemple :
Élimination des temps d’arrêt, corrélation des données, accélération de l’analyse des causes profondes, découverte et correction des erreurs : autant de gains qui laissent plus de temps à la collaboration.
En améliorant les performances de l’infrastructure IT, aussi bien cloud que locale, l’AIOps améliore les KPI qui définissent le succès d’une entreprise.
La plupart des défis que l’AIOps aide les opérations IT à relever sont communs à tous les secteurs d’activités. Certains problèmes sont toutefois plus fréquents ou menaçants dans certaines industries, notamment la santé, la fabrication et les services financiers. En automatisant les fonctions des opérations IT pour améliorer les performances du système, l’AIOps apporte des avantages significatifs à une entreprise. Par exemple :
Ces dernières années, les plateformes d’AIOps ont gagné en popularité dans tous les secteurs d’activité. Les entreprises les voient comme un outil indispensable pour gérer leur environnement de données et ont étendu son usage à toutes les fonctions de l’ITOM. On comprend que le marché de l’AIOps soit en pleine croissance et ne donne aucun signe de ralentissement. Selon Gartner, la valeur du marché de l’AIOps devrait atteindre 2,1 milliards de dollars en 2025, avec un taux de croissance annuel composé (TCAC) d’environ 19 %. De la même manière, Future Market Insights prévoit que le marché des plateformes d’AIOps atteindra 80,2 milliards de dollars en 2032, avec un TCAC de 25,4 % entre 2022 et 2032.
Avec la croissance exponentielle de ChatGPT, tout laisse à penser que l’IA générative jouera un rôle clé dans le développement et l’évolution de l’AIOps. Selon un rapport de TechTarget, l’IA générative pourrait être employée dans le développement de code d’applications, mais aussi dans des tâches d’ingénierie de routine comme la génération de tests. Les fonctions d’observabilité et l’automatisation des workflows de résilience, comme les tests de pénétration, pourraient également évoluer avec l’IA générative. Cette technologie pourrait être utilisée pour produire des analyses à partir de données non structurées incluant notamment des fichiers audio et des conversations.
Il reste toutefois à déterminer de quelle manière l’IA générative affectera ces fonctions. Mais tout porte à croire qu’elle jouera un rôle croissant et de plus en plus central, surtout avec l’intégration croissante de l’AIOps dans le parcours de transformation numérique des entreprises.
Pour mieux comprendre le futur rôle de l’AIOps, nous avons discuté avec Sanjay Munshi, Directeur d’exploitation adjoint de NETSCOUT pour connaître son point de vue sur l’importance et l’avenir de l’AIOps.
« Les cadres comptent énormément sur l’IA et investissent lourdement dans cette technologie en espérant voir les résultats révolutionnaires qu’on leur a promis. Mais les systèmes et les plateformes d’IA n’ont pas toujours le socle de données nécessaire pour délivrer ces résultats. La performance de l’IA dépend directement des données qu’elle reçoit. Si les données sont médiocres, l’IA le sera aussi. Les modèles créés à l’aide de données incomplètes ou abstraites peuvent avoir des problèmes de performance ou, pire encore, fausser la prise de décisions métiers.
Il est absolument fondamental de faire évoluer la stratégie de données pour alimenter correctement les systèmes d’IA et d’AIOps. Pour cela, il faut un framework de capteurs distribués qui ne s’appuie pas sur une représentation statique des composants de l’infrastructure, et qui soit invulnérable aux activités des pirates (ou permette au minimum de les voir instantanément). Le logiciel de ce framework doit capturer, analyser et sélectionner les informations à la source. Il ne doit pas seulement fournir les données les plus fidèles, il doit aussi enrichir les modèles de données qui reposent uniquement sur les métriques, les logs et les traces.
Pour tenir toutes ses promesses de correction rapide, d’automatisation de la réponse et de fiabilité des résultats pour une meilleure expérience utilisateur, une IA performante doit reposer sur un socle de données de grande qualité, soigneusement sélectionnées, exploitables et enrichies, en provenance de toute l’entreprise. »
La meilleure façon de bien démarrer avec l’AIOps consiste à adopter une approche incrémentielle. La bonne pratique recommande de commencer à petite échelle, en réorganisant vos domaines IT par source de données. Apprenez à travailler avec de grands jeux de données persistantes provenant de sources diverses. Donnez à votre équipe des opérations IT la possibilité de se familiariser avec les aspects big data de l’AIOps. Commencez par les données historiques, puis ajoutez progressivement de nouvelles sources de données en améliorant votre pratique.
Attachez-vous d’abord à importer les données : assimiler et analyser tous les types de données, de façon rapide et efficace, est une tâche colossale. Commencez plutôt par localiser et analyser les données machine et les métriques historiques brutes, afin d’acquérir une compréhension basique de la situation, puis utilisez des algorithmes de clustering et des analyses pour identifier des tendances et des motifs remarquables. Les données brutes sont les meilleures si vous tenez réellement à pouvoir faire de la détection en temps réel. Vous pouvez ensuite commencer à analyser les flux de données pour déterminer s’ils correspondent à ces motifs, en appliquant l’IA et le machine learning pour introduire de l’automatisation puis, à terme, parvenir à l’analyse prédictive.
Incorporez et analysez autant de types de données que possible : si vous commencez par analyser et comprendre les états passés de vos systèmes, vous pourrez ensuite corréler ce que vous aurez appris avec le présent. Pour y parvenir, les organisations doivent assimiler et donner accès à un très grand nombre de types de données historiques et de flux. Le type de données que vous allez sélectionner (log, métrique, texte, transaction, réseaux sociaux) dépend du problème que vous cherchez à résoudre. Vous pouvez par exemple utiliser les données de métriques de votre infrastructure pour superviser sa capacité, ou les logs d’applications pour être sûr de délivrer une expérience exceptionnelle à vos clients. C’est pourquoi les entreprises doivent choisir les plateformes capables d’assimiler et d’analyser des données issues de sources multiples.
N’essayez pas de tout faire en une fois : cherchez avant tout à déterminer la cause profonde de votre problème le plus urgent. Progressez ensuite vers la supervision des données. Ce n’est qu’une fois cela fait que vous pourrez aborder l’IA. Et là encore, procédez étape par étape :
Si vous êtes un professionnel de l’IT et des réseaux, on vous a dit et répété que les données sont l’actif le plus important de l’entreprise, et que les big data vont transformer le monde. L’IA est une révolution, et elle est là pour durer. L’AIOps est un moyen concret de faire du battage médiatique entourant l’IA et le big data une réalité au service de vos initiatives métiers. Pour améliorer la sécurité comme pour normaliser les opérations ou accroître la productivité, l’AIOps offre un moyen pratique et accessible de développer et agrandir vos opérations IT pour qu’elles soient à la hauteur des défis à venir, et consolider ainsi le rôle de l’IT comme catalyseur stratégique de la croissance de l’entreprise.
Lisez cet e-book pour découvrir comment vous lancer avec l’AIOps :
Une erreur à signaler ? Une suggestion à faire ? Contactez-nous à l’adresse ssg-blogs@splunk.com.
Cette publication ne représente pas nécessairement la position, les stratégies ou l’opinion de Splunk.
La plateforme Splunk élimine les obstacles qui séparent les données de l'action, pour donner aux équipes d'observabilité, d'IT et de sécurité les moyens de préserver la sécurité, la résilience et le pouvoir d'innovation de leur organisation.
Fondée en 2003, Splunk est une entreprise internationale. Ses plus de 7 500 employés, les Splunkers, ont déjà obtenu plus de 1 020 brevets à ce jour, et ses solutions sont disponibles dans 21 régions du monde. Ouverte et extensible, la plateforme de données Splunk prend en charge les données de tous les environnements pour donner à toutes les équipes d'une entreprise une visibilité complète et contextualisée sur l'ensemble des interactions et des processus métier. Splunk, une base solide pour vos données.