false
28 mai 2024
 | 
18 min de lecture

Qu’est-ce que l’AIOps ? Tout comprendre à l’AIOps

Qu’est-ce que l’AIOps ? Le terme « AIOps » désigne la pratique consistant à utiliser le big data, l’analyse et le machine learning pour automatiser et améliorer les opérations IT (ITOps). L’IA joue un rôle particulièrement important dans des fonctions ITOps telles que la détection des anomalies et la corrélation des événements, en raison de sa capacité à analyser de grandes quantités de données réseau et machine pour y reconnaître des tendances, identifier la cause des problèmes existants et trouver des moyens de prédire et prévenir les problèmes à venir.

Dans cet article :

Splunk ITSI est un leader dans le domaine de l’AIOps

Splunk IT Service Intelligence (ITSI) est une solution d’AIOps, d’analytique et de gestion IT qui aide les équipes à anticiper les incidents avant qu’ils n’affectent les clients.

ITSI utilise l’IA et le machine learning pour corréler les données collectées auprès de nombreuses sources de supervision et offrir une vue unifiée des services IT et métiers pertinents. La solution a un double avantage : elle réduit les déluges d’alertes et permet la prévention des interruptions de service.

En savoir plus sur Splunk ITSI ›

La complexité des environnements de données modernes, qui englobent des microservices, des architectures multicloud et hybrides ainsi que des conteneurs, parallèlement à la prolifération des systèmes distribués, crée des quantités massives et encombrantes de données de log et de performances. Ces données tendent à submerger les analystes IT et les empêchent d’avoir une bonne visibilité sur l’état et la sécurité du réseau. Les solutions AIOps aident les professionnels de l’informatique à résoudre ces problèmes en supervisant les actifs et en donnant de la visibilité sur les dépendances aussi bien internes qu’externes, sans aucune intervention humaine.

Dans cet article, nous nous intéressons au fonctionnement de l’AIOps, à ses innombrables scénarios d’utilisation et ses multiples avantages. Vous découvrirez également comment bien aborder l’adoption de l’AIOps dans votre entreprise. 

Fondamentaux de l’AIOps

En 2016, Gartner a inventé le terme « AIOps », abréviation d’« opérations IT algorithmiques ». Ce concept était censé incarner la nouvelle itération de l’analyse des opérations informatiques (ITOA). Au bout d’un an environ, Gartner a fait évoluer le sens de l’abréviation, qui signifie aujourd’hui « IA au service des opérations informatiques » : un changement subtil mais puissant pour la diffusion du concept.

L’AIOps est conçue pour mettre la vitesse et la précision de l’IA au service des opérations IT. La gestion des opérations informatiques est une tâche de plus en plus ardue en raison des dimensions et de la complexité croissantes des réseaux. Les outils et pratiques traditionnels de gestion des opérations parviennent difficilement à faire face aux volumes croissants de données issues de nombreuses sources, dans des environnements de réseau complexes et variés. Pour relever ces défis, les outils AIOps :

  • Réunissent les données issues de nombreuses sources : les approches, outils et solutions conventionnels n’ont pas été conçus en anticipant le volume, la variété et la vitesse générés par les environnements informatiques complexes et connectés d’aujourd’hui. C’est pourquoi elles rassemblent et agrègent les données, puis en font des moyennes, ce qui compromet la fidélité des données. L’un des avantages fondamentaux d’une plateforme AIOps réside dans sa capacité à capturer de vastes ensembles de données de tout type, provenant de tout l’environnement, tout en préservant la fidélité des données à des fins d’analyse complète.
  • Simplifient l’analyse des données : les plateformes AIOps ont le grand avantage de pouvoir recueillir tous les formats de big data de différents volumes et vélocités. La plateforme applique ensuite une analyse automatisée aux données pour prédire et prévenir les futurs problèmes, et identifier la cause des problèmes existants afin de prendre de meilleures décisions.

schéma aiops orbit

Une plateforme d’IA exploite le machine learning et le big data pour aider les opérations IT à produire davantage de valeur.

Les plateformes AIOps

Selon Gartner, « une plateforme AIOps rassemble big data et machine learning pour appuyer les opérations IT grâce à l’assimilation et l’analyse des données générées et sa capacité à s’adapter à des volumes croissants de données. La plateforme permet d’utiliser simultanément de nombreuses sources de données, méthodes de collecte et technologies d’analyse et de présentation. »

Entre autres choses, une plateforme AIOps doit pouvoir à la fois analyser les données stockées et fournir une analyse en temps réel au point d’assimilation. Les fonctions centrales d’une plateforme AIOps telle que définie par Gartner comprennent :

  • l’ingestion des données de sources multiples, quels que soient la source et le fournisseur,
  • la réalisation d’analyses en temps réel au point d’assimilation,
  • la réalisation d’analyses historiques sur les données enregistrées,
  • l’exploitation du machine learning,
  • le déclenchement d’une action ou d’une étape supplémentaire en fonction des informations et de l’analyse.

Les plateformes AIOps s’attaquent aux défis croissants qui affectent la gestion des écosystèmes de données complexes. Le Guide Gartner 2022 du marché des plateformes AIOps souligne que « les coûts et la complexité de la gestion des données deviennent une source de préoccupation pour beaucoup d’entreprises qui ont adopté une plateforme AIOps et élargissent son utilisation. ». Il souligne également que « l’adoption des plateformes AIOps augmente rapidement dans l’entreprise. »

Dans ce contexte, il semble logique que les plateformes d’IA restent une solution intéressante pour les entreprises qui tiennent à rendre leur cloud et leur environnement de données plus efficaces, économiques et faciles à gérer.

Les scénarios d’utilisation essentiels de l’AIOps

Gartner recense cinq scénarios d’utilisation principaux pour l’AIOps :

  1. Gestion des big data (volume, variété, variabilité et vélocité)
  2. Supervision et analyse des performances
  3. Détection des anomalies
  4. Corrélation et analyse des événements
  5. Gestion des services informatiques

Gartner recense cinq scénarios d’utilisation principaux pour l’AIOps : gestion des big data, analyse des performances, détection des anomalies, corrélation des événements et gestion des services IT.

  1. Analyse des performances : l’analyse des performances est une application clé de l’AIOps qui combine IA et machine learning pour recueillir et analyser rapidement de grandes quantités de données d’événement afin d’identifier la cause profonde d’un problème. Fonction essentielle de l’informatique, l’analyse des performances est devenue plus complexe avec l’augmentation du volume et de la variété des types de données. Il est devenu de plus en plus difficile pour les professionnels de l’IT d’analyser leurs données à l’aide des méthodes traditionnelles, même lorsque ces méthodes intègrent des technologies de machine learning. L’AIOps contribue à résoudre le problème de la croissance constante du volume et de la complexité des données, en appliquant des techniques d’IA plus sophistiquées pour analyser les jeux de données plus volumineux. Elle peut prédire les risques de dégradation et effectuer rapidement des analyses des causes profondes, permettant bien souvent d’empêcher les problèmes de se produire.
  2. Détection des anomalies : la détection des anomalies en IT consiste à identifier les valeurs anormales dans les données, autrement dit les événements et les activités qui se distinguent suffisamment des données historiques pour suggérer un problème potentiel. Ces valeurs sont appelées événements anormaux.

    La détection des anomalies repose sur des algorithmes. Un algorithme de tendance supervise un KPI unique en comparant son comportement actuel à son historique. Si le score augmente de façon anormale, l’algorithme génère une alerte. Un algorithme de cohésion examine un groupe de KPI devant se comporter de façon similaire et génère une alerte si le comportement de l’un d’entre eux change.L’AIOps rend la détection des anomalies plus rapide et plus efficace. Une fois qu’un comportement a été identifié, l’AIOps peut superviser la différence entre la valeur réelle du KPI étudié et la prédiction du modèle de machine learning, afin de reconnaître les écarts importants.
  3. Corrélation et analyse des événements : la corrélation et l’analyse des événements permettent de voir, dans un « orage d’événements » constitué de multiples alertes connexes, la cause sous-jacente des événements et une piste de résolution. Malheureusement, les outils informatiques traditionnels ne fournissent pas d’informations sur les problèmes, ils ne font qu’émettre quantité d’alertes.

    L’AIOps utilise des algorithmes d’IA pour regrouper automatiquement des événements notables sur la base de leur similarité. Cela réduit la charge sur les équipes IT chargées de gérer les événements en continu, et réduit la masse inutile (et agaçante) d’événements. L’AIOps accomplit ensuite des actions basées sur des règles, comme fusionner les événements dupliqués, supprimer des alertes et fermer des événements notables à la réception d’un nouvel événement.
  4. Gestion des services informatiques : la gestion des services informatiques (ITSM) est un terme général qui recouvre tout ce qui est impliqué dans la conception, l’élaboration, la livraison, la prise en charge et la gestion des services informatiques d’une entreprise. L’ITSM englobe les politiques, processus et procédures de livraison des services IT aux utilisateurs finaux d’une entreprise.L’AIOps apporte à l’ITSM les mêmes avantages qu’aux autres disciplines IT, en appliquant l’IA aux données pour identifier les problèmes et les résoudre rapidement, et donc en rendant les services IT plus efficaces et rentables. L’AIOps pour l’ITSM peut être appliqué aux données pour surveiller le service d’assistance IT, mais aussi pour gérer tous les périphériques.L’AIOps pour l’ITSM aide les services IT à :
    • gérer les performances des infrastructures dans un environnement multicloud,
    • faire des prédictions plus précises à des fins de planification des capacités,
    • optimiser les ressources de stockage en ajustant automatiquement les capacités,
    • améliorer l’utilisation des ressources en fonction des données historiques et des prédictions,
    • identifier, prédire et prévenir les problèmes des services informatiques,
    • gérer les appareils connectés sur l’ensemble du réseau.
  5. Automatisation : les outils conventionnels impliquent souvent d’assembler manuellement les informations de différentes sources avant qu’il soit possible de comprendre, dépanner et résoudre les incidents. L’AIOps offre un avantage conséquent par sa capacité à recueillir et à corréler automatiquement les données de sources diverses, ce qui augmente considérablement la vitesse et la précision de la démarche. L’approche AIOps automatise ces fonctions à l’échelle des opérations IT d’une entreprise :
    • Serveurs, OS et réseaux : collectez l’intégralité des logs, des métriques, des configurations, des messages et des pièges pour interroger les données, les corréler, générer des alertes et produire des rapports sur plusieurs serveurs.
    • Conteneurs : collectez, interrogez et corrélez les données des conteneurs avec d’autres données d’infrastructure pour une mise en contexte et une supervision améliorées des services, et pour produire des rapports de meilleure qualité.
    • Supervision du cloud : supervisez les performances, l’utilisation et la disponibilité de l’infrastructure cloud.
    • Supervision de la virtualisation : bénéficiez d’une visibilité sur l’ensemble de la pile virtuelle, établissez plus rapidement des corrélations entre les événements et faites des recherches portant sur des transactions issues des composants physiques et virtuels.
    • Supervision des systèmes de stockage : ayez une meilleure vision de vos systèmes de stockage dans le contexte des performances des applications associées, des temps de réponse des serveurs et de la charge de la virtualisation.

Les avantages métiers de l’AIOps

En automatisant les fonctions des opérations IT et en utilisant l’IA pour améliorer les performances du système, l’AIOps apporte des avantages significatifs à une entreprise. Par exemple :

Élimination des temps d’arrêt, corrélation des données, accélération de l’analyse des causes profondes, découverte et correction des erreurs : autant de gains qui laissent plus de temps à la collaboration.

En améliorant les performances de l’infrastructure IT, aussi bien cloud que locale, l’AIOps améliore les KPI qui définissent le succès d’une entreprise.

  • La prévention des interruptions améliore la satisfaction des clients.
  • Le regroupement de sources de données auparavant isolées dans des silos permet de produire des analyses et des informations plus complètes.
  • Accélérer l’analyse des causes profondes et la correction des problèmes réduit les coûts et économise du temps et des ressources.
  • La réduction du délai de réponse et le renforcement de la cohérence des réactions améliore la prestation de services.
  • Localiser et corriger des erreurs dont la prise en charge serait chronophage et fastidieuse, améliore la satisfaction des employés et permet aux équipes IT de se concentrer sur des analyses et des optimisations à grande valeur ajoutée.
  • Donner aux décideurs informatiques plus de temps pour collaborer avec leurs collègues des fonctions métiers leur permet de démontrer la valeur stratégique de l’organisation IT.

La plupart des défis que l’AIOps aide les opérations IT à relever sont communs à tous les secteurs d’activités. Certains problèmes sont toutefois plus fréquents ou menaçants dans certaines industries, notamment la santé, la fabrication et les services financiers. En automatisant les fonctions des opérations IT pour améliorer les performances du système, l’AIOps apporte des avantages significatifs à une entreprise. Par exemple :

L’AIOps peut être mise à profit de l’informatique dans le secteur de la santé (HIT) :

  • Sécurisation des informations médicales personnelles électroniques (ePHI) conformément à la loi HIPAA sur la portabilité et la traçabilité de l’assurance santé.
  • Réduction des risques associés aux réseaux mobiles et à l’utilisation des appareils personnels (« bring-your-own-device ») par les professionnels de santé.
  • Prévention des attaques par ransomware, qui ciblent les établissements de santé de façon disproportionnée.
  • Possibilité d’interroger et d’utiliser les données massives internes et externes à des fins de diagnostic.

L’AIOps est intéressante pour l’informatique dans le secteur de la fabrication :

  • Automatisation de la collecte et de l’analyse de sources de données disparates provenant de l’intégration de la chaîne d’approvisionnement, des opérations d’usine et de la gestion du cycle de vie des produits et des services.
  • Utilisation de la supervision en temps réel pour suivre chaque machine de l’usine, en regroupant des données telles que la durée des cycles de fabrication, les rendements de qualité par machine et cycle de production, l’utilisation des capacités et les niveaux de qualité des fournisseurs.
  • Prévention des ralentissements et résolution des problèmes de production grâce à l’exploitation des données historiques combinées à des analyses prédictives avec IA, de façon à protéger les flux de revenus et à améliorer la satisfaction des clients.
  • Utilisation des données machine pour permettre la maintenance prédictive, qui consiste à réparer les machines avant qu’elles ne subissent une défaillance.
  • Meilleure exploitation des données, permettant d’accroître l’efficacité des systèmes de gestion de la chaîne logistique.

L’AIOps peut jouer un rôle clé dans l’informatique dans le secteur des services financiers :

  • Prévention des failles de sécurité et de la cybercriminalité, toujours plus sophistiquées.
  • Possibilité de mettre les données clients au service des activités marketing et des opportunités de croissance.
  • Analyse des données client historiques permettant d’améliorer la précision des prédictions de croissance des revenus.
  • Sécurisation des données et conformité réglementaire.
  • Mise en place d’un framework intégrant de multiples groupes de données massifs, permettant d’exploiter des technologies émergentes comme la blockchain.
  • Capacité à proposer des expériences de banque mobile et numérique à la hauteur des attentes des clients.
  • Amélioration de la vitesse et des performances des réseaux.

L’avenir de l’AIOps

Ces dernières années, les plateformes d’AIOps ont gagné en popularité dans tous les secteurs d’activité. Les entreprises les voient comme un outil indispensable pour gérer leur environnement de données et ont étendu son usage à toutes les fonctions de l’ITOM.  On comprend que le marché de l’AIOps soit en pleine croissance et ne donne aucun signe de ralentissement. Selon Gartner, la valeur du marché de l’AIOps devrait atteindre 2,1 milliards de dollars en 2025, avec un taux de croissance annuel composé (TCAC) d’environ 19 %. De la même manière, Future Market Insights prévoit que le marché des plateformes d’AIOps atteindra 80,2 milliards de dollars en 2032, avec un TCAC de 25,4 % entre 2022 et 2032. 

Avec la croissance exponentielle de ChatGPT, tout laisse à penser que l’IA générative jouera un rôle clé dans le développement et l’évolution de l’AIOps. Selon un rapport de TechTarget, l’IA générative pourrait être employée dans le développement de code d’applications, mais aussi dans des tâches d’ingénierie de routine comme la génération de tests. Les fonctions d’observabilité et l’automatisation des workflows de résilience, comme les tests de pénétration, pourraient également évoluer avec l’IA générative. Cette technologie pourrait être utilisée pour produire des analyses à partir de données non structurées incluant notamment des fichiers audio et des conversations.

Il reste toutefois à déterminer de quelle manière l’IA générative affectera ces fonctions. Mais tout porte à croire qu’elle jouera un rôle croissant et de plus en plus central, surtout avec l’intégration croissante de l’AIOps dans le parcours de transformation numérique des entreprises.

Le point de vue de l’expert

Pour mieux comprendre le futur rôle de l’AIOps, nous avons discuté avec Sanjay Munshi, Directeur d’exploitation adjoint de NETSCOUT pour connaître son point de vue sur l’importance et l’avenir de l’AIOps.

« Les cadres comptent énormément sur l’IA et investissent lourdement dans cette technologie en espérant voir les résultats révolutionnaires qu’on leur a promis. Mais les systèmes et les plateformes d’IA n’ont pas toujours le socle de données nécessaire pour délivrer ces résultats. La performance de l’IA dépend directement des données qu’elle reçoit. Si les données sont médiocres, l’IA le sera aussi. Les modèles créés à l’aide de données incomplètes ou abstraites peuvent avoir des problèmes de performance ou, pire encore, fausser la prise de décisions métiers.

Il est absolument fondamental de faire évoluer la stratégie de données pour alimenter correctement les systèmes d’IA et d’AIOps. Pour cela, il faut un framework de capteurs distribués qui ne s’appuie pas sur une représentation statique des composants de l’infrastructure, et qui soit invulnérable aux activités des pirates (ou permette au minimum de les voir instantanément). Le logiciel de ce framework doit capturer, analyser et sélectionner les informations à la source. Il ne doit pas seulement fournir les données les plus fidèles, il doit aussi enrichir les modèles de données qui reposent uniquement sur les métriques, les logs et les traces.

Pour tenir toutes ses promesses de correction rapide, d’automatisation de la réponse et de fiabilité des résultats pour une meilleure expérience utilisateur, une IA performante doit reposer sur un socle de données de grande qualité, soigneusement sélectionnées, exploitables et enrichies, en provenance de toute l’entreprise. »


Pour bien démarrer

La meilleure façon de bien démarrer avec l’AIOps consiste à adopter une approche incrémentielle. La bonne pratique recommande de commencer à petite échelle, en réorganisant vos domaines IT par source de données. Apprenez à travailler avec de grands jeux de données persistantes provenant de sources diverses. Donnez à votre équipe des opérations IT la possibilité de se familiariser avec les aspects big data de l’AIOps. Commencez par les données historiques, puis ajoutez progressivement de nouvelles sources de données en améliorant votre pratique.

Attachez-vous d’abord à importer les données : assimiler et analyser tous les types de données, de façon rapide et efficace, est une tâche colossale. Commencez plutôt par localiser et analyser les données machine et les métriques historiques brutes, afin d’acquérir une compréhension basique de la situation, puis utilisez des algorithmes de clustering et des analyses pour identifier des tendances et des motifs remarquables. Les données brutes sont les meilleures si vous tenez réellement à pouvoir faire de la détection en temps réel. Vous pouvez ensuite commencer à analyser les flux de données pour déterminer s’ils correspondent à ces motifs, en appliquant l’IA et le machine learning pour introduire de l’automatisation puis, à terme, parvenir à l’analyse prédictive.

Incorporez et analysez autant de types de données que possible : si vous commencez par analyser et comprendre les états passés de vos systèmes, vous pourrez ensuite corréler ce que vous aurez appris avec le présent. Pour y parvenir, les organisations doivent assimiler et donner accès à un très grand nombre de types de données historiques et de flux. Le type de données que vous allez sélectionner (log, métrique, texte, transaction, réseaux sociaux) dépend du problème que vous cherchez à résoudre. Vous pouvez par exemple utiliser les données de métriques de votre infrastructure pour superviser sa capacité, ou les logs d’applications pour être sûr de délivrer une expérience exceptionnelle à vos clients. C’est pourquoi les entreprises doivent choisir les plateformes capables d’assimiler et d’analyser des données issues de sources multiples.

N’essayez pas de tout faire en une fois : cherchez avant tout à déterminer la cause profonde de votre problème le plus urgent. Progressez ensuite vers la supervision des données. Ce n’est qu’une fois cela fait que vous pourrez aborder l’IA. Et là encore, procédez étape par étape :

  • Commencez par mettre en place une plateforme AIOps qui fournira une fondation solide pour organiser de grands volumes de données afin de faciliter le passage à l’action, mais aussi des fonctions de supervision pour révéler tendances et motifs.
  • Analysez ensuite dans quelle mesure ces motifs vous permettent de prédire des incidents et adopter une approche plus proactive de l’IT, afin de réduire non seulement le MTTR mais aussi le nombre d’incidents affectant les activités.
  • Enfin, mettez le machine learning au service de l’analyse des causes profondes pour atteindre le stade de la prédiction, où vous pourrez identifier les incidents et leur impact avant même qu’ils n’affectent vos services stratégiques et l’expérience client.

Prendre un bon départ avec l’AIOps : fondamentaux de la corrélation des événements et détection des déluges d’alertes dans Splunk IT Service Intelligence

Conclusion

Investissez dès maintenant dans l’AIOps pour renforcer votre entreprise

Si vous êtes un professionnel de l’IT et des réseaux, on vous a dit et répété que les données sont l’actif le plus important de l’entreprise, et que les big data vont transformer le monde. L’IA est une révolution, et elle est là pour durer. L’AIOps est un moyen concret de faire du battage médiatique entourant l’IA et le big data une réalité au service de vos initiatives métiers. Pour améliorer la sécurité comme pour normaliser les opérations ou accroître la productivité, l’AIOps offre un moyen pratique et accessible de développer et agrandir vos opérations IT pour qu’elles soient à la hauteur des défis à venir, et consolider ainsi le rôle de l’IT comme catalyseur stratégique de la croissance de l’entreprise.

Le guide essentiel de l’AIOps

Lisez cet e-book pour découvrir comment vous lancer avec l’AIOps :

  • les scénarios d’utilisation principaux de l’AIOps définis par Gartner,
  • l’AIOps comme outil de transition vers une IT proactive capable de prédire et prévenir les incidents avant qu’ils ne se produisent,
  • les critères à prendre en compte pour choisir une solution AIOps.


Une erreur à signaler ? Une suggestion à faire ? Contactez-nous à l’adresse ssg-blogs@splunk.com.


Cette publication ne représente pas nécessairement la position, les stratégies ou l’opinion de Splunk.


Stephen Watts Picture

Stephen Watts works in growth marketing at Splunk. Stephen holds a degree in Philosophy from Auburn University and is an MSIS candidate at UC Denver. He contributes to a variety of publications including CIO.com, Search Engine Journal, ITSM.Tools, IT Chronicles, DZone, and CompTIA.

Articles connexes

À propos de Splunk

La plateforme Splunk élimine les obstacles qui séparent les données de l'action, pour donner aux équipes d'observabilité, d'IT et de sécurité les moyens de préserver la sécurité, la résilience et le pouvoir d'innovation de leur organisation.

Fondée en 2003, Splunk est une entreprise internationale. Ses plus de 7 500 employés, les Splunkers, ont déjà obtenu plus de 1 020 brevets à ce jour, et ses solutions sont disponibles dans 21 régions du monde. Ouverte et extensible, la plateforme de données Splunk prend en charge les données de tous les environnements pour donner à toutes les équipes d'une entreprise une visibilité complète et contextualisée sur l'ensemble des interactions et des processus métier. Splunk, une base solide pour vos données.

En savoir plus sur Splunk