Published Date: February 1, 2021
L’ITOps, ou opérations informatiques, englobe les processus et services administrés par le personnel informatique d’une entreprise pour ses clients internes ou externes. C’est l’une des quatre fonctions (avec la gestion des applications, la gestion technique et l’assistance) définies par le framework de gestion des opérations informatiques d’ITIL (Bibliothèque d’infrastructure des technologies de l’information).
Toute entreprise qui utilise des ordinateurs a une structure chargée de répondre aux besoins informatiques de ses employés ou de ses clients, qu’elle l’appelle ITOps, opérations informatiques ou autrement. Dans un environnement d’entreprise typique, cependant, l’ITOps est un groupe distinct au sein du service informatique. Chaque entreprise organise ses ressources informatiques différemment, mais une équipe ITOps est généralement composée d’un groupe d’opérateurs et dirigée par un responsable des opérations IT qui supervise toutes les activités relevant de l’ITOps.
L’ITOps joue un rôle essentiel dans la réalisation des objectifs commerciaux. Entre autres choses, l’ITOps contribue à la stabilité et à la fiabilité de l’écosystème informatique et veille à ce que l’informatique permette aux employés et à la direction de l’entreprise d’atteindre les résultats souhaités.
Mais l’exercice de cette fonction évolue avec la migration progressive des entreprises vers le cloud et l’abandon du datacenter. Dans cet article, nous verrons comment l’ITOps traditionnel évolue à l’ère du cloud, avec l’émergence du DevOps, du NoOps et du CloudOps, comment l’AIOps peut dynamiser les opérations informatiques grâce à l’automatisation, et ce que l’ITOps peut apporter aux environnements cloud modernes.
Les opérations IT jouent un rôle clé en assumant la responsabilité de bout en bout des services fournis par l’organisation IT, des systèmes et de l’infrastructure qui appuient les processus métier d’une entreprise. Cette équipe est chargée de maintenir la stabilité opérationnelle de l’organisation tout en soutenant de nouvelles initiatives visant à faire progresser l’entreprise.
L’ITOps fournit des conseils technologiques de haut niveau et effectue quotidiennement des tâches de routine pour maintenir l’infrastructure informatique de l’entreprise. L’ITOps peut être adapté aux besoins et aux ressources de chaque entreprise : on ne peut donc pas dresser une liste de tâches homogène. En tant que fonction, par contre, l’ITOps peut être décomposé en trois domaines de responsabilité clés. Le détail et le nombre des tâches incombant à l’équipe ITOps varie d’une entreprise à l’autre. Ces tâches couvrent les domaines suivants :
Infrastructure du réseau :
- configurer et gérer toutes les fonctions de mise en réseau pour les communications informatiques internes et externes ;
- configurer et gérer les lignes de télécommunication ;
- gérer les ports de pare-feu pour permettre au réseau de communiquer avec des serveurs externes ;
- fournir aux utilisateurs autorisés un accès distant sécurisé au réseau de l’entreprise ;
- superviser la santé et les performances du réseau, détecter les anomalies et prévenir ou résoudre rapidement les problèmes, ce qui peut inclure la construction et la gestion d’un centre d’opérations réseau (NOC), emplacement physique centralisé à partir duquel les équipes ITOps peuvent superviser un réseau en permanence.
Gestion des serveurs et des appareils :
- configurer, maintenir et gérer les serveurs de l’infrastructure et des applications ;
- gérer le réseau et les systèmes de stockage pour veiller à ce qu’ils répondent aux exigences des applications ;
- configurer et autoriser les serveurs de messagerie et de fichiers ;
- provisionner et gérer les ordinateurs approuvés par l’entreprise ;
- provisionner et gérer les téléphones portables et autres appareils mobiles ;
- gérer les licences et les logiciels pour ordinateurs de bureau, ordinateurs portables et appareils mobiles.
Opérations informatiques et service d’assistance :
- gérer l’emplacement et l’équipement des datacenters ;
- administrer le service d’assistance ;
- créer, autoriser et gérer tous les profils d’utilisateurs sur les systèmes de l’entreprise ;
- fournir des informations d’audit de configuration de réseau aux organismes de réglementation, aux partenaires commerciaux et autres entités externes ;
- assurer la disponibilité élevée du réseau et l’exécution des plans de reprise après sinistre ;
- avertir les utilisateurs lorsqu’un incident majeur affecte les services réseau ;
- mettre en place des sauvegardes régulières pour faciliter la récupération des données en cas de besoin ;
- maintenir l’ITIL pour l’entreprise.
Dans chacun de ces domaines, les membres de l’équipe ITOps sont également responsables de la gestion et de la collaboration avec les fournisseurs et les sous-traitants externes, de l’achat et du paiement de tous les matériels, logiciels et services utilisés pour le réseau et ses applications, de la gestion de projet, et du déploiement des mises à niveau et correctifs nécessaires à la santé et aux performances du réseau.
L’ITOps, le DevOps et le NoOps sont trois approches différentes pour structurer les équipes IT d’une entreprise. Chacune recouvre des responsabilités et des objectifs différents, et bien que les groupes de travail ITOps et DevOps aient été largement adoptés par les entreprises, le NoOps est encore principalement théorique. Nous allons les étudier en détail et voir comment ils s’articulent entre eux.
ITOps : le champ d’action vaste et parfois nébuleux de l’ITOps peut donner l’impression qu’il englobe tout ce qui concerne l’informatique. Il est vrai que les activités ITOps peuvent varier considérablement d’une entreprise à l’autre, mais dans tous les cas, elles consistent à fournir et à maintenir la technologie nécessaire au fonctionnement d’une entreprise. Dans la pratique, il s’agit de tâches telles que la maintenance des réseaux, la gestion des centres de données, la garantie de la sécurité et de la conformité réglementaire, la gestion du service d’assistance, la gestion des licences et des logiciels, et d’autres tâches encore visant à donner des moyens aux autres employés de faire leur travail et à soutenir les opérations commerciales quotidiennes. On notera que le développement de programmes et d’applications et les tâches connexes n’entrent pas dans les prérogatives de l’ITOps.
DevOps : le DevOps est une approche de la livraison IT qui associe des personnes, des pratiques et des outils pour abattre les silos qui isolent les équipes de développement et d’exploitation. Mais le DevOps fait également référence à un rôle IT spécifique, chargé du développement, de la mise en œuvre et de la maintenance d’applications personnalisées à usage interne ou externe.
Comme son nom l’indique, le DevOps regroupe les rôles de développement et d’opérations informatiques. En suivant un ensemble de pratiques spécifiques, les équipes DevOps accélèrent le développement des applications et des services grâce à une approche plus réactive de la gestion de l’infrastructure IT, afin de déployer et mettre à jour des produits à la vitesse des marchés d’aujourd’hui.
L’ITOps et le DevOps sont fondés sur des principes différents et opposés. L’ITOps, chargé de garantir la stabilité et la sécurité de l’infrastructure, ainsi que sa conformité aux normes et aux exigences réglementaires, privilégie une approche précise qui minimise les risques. Le DevOps s’articule autour de l’innovation et de l’optimisation des applications, tout en raccourcissant le cycle de vie du développement logiciel et en accélérant la mise sur le marché.
Sans surprise, ces impératifs différents entrent parfois en conflit. L’approche stable et linéaire de l’ITOps pour le développement et la maintenance de l’infrastructure empêche de mettre rapidement en œuvre des changements et ralentit le processus de développement. L’impératif de vitesse du DevOps incite parfois les équipes à contourner l’ITOps en raison de contraintes de temps, ce qui peut créer des risques pour la sécurité et la stabilité du système. Pour cette raison, une approche DevOps exige que l’ITOps renonce à certaines de ses responsabilités et en partage d’autres avec le DevOps, pour aider les équipes de développement à atteindre leurs objectifs de livraison.
NoOps : NoOps signifie No IT Operations et désigne une évolution du DevOps qui supprime entièrement les opérations informatiques de l’environnement de développement logiciel. Ses partisans affirment que les tâches de maintenance de l’infrastructure peuvent être entièrement automatisées, éliminant ainsi le besoin d’une équipe ITOps interne. Le NoOps n’est pas une plateforme, mais sa mise en pratique s’appuie sur plusieurs technologies cloud telles que l’IA et le machine learning.
Ses défenseurs disent que le NoOps présente plusieurs avantages potentiels :
- une réduction de la probabilité d’erreur humaine. Le NoOps minimise les erreurs humaines dues aux fonctions manuelles et les temps d’arrêt associés ainsi que d’autres tâches de gestion des incidents, car un système entièrement automatisé ne nécessite normalement aucune intervention humaine ;
- un gain de rapidité et d’efficacité. Il élimine les conflits entre l’approche de stabilité et de sécurité de l’ITOps et la volonté d’innovation du DevOps, permettant aux équipes de développement de travailler avec plus de vitesse et d’agilité ;
- un rôle plus prestigieux pour l’ITOps. Le NoOps soulage l’ITOps de ses responsabilités opérationnelles et lui permet ainsi d’assumer un rôle plus stratégique, de travailler sur les avancées technologiques et de garantir que les équipes DevOps disposent des outils dont elles ont besoin.
À ce stade, le NoOps reste davantage un concept qu’une solution pratique. Certains pensent que la suppression de l’ITOps du processus du cycle de vie du logiciel imposerait trop de responsabilités aux développeurs et entraverait la production. Pour d’autres, l’automatisation de chaque fonction de l’ITOps n’est tout simplement pas réaliste compte tenu de la complexité des systèmes modernes. Dans un avenir proche, selon toute probabilité, certains segments des opérations vont être automatisés tandis que d’autres domaines seront nécessairement effectués par des humains.
« CloudOps » est l’abréviation d’opérations cloud, un terme générique décrivant les processus de gestion et de fourniture de services d’infrastructure de cloud computing à des utilisateurs internes ou externes. L’objectif du CloudOps est de préserver l’état de santé et la fonctionnalité des plateformes de cloud computing ainsi que les applications et les données qu’elles abritent. Le CloudOps repose sur le fonctionnement continu : cette approche DevOps de l’exécution des systèmes basés sur le cloud évite d’avoir à mettre tout ou une partie d’une application hors service. Il faut une automatisation opérationnelle pour éliminer entièrement les interruptions. Le CloudOps est né en réponse aux nombreuses spécificités des systèmes basés sur le cloud :
- le cloud est distribué, sans état et évolutif. Le cloud permet d’adapter la capacité à la demande, de lancer de nouveaux serveurs ou périphériques de stockage et d’arrêter ceux qui sont devenus inutiles. Pendant les périodes de fort trafic, vous pouvez définir des règles pour provisionner automatiquement des serveurs afin de répondre à la demande et de maintenir la disponibilité. De plus, avec des ressources cloud distribuées à l’échelle mondiale, le CloudOps permet de superviser les indicateurs de performance clés et d’intervenir où que vous soyez, augmentant ainsi la flexibilité et l’évolutivité des applications et de l’infrastructure sous-jacentes ;
- le cloud est indépendant de l’infrastructure. L’infrastructure sous-jacente est abstraite de la plateforme et des applications ;
- le cloud est tolérant aux pannes et à la latence. Dans la mesure où les applications et services axés sur le cloud peuvent s’abstraire de l’infrastructure sous-jacente, ils sont moins sujets à la latence et aux erreurs ;
- le cloud est hautement automatisé. Les membres de l’équipe peuvent programmer des fonctions automatisées à chaque étape du cycle de vie du développement logiciel et utiliser votre infrastructure pour exécuter des commandes et des tâches en fonction de seuils de supervision et d’autres indicateurs de performance clés. On peut ainsi mettre en place des systèmes d’auto-réparation capables de résoudre les problèmes opérationnels courants sans affecter les applications ou les utilisateurs ;
- le cloud est actif-actif. Les réseaux cloud actifs-actifs utilisent plusieurs nœuds de traitement indépendants ; chacun d’eux a accès à plusieurs bases de données répliquées pour une seule application. Les applications peuvent extraire les données nécessaires d’autres sources lorsqu’un serveur subit une interruption de service, ce qui réduit les temps d’arrêt ;
- les applications cloud partagent les ressources. Les applications cloud peuvent partager des services sans être liées les unes aux autres ;
- les données cloud sont redondantes. Le cloud vous permet de stocker des données dans plusieurs emplacements physiques, ce qui offre davantage d’options de basculement, renforce la résilience du pipeline de données et assure une meilleure protection contre la perte de données.
Le CloudOps vise à maximiser les avantages de ces attributs cloud en formalisant les pratiques et les processus de l’administration d’un système basé dans le cloud. Les détails varient d’une entreprise à l’autre, mais le CloudOps traite généralement les mêmes problèmes opérationnels que l’ITOps traditionnel (gestion des ressources, prévention des menaces et conformité) pour permettre au DevOps de tirer le meilleur parti du cloud tout en garantissant vitesse, sécurité et efficacité opérationnelle.
L’observabilité consiste à mesurer les états internes d’un système en examinant ce qu’il produit. Le terme est issu de la théorie du contrôle, qui traite de la description et de la compréhension des systèmes autorégulés, mais il est de plus en plus appliqué aux systèmes IT distribués pour améliorer leurs performances. Dans ce contexte, l’observabilité utilise trois types de données de télémétrie (métriques, logs et traces distribuées) pour fournir une visibilité approfondie sur les systèmes distribués et permettre aux équipes d’identifier la cause profonde d’une multitude de problèmes et d’améliorer les performances du système.
L’entreprise a rapidement adopté les services d’infrastructure cloud proposés sous forme de microservices, serverless et de conteneurs. Dans ces systèmes distribués, il est extrêmement difficile de retracer la cause d’un événement. Pour synthétiser, l’observabilité rend les systèmes modernes plus contrôlables en permettant aux équipes de localiser et de relier facilement les composants d’une chaîne complexe, pour remonter jusqu’à la cause. Elle permet aussi à chaque rôle, des administrateurs système aux analystes ITOps en passant par les développeurs, d’avoir une visibilité sur l’ensemble de l’architecture : une capacité essentielle à l’ère des microservices.
L’observabilité est indispensable car elle donne un contrôle accru sur les systèmes complexes. Les systèmes simples ont moins de « pièces mobiles », ce qui rend leur stabilité plus facile à gérer. Les systèmes distribués ont un nombre beaucoup plus élevé de pièces interconnectées, ce qui accroît le nombre et la diversité des défaillances potentielles. Les systèmes distribués produisent également plus d’« inconnues inconnues » que les systèmes plus simples. Et comme la supervision repose sur les « inconnues connues », les diagnostics deviennent encore plus difficiles dans ces environnements complexes.
En tant qu’approche exploratoire permettant de poser des questions sur le comportement du système en cas de problème, l’observabilité est mieux adaptée à l’imprévisibilité des systèmes distribués. « Pourquoi est-ce que X ne fonctionne plus ? », « Qu’est-ce qui provoque de la latence en ce moment ? » ou « Ce problème affecte-t-il actuellement tous les utilisateurs d’Android ou seulement certains d’entre eux ? ». Voilà le type de questions auxquelles une observabilité efficace peut répondre.
AIOps signifie intelligence artificielle pour les opérations informatiques et désigne la pratique consistant à utiliser l’analyse par IA et le machine learning pour automatiser et améliorer les opérations IT.
Il est devenu de plus en plus difficile pour les opérations IT de gérer des réseaux toujours plus vastes et complexes. Les outils et pratiques traditionnels de gestion des opérations ne parviennent pas à faire face aux volumes croissants de données issues des nombreuses sources qu’abritent ces environnements réseau complexes et variés. L’AIOps a été développé pour relever ces défis et offre deux avantages significatifs dans les environnements cloud :
1. Il réunit les données de sources multiples. Les solutions traditionnelles de gestion IT ont été conçues pour les systèmes physiques statiques, et non pour la combinaison de services résidant localement et dans des clouds privés, gérés et publics, et qu’on retrouve dans la plupart des entreprises. Elles sont donc incapables de traiter le volume, la variété et la vitesse des données massives produites par ces réseaux dynamiques. Elles ne peuvent que consolider les données, les agréger et exploiter des valeurs moyennes, ce qui compromet la fidélité des données. Les plateformes AIOps sont conçues pour les réseaux d’aujourd’hui et sont en mesure capturer de grands ensembles de données dans l’environnement tout en préservant la fidélité des données pour une analyse complète.
2. Il simplifie l’analyse des données. Les plateformes AIOps peuvent collecter tous les formats de données, malgré des vitesses et des volumes variables. Elles effectuent ensuite une analyse automatisée des données pour prédire et prévenir les futurs problèmes, et identifier la cause des problèmes existants. Elles peuvent également suggérer des solutions, automatiser certaines réponses et modifier leurs algorithmes pour améliorer la gestion des problèmes futurs.
En pratique, l’AIOps est un processus en trois étapes (observation, engagement, action) exécuté en continu :
- l’observation. Tout d’abord, la plateforme AIOps traite les données provenant de diverses sources en temps réel, y compris celles de la supervision informatique traditionnelle et les événements de log, entre autres. Les algorithmes d’IA s’appuient sur les anomalies présentes dans les données pour détecter automatiquement les problèmes importants, que la plateforme analyse ensuite en regroupant les problèmes similaires ;
- l’engagement. La plateforme AIOps avertit les équipes informatiques concernées de la présence d’anomalies. Comme elles sont regroupées par type, le nombre de notifications est réduit ;
- l’action. Les plateformes AIOps peuvent automatiser l’acheminement des workflows avec ou sans intervention humaine, en apprenant des réponses de l’équipe informatique pour gagner progressivement en précision. À terme, elle peut apprendre à résoudre les problèmes avant qu’ils n’atteignent l’entreprise et n’affectent les utilisateurs finaux.
Aujourd’hui, les équipes IT ont pour mission de garantir la stabilité, la sécurité et l’efficacité d’environnements de plus en plus dynamiques et connectés. La prévalence du cloud hybride et du multicloud, l’impératif d’observabilité, ainsi que la vitesse et l’agilité requises par le DevOps poussent les approches et outils informatiques conventionnels jusqu’à leurs limites. Compromission des niveaux de service compromis et insatisfaction des utilisateurs en sont les conséquences inévitables.
Il est temps que les opérations informatiques adoptent le CloudOps et l’AIOps, qui offrent la vitesse et la flexibilité nécessaires pour gérer plus efficacement les environnements cloud. Ces outils ne sont pas des évolutions de l’ITOps mais bien une toute nouvelle façon d’administrer les opérations IT. Et bien que leur mise en œuvre nécessite souvent un changement de culture à l’échelle de l’organisation, les avantages nets (une flexibilité, une sécurité et une fiabilité accrues) sont trop importants pour être ignorés.
Prévisions pour l’IT et l’observabilité
Quoi de mieux qu’une surprise ? Être prêt à tout. Nos leaders font le point sur les grandes tendances pour 2023.