Published Date: August 1, 2019
Un centre d’opérations du réseau, ou Network Operation Center en anglais (NOC), est un lieu centralisé où les équipes IT peuvent superviser en continu les performances et la santé d’un réseau. Le NOC sert de première ligne de défense contre les perturbations et les défaillances du réseau.
Grâce au Network Operation Center ou NOC (prononcé « noque »), les entreprises mettent en place une salle de supervision qui leur permet d’obtenir une visibilité totale sur leur réseau, ce qui leur permet de détecter les anomalies et de prendre des mesures pour prévenir les problèmes ou les résoudre rapidement lorsqu’ils se manifestent. L’Operation Center NOC supervise l’infrastructure et l’équipement (du câblage aux serveurs), les systèmes sans fil, les bases de données, les pare-feu, les divers périphériques réseau (y compris les dispositifs IoT et les smartphones), les télécommunications, les tableaux de bord et les rapports. Ses services de gestion incluent également la supervision des appels des clients et des systèmes de tickets d’assistance clients, et ils s’intègrent aux outils de réseau des clients. On comprend donc que dans le domaine informatique, le NOC joue un rôle considérable pour la qualité de l’expérience client.
Dans le data center, le NOC peut être mis sur pied et hébergé ’en interne, mais cette fonction peut aussi être sous-traitée à une société externe spécialisée dans la supervision et la gestion du réseau et des infrastructures. Quelle que soit l’approche de conception, le personnel du Network Operation Center (NOC) a pour mission de détecter les problèmes et de prendre rapidement des décisions pour les résoudre.
Pour faire simple, par définition, le ’NOC a pour objectif de maintenir les performances et la disponibilité du réseau à un niveau optimal, et d’assurer son fonctionnement continu. Le NOC gère un large éventail d’activités stratégiques :
- supervision du network informatique (réseau) et détection des problèmes nécessitant une attention spéciale, notamment ceux qui proviennent de sources extérieures ;
- Gestion des serveurs, des réseaux et des appareils, en incluant l’installation, la mise à jour, le dépannage et la distribution des logiciels sur tous les périphériques ;
- Réponse aux incidents, gestion des pannes électriques et des problèmes des lignes de communication ;
- Sécurité : supervision et analyse des menaces, déploiement des outils, en conjonction avec les opérations de sécurité ;
- Sauvegarde, stockage et récupération en cas de sinistre ;
- Gestion des données d'emails, d'appels vocaux et vidéos ;
- Gestion des correctifs.
- Gestion des pare-feux et des systèmes de prévention des intrusions, et gestion des antivirus ;
- Application des politiques.
- Amélioration des services grâce à la collecte de commentaires et de recommandations d’utilisateurs ;
- Suivi des accords de niveau de service ;
- Gestion des fournisseurs, des travailleurs indépendants et des sous-traitants ;
La gestion du network informatique et la supervision des performances n’ont jamais été aussi difficiles à réaliser. Les entreprises d’aujourd’hui font face à des réseaux de plus en plus complexes : elles ont des bureaux dans le monde entier, des collaborateurs en télétravail et un nombre toujours plus considérable d’appareils à gérer et à superviser.
Le volume d’utilisateurs, le trafic web et les logiciels malveillants peuvent nuire aux performances du network informatique, et le risque peut venir de partout. Même des problèmes apparemment mineurs peuvent entraîner des interruptions désastreuses pour la productivité et votre capacité à répondre aux besoins des clients
L’absence de salle de supervision du network (réseau) d’une entreprise peut engendrer différents risques impactant la productivité de celle-ci. Par exemple, un temps de détection d'interruption de service trop élevé, une perte de données cruciales, une absence de prévention d’attaques informatiques, une mauvaise gestion des partenaires et fournisseurs, pour n’en citer que quelques-uns.
Dans la salle de supervision du NOC, vous trouverez une équipe de techniciens (des ingénieurs, des analystes ou des opérateurs) et plusieurs chefs d’équipe et superviseurs. Le personnel du NOC doit posséder des compétences particulières en supervision, en maintenance et en résolution rapide des problèmes de performance au sein du réseau. Ce niveau de connaissance dépasse généralement le bagage du professionnel IT non spécialisé. Les techniciens informatiques NOC possèdent généralement une expérience significative dans le domaine de la supervision du réseau et des outils associés. Beaucoup détiennent aussi des certifications avancées sur le sujet.
Comme il n’est pas toujours possible pour de nombreuses petites entreprises de dédier toute une équipe à la seule mission de superviser les performances du réseau, des prestataires de services tiers proposent aussi des services de Network Operation Center comme alternative au NOC interne.
Idéalement, le NOC doit disposer de sa propre salle de supervision. On pourra couvrir un mur d’écrans vidéo offrant une visibilité en temps réel sur les performances du réseau, les incidents en cours et les alertes. Les écrans seront montés en grille et connectés de manière à pouvoir fonctionner comme une seule et même unité haute résolution. La taille de l’espace physique de la salle de supervision du Network Operation Center et de l’équipe dépend de celle de l’entreprise et du data center du NOC
C’est sur le mur vidéo que les alertes apparaissent et montrent spécifiquement aux techniciens où se situent les problèmes, quel appareil ou quelle ligne est touchée. Les écrans peuvent également diffuser des actualités et des informations météorologiques qui permettent aux techniciens d’adapter leurs plans aux problèmes en cours pouvant affecter plus largement les opérations réseau. Le mur vidéo de la salle de supervision est également connecté aux différents postes de travail de la salle, où les techniciens ont pour mission de superviser une technologie ou une problématique particulière. Les techniciens peuvent ensuite analyser les problèmes connexes et suivre les protocoles mis au point pour résoudre l’incident.
Chaque poste de travail présent dans le NOC est équipé de plusieurs moniteurs pour faciliter et accélérer l’analyse des informations et rendre la réponse plus efficace. Chaque poste est également lié à un système PA qui permet aux techniciens de communiquer entre eux et de partager rapidement des informations. Les techniciens peuvent également envoyer des informations sur les alertes sur le mur vidéo pour qu’elles soient visibles de tous.
Dans les grandes entreprises, on aménage souvent une salle de supervision NOC réservée à une équipe chargée de la gestion des incidents réseau graves.
Généralement, le Network Operation Center (NOC) adopte une approche hiérarchique de la gestion des incidents. Les techniciens sont catégorisés en niveaux (3 niveaux la plupart du temps) selon leur compétence et leur expérience dans la résolution de problèmes particuliers. Lorsqu’un technicien NOC découvre un problème, il crée un ticket qui le place dans une catégorie en fonction du type et de la gravité de l’alerte, entre autres critères. Si le technicien informatique NOC affecté à un niveau particulier ne parvient pas à résoudre rapidement le problème, celui-ci est transmis au niveau supérieur, et ainsi de suite jusqu’à résolution complète.
La combinaison d’un équipement puissant et d’un personnel hautement compétent agissant selon des protocoles très spécifiques permet au NOC de fonctionner sans interruption.
Si le NOC se concentre sur les performances et la disponibilité du réseau, par définition, le SOC, ou centre des opérations de sécurité, rassemble des outils et des professionnels qui supervisent, détectent et analyse la position de sécurité d’une entreprise 24 h/24, 7 j/7..
Les techniciens du NOC recherchent les problèmes susceptibles de dégrader la vitesse et la disponibilité du réseau, tandis que les techniciens du SOC ont pour mission de repousser les menaces de cybersécurité et réagir aux attaques. Contrairement au NOC, le SOC se focalise également sur la protection des données des clients et de la propriété intellectuelle. Les NOC gèrent plutôt des événements réseau courants, qui se produisent naturellement, tandis que les SOC répondent presque toujours aux menaces externes qui ciblent le réseau de l’entreprise.
Le NOC comme le SOC assument des fonctions stratégiques pour l’organisation (identification, investigation et résolution des problèmes) et les deux s’efforcent de résoudre rapidement les problèmes avant qu’ils n’affectent les activités. De plus, les deux fonctionnent de façon similaire, partageant la même approche hiérarchique de la résolution des incidents. Mais les problèmes qu’ils traitent sont de natures très différentes. Par conséquent, les compétences, connaissances et pratiques du personnel des deux unités sont également différentes. Un technicien informatique NOC doit comprendre les tenants et les aboutissants de la supervision et de la gestion des applications et du réseau, tandis qu’un analyste SOC va se concentrer se concentrer exclusivement sur la sécurité.
Cela dit, les SOC et les NOC doivent collaborer pour démêler les incidents majeurs et résoudre les crises, donc les deux équipes ne doivent pas être isolées l’une de l’autre. On sera surpris d’apprendre que près d’un tiers des entreprises n’indiquent que peu ou pas de contact entre le NOC et le SOC, et qu’elles soient 20 % à dire que les équipes ne coopèrent que pendant les urgences, selon une étude de SANS. Les experts encouragent toutefois une meilleure intégration du NOC et du SOC. L’intégration des deux unités, même si elles restent essentiellement séparées au quotidien, commence par la mise en place de procédures opérationnelles, l’automatisation de certaines actions et l’adoption d’outils permettant la collecte et le partage des données de supervision du réseau entre le NOC et le SOC.
Lorsqu’il n’est pas possible de mettre en place un NOC et un SOC distincts, le NOC (Network Operation Center) peut superviser et résoudre les problèmes de sécurité, bien que ce ne soit pas idéal. Les NOC peuvent détecter les menaces de sécurité et le font effectivement, car elles affectent les performances du réseau, et un personnel formé peut leur apporter une réponse efficace. Ce dernier aspect est toutefois crucial. Les techniciens informatiques NOC doivent rechercher les menaces de sécurité, et posséder les compétences nécessaires pour intervenir. Les professionnels aussi compétents dans le domaine des performances du réseau que dans celui de la sécurité sont rares.
Outre le bon ensemble de compétences, les services NOC orientés sécurité doivent disposer des bons outils pour résoudre les incidents de sécurité. Par exemple, le système de gestion des événements et des informations de sécurité (SIEM), offrant une visibilité totale sur les activités en cours sur votre réseau, est un outil indispensable. Les SIEM collectent, lisent et catégorisent les données machine issues d’un large éventail de sources sur le réseau, puis les analysent pour vous permettre d’agir en temps réel. Pour résumer, le SIEM automatise une grande part de la charge de travail d’une équipe SOC classique. Il met au jour les incidents tout en réduisant les faux positifs, ce qui facilite la tâche d’un NOC chargé de garder un œil sur la sécurité.
Les bonnes pratiques en lien avec un Network Operation Center (NOC) donnent la priorité à la formation, s’appuient sur des rôles clairement définis et établissent des protocoles et des moyens de communication clairs.
Faites de la formation et du développement des connaissances une priorité : votre équipe en charge du NOC doit avoir une expertise de haut niveau, spécifiquement dans la supervision, la gestion et la résolution des problèmes propres aux performances du réseau et à votre infrastructure IT. Réalisez des formations approfondies et fréquentes sur les procédures et les protocoles associés à tous les événements, et tenez-vous à jour de l’évolution du paysage technologique et de votre environnement informatique. Donnez la priorité aux problèmes de performance du réseau mais ne négligez pas les procédures de collaborations avec le SOC sur les questions de sécurité. La question de quand « escalader » est une problématique de procédure essentielle au bon fonctionnement d’un Network Operation Center. Veillez à ce que vos collaborateurs sachent quand et comment prendre la décision rapide de transmettre un problème qui grossit trop à un collègue plus expérimenté.
Définissez des rôles clairs : notre époque privilégie les hiérarchies plus plates. Face au rythme rapide du monde actuel de la surveillance du network informatique, qui exige une action immédiate, il est justifié de donner de l’autonomie à chaque collaborateur plutôt que de s’attacher à un système rigide d’autorisations basées sur le rang ou le rôle. Pourtant, si les techniciens doivent avoir les connaissances et l’autorité nécessaires pour agir rapidement afin d’éviter les interruptions de service, les niveaux d’escalades et les chefs d’équipe sont indispensables à la bonne administration du NOC.
Si les techniciens informatiques du NOC doivent avoir la liberté de faire leur travail et de proposer leurs éclairages (à l’abri de toute forme de micro-management, bien évidemment) il faut qu’un chef d’équipe répartisse le travail entre les techniciens selon leurs compétences, hiérarchise les tâches, prépare les rapports, veille à la bonne résolution des incidents et tienne les autres fonctions de l’entreprise informées des événements au besoin. De plus, chaque technicien doit savoir précisément quelles tâches sont attendues de lui, quel est son niveau et quelle est sa ligne hiérarchique s’il doit escalader ou prendre en charge un incident.
Mettez en place des communications robustes : il n’est pas forcément simple de garder les lignes de communication ouvertes entre le NOC, le SOC et les autres équipes externes. Il faut bien plus qu’une poignée de réunions régulières. Au contraire, il faut un effort concerté pour former le personnel aux modalités de partage des informations, et pour veiller à ce qu’ils s’acquittent de ces obligations. Un Network Operation Center (NOC) solide a impérativement besoin d’avoir des opportunités régulières de collaboration et de coordination
Mettez en place des directives et des protocoles clairs : assurez le bon déroulement des opérations en créant des politiques rigoureuses pour encadrer les activités suivantes :
- Gestion des incidents : documentez les étapes que les techniciens NOC doivent suivre pour gérer les incidents (par exemple, dans quelles circonstances le technicien peut prendre une décision, quand escalader la décision, quand informer ses collaborateurs, etc.).
- Solutions : décrivez les procédures de prise en charge des problèmes courants et fournissez des méthodes immédiates de gestion des urgences.
- Escalade : déterminez dans quelles conditions l’équipe doit escalader les problèmes, et à qui.
- Hiérarchisation : identifiez les types d’incidents qui doivent être traités en priorité et quel niveau de techniciens doit traiter les plus importants. Les incidents doivent être classés en fonction de l’impact qu’ils peuvent exercer sur les activités.
Disposer de protocoles établis garantit que toutes les parties prenantes sont sur la même longueur d’onde, assure la cohérence des opérations à l’échelle de l’entreprise et renforce la responsabilisation du personnel du Network Operation Center (NOC). Certes, du personnel compétent et des processus solides forment d’excellentes fondations, mais le véritable travail ne peut se faire sans les bons outils.
L’outil dans lequel vous devez investir dépend largement des besoins de votre entreprise, mais votre Network Operation Center, ou centre d’opération du réseau, doit disposer d’un outil ou d’un groupe d’outils offrant
- Une image complète de votre infrastructure : qu’elle soit physique, virtuelle ou dans le cloud.
- L'automatisation : pour réduire les tâches répétitives, libérer le personnel de niveau 1 pour qu’il se concentre sur des problèmes plus importants et réduire le déluge d'alertes du NOC.
- La gestion des tickets : pour voir les informations liées aux tickets ouverts, les tâches prioritaires et les techniciens NOC auxquels elles sont affectées, afin de résoudre rapidement les problèmes internes et externes.
- Le signalement des incidents : un outil assurant des analyses visuelles et une représentation graphique des seuils, alarmes, indicateurs et tendances, facilite l’investigation des problèmes et leur documentation à des fins de référence future.
- Une interface et un déploiement simples : vous voulez profiter des avantages de l’outil NOC sans attendre ni devoir traverser un déploiement long et complexe, doublé d’une courbe d’apprentissage ardue.
- L'évolutivité :il faut que votre NOC puisse, en définition, gérer la croissance de votre entreprise.
L’outil que vous choisirez doit vous donner une visibilité complète sur tout votre réseau et vous permettre d’analyser les données et les problèmes ainsi qu’améliorer votre réponse aux incidents au fur et à mesure.
Le centre d’opérations du réseau (ou Network Operation Center) est l’une des équipes fonctionnelles les plus importantes de l’IT. Jour après jour, vos clients internes et externes se fient à vos services informatiques. Vous avez des accords de niveau de service (SLA) à respecter, la productivité de l’entreprise à assurer, et toute l’expérience numérique de vos clients à préserver.
Il est important d’avoir un NOC capable de maximiser la disponibilité de tous les services informatiques et d’éviter les pannes catastrophiques. De nombreuses entreprises se sont dotées d’un NOC mais parviennent difficilement à entretenir une équipe suffisamment nombreuse et formée, et à l’équiper des meilleurs outils et systèmes d’automatisation. Les entreprises qui ne parviennent pas à maintenir un NOC efficace auront sans doute plus de chances avec des prestataires de services tiers.
Prévisions pour l’IT et l’observabilité
Quoi de mieux qu’une surprise ? Être prêt à tout. Nos leaders font le point sur les grandes tendances pour 2023.