Veröffentlichungsdatum: 17. Mai 2023
Ein Network Operations Center (NOC) ist ein zentraler Ort, an dem IT-Teams die Leistung und den Zustand eines Netzwerks kontinuierlich überwachen können. Das NOC dient im Unternehmen als erste Verteidigungslinie gegen Netzwerkstörungen und -ausfälle. Mit dem NOC erhalten Unternehmen einen vollständigen Überblick über ihr Netzwerk, sodass sie Anomalien erkennen und entweder Maßnahmen zur Vermeidung von Problemen ergreifen oder Probleme schnell lösen können, sobald sie auftreten.
In diesem Artikel stellen wir Ihnen die Aufgaben und Funktionen eines Network Operations Center kurz vor. Anhand von Best Practice Beispielen wollen wir Ihnen zeigen, wie wichtig das NOC für die optimale Überwachung Ihres IT-Netzwerks und die Verhinderung von Systemausfällen ist.
Das Network Operations Center beaufsichtigt Infrastruktur und Anlagen (von der Verkabelung bis zum Server), Drahtlossysteme, Datenbanken, Firewalls, verschiedene zugehörige Netzwerkgeräte (einschließlich IoT-Geräte und Smartphones), Telekommunikationssysteme, Dashboards und Reporting. Zu seinen Aufgaben gehören auch das Monitoring von Anrufen beim Kundensupport und von Ticketsystemen im Helpdesk sowie die Integration mit den Netzwerktools von Kunden, wodurch das NOC eine wichtige Rolle bei der Gewährleistung einer positiven Customer Experience spielt.
Network Operations Center können intern aufgebaut und lokal, oft im Rechenzentrum, eingerichtet werden. Dieser Aufgabenbereich kann aber auch an ein externes Unternehmen ausgelagert werden, das sich auf die Überwachung und Verwaltung von Netzwerken und Infrastrukturen spezialisiert hat. Unabhängig vom Modell sind NOC-Mitarbeiter dafür verantwortlich, Probleme zu erkennen und schnelle Entscheidungen zur Lösung zu treffen.
Einfach ausgedrückt, ist das Ziel eines jeden Network Operations Center, eine optimale Netzwerkperformance und -verfügbarkeit aufrechtzuerhalten und eine ununterbrochene Betriebszeit zu gewährleisten. Mit dem NOC lassen sich eine Vielzahl kritischer Aktivitäten verwalten, darunter:
- Monitoring des Netzwerks auf Probleme, die besondere Aufmerksamkeit erfordern, einschließlich Problemen aus externen Quellen
- Server-, Netzwerk- und Geräteverwaltung, einschließlich Softwareinstallation, Updates, Fehlerbehebung und Verteilung auf alle Geräte
- Incident Response, d. h. die Reaktion auf Vorfälle wie Stromausfälle und Probleme mit Kommunikationsverbindungen
- Cyber-Security, einschließlich Überwachung, Bedrohungsanalyse und Toolbereitstellung, in Verbindung mit Security Operations
- Backup und Speicherung, Disaster Recovery
- Management von E-Mail-, Sprach- und Videodaten
- Patch-Verwaltung
- Firewall- und Intrusion Prevention System Management, Support für Antivirus-Software
- Erzwingung von Richtlinien
- Verbesserung von Services durch Sammeln von Feedback und Benutzerempfehlungen
- Einhaltung von Service Level Agreements (SLAs)
- Verwaltung von Lieferanten, freiberuflichen Mitarbeitern und Auftragnehmern
Warum ist ein Network Operations Center so wichtig?
Netzwerk-Management und Performance-Monitoring waren noch nie so schwierig. Heutige Unternehmen haben es mit immer komplexeren Netzwerken zu tun. Sie haben Niederlassungen auf der ganzen Welt, Mitarbeiter, die von zu Hause aus arbeiten, und müssen eine immer größere Anzahl von Geräten verwalten und überwachen.
User-Volumen, Website-Traffic und Malware – sie alle können sich auf die Netzwerk-Performance auswirken, weshalb Probleme von fast überall kommen können. Selbst scheinbar kleine Probleme können zu Ausfallzeiten führen, die verheerende Auswirkungen auf die Produktivität und Ihre Fähigkeit, Kundenbedürfnisse zu erfüllen, haben können.
Vor einigen Jahren gab Gartner in einem Bericht bekannt, dass eine Minute Ausfallzeit ein Unternehmen 5.600 US-Dollar kosten kann. Netzwerkausfälle mindern den Umsatz, die Produktivität und die Reputation Ihres IT-Teams und des gesamten Unternehmens. Vor diesem Hintergrund sind Network Operations Center speziell darauf ausgelegt, Ausfallzeiten zu vermeiden, sodass Kunden und interne End User es nicht einmal bemerken, wenn unvermeidliche Incidents oder Ausfälle auftreten.
Im Idealfall verfügt das Network Operations Center über einen eigenen reservierten Raum. Eine Wand kann mit Videobildschirmen bestückt sein, die jeweils einen Echtzeitüberblick über die allgemeine Netzwerk-Performance sowie aktive Incidents und Alarme bieten. Die Videobildschirme sind so angeordnet und miteinander verbunden, dass sie als eine große, hochauflösende Einheit fungieren können. Die Größe des physischen NOC-Raums und des NOC-Teams hängt von der Größe des Unternehmens und des Rechenzentrums ab.
Warnmeldungen werden erstmals auf der Videowand angezeigt, die Technikern genau zeigen, wo ein Problem auftritt und welches Gerät oder welche Leitung betroffen ist. Die Videobildschirme im NOC können auch Nachrichten einblenden und das Wetter im Blick behalten, damit Techniker laufende Probleme, die den Betrieb des gesamten Netzwerks beeinträchtigen können, in Ihre Planungen miteinbeziehen können. Die Videowand ist auch mit einzelnen Workstations im ganzen Raum verbunden, an denen Techniker eingesetzt werden, die eine bestimmte Technologie oder eine bestimmte Schwachstelle überwachen. Dort können die NOC-Techniker damit verbundene Probleme detailliert untersuchen und Vorgaben befolgen, die zur Beseitigung des jeweiligen Incidents festgelegt wurden.
Die Workstations im Network Operations Center verfügen über mehrere Monitore, wodurch die Techniker verschiedenste Informationen schneller und einfacher analysieren und effizienter darauf reagieren können. Jede Station ist auch an ein Art PA-System angeschlossen, sodass die Techniker miteinander kommunizieren und Informationen schnell austauschen können. Auf dem Videowandbildschirm lassen sich auch Alarmdetails platzieren, die dann von allen anderen Technikern geprüft werden können.
In Großunternehmen wird das NOC oft in einem separaten Raum eingerichtet, wo ein Team schwerwiegende Netzwerkvorfälle bearbeitet. Typischerweise wird in einem Network Operations Center ein hierarchischer Ansatz für das Management von Incidents verfolgt. Techniker werden in Kategorien wie beispielsweise 1, 2 oder 3 eingeteilt, die auf ihren Fähigkeiten und ihrer Erfahrung mit der Lösung spezifischer Probleme basieren. Sobald ein NOC-Techniker ein Problem entdeckt, erstellt er ein Ticket, mit dem das Problem auf der Grundlage von Warnmeldungstyp und -schweregrad sowie anderer Kriterien kategorisiert wird. Wenn der NOC-Techniker, der einer bestimmten Problemkategorie zugeordnet ist, ein Problem nicht schnell genug löst, wechselt es in die nächste Kategorie und wird weiter eskaliert, bis das laufende Problem vollständig behoben ist.
Die Kombination aus leistungsstarken Systemen und hochqualifizierten Mitarbeitern, die gemäß sehr spezifischer Vorgaben arbeiten, ermöglicht es dem NOC, rund um die Uhr aktiv zu sein.
Zum Team eines Network Operations Center zählen Techniker wie z.B. NOC-Ingenieure, -Analysten oder -Bediener, und wahrscheinlich mehrere Team- oder Schichtleiter. NOC-Mitarbeiter benötigen spezifische Fähigkeiten beim Monitoring, der Wartung und der schnellen Behebung von Performance-Problemen im Netzwerk. Derartige Kenntnisse übersteigen in der Regel die Möglichkeiten der nicht spezialisierten IT-Experten. NOC-Techniker verfügen in der Regel über umfangreiche Berufserfahrung, insbesondere in den Bereichen Netzwerk-Monitoring und -Tools. Viele Mitarbeiter im NOC verfügen aber auch über umfangreiche Zertifizierungen in diesem Bereich.
Da es für viele kleinere Unternehmen nicht machbar ist, ein großes NOC-Team zu unterhalten, dass sich ausschließlich auf die Netzwerk-Performance fokussiert, werden von Drittanbietern ausgewählte NOC-Services als Alternative zum internen NOC angeboten.
Während sich das Network Operation Center (NOC) auf Netzwerk-Performance und -Verfügbarkeit konzentriert, umfasst ein Security Operations Center (SOC) Tools und Mitarbeiter, die die Sicherheitslage eines Unternehmens rund um die Uhr überwachen, erfassen und analysieren.
Techniker im NOC suchen nach Problemen, die die Netzwerkgeschwindigkeit und -verfügbarkeit beeinträchtigen könnten, während sich Techniker im SOC mit der Beseitigung von Cyber-Security-Bedrohungen und der Reaktion auf Angriffe befassen. Das SOC konzentriert sich außerdem auf den Schutz von Kundendaten und geistigem Eigentum. NOCs beschäftigen sich in der Regel mit Netzwerkereignissen, die häufig in der Praxis auftreten, während SOCs fast immer auf externe Bedrohungen des Unternehmensnetzwerks reagieren.
Sowohl das NOC als auch das SOC erfüllen wichtige Aufgaben für das Unternehmen bei der Erkennung, Untersuchung und Lösung von Problemen und arbeiten intensiv daran, Probleme schnell zu lösen, bevor sie das Unternehmen beeinträchtigen. Darüber hinaus agieren beide ähnlich und verwenden einen hierarchischen Ansatz zur Behebung von Incidents. Dabei konzentrieren sie sich jedoch auf sehr unterschiedliche Aspekte. Infolgedessen sind auch die Fähigkeiten, Kenntnisse und Herangehensweisen der Mitarbeiter in beiden Gruppen unterschiedlich. Ein NOC-Techniker muss mit den Besonderheiten des Monitorings und Managements von Netzwerken und Anwendungen vertraut sein, während sich ein SOC-Analyst ausschließlich auf die Sicherheit konzentriert.
Allerdings sollten Security Operations Center und Network Operations Center idealerweise zusammenarbeiten, um größere Vorfälle und Krisen gezielt in den Griff zu bekommen. Das ist auch der Grund, weshalb die beiden Teams nicht isoliert voneinander agieren sollten. Überraschenderweise gibt fast ein Drittel der Unternehmen an, dass es kaum Kontakt zwischen NOC und SOC gibt. Weitere 20% sagen, dass die NOC- und SOC-Teams nur in Notfällen zusammenarbeiten (siehe die SANS-Studie). Experten befürworten jedoch eine engere Integration von NOC und SOC. Die Integration der beiden Bereiche, auch wenn sie im Alltag weitgehend getrennt bleiben, beginnt mit der Festlegung von Betriebsabläufen, der Automatisierung bestimmter Aktionen und der Einführung von Tools, die es ermöglichen, Netzwerküberwachungsdaten sowohl im NOC als auch im SOC zu sammeln und gemeinsam zu nutzen.
Wenn es nicht möglich ist, NOC und SOC getrennt voneinander einzurichten, kann auch ein Network Operations Center entsprechende Sicherheitsprobleme überwachen und lösen – auch wenn das nicht ideal ist. NOCs können und werden Sicherheitsbedrohungen hinsichtlich der Netzwerk-Performance erkennen, und geschulte Mitarbeiter können wirksam darauf reagieren. Dieser letzte Aspekt ist jedoch der springende Punkt. Techniker müssen nach Sicherheitsbedrohungen suchen und über die Fähigkeiten verfügen, um überhaupt darauf reagieren zu können. Techniker mit hoher Kompetenz in beiden Bereichen – Netzwerk-Performance und Cyber-Security – sind in der Praxis kaum zu finden.
Zusätzlich zum passenden Mitarbeiter-Skillset benötigt das sicherheitsorientierte Network Operations Center auch die richtigen NOC-Tools zur Behebung von Sicherheitsproblemen. So ist beispielsweise ein SIEM-System (Security Information and Event Management), das als zentrales Sicherheitsmanagementsystem die vollständige Transparenz über die Aktivitäten in Ihrem Netzwerk bietet, ein zentrales Element im NOC. SIEM-Systeme sammeln, analysieren und kategorisieren Maschinendaten aus einer Vielzahl von Quellen in einem Netzwerk und untersuchen die Daten, damit Sie in Echtzeit handeln können. Ein SIEM-System automatisiert also quasi das Aufgabenspektrum eines typischen SOC-Teams. Dadurch werden Incidents aufgedeckt und gleichzeitig Fehlalarme (False Positives) reduziert, was es einem ordnungsgemäß besetzten NOC-Team leichter macht, die Sicherheit im Auge zu behalten.
Best Practices für ein NOC (Network Operations Center) beinhalten unter anderem die Priorisierung von Schulungen, das Stützen auf klar definierte Rollen und die Etablierung klarer Vorgaben und Kommunikationswege.
Machen Sie Schulungen und Wissensaufbau zu einer Top-Priorität:
Ihr NOC-Team muss über ein hohes Maß an Fachwissen verfügen, insbesondere beim Monitoring, Management und Lösen von Problemen, die sich speziell auf die Netzwerk-Performance und Ihre IT-Infrastruktur beziehen. Bieten Sie fundierte und regelmäßige Schulungen zu Abläufen und Vorgaben für alle Eventualitäten an und bleiben Sie auf dem Laufenden was die sich ändernde technologische Landschaft und Änderungen in Ihrer eigenen IT-Umgebung betrifft. Priorisieren Sie Probleme mit der Netzwerkleistung, übersehen Sie dabei aber nicht die Möglichkeiten der Zusammenarbeit mit Ihrem SOC bei Sicherheitsfragen. Ein wichtiges Thema ist der Eskalationsprozess. Stellen Sie sicher, dass Ihre Mitarbeiter wissen, wann und wie sie schnell die Entscheidung treffen, ein sich verschärfendes Problem an einen erfahreneren Teamkollegen zu eskalieren.
Definieren Sie klare Rollen:
Flache Organisationshierarchien erfreuen sich heutzutage größerer Beliebtheit – auch in einem Network Operations Center. In der schnelllebigen Welt der Netzwerküberwachung, die sofortiges Handeln erfordert, ist es sinnvoll, jedes Teammitglied des NOCs zu befähigen, anstatt starr auf risiko- oder rollenbasierten Übergaben zu bestehen. Doch während Techniker mit dem Wissen und der Befugnis zum schnellen Handeln ausgestattet sein sollten, um Netzwerkausfälle zu verhindern, benötigen Sie dennoch auch Eskalationsstufen und Schichtleiter zur Beaufsichtigung des NOC.
Zwar sollten NOC-Techniker weitgehend selbständig ihren Aufgaben nachgehen und Erkentnisse liefern (Sie sollten dabei keinesfalls Micromanagement betreiben), sie brauchen jedoch einen Vorgesetzten im Network Operations Center, der den Technikern Aufgaben entsprechend ihren Fähigkeiten zuweist, Prioritäten setzt, Berichte erstellt, sicherstellt, dass Incidents ordnungsgemäß behoben werden, und bei Bedarf die gesamte Organisation über Ereignisse benachrichtigt. Darüber hinaus sollte jeder NOC-Techniker genau wissen, welche Aufgaben von ihm erwartet werden und wie und wann ein Incident gemeldet werden muss, um ihn zu eskalieren oder darauf zu reagieren.
Fördern Sie eine rege Kommunikation:
Kommunikationswege (innerhalb des NOC, SOC und anderer externer Teams) geöffnet zu halten, kann sich als schwierig erweisen. Dabei geht es definitiv um mehr als nur um die Festlegung einiger regelmäßiger Meetings. Stattdessen muss sich in einem Network Operations Center gezielt darum gekümmert werden, Mitarbeiter darin zu schulen, wie und wann sie Informationen austauschen sollen. Entsprechend sollten Sie dann für diesen Austausch auch Verantwortung übernehmen. Die Schaffung regelmäßiger Gelegenheiten zur Zusammenarbeit und Koordination ist für ein solides NOC von entscheidender Bedeutung.
Definieren Sie klare Richtlinien und Vorgaben
Sorgen Sie für einen reibungslosen Betrieb Ihres NOC, indem Sie klare Richtlinien für die folgenden Bereiche aufstellen:
- Incident-Management: Dokumentieren Sie die einzelnen Schritte, welche die NOC-Techniker befolgen sollten, um Incidents (Vorfälle) in den Griff zu bekommen (z. B. wann der Techniker die Entscheidung treffen kann, wann er die Entscheidung eskalieren soll, wann er Teammitglieder benachrichtigen soll usw.)..
- Lösungen: Definieren Sie Verfahren für die Behandlung gängiger Themen und legen Sie Sofortmaßnahmen für Notfälle fest.
- Eskalation: Bestimmen Sie, wie und an wen das NOC-Team Probleme eskalieren soll.
- Priorisierung: Legen Sie fest, welche Vorfälle höchste Priorität haben und welche Technikerkategorie die wichtigsten Incidents bearbeiten soll. Vorfälle sind dabei nach dem Ausmaß ihrer Auswirkungen auf das Unternehmen zu bewerten.
Etablierte Abläufe in Ihrem Network Operations Center zu besitzen, stellt sicher, dass alle auf einer Wellenlänge sind. Zudem sorgt es für Konsistenz im gesamten Unternehmen und dafür, dass NOC-Mitarbeiter verstärkt Verantwortung übernehmen. Gewiss sind die richtigen Mitarbeiter und Prozesse die Grundlage, aber die eigentliche Arbeit im NOC kann nicht ohne die richtigen Tools erledigt werden.
In welche Lösung Sie investieren, hängt weitgehend von Ihren Geschäftsanforderungen ab, aber Ihr NOC benötigt ein Tool oder eine Kombination von Tools, die Folgendes bieten:
- Einen umfassender Überblick über Ihre Infrastruktur: ganz gleich ob physisch, virtuell oder in der Cloud.
- Automatisierung: Ziel ist es, sich wiederholende Aufgaben zu reduzieren und Level-1-Mitarbeitern die Möglichkeit zu geben, sich auf Themen mit höherer Priorität zu konzentrieren und gleichzeitig Alert-Fatigue zu reduzieren.
- Ticket-Management: Ziel ist es, Informationen zu offenen Tickets anzuzeigen, einschließlich Priorität, Aufgabe und zugewiesenem Techniker, um sicherzustellen, dass interne und externe Probleme im NOC schnell gelöst werden.
- Incident Reporting: Dieses Instrument zur visuellen Analyse, grafischen Darstellung von Schwellenwerten, Alarmen, Indikatoren und Trends erleichtert die Untersuchung von Problemen und ihre Dokumentation für die Zukunft.
- Einfache Benutzeroberfläche und Bereitstellung: Sie wollen sofort den Nutzen spüren und sich nicht mit einer langwierigen, komplexen Bereitstellung und ausgedehnten Lernkurve herumschlagen müssen.
- Skalierbarkeit: Wenn Ihr Unternehmen wächst, möchten Sie sicherstellen, dass dies für Ihr NOC kein Problem darstellt und es damit zurechtkommt.
Die von Ihnen gewählte Lösung sollte Ihnen vollständige Transparenz für Ihr gesamtes Netzwerk bieten und es Ihrem NOC-Team ermöglichen, detailliertere Nachforschungen anzustellen, Probleme zu untersuchen und im Laufe der Zeit Ihre gesamte Reaktion auf Vorfälle (Incident Response) zu verbessern.
Das Network Operations Center (NOC) ist einer der wichtigsten Funktionsbereich in der IT. Tagtäglich verlassen sich interne und externe Kunden auf Ihre IT-Services. Sie müssen SLAs (Service Level Agreements) einhalten, die Produktivität Ihres Kerngeschäfts steigern und die gesamte digitale Erfahrung Ihrer Kunden aufrechterhalten.
Es ist wichtig für ein NOC, die Betriebszeit aller IT-Services zu maximieren und katastrophenähnliche Ausfälle zu verhindern. Viele Unternehmen besitzen zwar ein Network Operations Center, haben aber Schwierigkeiten, es vollständig mit Personal auszustatten, das gut geschult ist und über die besten Tools und Automatisierungsmöglichkeiten verfügt. Unternehmen, die kein effektives NOC unterhalten können, sollten möglicherweise auf Drittanbieter zurückgreifen.
Was ist die Aufgabe eines Network Operation Centers?
Was ist der Unterschied zwischen einem NOC und einem SOC?
Welche Best Practices gibt es für ein Network Operations Center (NOC)?
Wie finden Sie die richtigen Tools für Ihr NOC?
Prognosen zu IT & Observability
Gibt es etwas besseres als Überraschungen? Ja, nämlich auf alles vorbereitet zu sein. Unsere Experten verraten, wie das geht - in ihren Prognosen zu den wichtigsten Trends des kommenden Jahres.