Veröffentlichungsdatum: 1. Februar 2021
Als ITOps oder IT Operations bezeichnet man die Prozesse und Services, die von der IT-Abteilung eines Unternehmens für seine internen oder externen Kunden verwaltet werden. ITOps ist eine der vier Funktionen – neben Application Management, technischem Management und Service Desk – die im IT Operations Management-Framework in der ITIL (Information Technology Infrastructure Library) definiert sind.
In jedem Unternehmen, das Computer einsetzt, gibt es Methoden, um die IT-Anforderungen der Mitarbeiter oder Kunden zu erfüllen – ganz gleich, ob diese als ITOps (Information Technology Operations) bezeichnet werden oder nicht. In einer typischen Unternehmensumgebung ist ITOps jedoch ein eigener Bereich innerhalb der IT-Abteilung. Jedes Unternehmen organisiert seine IT-Ressourcen zwar anders, doch ein ITOps-Team besteht im Allgemeinen aus einer Gruppe von IT-Mitarbeitern unter der Leitung eines IT Operations-Managers, der alle Aktivitäten im Aufgabenbereich von ITOps überwacht.
ITOps spielt eine wichtige Rolle beim Erreichen von Unternehmenszielen. ITOps trägt unter anderem dazu bei, ein stabiles und zuverlässiges IT-Ökosystem zu unterhalten, und stellt sicher, dass Belegschaft und Management des Unternehmens von der IT unterstützt werden, um die gewünschten Geschäftsergebnisse zu erzielen.
Die Art und Weise, wie diese Rolle ausgefüllt wird, ändert sich jedoch, da immer mehr Unternehmen vom Rechenzentrum in die Cloud migrieren. In diesem Artikel befassen wir uns damit, wie sich das herkömmliche ITOps im Zeitalter der Cloud durch das Aufkommen von DevOps, NoOps und CloudOps weiterentwickelt, wie AIOps durch Automatisierung zum Turbo für IT Operations werden kann und welche Vorteile ITOps in modernen Cloud-Umgebungen haben kann.
Die Bedeutung von IT Operations liegt in seiner End-to-End-Verantwortung für die Services, die von der IT-Organisation bereitgestellt werden, also von den Systemen und der Infrastruktur, die die Geschäftsprozesse eines Unternehmens unterstützen. ITOps hat die Aufgabe, die operative Stabilität des Unternehmens aufrechtzuerhalten und gleichzeitig neue Initiativen zu unterstützen, um das Geschäft voranzubringen.
ITOps bietet allgemeine technologische Beratung und führt tägliche Routineaufgaben zur Pflege der IT-Infrastruktur des Unternehmens durch. Da ITOps auf die individuellen Anforderungen und Ressourcen eines Unternehmens zugeschnitten werden kann, wäre eine allgemeingültige „Aufgabenliste“ wenig praktikabel. Als Unternehmensfunktion kann ITOps jedoch in drei Hauptaufgabenbereiche aufgegliedert werden. Für welche und wie viele dieser Aufgaben einzelne ITOps-Teams zuständig sind, variiert von Unternehmen zu Unternehmen. Mögliche Aufgaben sind:
Netzwerkinfrastruktur:
- Konfigurieren und Verwalten aller Netzwerkfunktionen für die interne und externe IT-Kommunikation
- Konfigurieren und Verwalten von Telekommunikationsleitungen
- Verwalten von Firewall-Ports, um dem Netzwerk die Kommunikation mit externen Servern zu ermöglichen
- Bereitstellen von sicherem Remote-Zugriff auf das Unternehmensnetzwerk für autorisierte Benutzer
- Monitoring von Netzwerkzustand und -Performance, Erkennen von Anomalien und Verhindern bzw. schnelles Beheben von Problemen, wozu auch der Aufbau und die Verwaltung eines Network Operations Center (NOC) gehören kann, also ein zentraler, physischer Standort, von dem aus ITOps-Teams ein Netzwerk kontinuierlich überwachen können
Server- und Gerätemanagement:
- Konfigurieren, Warten und Verwalten von Servern für Infrastruktur und Anwendungen
- Verwalten von Netzwerk- und individuellem Speicher, um sicherzustellen, dass die Anforderungen der Anwendungen erfüllt werden
- Einrichten und Autorisieren von E-Mail- und Dateiservern
- Bereitstellen und Verwalten der vom Unternehmen zugelassenen PCs
- Bereitstellen und Verwalten von Mobiltelefonen und anderen Mobilgeräten
- Lizenzieren und Verwalten der Software für Desktop-, Laptop- und Mobilgeräte
Computer-Operations und Help Desk:
- Verwalten von Rechenzentrumsstandorten und -anlagen
- Betreiben des Help Desks
- Erstellen, Autorisieren und Verwalten von Benutzerprofilen auf Systemen des Unternehmens
- Bereitstellen von Audit-Informationen zur Netzwerkkonfiguration für Aufsichtsbehörden, Geschäftspartner und andere externe Einrichtungen
- Sicherstellen der Hochverfügbarkeit des Netzwerks und Erstellen von Disaster Recovery-Plänen
- Benachrichtigen von Benutzern bei gravierenden Incidents mit Auswirkungen auf Netzwerkservices
- Einrichten regelmäßiger Sicherungen, um Daten bei Bedarf leichter wiederherstellen zu können
- Pflegen der ITIL für das Unternehmen
In jedem dieser Bereiche sind die Mitglieder des ITOps-Teams auch für die Verwaltung und die Zusammenarbeit mit Anbietern und externen Auftragnehmern zuständig, für die Beschaffung und Bezahlung der gesamten Hardware, Software und Dienstleistungen, die für das Netzwerk und seine Anwendungen verwendet werden, für das Projektmanagement und die Bereitstellung von Upgrades und Fixes, um den Zustand und die Leistung des Netzwerks zu erhalten.
ITOps, DevOps und NoOps sind drei unterschiedliche Ansätze zur Strukturierung der IT-Teams eines Unternehmens. Alle drei Ansätze haben unterschiedliche Aufgaben und Ziele, und während sowohl ITOps- als auch DevOps-Arbeitsgruppen zum Großteil in der Praxis umgesetzt wurden, ist NoOps noch weitgehend Theorie. Lassen Sie uns einen genaueren Blick auf die einzelnen Ansätze und ihre Beziehung zueinander werfen.
ITOps: Durch den weit gefassten und manchmal etwas schwammig definierten Aufgabenbereich von ITOps kann der Eindruck entstehen, dass ITOps alles umfasst, was mit IT zu tun hat. Die ITOps-Aktivitäten von Unternehmen können zwar stark variieren, sie gehören aber in jedem Fall in den Bereich der Bereitstellung und Wartung der für den Geschäftsbetrieb nötigen Technologie. In der Praxis gehören dazu Aufgaben wie das Warten von Netzwerken, Verwalten von Rechenzentren, Sicherstellen von Security und Compliance, Verwalten des Help Desks, Lizenzieren und Verwalten von Software und andere Aufgaben, die Mitarbeitern ihre Arbeit ermöglichen und die Prozesse des Geschäftsalltags unterstützen. Die Programm- und Anwendungsentwicklung und damit zusammenhängende Aufgaben zählen nicht zum Aufgabenbereich von ITOps.
DevOps: DevOps ist ein Ansatz zur IT-Bereitstellung, bei dem Menschen, Praktiken und Tools miteinander kombiniert werden, um Silostrukturen zwischen Entwicklungs- und Operations-Teams aufzubrechen. DevOps bezeichnet aber auch eine bestimmte IT-Rolle, die für die Entwicklung, Implementierung und Wartung benutzerdefinierter Anwendungen für den internen oder externen Gebrauch verantwortlich ist.
Wie der Name schon sagt, vereint DevOps die Rollen der Entwicklung (Dev, von englisch development) und IT Operations. Mit DevOps-Methoden können DevOps-Teams die Entwicklung von Anwendungen und Services beschleunigen und sind dank eines reaktionsschnelleren Ansatzes bei der Verwaltung der IT-Infrastruktur in der Lage, IT-Produkte in der Geschwindigkeit des modernen Marktes bereitzustellen und zu aktualisieren.
ITOps und DevOps beruhen auf unterschiedlichen, gegensätzlichen Prinzipien. Für ITOps – zuständig für eine stabile, sichere Infrastruktur, die Standards und Vorschriften erfüllt – wird ein konkreter Ansatz bevorzugt, der Risiken minimiert. Bei DevOps liegt der Fokus auf der innovativen Entwicklung und Optimierung von Apps und der gleichzeitigen Verkürzung des Lebenszyklus der Softwareentwicklung und der Time-to-Market.
Es wird niemanden überraschen, dass diese unterschiedlichen Ausrichtungen manchmal zu Konflikten führen. Der beständige, lineare Ansatz von ITOps bei der Entwicklung und Wartung der Infrastruktur erschwert eine schnelle Umsetzung von Änderungen und bremst den Entwicklungsprozess. Der enorme Zeitdruck veranlasst dagegen DevOps manchmal dazu, ITOps zu umgehen, was zu Risiken für die Systemsicherheit und -stabilität führen kann. Aus diesem Grund ist es für einen DevOps-Ansatz notwendig, dass ITOps einige seiner Aufgaben abgibt und andere mit DevOps teilt, um die Entwicklungsteams beim Erreichen ihrer Lieferziele zu unterstützen.
NoOps: NoOps steht für „No IT Operations“ und bezeichnet eine Weiterentwicklung von DevOps, die IT Operations komplett von der Softwareentwicklung trennt. Verfechter dieses Ansatzes behaupten, dass die Infrastrukturwartung vollständig automatisiert werden kann, sodass kein eigenes ITOps-Team im Unternehmen mehr erforderlich ist. NoOps ist keine Plattform – es wird vielmehr mithilfe verschiedener Cloud-Technologien wie KI und Machine Learning in die Praxis umgesetzt.
Laut den Befürwortern von NoOps bietet dieser Ansatz verschiedene Vorteile:
- Menschliche Fehler sind weniger wahrscheinlich: NoOps minimiert die Wahrscheinlichkeit menschlicher Fehler bei manuellen Funktionen und die damit verbundene Downtime und reduziert andere Incident Management-Aufgaben, da ein voll automatisiertes System kein menschliches Eingreifen erfordert.
- Höhere Geschwindigkeit und bessere Effizienz: NoOps beseitigt die Konflikte zwischen dem auf Stabilität und Sicherheit ausgelegten ITOps-Ansatz und dem Innovationsdruck von DevOps, sodass Entwicklungsteams schneller und agiler arbeiten können.
- Strategischere Ausrichtung von ITOps: NoOPs befreit ITOps von seinen operativen Aufgaben und ermöglicht der IT, eine strategischere Rolle zu übernehmen, sich um den technologischen Fortschritt zu kümmern und sicherzustellen, dass DevOps-Teams die nötigen Tools zur Verfügung stehen.
Derzeit ist NoOps noch eher ein Konzept als eine praktische Lösung. Manche sind der Ansicht, dass die Herauslösung von ITOps aus dem Software-Lebenszyklus den Entwicklern zu viel Verantwortung aufbürden und die Produktion behindern könnte. Andere halten die Automatisierung sämtlicher ITOps-Funktionen angesichts der Komplexität moderner Systeme schlicht für unrealistisch. In naher Zukunft ist es eher wahrscheinlich, dass bestimmte Operations-Bereiche automatisiert werden, während für andere Aufgaben zwangsläufig Menschen zuständig sein werden.
CloudOps ist die Kurzform von „Cloud Operations“, einem Oberbegriff für die Prozesse bei der Verwaltung und Bereitstellung von Infrastrukturservices für das Cloud-Computing für interne oder externe Benutzer. Das Ziel von CloudOps ist es, langfristig für einen stabilen Zustand und die Funktionsfähigkeit von Cloud Computing-Plattformen – und ihrer Anwendungen und Daten – zu sorgen. CloudOps setzt dabei auf „Continuous Operation“, einen DevOps-Ansatz für die Ausführung Cloud-basierter Systeme, der es überflüssig macht, eine Anwendung ganz oder teilweise aus einem Service zu entfernen. Dafür muss die operative Automatisierung für „Zero Downtime“ sorgen, also Ausfallzeiten verhindern. CloudOps entstand in Reaktion auf die vielen spezifischen Eigenschaften Cloud-basierter Systeme:
- Die Cloud ist verteilt, zustandslos (stateless) und skalierbar: Die Cloud ermöglicht Ihnen, Kapazität nach Bedarf zu skalieren, indem Sie neue Server oder Speichergeräte hoch- und nicht benötigte Geräte bei Bedarf herunterfahren. In Zeiten mit hohem Datenverkehr können Sie Regeln für die automatische Bereitstellung von Servern festlegen, um dem Bedarf gerecht zu werden und Uptime zu gewährleisten. Da Cloud-Ressourcen rund um den Globus verteilt sind, können Sie mit CloudOps außerdem wichtige Leistungsmetriken überwachen und standortunabhängig reagieren. Dies erhöht die Flexibilität und Skalierbarkeit der zugrunde liegenden Anwendungen und Infrastruktur.
- Die Cloud ist infrastrukturneutral: Die zugrunde liegende Infrastruktur wird von der Plattform und den Anwendungen abstrahiert.
- Die Cloud ist fehler- und latenztolerant: Da Cloud-zentrierte Anwendungen und Services von der zugrunde liegenden Infrastruktur abstrahiert werden können, sind sie weniger anfällig für Latenzzeiten und Fehler.
- Die Cloud ist hochgradig automatisiert: Teammitglieder können automatisierte Funktionen für jeden Teil des Softwareentwicklungs-Lebenszyklus programmieren und Ihre Infrastruktur nutzen, um Befehle und Aufgaben abhängig von Monitoring-Schwellenwerten und anderen wichtigen Leistungsmetriken auszuführen. Dadurch entstehen selbstheilende Systeme, die gängige operative Probleme ohne Auswirkungen für Anwendungen oder Benutzer beheben können.
- Die Cloud nutzt ein Aktiv/Aktiv-Modell: Cloud-Netzwerke vom Typ Aktiv/Aktiv nutzen mehrere unabhängige Verarbeitungsknoten, und jeder Knoten hat Zugriff auf mehrere replizierte Datenbanken für eine einzelne Anwendung. Beim Ausfall eines Servers können Anwendungen die notwendigen Daten dadurch aus verschiedenen Quellen abrufen, was die Downtime und die Zahl der Ausfälle verringert.
- Cloud-Anwendungen teilen sich Ressourcen: Cloud-Anwendungen teilen sich Services, ohne aneinander gebunden zu sein.
- Cloud-Daten sind redundant: Die Cloud ermöglicht Ihnen, Daten an mehreren physischen Standorten zu speichern. Dies bietet mehr Failover-Optionen, eine resilientere Datenpipeline und mehr Schutz vor Datenverlust.
CloudOps versucht, die Vorteile dieser Cloud-Eigenschaften zu maximieren, indem es Verfahren und Operations-Prozesse in einem Cloud-basierten System formalisiert. Die Einzelheiten werden sich bei jedem Unternehmen unterscheiden, doch CloudOps geht im Allgemeinen dieselben operativen Probleme wie herkömmliches ITOps an – einschließlich Ressourcenmanagement, Bedrohungsprävention und Compliance – sodass DevOps optimalen Nutzen aus der Cloud ziehen und gleichzeitig Geschwindigkeit, Sicherheit und operative Effizienz sicherstellen kann.
Bei Observability wird der Zustand eines Systems anhand seiner Ausgabewerte gemessen. Der Begriff stammt aus der Systemsteuerungstheorie, bei der es um das Beschreiben und Verstehen selbstregelnder Systeme geht, wird jetzt jedoch verstärkt im Zusammenhang mit der Performance-Verbesserung verteilter IT-Systeme verwendet. In diesem Kontext werden für Observability drei Arten von Telemetriedaten genutzt (Metriken, Logs und Trace-Daten), um detaillierte Einblicke in verteilte Systemen zu geben und Teams Antworten auf vielfältige Fragen zu liefern, damit die Performance des Systems verbessert werden kann.
In der Unternehmenswelt haben sich Cloud-basierte Infrastruktur-Services in Form von Microservice-, Serverless- und Container-Technologien schnell durchgesetzt. Das Tracing eines Events bis zu seiner Ursache ist in diesen verteilten Systemen extrem komplex. Observability verbessert im Grunde die Monitoring-Möglichkeiten in modernen Systemen, da sie Teams hilft, die Elemente einer komplexen Kette zu identifizieren, zu verknüpfen und zu ihrer Ursache zurückzuverfolgen. Außerdem verschafft Observability jeder Rolle, von Systemadministratoren über ITOps-Analysten bis hin zu Entwicklern, Sichtbarkeit innerhalb ihrer gesamten Architektur – und genau diese Fähigkeit ist im Zeitalter von Microservices essentiell.
Observability ist notwendig, da sie Ihnen mehr Kontrolle über komplexe Systeme gibt. Bei einfachen Systemen gibt es weniger bewegliche Komponenten, wodurch die Stabilität ein geringeres Problem ist. Bei verteilten Systemen gibt es viel mehr ineinander greifende Elemente, weshalb auch Anzahl und Art möglicher Fehler höher sind. Außerdem gibt es bei verteilten Systemen mehr „unbekannte Unbekannte“ als bei einfacheren Systemen. Und da Monitoring auf „bekannten Unbekannten“ basiert, kann sich die Diagnose in solch komplizierten Umgebungen schwierig gestalten.
Als erklärender Ansatz, mit dem Sie beim Auftreten von Problemen Fragen zum Systemverhalten beantworten können, ist Observability besser für die Unvorhersehbarkeit verteilter Systeme geeignet. „Warum ist X ausgefallen?", „Was verursacht momentan Latenz?“ oder „Beeinträchtigt das Problem momentan alle Android-Benutzer oder nur einige davon?“ sind nur ein paar Beispiele für die Fragen, die man mit wirkungsvoller Observability beantworten kann.
AIOps steht für „Artificial Intelligence for IT Operations“ und bezieht sich auf den Einsatz von KI-Analytik und Machine Learning, um IT Operations zu automatisieren und zu verbessern..
Für IT Operations wird es zunehmend schwierig, die immer größer und komplexer werdenden Netzwerke zu verwalten. Herkömmliche Operations Management-Tools und -Verfahren können mit den ständig wachsenden Datenmengen aus verschiedenen Quellen, die in diesen vielfältigen Netzwerkumgebungen generiert werden, nicht Schritt halten. AIOps wurde speziell für diese Herausforderungen entwickelt und bietet zwei wesentliche Vorteile in Cloud-Umgebungen:
1. AIOps führt Daten aus verschiedenen Quellen zusammen: Herkömmliche IT Management-Lösungen wurden für statische physische Systeme konzipiert und nicht für die Mischung aus lokalen und privaten, verwalteten und öffentlichen Cloud-Services, die in den meisten Unternehmen zu finden ist. Sie sind daher nicht in der Lage, Volumen, Vielfalt und Geschwindigkeit der von diesen dynamischen Netzen erzeugten Daten zu verarbeiten. Vielmehr konsolidieren, aggregieren und mitteln sie Daten, was die Datenintegrität beeinträchtigt. AIOps-Plattformen sind dagegen auf moderne Netzwerke ausgelegt und können riesige Datenmengen aus der gesamten Umgebung erfassen und dabei gleichzeitig die Datenintegrität für umfassende Analysen aufrechterhalten.
2. AIOps erleichtert die Datenanalyse: Eine AIOps-Plattform kann Daten in allen Formaten in wechselnden Geschwindigkeiten und Mengen erfassen. Anschließend werden automatisierte Datenanalysen durchgeführt, um künftige Probleme vorherzusagen bzw. zu verhindern sowie die Ursache bestehender Probleme zu identifizieren. Die AIOps-Plattform kann zudem Lösungen vorschlagen, Antworten automatisieren und ihre Algorithmen anpassen, um die künftige Problembehandlung zu verbessern.
In der Praxis ist AIOps ein Prozess aus den drei Schritten „Beobachten“, „Informieren“ und „Handeln“, die in einem kontinuierlichen Kreislauf ausgeführt werden:
- Beobachten: Zuerst verarbeitet die AIOps-Plattform Echtzeitdaten aus einer Vielzahl von Quellen, wie etwa herkömmliches IT-Monitoring und Log-Events. Die KI-Algorithmen erkennen anhand von Datenanomalien automatisch signifikante Probleme, die dann von der Plattform analysiert und einer Gruppe ähnlicher Probleme zugeordnet werden.
- Informieren: Die AIOps-Plattform benachrichtigt die zuständigen IT-Teams über die Anomalien. Da sie nach Typ gruppiert sind, gibt es weniger Benachrichtigungen.
- Handeln: AIOps-Plattformen können die Workflow-Weiterleitung mit oder ohne menschliches Eingreifen automatisieren und lernen aus den Antworten des IT-Teams, sodass sie mit der Zeit immer genauer werden. Im Endeffekt soll die Plattform lernen, Probleme zu lösen, bevor das Unternehmen sie bemerkt und sie sich auf die Endbenutzer auswirken.
Heutzutage wird von IT-Teams erwartet, dass sie in zunehmend dynamischen und verzahnten Umgebungen für Stabilität, Sicherheit und Effizienz sorgen. Die Verbreitung von Multi-Cloud-Hybridsystemen, die Notwendigkeit von Observability und die für DevOps nötige Geschwindigkeit und Agilität bringen die herkömmlichen IT-Ansätze und -Tools allerdings an ihre Grenzen. Dies führt unweigerlich zu Service Level-Beeinträchtigungen und unzufriedenen Benutzern.
Es ist Zeit, dass bei IT Operations vermehrt auf CloudOps und AIOps gesetzt wird, da diese Ansätze die Geschwindigkeit und Flexibilität bieten, die für ein effektiveres Management von Cloud-Umgebungen erforderlich sind. Diese Tools sind keine Weiterentwicklung von ITOps, sondern stellen eher ganz neue Verfahren für IT Operations dar. Für ihre Implementierung ist zwar oftmals ein unternehmensweiter Kulturwandel nötig, doch letztlich überwiegen die Vorteile – mehr Flexibilität, Sicherheit und Zuverlässigkeit – bei Weitem.
Prognosen zu IT & Observability
Gibt es etwas besseres als Überraschungen? Ja, nämlich auf alles vorbereitet zu sein. Unsere Experten verraten, wie das geht - in ihren Prognosen zu den wichtigsten Trends des kommenden Jahres.