Published Date: May 1, 2023
IT-Monitoring umfasst ein breites Spektrum an Monitoring Software, Monitoring Tools und Produkten, mit denen Analysten feststellen, ob die IT-Systeme online sind und das erwartete Service-Level erfüllen. Während sie zudem gleichzeitig erkannte Probleme beheben. Monitoring Software reicht von einfachen Überprüfungs-Tools bis hin zu anspruchsvolleren Monitoring Tools, die die Performance eines Produkts detailliert untersuchen oder sogar Korrekturmaßnahmen automatisieren, wenn Probleme vermutet werden. Bei der Verwendung mit einem Webserver könnte ein IT-Monitoring-Tool beispielsweise Trends bei der CPU- und RAM-Auslastung analysieren. Oder feststellen, ob der Festplattenspeicher knapp wird bzw. ermitteln, wie oft das System im letzten Jahr abgestürzt ist.
In diesem Artikel werden die grundlegenden Typen von IT-Monitoring und die verschiedenen Arten von Monitoring Tools und Monitoring Software vorgestellt. Ebenso wird beschrieben, wie IT-Monitoring in Zusammenhang mit der Netzwerkverwaltung und -performance sowie DevOps und Automatisierung funktioniert. Abschließend wird erläutert, worauf bei der Wahl einer effektiven IT-Monitoring-Strategie zu achten ist.
Das IT-Monitoring, zu dem auch das Netzwerk- und Anwendungs-Monitoring gehören, hat sich seit 2010 dramatisch weiterentwickelt und zunehmend an Bedeutung gewonnen. In erster Linie, um mit der zunehmenden Komplexität von IT-Umgebungen mitzuhalten. Hier ist besonders hervorzuheben, dass Monitoring Tools bzw. Monitoring Software heute sowohl lokale als auch Cloud-basierte Systeme überwachen können. Das Angebot umfasst unzählige Monitoring-Produkte und Monitoring-Tools, die sich in Komplexität und Ansatz deutlich unterscheiden. Es kann also sein, dass ein IT-Monitoring-Tool oder eine Monitoring-Software für ein Unternehmen perfekt geeignet ist, zu einem anderen Unternehmen aber überhaupt nicht passt.
Bei den im IT-Monitoring geltenden Konzepten gibt es große Überschneidungen mit anderen Disziplinen, einschließlich IT Operations Management (ITOM), SIEM (Security Information and Event Management), SOAR (Security Orchestration, Automation and Response), Operational Intelligence (OI) und vielen anderen
Zu den grundlegenden Arten von IT-Monitoring gehören das Verfügbarkeits-Monitoring, das Web-Performance-Monitoring, Anwendungs-Management und Anwendungs-Performance-Management (APM), die API-Verwaltung, das Real-User-Monitoring (RUM), das Sicherheits-Monitoring und das Monitoring von Geschäftsaktivitäten.
Welche IT-Monitoring-Systeme gibt es?
Da es keine offizielle Liste der verschiedenen Arten von Monitoring Tools und Monitoring Software gibt und viele Begriffe mehrere Arten des IT-Monitoring beinhalten, ist in diesem Segment keine klare Abgrenzung möglich. Im Folgenden sehen wir uns die allgemeinen IT-Monitoring-Arten an, die Teil eines IT-Monitoring-Systems sein können und in denen Monitoring Tools und IT-Monitoring-Software Anwendung finden:
- Verfügbarkeits-Monitoring: Verfügbarkeits-Monitoring wird oft auch als System-Monitoring bezeichnet und ist wohl die ausgereifteste Art von IT-Monitoring-Tool. Verfügbarkeits-Monitoring beinhaltet Kategorien wie Serververwaltung, Infrastruktur-Monitoring/-Verwaltung und Netzwerk-Monitoring/-Verwaltung und soll Benutzern Informationen über Uptime und Performance des Monitoring-Ziels bereitstellen.
- Web-Performance-Monitoring: Als Teilbereich von Verfügbarkeits-Monitoring ist Web-Performance-Monitoring darauf ausgelegt, die Verfügbarkeit eines Webservers oder Webservice zu überwachen. Liefert aber auch genauere Details über das System. Diese Monitoring Tools können Informationen wie die Ladezeit einer Seite, den Ursprung erzeugter Fehler und individuelle Ladezeiten verschiedener Web-Elemente erfassen und Analysten damit bei der Feinabstimmung der Performance einer Website oder einer webbasierten App unterstützen.
- Anwendungs-Management/Anwendungs-Performance-Management (APM): APM-Tools ähneln Monitoring Tools für das Web-Performance-Monitoring, sind jedoch auf kundenorientierte Anwendungen ausgerichtet. Diese Art von Monitoring Software ermöglicht es Analysten, die Performance einer Anwendung zu verfolgen und Probleme zu erkennen, bevor sich diese gravierend auf die Benutzerbasis auswirken. Modernere APM-Tools enthalten eventuell automatisierte Routinen, um diese Probleme ohne menschliches Eingreifen zu beheben..
- API-Monitoring: Für Unternehmen, die APIs für Entwickler von Drittanbietern bereitstellen, ist es von entscheidender Bedeutung, die Uptime dieser Services sicherzustellen. Monitoring Tools und Monitoring Software für das API-Monitoring liefern Erkenntnisse darüber, ob eine API ordnungsgemäß funktioniert, und sorgen für minimale Ausfallzeiten.
- Real-User-Monitoring: Das Real-User-Monitoring wurde entwickelt, um die tatsächlichen Interaktionen der Endbenutzer mit einer Website oder Anwendung aufzuzeichnen. Durch das Monitoring der realen Ladezeiten und des Benutzerverhaltens können Probleme auf der Grundlage „realer“ (im Gegensatz zu simulierten) Herausforderungen für die Benutzererfahrung identifiziert werden. Dieses Monitoring ist rückwärtsgerichtet und nicht prädiktiv – Analysten erkennen Probleme also erst, nachdem sie aufgetreten sind.
- Sicherheits-Monitoring: Sicherheits-Monitoring ist eine sehr spezifische Art von IT-Monitoring, die darauf ausgelegt ist, ein Netzwerk auf Sicherheitsverletzungen oder andere ungewöhnlichen Aktivitäten zu überwachen. Sicherheits-Monitoring ist eine weit umfassende, übergeordnete Kategorie, die zahlreiche Untergruppen von Monitoring-Tools für die Sicherheitsanalyse umfasst.
- Monitoring von Geschäftsaktivitäten: Diese Art von Monitoring-Tool erfasst die wichtigsten Performance-Metriken eines Unternehmens und verfolgt sie über einen bestimmten Zeitraum. Diese Metriken könnten zum Beispiel Informationen über Einzelhandelsumsätze, Downloads von Anwendungen oder das Volumen von Finanztransfers enthalten.
Zu beachten ist, dass je nach Funktionsweise Monitoring Tools bei all diesen Arten von IT-Monitoring sowohl für die Überwachung von Geräten oder Anwendungen vor Ort als auch, in Verbindung mit Cloud-basierten Systemen oder für beides verwendet werden können.
Sicherheits-Monitoring wird für die Überwachung auf Bedrohungen und verdächtige Aktivitäten im Netzwerk eingesetzt.
Welche Monitoring-Tools gibt es?
Die Monitoring-Tools für die Überwachung der IT-Infrastruktur können in drei allgemeine Kategorien oder Arten von Netzwerkgeräten unterteilt werden. Je nachdem, wie sie eingesetzt werden, unterscheiden wir zwischen Monitoring Tools zur Beobachtung, für die Analyse und zur Ergreifung von Maßnahmen:
- Monitoring-Tools für die Beobachtung: Dies sind die grundlegendsten Tools im IT-Monitoring. Sie werden für die Beobachtung von Hardware, Software oder Services und die Rückmeldung von Erkenntnissen über deren operative Effizienz eingesetzt. Zu dieser Kategorie zählen die meisten Monitoring-Tools für das Verfügbarkeits-Monitoring, einschließlich Monitoring-Tools für Infrastruktur-Monitoring und -Management sowie Monitoring-Tools für das Web-Performance-Monitoring.
- Monitoring-Tools für die Analyse: Diese Art von IT-Monitoring-Tool dient dem Zweck, Beobachtungsdaten zu erfassen und weiter zu analysieren. Durch die weitere Analyse dieser Daten kann festgestellt werden, wo Probleme ihren Ursprung haben, und, was noch wichtiger ist, eventuell herausgefunden werden, warum die Probleme auftreten. Fortschrittliche Analyse-Tools, wie z. B. AIOps-Systeme, haben die Aufgabe, auf der Grundlage historischer Trends und Muster zu prognostizieren, wo Probleme wahrscheinlich auftreten werden.
- Monitoring-Tools zur Maßnahmenergreifung: Als IT-Monitoring-Tools dieser letzten Kategorie sind Monitoring Tools zur Maßnahmenergreifung (sogenannte Engagement Tools) darauf ausgelegt, auf Informationen zu reagieren, die sowohl von Analyse- als auch Beobachtungstools erzeugt wurden. Die Reaktion kann dabei ganz einfache Formen annehmen, wie beispielsweise im Fall von Service-Tickets oder Benachrichtigungen, die intelligent an den entsprechenden Analysten oder Business Manager weitergeleitet werden. Häufiger sieht der Eingriff jedoch so aus, dass ein zusätzlicher IT-Monitoring-Service gestartet, Fehler verursachende Hardware oder Software neu gestartet oder Backups ausgeführt werden.
Wie arbeiten IT-Monitoring und Management zusammen?
IT-Monitoring-Tools liefern die Informationen, auf die Führungskräfte und das Mangement reagieren können. IT-Monitoring hat Relevanz für die Geschäftsleitung, da dabei Performance-Informationen erfasst und bereitgestellt werden, die dann in taktische und wirtschaftliche Entscheidungsprozesse einfließen können.
Die von IT-Monitoring-Tools bereitgestellten Informationen ermöglichen Business-Managern, tiefere Einblicke in die Auswirkungen der IT-Infrastruktur auf Umsatz und Geschäftsergebnis zu erhalten. Eine mit Hilfe von Monitoring-Tools dokumentierte Ausfallzeit von 0,11 % bedeutet 11 Minuten Nichtverfügbarkeit pro Woche. Während der Hauptgeschäftszeiten können 11 Minuten, in denen das System keine Zahlungen verarbeiten kann, erhebliche Kosten verursachen. Wie verhält sich das im Vergleich zu den Kosten für den Austausch einer Speicherkarte im Server oder die Aufrüstung des Netzwerks, mit denen diese Ausfallzeit vermieden werden kann? Oder gibt es einen Prozessfehler, der behoben werden sollte, um das Problem zu lösen? Nehmen die Ausfallzeiten zu, schließt ein erfahrener Manager eventuell daraus, dass noch größere Probleme bevorstehen, und nutzt dann die Daten aus dem IT-Monitoring, um den Austausch oder die Aufrüstung der vorhandenen Hardware zu rechtfertigen.
Wie funktioniert IT-Monitoring im Bereich DevOps?
IT-Monitoring besitzt inzwischen eine enorme Bedeutung und spielt eine zunehmend wichtige Rolle im Bereich DevOps. Dies liegt hauptsächlich daran, dass es bei DevOps um die Zusammenarbeit zwischen mehreren Teams geht, insbesondere zwischen Entwicklungs- und Operations-Teams. Doch immer öfter haben Unternehmen festgestellt, dass es noch größere Vorteile bringt, wenn andere Abteilungen in diese Kombination einbezogen werden. Hier sind beispielsweise Security- und QA/Testing-Teams zu nennen. Nur wenn alle diese Gruppen wirklich als Team zusammenarbeiten, kann eine Software oder ein Service erfolgreich auf den Markt gebracht werden.
IT-Monitoring ist eine natürliche Ergänzung dieses Konzepts und besonders für Produkte relevant ist, bei denen hohe Verfügbarkeit zählt, wie z. B. ein Cloud-basierter Service oder eine App, die auf die API Ihres Unternehmens angewiesen ist. Wenn solche Services langsam werden oder ganz ausfallen, kann die Kundenzufriedenheit und möglicherweise auch der Umsatz darunter leiden. Es ist daher für DevOps-Teams von entscheidender Bedeutung, dafür zu sorgen, dass kritische Systeme betriebsbereit und verfügbar bleiben, und diese Performance-Messungen von Anfang an direkt in den Entwicklungsprozess einzubauen.
Eine weitere Schnittmenge von DevOps und IT-Monitoring ist die zunehmende Geschwindigkeit von Produktaktualisierungen, da Anwendungen manchmal mehrmals am Tag aktualisiert werden. Monitoring ist in solchen Umgebungen unerlässlich, da das rasante Entwicklungstempo oft nur wenig Zeit für die Qualitätssicherung lässt, bevor ein neues Update live geschaltet wird. In manchen Fällen gelangt so ein unentdeckter Fehler in das Produktionssystem und kann dazu führen, dass ein wichtiges System zu langsam wird oder ganz abstürzt. Ist eine solide Lösung für IT-Monitoring in Echtzeit implementiert, können solche Fehler oftmals in Sekundenschnelle erkannt werden. Dadurch sind DevOps-Teams in der Lage, ein Problem sofort zu beheben oder den Code auf einen bekannten, fehlerfreien Zustand zurückzusetzen, um Ausfallzeiten zu minimieren.
In der Welt von DevOps ist das IT-Monitoring allerdings auch zukunftsorientiert. IT-Monitoring-Systeme im Bereich DevOps können genutzt werden, um genau die Tools zu überwachen, die Entwickler bei ihrer eigenen Arbeit verwenden. So können Führungskräfte Bereiche erkennen, die ineffizient sind oder von einer Automatisierung profitieren könnten.
IT-Monitoring ist ein zunehmend wichtiger Bestandteil von DevOps, da DevOps die Zusammenarbeit mehrerer Teams erfordert.
In welcher Beziehung stehen IT-Monitoring und Automatisierung?
Im Bereich Automatisierung erfolgt IT-Monitoring hauptsächlich durch Maßnahme-Tools. Wie bereits erwähnt, kann die Automatisierung in Form von automatisierten Service-Tickets oder Benachrichtigungen erfolgen. Es kann aber auch eine komplexe Abfolge von Aktionen durchgeführt werden, die ein vom Monitoring-Tool erkanntes Problem ohne menschliches Zutun beheben. Je komplexer die Infrastruktur ist, desto notwendiger wird die Automatisierung. Selbst in Unternehmen von bescheidener Größe gibt es schlicht zu viele bewegliche Teile, als dass sie von Menschen verwaltet werden könnten. Und bei hybriden Systemen, die Cloud-basierte und lokale Netzwerke kombinieren, ist dies sogar noch komplizierter.
IT-Monitoring-Tools mit integrierten Automatisierungsfunktionen wurden dafür entwickelt, all dies zu erleichtern. Wenn ein Server als Reaktion auf einen plötzlichen Anstieg der Kundenaktivität langsamer wird, kann das Monitoring Tool bzw. die Monitoring Software das Problem als überlastete CPU diagnostizieren und automatisch einen anderen Server (real oder virtuell) anweisen, zu übernehmen. Nimmt der Netzwerkverkehr dann ab, kann das jeweilige Monitoring Tool entscheiden, den zweiten Server wieder herunterzufahren. Außerdem hat das Monitoring-Tool die Möglichkeit, einen Bericht über die Kernursache des IT Vorfalls zu erstellen, damit das Management entscheiden kann, ob ein Upgrade notwendig ist.
Analysten nutzen IT-Monitoring-Tools und IT-Monitoring-Software auf unterschiedlichste Weise. Dementsprechend existieren keine festgeschriebenen Regeln dafür, wie solche System Monitoring Tools genau eingesetzt werden sollten. Im Großen und Ganzen verwenden Analysten die verschiedenen IT-Monitoring-Tools, um ein ganzes Spektrum kritischer Funktionen auszuführen, wie z.B.:
- Monitoring und Troubleshooting physischer und virtueller Infrastrukturknoten, einschließlich Server, Netzwerkhardware und Cloud-basierte Systeme, damit Probleme schnell behoben werden können
- Monitoring in Echtzeit laufender Anwendungen, um die Uptime sicherzustellen und die Entwicklung in einer DevOps-Umgebung zu beschleunigen
- Verbessern des IT-Entscheidungsprozesses durch einfachere Identifizierung von Engpässen, exzessiven Bandbreitennutzern und anderen potenziellen Problemkreisen in der Netzwerkumgebung
- Steigern der Transparenz bei Cloud-basierten Systemen und Integration von Monitoring bei lokalen Systemen
- Prognostizieren und Analysieren der Auswirkungen von IT-Abläufen auf das Geschäft – finanzielle Auswirkungen eingeschlossen
- Automatisieren des Incident Managements, um die Notwendigkeit für menschliche Überwachung zu reduzieren, Probleme schnell zu beheben und Over-Alerting zu vermeiden
- Verfolgen des Endbenutzerverhaltens innerhalb einer Anwendung, um Verbesserungsmöglichkeiten zu erkennen
Die folgende Anleitung beschreibt den schrittweisen Einstieg und Implementierung von Monitoring-Tools zur Umsetzung einer eigenen IT-Monitoring-Strategie:
- Definieren Sie Ihre Ziele: Möchten Sie nur benachrichtigt werden, wenn ein einzelner Server ausfällt, oder müssen Sie eine hybride Umgebung mit lokaler Hardware und Cloud-Services überwachen? Möchten Sie Ihr Monitoring-Tool mit anderen Services integrieren? Möchten Sie Transparenz bei bestimmten Performance-Daten erreichen? Möchten Sie Machine Learning-Technologie nutzen, um Korrekturmaßnahmen zu automatisieren? Die Antworten auf diese Fragen haben einen großen Einfluss auf die Komplexität der Monitoring-Tools, die Sie in Betracht ziehen sollten.
- Holen Sie die Geschäftsleitung ins Boot: In Verbindung mit Schritt 1 sollten Sie Personen außerhalb der IT-Abteilung einbeziehen, um auch ihre Ziele für ein effektives IT-Monitoring in Erfahrung zu bringen und sich ihre Unterstützung zu sichern. Konsolidieren Sie diese Anforderungen mit den Monitoring-Zielen der IT-Abteilung in einer Liste mit Zielen.
- Identifizieren Sie wichtige Funktionen, die Sie benötigen: Die meisten Monitoring-Tools bieten grundlegende Funktionen wie Reporting und Dashboards, variieren jedoch in Entwicklungsstand und Komplexität. Wenn Sie besonderen Wert auf Datenspeicherung legen oder auf Machine Learning (ML) gestützte Echtzeiterkenntnisse benötigen, tragen diese Arten von Funktionen ebenfalls dazu bei, die Auswahl der geeigneten Lösungen einzugrenzen.
- Identifizieren Sie Datenquellen, die genutzt werden können: Diese Datenquellen können von servlogs über Maschinendaten bis hin zu Datenquellen von Drittanbietern reichen. Ganz gleich, was Sie überwachen möchten, es sollte mindestens eine relevante Datenquelle geben, die damit in Zusammenhang steht. Listen Sie alle diese Quellen auf, damit Sie sicherstellen können, dass die Monitoring Tools bzw. die Monitoring Software, die Sie in Betracht ziehen, die gewünschten Informationen auch unterstützen.
- Beurteilen Sie die potenziellen Tools mithilfe von Tests: Wenn Sie alle diese Informationen zusammengetragen haben, müssen Sie nicht gleich das erstbeste IT-Monitoring-Tool kaufen, das geeignet scheint. Die meisten Monitoring Tools können getestet werden, sodass Sie vor der Kaufentscheidung prüfen können, wie gut sie in Ihrer Umgebung funktionieren. Dies gilt ganz besonders für Monitoring Tools und Monitoring Software, die als IT-Monitoring-Services auf Abonnementbasis angeboten werden.
Was sind Best Practices für das IT-Monitoring?
Genauso wichtig wie die Auswahl des Monitoring-Tools ist die Art und Weise, wie Sie es einsetzen. Zu einigen Best Practices, die es sich zu beachten lohnt, zählen der clevere Umgang mit Warnmeldungen, die Berücksichtigung der Dringlichkeit und des Mediums für Benachrichtigungen, die Optimierung von Dashboards, die Erstellung eines Eskalationsplans, Redundanz und die Überwachung von Ausreißern.
- Cleverer Umgang mit Warnmeldungen: Ein Übermaß an Benachrichtigungen und Warnmeldungen führt schnell zu „Over-Alerting“. Schlimmer noch dazu, dass Warnmeldungen ignoriert werden. Besser ist eine Benachrichtigungslogik, die wirklich nur dann ausgelöst wird, wenn menschliches Eingreifen notwendig ist.
- Berücksichtigung der Dringlichkeit von Benachrichtigungen: Warnungen zu einfachen Abstürzen oder kurzen Ausfallzeiten können an Low-Level-Analysten weitergeleitet werden, schwerwiegendere Probleme müssen jedoch schnell an Führungskräfte eskaliert werden. Weisen Sie Problemen eine Dringlichkeit zu, um diese Kategorisierung und Eskalation zu erleichtern.
- Berücksichtigung des Mediums: Wann ist eine Benachrichtigung per E-Mail akzeptabel und wann muss eine SMS oder eine andere mobile Benachrichtigung verwendet werden? Denken Sie daran, dass zu viele SMS-Nachrichten schnell zu Over-Alerting und ignorierten Benachrichtigungen führen können.
- Optimieren von Dashboards: Das Dashboard ist der Ort, an dem die meisten Analysten den größten Teil ihres Arbeitstages verbringen. Es lohnt sich daher, einen gewissen Aufwand zu betreiben, um sicherzustellen, dass das Dashboard die wichtigsten Informationen in den Vordergrund stellt und leicht auf sekundäre Informationen zugegriffen werden kann.
- Erstellen eines vom Benachrichtigungssystem getrennten Eskalationsplans: Selbst wenn ihr Benachrichtigungssystem über einfache Eskalationsroutinen verfügt, kann ein scheinbar simples Problem mit einem Server schnell zu einem großen Problem eskalieren. Eventuell meldet Ihr IT-Monitoring-Tool beispielsweise nur, dass ein nicht Offsite-Server offline ist, ohne zu wissen, dass ein Wirbelsturm der Stärke 5 auf das Rechenzentrum zurollt. Dies sind Probleme mit ganz unterschiedlicher Tragweite, die ganz unterschiedliche Antworten erfordern.
- Redundanz ist gut: Vermeiden Sie es möglichst, sich beim IT-Monitoring des Zustands eines bestimmten Knotens auf eine einzige Datenquelle zu verlassen. Wenn Ihr Monitoring-Tool den Zugriff auf ein Serverprotokoll verliert, kann das bedeuten, dass der Server ausgefallen ist oder dass ein Netzwerkkabel durchtrennt wurde. Sie können die tatsächliche Ursache nur ermitteln, wenn Sie über eine zweite Datenquelle verfügen, die den Netzwerkverkehr überwachen kann. Dies kann dazu beitragen, diese Art von Problemen schneller zu beheben.
- Überwachen von Ausreißern: Eine durchschnittliche Webseiten-Antwortzeit von 0,3 Sekunden ist großartig, solange das nicht bedeutet, dass ein kleiner Prozentsatz Ihrer Benutzer tatsächlich Antwortzeiten von 30 Sekunden oder mehr erlebt, und dies nicht erfasst wird. Eine intelligente Monitoring-Strategie muss alle Daten berücksichtigen, nicht nur Mittelwerte. Bei der Fehlerbehebung müssen zudem oft die spezifischen Variablen betrachtet werden, die bei einem kleinen Teil der Endbenutzer Probleme verursachen könnten.
Beim IT-Monitoring geht es nicht nur darum, einen Techniker zu benachrichtigen, wenn ein Server abstürzt. Vielmehr geht es darum, solche Probleme im Voraus intelligent vorherzusagen. Immer häufiger werden Netzwerk-Monitoring-Tools und IT-Monitoring-Software auch dazu eingesetzt, um Reaktionen zu automatisieren. Damit solche Probleme behoben werden, bevor sie sich auf Benutzer auswirken können.
Da IT-Infrastrukturen immer komplexer werden, müssen IT-Manager unbedingt Systeme implementieren, durch die sie Schritt halten können. Durch die formale Integration von IT-Monitoring in Ihr gesamtes Ökosystem können Sie operative Prozesse im Hinblick auf zahlreiche Metriken dramatisch verbessern – von der einfachen Serviceverfügbarkeit bis hin zur Sicherstellung einer hohen Performance und der Gesamtrentabilität des Unternehmens.
Prognosen zu IT & Observability
Gibt es etwas besseres als Überraschungen? Ja, nämlich auf alles vorbereitet zu sein. Unsere Experten verraten, wie das geht - in ihren Prognosen zu den wichtigsten Trends des kommenden Jahres.