Das Konzept ist keineswegs neu. Aber in letzter Zeit hat Observability deutlich Fahrt aufgenommen. Das liegt vor allem daran, dass die Pandemie die Cloud-Migration noch einmal beschleunigt hat. Und mit mehr Clouds kam noch mehr Komplexität. Denn moderne Cloud-Architekturen sind überwiegend (hybride) Multi-Clouds, die mit klassischen Monitoring-Mitteln kaum zu durchschauen sind. Entsprechend groß ist nun das Interesse an Observability-Lösungen.
Was erhoffen sich die Unternehmen davon? Was erreichen sie tatsächlich damit? Und wohin geht die weitere Observability-Reise? Diesen Fragen sind wir gemeinsam mit der Enterprise Strategy Group in unserem Lagebericht Observability 2022 nachgegangen. 1250 Praktiker, Fachleute und Führungskräfte weltweit haben uns dazu Auskunft gegeben. Das Ergebnis in Kurzversion: Observability ist heute eindeutig erfolgsentscheidend – das lässt sich mit messbaren Ergebnissen belegen: Darunter bessere Visibilität, kürzere MTTD (Mean Time to Detect), aber auch mehr Produkt-Launches, eine erfolgreichere digitale Transformation und einfacheres Recruiting von Top-Talenten. Und im internationalen Vergleich stehen deutsche Unternehmen gar nicht schlecht da.
Dass das Thema Observability im deutschsprachigen Raum immer mehr an Fahrt aufnimmt, beobachtet auch Michael Friedrich, Observability-Experte und Gründer von o11y.love: „Der Trend von traditionellem Monitoring hin zu Observability mit Metriken, Tracing, Logs und mehr setzt sich fort. Neben den Leadern erkennen auch Einsteiger im Bereich Dev, Ops, DevOps und SRE den Mehrwert von Observability.” Außerdem führt er aus: „Observability ist Teil von produktiven Workflows, und läuft nicht mehr nur ‘am Ende’ mit – unterstützt von neuen Technologien wie Auto-Instrumentation in OpenTelemetry und eBPF sowie der Einfachheit von cloud-nativen Workloads und Plattformen. Der Einstieg in die Welt von Observability kann überwältigend sein – hier helfen viele neue Vorträge, Artikel und Dokumentationen, die im letzten Jahr entstanden sind oder noch kommen werden – z. B. auf der KubeCon EU.”
Klar ist, dass die Komplexität heutiger Clouds der Observability-Treiber Nr. 1 ist. Hybride Multi-Clouds, in denen moderne Apps mit Microservices und Containern laufen, kann klassisches Monitoring schlicht nicht mehr durchschauen. Die direkten Folgen sind unerkannte Fehler, lange Ausfallzeiten und umständliche Abläufe. Und: Personal zu finden, wird oft ein Ding der Unmöglichkeit. Kein Wunder, wer will schon einen Job übernehmen, bei dem Scheitern quasi vorprogrammiert ist, weil es am richtigen Werkzeug fehlt und der Anteil ärgerlicher Handarbeit unnötig groß ist? Qualifizierte Monitoring-Fachkräfte zu finden, bereitet prompt ganzen 95% der Befragten Schwierigkeiten, die Not schlägt aber bis in die Entwicklerteams durch. Die Folgen sind u. a. verzögerte (81 %) oder gescheiterte Projekte und Planungen (71 %) sowie direkte Kündigungen wegen Burn-out (69 %).
Die gute Nachricht ist, dass sich die Wirtschaft ganz gut im Klaren ist, was dagegen helfen kann: ein optimierter Einsatz der vorhandenen Personalressourcen im Verein mit Fortbildungen und KI/ML-basierten Automatisierungslösungen. Fragt man nach den Gründen für die derzeitige Observability-Praxis, so steht fast ganz obenan – gleich nach der besseren Performance bzw. User Experience –: Observability zieht Fachkräfte an. In ihrer Offenherzigkeit hat uns diese Erkenntnis doch erstaunt. Tatsächlich liegt die Logik auf der Hand: Die besten Leute arbeiten am liebsten dort, wo sie gute Arbeit leisten können und dabei auch gleich noch etwas für die eigene Karriere tun.
Bei den Empfehlungen, die der Lagebericht gibt, haben wir diesen Punkt näher betrachtet. So ist es in jedem Fall ratsam, einen Talentpool anzulegen. Ebenso kann man den Bedarf an Fachkräften trennschärfer formulieren – zur Einrichtung von Observability-Praktiken braucht es z. B. andere Leute als anschließend für den laufenden Monitoring-Betrieb. Diese strategischen Praxistipps findet ihr im Report ab S. 24.
Dass ausgereifte Observability dem Unternehmen messbare Vorteile bringt, zeigt aufs Schönste der Vergleich der Leader-Gruppe mit den Einsteigern. Hier eine kurze Auswahl mit etwa dem Erfolgsfaktor 2:
Das geht, wenn auch nicht immer so kontrastreich, noch eine Weile so weiter. Von den ganz anspruchsvollen Disziplinen wollen wir der Fairness halber lieber schweigen – etwa wenn es darum geht, Fehler innerhalb von Sekunden zu erkennen. Das können 19 % der Leader-Unternehmen (und praktisch alle Splunker), aber nur 3 % der Einsteiger.
Wie bereits erwähnt stehen deutsche Unternehmen gut da, was ihre Observability-Reife angeht: Die Leader-Quote liegt hierzulande bei 19 % und damit über dem globalen Gesamtdurchschnitt (9 %). Selbst Länder wie die USA (13 %), Frankreich (5 %) oder Großbritannien (2 %) hinken hier hinterher. Einer der Gründe für diesen Reifegrad deutscher Unternehmen ist darin zu sehen, dass sie öfter (46 %) als die Unternehmen anderer Länder (35 %) Daten über ihr gesamtes Observability-Toolset hinweg konsolidieren und korrelieren können. Hier einige weitere Ergebnisse im Detail:
Aber was macht eigentlich die Gruppe der Leader-Unternehmen richtig? Klingt gemein, ist aber so: Die Leader haben schon gestern angefangen. Sie haben schlicht mehr Observability-Erfahrung, bessere Abläufe, ausgereiftere Prozesse – und günstigere Bedingungen. Das kommt daher, dass sie zwar eine Vielzahl von passgenauen Einzeltools haben, aber die Zahl ihrer Observability-Anbieter bereits reduziert. Sie wissen mittlerweile genau, was sie brauchen, achten auf Kompatibilität, verschlanken ihre Beschaffungsprozesse, beschleunigen das Onboarding und profitieren obendrein von niedrigeren Fortbildungskosten. Heißt also: Je weiter man auf dem Weg Richtung Plattformansatz ist, desto besser.
Ein Blick rechts und links dieses Weges zeigt auch, dass die Unternehmen mittlerweile stärker auf CI/CD-Automation setzen (96 %) und sich mit AIOps die Arbeit erleichtern (71 %). Der Unterschied zwischen Einsteigern und Leadern liegt hier weniger im Umfang als im Verwendungszweck: Einsteiger wollen mit AIOps vor allem die MTTD verkürzen und die Fehlerursachenanalyse erleichtern; Leader hingegen setzen KI auch auf die Datenkorrelation an. In beiden Fällen sind die immer gigantischeren Datenmengen der Treiber im Hintergrund. AIOps leistet aber ebenso gute Dienste als Mittel gegen den Fachkräftemangel.
Branchen-führend im Bereiche AIOps sind übrigens die Kommunikations- und Medienunternehmen: 47 % melden eine umfassende Nutzung, allerdings herrschen hier auch oft extrem komplexe Cloud-Architekturen vor, und der Fachkräftemangel ist bei 63 % empfindlich spürbar. Kaum überraschend ist, dass auch Tech-Unternehmen und der Einzelhandel einen gute Werte vorweisen können – den einen liegt die Thematik nahe, die anderen können jede Minute Ausfallzeit sofort auf Twitter nachlesen. Im AIOps-Ländervergleich sind Japan und Indien führend.
Insgesamt hat sich die globale Observability-Lage gegenüber unserer Vorjahresbefragung sichtlich verbessert, die positiven Werte sind unabhängig vom Reifegrad gestiegen – allerdings halten die Leader ihren Vorsprung deutlich. Das Bild, das sich zeigt, ist das einer Umbruchsituation, in der Observability als Notwendigkeit erkannt und akzeptiert ist, sodass für die Einsteiger eine Art Massenstart als Aufholjagd begonnen hat – kein ganz leichtes Unterfangen, aber wenigstens lässt sich durch geschickte Konsolidierung gleich einen Gang höher schalten. Wie gesagt: Je eher ein Plattformansatz in Reichweite rückt, desto besser.
Für die nächste Zeit erwarten wir also eine Phase des Buzzword-Hypes, was Einsteigern die Sache nicht leichter machen wird. Auf den Seiten des Studienreports halten wir uns zwar vornehm zurück, aber hier kann es ruhig gesagt sein: Wer sich bei der Lösungswahl nicht auskennt, nimmt am besten eine, die bewiesen hat, dass sie Observability kann. Ist leicht zu merken und leicht zu finden: Splunk.
Noch sehr viel mehr Infos, Zahlen und Grafiken zu Fragen von Sichtbarkeit, Monitoring und Erfolg in hybriden Multi-Cloud-Welten findet ihr im vollständigen Lagebericht Observability 2022.
Die Splunk-Plattform beseitigt die Hürden zwischen Daten und Handlungen, damit Observability-, IT- und Security-Teams in ihren Unternehmen für Sicherheit, Resilienz und Innovation sorgen können.
Splunk wurde 2003 gegründet und ist ein globales Unternehmen – mit mehr als 7.500 Mitarbeitern, derzeit über 1.020 Patenten und einer Verfügbarkeit in 21 Regionen rund um den Globus. Mit seiner offenen, erweiterbaren Datenplattform, die die gemeinsame Nutzung von Daten in beliebigen Umgebungen unterstützt, bietet Splunk allen Teams im Unternehmen für jede Interaktion und jeden Geschäftsprozess End-to-End-Transparenz mit Kontext. Bauen auch Sie eine starke Datenbasis auf – mit Splunk.