In unserer serviceorientierten Welt müssen Unternehmen die bestmögliche Benutzererfahrung bieten. Ein hervorragender Service hilft euch, eure Kunden langfristig zu halten und gleichzeitig euren Kundenstamm zu vergrößern. Es gibt einige wichtige Metriken und Signale, mit denen ihr die Serviceleistung m Auge behalten könnt.
Service Level Agreements (SLAs), Service Level Objectives (SLOs) und Service Level Indicators (SLIs) sind Metriken, die Auskunft über die von Unternehmen angebotenen Produkte und Services sowie die Art und Weise geben, in der diese Unternehmen durch Monitoring die Einhaltung ihrer Leistungs- und Qualitätsziele kontrollieren.
In diesem Artikel befassen wir uns mit den Unterschieden zwischen SLAs, SLOs und SLIs und betrachten zudem die Herausforderungen und bewährten Verfahren im Zusammenhang mit ihrer Implementierung in Unternehmen.
Ein Service Level Agreement (SLA) ist eine Vereinbarung zwischen einem Serviceanbieter und seinen Kunden. Das SLA basiert auf spezifischen Serviceverpflichtungen, wie z. B. der Behebungsdauer für Kundentickets, der Serviceverfügbarkeit und der Reaktionsgeschwindigkeit einer Website. Jedes SLA ist ein spezifisches „Versprechen“ an den Kunden, d. h., nicht alle SLAs sind gleich.
SLAs können je nach Branche und Serviceanbieter stark variieren. Die Business- oder Rechtsteams des Serviceanbieters erstellen in der Regel SLAs für bezahlte und verfügbare Services des Unternehmens. Diese SLAs umfassen die folgenden Hauptbestandteile:
SLAs werden vom Business- oder Rechtsteam eines Unternehmens verfasst. Hierbei ist die Zusammenarbeit mit den technischen Teams wichtig, um technische Lücken bei der SLA-Definition zu vermeiden.
Ein Service Level Objective (SLO) ist das, was der Service den Benutzern hinsichtlich bestimmter Messwerte zusagt. Zu diesen Messwerten gehören Metriken wie z. B.:
Im Gegensatz zu SLAs definieren SLOs einen spezifischen Wert für jedes dieser einzelnen Versprechen. Ein SLA ist eine formelle Vereinbarung, die von einem Serviceanbieter hinsichtlich der Leistung oder Qualität eines Service festgelegt wird. SLOs dagegen sind konkrete Ziele, die ihr als Anbieter intern festlegt, um zu bewerten, ob die SLAs eingehalten werden.
Das folgende Beispiel zeigt einen Auszug aus einem SLO von AWS für seine einzelne EC2-Instanz.
Service Level Indicators (SLIs) sind die Schlüsselindikatoren zur Messung der Service-Leistung. SLIs helfen zu beurteilen, ob das Unternehmen die definierten SLOs erreicht hat.
Im Vergleich zu definierten SLAs handelt es sich bei SLIs um die tatsächlichen oder historischen Werte. Liegen die Werte unter den definierten SLOs, gibt es ein Problem mit dem Service. Ihr könnt den Service dann also entweder optimieren, um das SLO zu erreichen, oder den SLO-Wert so anpassen, dass er mehr Spielraum lässt.
Im vorherigen Beispiel zur EC2-Instanz von AWS ist das SLO kleiner als 99,5 %, aber größer oder gleich 99,0 %; der SLI wäre der tatsächliche Messwert der Serviceverfügbarkeit, könnte also beispielsweise bei 99,26 % liegen.
In der folgenden Tabelle haben wir die wichtigsten Unterschiede zwischen SLAs, SLOs und SLIs zusammengefasst.
SLA |
SLO |
SLI |
|
Zweck |
Mit den Kunden vereinbarte Serviceverpflichtungen |
Intern gesetzte Ziele, die der Service den Kunden bieten will. Dienen als Benchmark zur Leistungsbewertung. |
Tatsächliche Werte von SLOs als Maß für die Service-Leistung |
Verwendung |
Geeignet für kostenpflichtige Services |
Sowohl für kostenlose als auch kostenpflichtige Services |
Erforderlich zur Leistungsmessung, wenn SLOs definiert wurden |
Fokus |
Umfang, Metriken, rechtliche und finanzielle Folgen |
Spezifisches Ziel zum Erfüllen der SLAs |
Konkrete Daten zum Beurteilen der Leistung |
Beispiele |
Uptime in Prozent, Verfügbarkeit, Problembehebungsdauer |
Reaktionszeit kleiner gleich 300 ms, Fehlerrate unter 2 % |
Durchschnittliche Reaktionszeit = 250,1 ms Uptime in Prozent = 98,9 % |
Flexibilität |
Geringe Flexibilität, da Änderungen zwischen Serviceanbietern, Rechtsteams und Kunden vereinbart werden müssen |
Flexibler als SLAs. Änderungen aufgrund technologischer und Service-bezogener Anforderungen möglich. |
Flexibler als SLOs. Änderungen aufgrund geänderter Leistungsanforderungen möglich. |
Jede dieser „Metriken“ kann zwar auf verschiedene Arten von Unternehmen und Services angewandt werden, man trifft sie allerdings häufiger im Zusammenhang mit dem Site Reliability Engineering (SRE) an. Da Verfügbarkeit die Voraussetzung für den SRE-Erfolg ist, sind SLIs, SLOs und SLAs wichtige Tools für SREs, die die Zuverlässigkeit eines Systems über die Zeit quantifizieren möchten.
Ganz unabhängig vom Kontext gibt es jedoch einige Herausforderungen bei der effektiven Messung und Anwendung dieser Metriken in einer Organisation.
Sehen wir uns nun einige der Herausforderungen an, mit denen ihr im Zusammenhang mit diesen Metriken möglicherweise konfrontiert werdet:
Mangelnde Zusammenarbeit zwischen Rechts- und Tech-Teams kann zu unrealistischen SLAs führen
SLAs werden von den Rechts- oder Business-Teams eines Unternehmens erstellt und definiert, denen in der Regel der technische Hintergrund für den Service fehlt. Dies kann zur Festlegung unrealistischer SLOs führen, die schwer zu erreichen sind.
Angenommen, ein Rechtsteam definiert die Verfügbarkeit als 99,999 % der Zeit. Dieser Wert entspricht möglicherweise nur der Vorstellung des Rechtsteams von Hochverfügbarkeit und lässt die potenziellen Herausforderungen außer Acht, mit denen ihr beim Erreichen dieses Ziels konfrontiert sein könntet, wie etwa Software-, Hardware- und Netzwerkausfälle sowie Abhängigkeiten von Drittanbieter-Services.
Anpassung der SLAs an geänderte Kundenanforderungen und technologische Entwicklungen
Aufgrund der rasanten Entwicklung von Technologien kann es schwierig sein, mit den verfügbaren Ressourcen des Serviceanbieters und den Budgetzwängen mit solch drastischen Veränderungen Schritt zu halten. Das Gleiche gilt für sich ändernde Kundenanforderungen, die ständige Anpassungen und Neuverhandlungen notwendig machen.
Kosten
Unternehmen müssen in Personal und neue Technologien investieren, um die SLAs wie geplant zu erfüllen. Dadurch könnten Zusatzkosten entstehen.
Das richtige Gleichgewicht zwischen Komplexität und Einfachheit finden
SLOs können manchmal zu kompliziert sein, um sie zu messen. Wenn sie nicht von Anfang an klar definiert sind, kostet es Teams viel Zeit herauszufinden, wie die Ziele erreicht werden können. Leicht zu erreichende SLOs tragen dagegen nicht dazu bei, die gewünschten Kundenerwartungen zufrieden zu stellen. Es kann daher schwierig sein, ausgewogene SLOs zu definieren.
Auswahl der richtigen Metriken
Nehmen wir an, ihr wählt Metriken aus, die nicht zum Geschäftsziel und den Kundenerwartungen des Unternehmens passen. In diesem Fall spiegeln diese SLOs nicht das wider, was das Unternehmen seinen Kunden verspricht.
Berücksichtigen externer Abhängigkeiten kann schwierig sein
Services hängen häufig von Komponenten oder Services von Drittanbietern ab. Gibt es Ausfälle bei diesen externen Abhängigkeiten, kann die SLO-Erfüllung des Service beeinträchtigt werden, selbst wenn die internen Komponenten perfekt funktionieren.
Zu viele Metriken
Zu viele Metriken können alles verkomplizieren, machen aber für den Benutzer kaum einen Unterschied.
Manche Metriken sind schwierig zu messen
Manche Leistungsmetriken lassen sich nur schwer genau messen. So kann es beispielsweise schwierig sein, das Benutzerengagement, die Latenz bei Echtzeitanwendungen und die allgemeine Benutzerzufriedenheit zu messen.
Es kann schwierig sein, die Werte genau zu messen
Es ist wichtig, die Leistung der einzelnen SLO-Metriken korrekt zu messen. Ihr benötigt genaue und zuverlässige Test- und Monitoring-Strategien.
Auch wenn sie Herausforderungen mit sich bringen können, sind SLAs, SLIs und SLOs bei der Bereitstellung von Services oder Produkten unglaublich wertvoll. Mit den folgenden bewährten Methoden setzt ihr diese Kennzahlen optimal ein:
Kurz zusammenfasst, sind SLAs die allgemeinen Vereinbarungen zwischen Anbietern, SLOs sind die konkreten Versprechen, die die Services den Kunden geben, und SLIs sind die tatsächlichen Werte, die zur Leistungsmessung herangezogen werden.
Wie bei den meisten Unternehmens- oder IT-Konzepten lassen sich typische Herausforderungen bei SLAs, SLOs und SLIs durch Befolgen bewährter Methoden meistern. Wenn ihr diese Metrik effizient nutzt, könnt ihr sicherstellen, dass euer Unternehmen einen möglichst zuverlässigen und nützlichen Service bietet.
Dieser Beitrag spiegelt nicht zwingend die Position, Strategie oder Meinung von Splunk wider.
Dieser Artikel wurde aus dem Englischen übersetzt und editiert. Geschrieben wurde dieser Blog von Shanika Wickramasinghe, Softwareentwicklering spezialisiert auf Web und Mobile. Weitere Artikel von ihr, könnt ihr auch auf Medium finden.
Die Splunk-Plattform beseitigt die Hürden zwischen Daten und Handlungen, damit Observability-, IT- und Security-Teams in ihren Unternehmen für Sicherheit, Resilienz und Innovation sorgen können.
Splunk wurde 2003 gegründet und ist ein globales Unternehmen – mit mehr als 7.500 Mitarbeitern, derzeit über 1.020 Patenten und einer Verfügbarkeit in 21 Regionen rund um den Globus. Mit seiner offenen, erweiterbaren Datenplattform, die die gemeinsame Nutzung von Daten in beliebigen Umgebungen unterstützt, bietet Splunk allen Teams im Unternehmen für jede Interaktion und jeden Geschäftsprozess End-to-End-Transparenz mit Kontext. Bauen auch Sie eine starke Datenbasis auf – mit Splunk.