Dans notre monde axé sur les services, les entreprises doivent offrir la meilleure expérience utilisateur possible. Un service de qualité permet à la fois de fidéliser vos clients à long terme et d’élargir votre clientèle. Pour garder le contrôle sur les performances du service, vous allez vous appuyer sur plusieurs indicateurs et signaux clés.
Les accords de niveau de service (SLA), les objectifs de niveau de service (SLO) et les indicateurs de niveau de service (SLI) sont des mesures qui s’appliquent aux produits et services promis par les entreprises. Elles décrivent les critères retenus pour évaluer les progrès réalisés dans la poursuite des objectifs de performance et de qualité.
Dans cet article, nous explorerons les différences entre SLA, SLO et SLI, ainsi que les défis et les bonnes pratiques liées à leur mise en œuvre dans votre organisation.
Un accord de niveau de service (SLA) est un accord entre un fournisseur de services et ses clients. Il repose sur des engagements de service spécifiques, tels que le délai de résolution des dossiers clients, la disponibilité du service et la réactivité du site web. Chaque SLA est une « promesse » spécifique faite au client : tous les SLA ne sont pas identiques.
Les SLA peuvent varier considérablement selon le secteur et le fournisseur de services. Les équipes commerciales ou juridiques du service préparent généralement des SLA pour les services payants de l’entreprise, et ils y font figurer les éléments clés suivants :
Les SLA sont rédigés par l’équipe commerciale ou juridique d’une entreprise. Elles doivent impérativement collaborer avec les équipes techniques pour éviter toute lacune technique dans leur définition.
Un objectif de niveau de service (SLO) décrit ce que le service s’engage à fournir à ses utilisateurs concernant des mesures spécifiques. Ces mesures incluent généralement les métriques suivantes :
Si on les compare aux SLA, les SLO définissent une valeur spécifique pour chacune de ces promesses. Un SLA est un accord formel établi par un fournisseur de services pour la performance ou la qualité d’un service. Les SLO, quant à eux, sont des objectifs clairs que le fournisseur définit en interne pour évaluer si les SLA sont respectés.
À titre d’exemple, voici un extrait des SLO fournis par AWS pour une instance EC2 individuelle.
Les indicateurs de niveau de service (SLI) sont les indicateurs clés qui mesurent les performances du service. Ils permettent d’évaluer si l’entreprise a atteint les SLO définis.
Par rapport aux SLA, les SLI correspondent à des valeurs réelles ou historiques. Si ces valeurs sont inférieures aux SLO définis, le service présente un problème. Vous pouvez donc optimiser le service pour respecter le SLO ou ajuster le SLO pour plus de valeur.
Par exemple, dans l’exemple précédent concernant AWS EC2, le SLO est inférieur à 99,5 % mais égal ou supérieur à 99,0 % ; le SLI décrira la disponibilité réelle du service – 99,26 %, par exemple.
Le tableau suivant résume les principales différences entre SLA, SLO et SLI.
SLA |
SLO |
SLI |
|
Objectif |
Accords conclus avec les clients lors des engagements de service |
Objectifs internes que le service vise à fournir aux clients. Servent de référence pour mesurer les performances |
Valeurs réelles des performances du service selon les critères des SLO |
Quand l’utiliser |
Convient aux services payants |
Services gratuits et payants |
Obligatoire si des SLO sont définis pour mesurer les performances |
Centre d’intérêt |
Portée, mesures, conséquences juridiques et financières |
Objectif spécifique visant à respecter les SLA |
Données réelles visant à évaluer les performances |
Exemples |
Pourcentage de disponibilité, temps de résolution |
Temps de réponse inférieur ou égal à 300 ms, taux d’erreur inférieur à 2 % |
Temps moyen de réponse = 250,1 ms Pourcentage de disponibilité = 98,9 % |
Flexibilité |
Moins flexible, car toute modification doit faire l’objet d’un accord entre les prestataires de services, les équipes juridiques et les clients |
Plus flexibles que les SLA. Peuvent être mis à jour en fonction des exigences des technologies et des services. |
Plus flexibles que les SLO. Peuvent être adaptés en fonction d’une évolution dans les exigences de performance. |
Bien que chacune de ces « métriques » puisse s’appliquer à différents types d’entreprises et de services, vous les retrouverez principalement dans le contexte de l’ingénierie de fiabilité de site (SRE). Dans la mesure où la performance SRE repose sur la disponibilité, les SLI, SLO et SLA sont des outils essentiels pour les SRE qui cherchent à quantifier la fiabilité des performances d’un système au fil du temps.
Dans tous les cas, la collecte et l’exploitation de ces métriques ne sont pas sans difficulté pour les organisations.
Examinons les défis que vous pourriez rencontrer avec chacune de ces mesures :
Un manque de collaboration entre les équipes juridiques et techniques peut conduire à des SLA irréalistes
Les SLA sont créés et définis par les équipes juridiques ou commerciales d’une entreprise, qui ne disposent généralement pas d’une riche expérience technique. Cela peut conduire à des SLA irréalistes et difficiles à atteindre.
Supposons qu’une équipe juridique définisse une disponibilité de 99,999 %. Cette valeur reflète uniquement la perception qu’a l’équipe juridique de la haute disponibilité, en négligeant les défis qui peuvent empêcher d’y parvenir comme les problèmes de logiciels, de matériel ou de réseau, la dépendance vis-à-vis de services tiers, etc.
Les SLA doivent être actualisés en fonction de l’évolution des besoins des clients et des technologies
L’évolution rapide des technologies peut être difficile à suivre avec les ressources disponibles et les contraintes budgétaires du fournisseur de services. Il en va de même pour les besoins des clients, qui évoluent et imposent constamment des ajustements et des renégociations.
Coûts
Les entreprises doivent investir dans des ressources humaines et de nouvelles technologies pour respecter les SLA comme prévu. Cela peut entraîner des coûts supplémentaires.
Trouver le juste milieu entre complexité et simplicité
Certains SLO peuvent être trop complexes à mesurer. S’ils ne sont pas correctement définis au départ, les équipes vont perdre du temps à comprendre comment les atteindre. À l’inverse, des SLO faciles à respecter ne permettront pas de répondre aux attentes des clients. Tout l’art consiste donc à définir des SLO équilibrés.
Sélectionner le bon ensemble de métriques
Si vous ne choisissiez pas des indicateurs en phase avec l’objectif commercial et les attentes des clients, les SLO ne refléteront pas la promesse de l’entreprise.
Difficultés liées aux dépendances externes
Les services dépendent souvent de composants ou de services tiers. Une défaillance de ces dépendances externes peut affecter la conformité de SLO du service, même si les composants internes fonctionnent parfaitement.
Excès de métriques
Une quantité excessive de métriques va compliquer la tâche des équipes sans avoir de réel effet sur l’utilisateur.
Certaines métriques peuvent être difficiles à mesurer
Certains indicateurs de performances peuvent être difficiles à mesurer avec précision. L’engagement des utilisateurs, la latence des applications en temps réel et la satisfaction globale des utilisateurs, notamment, ne se mesurent pas facilement.
Il peut être difficile d’obtenir des valeurs précises
Il est important de mesurer correctement chaque métrique SLO. Pour y parvenir, il faudra mettre en place des stratégies de test et de supervision précises et fiables.
Malgré ces défis, les SLA, SLI et SLO sont incroyablement utiles pour fournir un service ou un produit de qualité. Ces quelques bonnes pratiques vous aideront à tirer le meilleur parti de ces métriques :
Pour résumer, les SLA sont les accords globaux qui décrivent les promesses faites par les fournisseurs à leurs clients, tandis que les SLO sont les objectifs définis en interne pour tenir ces promesses, et les SLI, les valeurs qui permettent de mesurer les performances réelles du service.
Comme pour la plupart des concepts techniques ou métiers, les bonnes pratiques vous permettront de relever les défis couramment associés aux SLA, SLO et SLI. En utilisant efficacement ces outils, vous aiderez votre entreprise à offrir le service le plus fiable et le plus utile possible.
Cette publication ne représente pas nécessairement la position, les stratégies ou l’opinion de Splunk.
*This article has been translated and edited. The original post was written by Shanika Wickramasinghe and can be found here.
La plateforme Splunk élimine les obstacles qui séparent les données de l'action, pour donner aux équipes d'observabilité, d'IT et de sécurité les moyens de préserver la sécurité, la résilience et le pouvoir d'innovation de leur organisation.
Fondée en 2003, Splunk est une entreprise internationale. Ses plus de 7 500 employés, les Splunkers, ont déjà obtenu plus de 1 020 brevets à ce jour, et ses solutions sont disponibles dans 21 régions du monde. Ouverte et extensible, la plateforme de données Splunk prend en charge les données de tous les environnements pour donner à toutes les équipes d'une entreprise une visibilité complète et contextualisée sur l'ensemble des interactions et des processus métier. Splunk, une base solide pour vos données.