Rien de plus simple ici, car toutes les données sont disponibles en Open Data sur le site du gouvernement.
➡️ L'Open Data, qu'est ce que c'est ? Ce sont des données produites par des services publics et proposées en libre service pour consultation, mais également libres d'exploitation pour créer de nouveaux produits et services. D’ailleurs, Audrey de Splunk avait fait un épisode de Data Talks à ce sujet.
Pour nos données sur le carburant, vous y trouverez l'historique de prix des carburants pour chaque station sur plusieurs années, ainsi que différentes méthodes pour les récupérer.
De notre côté, nous nous sommes concentrés sur l'API "instantané" qui va nous fournir un aperçu en temps réel des prix des carburants dans chaque station en France.
En se connectant à cette API, un zip contenant les données est téléchargé. Dans cette archive se trouve un fichier au format xml.
Afin d'ingérer les données dans Splunk, Olivier a développé un script Python qui effectue les actions suivantes :
Il ne nous reste plus qu’à planifier l'exécution de notre script chaque matin (pour info, cela se passe dans le fichier de configuration Splunk inputs.conf).
Ce jeu de données instantané contient l'ID et l'adresse de chaque station. Si vous voulez aller plus loin, sachez qu'il est possible de récupérer également le nom des stations. Il ne vous restera plus qu'à créer une “automatic lookup” qui vous ajoutera ensuite automatiquement le nom de station associé à chaque ID.
On commence ici avec l'utilisation de l'application Maps + for Splunk disponible gratuitement sur la Splunkbase qui va nous permettre d'exploiter les coordonnées GPS des différentes stations, et ainsi visualiser sur une carte toutes les données de nos stations.
Très simplement, il suffit que notre requête retourne les coordonnées (latitude et longitude), une icône (l'application utilise Font Awesome, ce qui fournit un vaste choix d'icônes), un code couleur, et une info-bulle à afficher au passage de la souris.
Nous avons utilisé ici les icônes gas-pump et trophy pour représenter la station la moins chère. Nous appliquons ensuite le code couleur suivant : vert si le prix n'augmente pas de plus de 5% par rapport au minimum constaté, orange pour une augmentation entre 5 et 10%, et rouge pour tout ce qui est supérieur à 10% d'augmentation.
Et nous voici avec une carte actualisée chaque jour nous permettant de trouver la station la moins chère proche de chez nous. À nous les économies !
Pour notre second tableau de bord, on ne change pas les bonnes habitudes, et nous utilisons Dashboard Studio pour analyser les prix de l'essence sur toute la France.
Historique de prix, départements/villes les plus ou moins chers, emplacement des stations… les possibilités d'exploitation des données sont grandes. Nous allons essayer d'en sortir quelques chiffres intéressants.
Voici quelques chiffres insolites mais pas toujours réjouissants sur le prix du carburant en France :
Bonus, mon préféré, le chiffre que je trouve le plus fou
***
Cet article est signé Thomas Labetoulle, talentueux Consultant Splunk chez notre partenaire CGI. Depuis 2017, il accompagne ses clients dans la mise en place de Splunk pour exploiter et valoriser leurs données. Thomas est certifié Splunk Admin, et il s’est formé à de nombreux modules comme ITSI, Enterprise Security ou encore Splunk Dashboards Beta.
La plateforme Splunk élimine les obstacles qui séparent les données de l'action, pour donner aux équipes d'observabilité, d'IT et de sécurité les moyens de préserver la sécurité, la résilience et le pouvoir d'innovation de leur organisation.
Fondée en 2003, Splunk est une entreprise internationale. Ses plus de 7 500 employés, les Splunkers, ont déjà obtenu plus de 1 020 brevets à ce jour, et ses solutions sont disponibles dans 21 régions du monde. Ouverte et extensible, la plateforme de données Splunk prend en charge les données de tous les environnements pour donner à toutes les équipes d'une entreprise une visibilité complète et contextualisée sur l'ensemble des interactions et des processus métier. Splunk, une base solide pour vos données.