Depuis le début de l’année, l’intelligence artificielle est sur toutes les lèvres. Mais rien de tout cela ne serait possible sans données, et la dynamique d’ouverture engagée depuis quelques années dans ce domaine a largement contribué au développement des outils que nous utilisons aujourd’hui. Les progrès réalisés récemment ne doivent toutefois pas nous faire oublier le chemin qu’il reste à parcourir pour rendre la data encore plus accessible et pertinente.
C’est justement un des points soulevés par les invités de notre podcast Étant Données, qui donne la parole aux acteurs et aux actrices de la data. À l’occasion d’un LinkedIn Live, Laure Lucchesi, ex-directrice d’Etalab, Sébastien Rozanes, Global Chief Data & Analytics Officer de Carrefour, Audrey Raveneau, Chief Data Officer de la Direction Matériel de SNCF Voyageurs, et Maxime Havez, Chief Data Officer de Crédit Mutuel Arkéa ont accepté de revenir sur ce thème d’actualité en répondant aux questions du journaliste Bertrand Lenotre.
En tant qu’ex-directrice d’Etalab, Laure Lucchesi était aux premières loges pour constater les progrès de la France dans le domaine de l’ouverture des données produites par des acteurs publics. Et le pays en a parcouru du chemin dans ce domaine depuis une dizaine d’années, au point de s’imposer comme le leader européen de l’open data !
Il reste toutefois de nombreux freins à lever pour disposer de données fiables et de qualité :
Malgré ces difficultés, Etalab est parvenu à ouvrir des données majeures, notamment en ce qui concerne les transactions immobilières. Bien évidemment, le processus a nécessité de prendre des mesures pour protéger les informations personnelles des utilisateurs, mais il constitue une avancée importante profitant également à de nombreux acteurs privés. La relation avec les réutilisateurs de la data a d’ailleurs été au cœur de cette dynamique.
Toutefois, l’enjeu est aussi de disposer d’une data de qualité, fiable et à jour, et de se doter de référentiels communs afin de synchroniser certaines données critiques ayant une forte valeur économique et sociale. Par exemple, il pourrait être judicieux de s’accorder sur les caractéristiques d’une adresse, pour que tous les acteurs utilisent les mêmes standards. Ce besoin de références communes se fait encore plus sentir dans le domaine de la transition écologique, y compris pour des questions de mesure d’impact. L’Ademe et d’autres acteurs publics produisent déjà des bases de données dans ce secteur, mais il y a encore des progrès à faire.
Enfin, l’État doit tenir son rôle en matière d’investissement et de co-investissement avec les acteurs privés pour créer et entretenir une infrastructure de données dotée d’une gouvernance ouverte et efficace.
La première partie de ce LinkedIn Live a largement été consacrée à l’IA et au machine learning, mais ces avancées technologiques ne représentent que la partie émergée de l’iceberg. Comme l’explique Sébastien Rozanes, « sans une donnée accessible, compréhensible et de qualité, rien n’est possible », et, dans ce contexte, le véritable changement ne peut venir que des métiers.
Pour faire passer le message, le CDAO de Carrefour rappelle régulièrement que la data n’appartient pas aux équipes techniques. Les professionnels de terrain qui produisent l’information disposent en effet d’une meilleure compréhension des enjeux pratiques et sont dès lors les mieux placés pour corriger et critiquer leurs propres données. Toutefois, la tâche est loin d’être facile. Quelle que soit la taille de l’entreprise, les leaders métiers ont souvent du mal à accepter que la gouvernance et la gestion de la data relèvent de leur responsabilité ainsi que de celle de leur équipe.
Pour expliquer ce changement de paradigme, Sébastien Rozanes compare d’ordinaire la donnée à des produits mis en rayon dans un supermarché. Cela signifie que, sauf exception, l’information est ouverte à tous ; les utilisateurs peuvent la voir, connaître sa fonction, sa provenance, évaluer sa qualité, etc. Cela ne signifie pas pour autant que tout le monde peut se l’approprier. Cette analogie est un bon moyen de faire accepter aux différents acteurs qu’il leur appartient de mettre la data à disposition de tous, sans pour autant permettre à tout un chacun de l’utiliser à sa guise.
Les métiers doivent donc non seulement reprendre la main sur les données, mais également en faire un actif partagé entre les différentes entités de l’entreprise. Cette capacité à croiser les informations est en effet essentielle pour en tirer toute la valeur, mais il y a encore du chemin à parcourir pour faire évoluer les mentalités dans ce domaine.
Dans cette ère des données sans précédent, les changements ne semblent donc plus se cantonner aux experts techniques. Ils affectent dorénavant l’ensemble des collaborateurs qui doivent mettre à jour leurs connaissances et adapter leurs pratiques à cette nouvelle réalité. Mais pour tirer toute la valeur des données, il est également important que les entreprises adoptent une approche davantage axée sur le partage et l’ouverture.
Pour répondre aux besoins d’acculturation et de gouvernance de l’entreprise, SNCF Voyageurs a adopté une organisation de type data mesh, dotée d’un ensemble d’outils et de process. Parmi les solutions mises en place, on trouve notamment une plateforme permettant de centraliser les accès et de traiter les données ainsi qu’un data catalog référençant l’ensemble des métadonnées du domaine. Les référents métiers impliqués se voient par ailleurs attribuer des missions data précises.
Grâce à ce système, les différentes filières de la direction Matériel de SNCF Voyageurs sont désormais expertes de leurs données, mais pour que cela fonctionne, il est également important que les collaborateurs soient soutenus. L’équipe d’Audrey Raveneau a donc développé une plateforme facilitant des actions ciblées de transformation des métiers et instauré un accompagnement à la formation par type de poste. Ces initiatives se révèlent essentielles pour identifier, former et animer un réseau de contributeurs data à même de faire évoluer en profondeur la culture de l’entreprise.
Dans ce domaine, Maxime Havez veut aller encore plus loin et instaurer une forme de data altruisme. Les travaux menés par Etalab et d’autres acteurs ont en effet été déterminants pour ouvrir les données publiques, qui sont désormais utilisées par de nombreuses organisations. Mais il est temps pour les entreprises privées de s’engager dans une démarche similaire : mettre des jeux de données agrégées et anonymisées au service du bien commun.
Pour y parvenir, l’approche du CDO de Crédit Mutuel Arkéa consiste à identifier des cas d’usage précis en collaboration directe avec les collectivités. Ces rencontres sont essentielles pour que le secteur public et le privé modifient en profondeur leurs modes de travail et échangent davantage. Cet usage responsable de la data pourrait ainsi encourager l’innovation et permettre de trouver des solutions aux défis d’aujourd’hui.
Vous voulez en savoir plus sur l’avenir de la data ? Visionnez l’intégralité du LinkedIn Live et téléchargez notre e-book hors-série La data du futur : l’ère de la démocratisation.
La plateforme Splunk élimine les obstacles qui séparent les données de l'action, pour donner aux équipes d'observabilité, d'IT et de sécurité les moyens de préserver la sécurité, la résilience et le pouvoir d'innovation de leur organisation.
Fondée en 2003, Splunk est une entreprise internationale. Ses plus de 7 500 employés, les Splunkers, ont déjà obtenu plus de 1 020 brevets à ce jour, et ses solutions sont disponibles dans 21 régions du monde. Ouverte et extensible, la plateforme de données Splunk prend en charge les données de tous les environnements pour donner à toutes les équipes d'une entreprise une visibilité complète et contextualisée sur l'ensemble des interactions et des processus métier. Splunk, une base solide pour vos données.