La modélisation prédictive consiste à utiliser des résultats connus pour créer un modèle statistique exploitable à des fins d’analyse prédictive ou pour prévoir les comportements futurs. Cet outil entre dans le cadre de l’analyse prédictive, un domaine de l’exploration de données qui tente de répondre à la question : « Qu’est-ce qu’il est susceptible de se passer ensuite ? »
La numérisation a créé d’énormes volumes de données en temps réel dans tous les secteurs ou presque. Les données historiques peuvent être analysées afin de prévoir différents types d’événements futurs : risques financiers, défaillances mécaniques, comportement des clients et autres résultats. Cependant, les données produites par les produits numériques sont souvent « non structurées » (autrement dit, non organisées de manière prédéfinie), ce qui les rend trop complexes pour une analyse humaine. Les entreprises utilisent donc des outils de modélisation prédictive qui s’appuient sur des algorithmes de machine learning pour identifier et analyser, dans les données, des modèles qui peuvent suggérer quels événements sont susceptibles de se produire à l’avenir.
Cette fonction de « boule de cristal » s’applique dans toute l’entreprise. La modélisation prédictive sert à rendre les opérations plus efficaces, commercialiser les produits plus rapidement et améliorer les relations avec les clients, entre autres utilités. C’est un outil particulièrement puissant dans l’ITOps et le développement de logiciels, où il peut aider à anticiper les coupures du système, les défaillances d’applications et d’autres types de problèmes.
Splunk IT Service Intelligence (ITSI) est une solution d’AIOps, d’analytique et de gestion IT qui aide les équipes à anticiper les incidents avant qu’ils n’affectent les clients.
ITSI utilise l’IA et le machine learning pour corréler les données collectées auprès de nombreuses sources de supervision et offrir une vue unifiée des services IT et métiers pertinents. La solution a un double avantage : elle réduit les déluges d’alertes et permet la prévention des interruptions de service.
Nous allons voir comment fonctionnent les modèles prédictifs, les différentes techniques de modélisation prédictive et les avantages de l’analyse prédictive. Et nous vous donnerons des conseils pour bien choisir un modèle prédictif pour votre organisation.
Qu’est-ce que l’analyse prédictive ? L’analyse prédictive consiste à appliquer des modèles mathématiques à de grandes quantités de données dans le but d’identifier les modèles de comportements passés et de prédire les résultats futurs. La pratique combine la collecte de données, l’analyse de données, le machine learning et des algorithmes statistiques pour délivrer l’aspect « prédictif ».
L’analyse prédictive n’est qu’une pratique parmi un large éventail d’approches analytiques, dont voici les grandes catégories :
Les outils d’analyse descriptive et diagnostique ont une valeur inestimable quand il s’agit d’aider les data scientists à prendre des décisions factuelles sur les événements actuels, mais ils ne suffisent pas à eux seuls. Les entreprises doivent être en mesure d’anticiper les tendances, les problèmes et d’autres événements pour rester compétitives. L’analyse prédictive s’appuie sur l’analyse descriptive et diagnostique en identifiant des modèles dans les sorties de données et en prévoyant les résultats possibles ainsi que leur probabilité. Les entreprises peuvent ainsi planifier avec plus de précision, éviter ou atténuer les risques, évaluer rapidement les options et prendre globalement des décisions métiers plus sûres.
Dans le secteur du retail, l’analyse prédictive peut prévoir la valeur des clients à long terme. Elle va aussi aider les professionnels de la santé à déterminer le traitement le plus efficace et les enseignants à repérer les élèves qui ont besoin d’un soutien spécifique, pour ne citer que quelques scénarios d’utilisation.
L’analyse prédictive a été particulièrement transformatrice dans l’IT. La complexité accrue de l’architecture, liée à la virtualisation, au cloud, à l’Internet des objets (IoT) et à bien d’autres avancées technologiques, augmente de manière exponentielle le volume de données à interpréter – et donc les retards dans le diagnostic et la résolution des problèmes. Soutenue par le big data et l’intelligence artificielle (IA), l’analyse prédictive surmonte ces difficultés. En identifiant des modèles, elle peut créer des « prédicteurs » axés sur les problèmes de performances, les défaillances de réseau, l’épuisement des capacités, les failles de sécurité et une foule d’autres problèmes d’infrastructure. Grâce à ces prédictions, une organisation peut améliorer ses performances, réduire les temps d’arrêt et accroître globalement la résilience de son infrastructure.
Les modèles d’analyse prédictive exécutent des algorithmes de machine learning sur des ensembles de données pertinentes. La création d’un modèle prédictif est un processus en plusieurs étapes qui commence par la définition d’un objectif métier clair. Souvent formulé comme une question, cet objectif permet de déterminer la portée du projet et le type de modèle de prédiction à utiliser. Il faut ensuite suivre une série d’étapes, qui sont décrites ci-dessous.
La modélisation prédictive est un processus itératif. Une fois qu’un modèle d’apprentissage est créé et déployé, ses performances doivent être supervisées et améliorées. Autrement dit, il doit être continuellement actualisé avec de nouvelles données, entraîné, évalué et géré pour rester à jour.
Il existe plusieurs techniques courantes de modélisation prédictive, que l’on peut classer en deux catégories : analyse de régression et analyse de classification. L’analyse de régression examine une variable dépendante (l’action) et plusieurs variables indépendantes (les résultats) et évalue la force de la relation entre elles. Elle peut être utilisée pour prévoir des tendances, prédire l’impact d’une action particulière ou déterminer si une action et ses résultats sont corrélés. Une fois que vous décidez d’utiliser l’analyse de régression, vous avez le choix entre plusieurs types. Voici les plus courants :
L’analyse de classification trie les données en catégories en vue d’une analyse plus précise. Elle utilise plusieurs techniques mathématiques :
La modélisation prescriptive consiste à analyser des données pour suggérer un plan d’action en temps réel. Elle s’appuie essentiellement sur les informations produites par d’autres modèles d’analyse pour envisager les ressources disponibles, les performances passées et actuelles et les résultats potentiels, afin de proposer la prochaine mesure à prendre. Dans un contexte informatique, par exemple, la modélisation prescriptive peut proposer des améliorations d’infrastructure sur la base des données de surveillance et de maintenance, et même permettre au système de faire lui-même les ajustements nécessaires selon un script préenregistré.
L’analyse prescriptive est une extension de l’analyse prédictive. Si l’analyse prédictive peut vous dire quel problème va probablement se produire, quand et pourquoi, l’analyse prescriptive va plus loin et suggère des actions spécifiques pour le résoudre. Les deux types d’analyses vous permettent de prendre des décisions plus éclairées, mais c’est l’analyse prescriptive qui exploite le mieux vos données en vous permettant d’optimiser les processus et les systèmes à court et à long terme. En savoir plus sur les différences entre analyse prédictive et analyse prescriptive.
Il en existe plusieurs. La plupart sont conçus pour des applications spécifiques, mais certains peuvent être utilisés dans diverses situations :
Plusieurs facteurs doivent être soupesés pour bien choisir un modèle prédictif :
En fin de compte, vous devrez sans doute exécuter plusieurs algorithmes et modèles prédictifs sur vos données et évaluer les résultats pour trouver la formule qui répond le mieux à vos besoins.
Chaque entreprise, quel que soit son secteur d’activité, s’appuie sur les données pour prendre de meilleures décisions métiers. La modélisation prédictive renforce votre confiance dans les décisions en présentant les effets les plus probables de l’action que vous envisagez.
La pratique offre plusieurs avantages concrets :
Les prédictions effectuées de façon mathématique sur la base d’ensembles de données ne sont pas infaillibles. En règle générale, les problèmes liés à la modélisation prédictive se résument à quelques facteurs. Le premier est le manque de bonnes données. Pour faire des prédictions précises, il vous faut un grand ensemble de données, contenant de nombreuses variables appropriées pour établir vos prédictions. Mais bien souvent, les organisations ne sont pas équipées d’une plateforme de données robuste, capable de centraliser toutes leurs données, d’analyser les informations à un niveau granulaire et d’en extraire des informations exploitables. Or des échantillons de données restreints ou incomplets peuvent facilement nuire à la fiabilité des prédictions.
Autre obstacle majeur à l’efficacité de la modélisation prédictive : l’idée selon laquelle l’avenir restera à l’image du passé. Les modèles prédictifs sont bâtis à partir de données historiques, mais les comportements évoluent avec le temps, ce qui peut invalider brutalement des modèles utilisés depuis longtemps. Selon les situations, des variables inédites ou uniques suscitent de nouveaux comportements et approches que les modèles antérieurs ne pourront pas toujours anticiper. C’est pourquoi les modèles prédictifs doivent être constamment actualisés à l’aide de nouvelles données pour suivre l’évolution des comportements et baser des prédictions précises dessus.
Autre problème majeur : la dérive de modèle. La dérive de modèle désigne la tendance d’un modèle à perdre sa capacité prédictive au fil du temps. Généralement due à des changements statistiques dans les données, elle peut dégrader la qualité des prévisions si elle n’est pas détectée, et donc nuire à l’entreprise qui les exploite.
La modélisation prédictive est une science des données robuste, mais elle n’est pas omnisciente. Aucun modèle prédictif n’aurait pu prévoir la pandémie de Covid-19 ni son impact sur le comportement des consommateurs à une si grande échelle, par exemple. En dehors de ces circonstances uniques, la modélisation prédictive est un moyen très efficace d’éclairer les décisions métiers dès lors que vous disposez de la bonne solution et des bonnes équipes, mais aussi que vous actualisez continuellement votre modèle avec de nouvelles données.
Commencez par bien définir les problèmes que votre organisation cherche à résoudre. Si vous établissez clairement l’objectif à atteindre, vous obtiendrez un résultat précis et utilisable, tandis qu’adopter une approche ad hoc sera beaucoup moins efficace.
Ensuite, évaluez les lacunes en matière de compétences et de technologie dans votre entreprise. Certes, les solutions logicielles font une grande partie du travail, mais la modélisation prédictive a besoin d’expertise pour être efficace. Assurez-vous de disposer du personnel, des outils et de l’infrastructure nécessaires pour identifier et préparer les données que vous utiliserez dans votre analyse.
Enfin, réalisez un projet pilote – idéalement, un projet de petite envergure sans enjeu stratégique, mais tout de même intéressant pour l’entreprise. Identifiez votre objectif, choisissez les indicateurs que vous utiliserez pour l’atteindre et établissez une méthode pour en quantifier la valeur. Une fois votre premier succès en main, vous aurez une base sur laquelle bâtir des projets de modélisation prédictive plus importants.
La modélisation prédictive est l’outil ultime de l’arsenal analytique. Elle permet aux organisations de toutes tailles d’accroître la fiabilité et l’impact de leurs décisions métiers. Muni d’une approche systématique et de la bonne solution logicielle, vous pouvez commencer à mettre la puissance de la modélisation prédictive au service de la résolution des problèmes métiers les plus épineux et ainsi découvrir de nouvelles opportunités.
Une erreur à signaler ? Une suggestion à faire ? Contactez-nous à l’adresse ssg-blogs@splunk.com.
Cette publication ne représente pas nécessairement la position, les stratégies ou l’opinion de Splunk.
La plateforme Splunk élimine les obstacles qui séparent les données de l'action, pour donner aux équipes d'observabilité, d'IT et de sécurité les moyens de préserver la sécurité, la résilience et le pouvoir d'innovation de leur organisation.
Fondée en 2003, Splunk est une entreprise internationale. Ses plus de 7 500 employés, les Splunkers, ont déjà obtenu plus de 1 020 brevets à ce jour, et ses solutions sont disponibles dans 21 régions du monde. Ouverte et extensible, la plateforme de données Splunk prend en charge les données de tous les environnements pour donner à toutes les équipes d'une entreprise une visibilité complète et contextualisée sur l'ensemble des interactions et des processus métier. Splunk, une base solide pour vos données.