Veröffentlichungsdatum: 1. September 2021
Bei der prädiktiven Modellierung wird mithilfe bekannter Ergebnisse ein statistisches Modell erstellt, mit dem prädiktive Analysen durchgeführt oder zukünftige Verhaltensweisen vorhergesagt werden können. Es handelt sich um ein Tool im Rahmen der Predictive Analytics, eines Bereichs des Data Mining, bei dem versucht wird, die Frage „Was wird wohl als Nächstes passieren?“ zu beantworten.
Durch die Digitalisierung wurden in so gut wie jeder Branche enorme Mengen von Echtzeitdaten geschaffen. Mithilfe dieser Daten lassen sich historische Events analysieren, um zukünftige Events, wie z. B. finanzielle Risiken, Maschinenschäden, Verhaltensweisen von Kunden und weitere Ergebnisse vorherzusagen. Die Daten, die mit digitalen Produkten erzeugt werden, sind jedoch oftmals unstrukturiert – d. h. nicht wie zuvor definiert organisiert –, sodass sie für menschliche Analysen zu komplex sind. Stattdessen verwenden Unternehmen Modellierungs-Tools, die mithilfe von Machine Learning-Algorithmen Muster in den Daten analysieren und erkennen, die darauf hinweisen können, was wohl in der Zukunft passieren wird.
Diese „Kristallkugel“-Funktion findet überall im Unternehmen Anwendung; Unternehmen nutzen prädiktive Modellierung (Predictive Modeling), um ihre Geschäftstätigkeiten effizienter zu gestalten, ihre Produkte schneller auf den Markt zu bringen und das Verhältnis zu ihren Kunden zu verbessern, um nur einige Möglichkeiten zu nennen. Es handelt sich dabei um ein besonders leistungsstarkes Tool im Bereich ITOps und in der Softwareentwicklung, wo es die Vorhersage von Systemausfällen, Anwendungsunterbrechungen und weiterer Probleme unterstützen kann.
Im Folgenden werden wir uns mit der Funktionsweise prädiktiver Modelle, den verschiedenen Verfahren zur prädiktiven Modellierung, den Vorteilen von Predictive Analytics und der Auswahl des richtigen prädiktiven Modells für Ihre Organisation beschäftigen.
Was ist Predictive Analytics?
Predictive Analytics bezieht sich auf die Anwendung mathematischer Modelle auf große Mengen von Daten zur Erkennung vergangener Verhaltensmuster und Vorhersage zukünftiger Ergebnisse. Die Praktik kombiniert Datenerfassung, Data Mining, Machine Learning und statistische Algorithmen miteinander, um das „prädiktive“ Element zu ermitteln.
Predictive Analytics ist lediglich eine Praktik innerhalb eines Spektrums von Analyseansätzen wie z. B. der folgenden :
- Deskriptiv: Die deskriptive Analyse als grundlegendster Analysetyp erkennt ein Problem bzw. beantwortet die Frage „Was ist passiert?“ Sie kann Ihnen jedoch auch mitteilen, warum etwas passiert ist, sodass sie in der Regel in Kombination mit einem oder mehreren anderen Analysetypen verwendet wird.
- Diagnostisch: Die diagnostische Analyse kommt dort ins Spiel, wo die deskriptive Analyse aufhört und stellt Zusammenhänge her, die erklären, warum etwas passiert ist.
- Prädiktiv: Die prädiktive Analyse erfasst historische Daten und erkennt Muster, die auf wahrscheinliche Ereignisse in der Zukunft hinweisen.
- Präskriptiv: Als raffiniertester Typ legt die präskriptive Analyse nahe, wie weiter vorzugehen ist, um ein Problem zu lösen oder zu vermeiden.
Deskriptive und diagnostische Analyse-Tools sind von unschätzbarem Wert, wenn es darum geht, Data Scientists dabei zu unterstützen, faktenbasierte Entscheidungen zu aktuellen Ereignissen zu treffen, aber für sich genommen sind sie nicht ausreichend. Unternehmen müssen Trends, Probleme und andere Ereignisse vorhersehen können, um wettbewerbsfähig zu sein. Die prädiktive Analyse baut auf der deskriptiven und der diagnostischen Analyse auf, indem sie Muster in Datenausgaben erkennt und mögliche Ergebnisse sowie die Wahrscheinlichkeit, dass sie passieren werden, vorhersagt. Dadurch können Unternehmen genauer planen, Risiken vermeiden oder abschwächen, Optionen schnell evaluieren und ganz allgemein fundiertere geschäftliche Entscheidungen treffen.
Dank der prädiktiven Analyse können Einzelhandelsunternehmen den langfristigen Kundenwert vorhersagen; medizinisches Fachpersonal kann die kostengünstigste Methode zur Behandlung von Patienten bestimmen und Lehrende können ermitteln, welche Schülerinnen und Schüler ihre persönliche Betreuung benötigen, um nur einige Anwendungsfälle zu nennen.
Die prädiktive Analyse war in der IT schon immer besonders wandlungsfähig. Die Komplexität der zur Virtualisierung benötigten Architektur, der Cloud, des Internet of Things (IoT) und weiterer technologische Fortschritte erhöht das Volumen der verständlichen Daten exponenziell, sodass es bei der Diagnose und Lösung von Problemen zu langen Verzögerungen kommt. Mit der durch Big Data und künstliche Intelligenz (KI) unterstützten prädiktiven Analyse werden diese Schwierigkeiten bewältigt. Da sie Muster erkennt, kann sie Prädiktoren rund um Performance-Probleme, Netzwerkausfälle, Kapazitätsengpässe, Sicherheitsverstöße und verschiedene weitere Infrastrukturprobleme erschaffen und damit für eine bessere Performance, geringere Ausfallzeiten und eine insgesamt widerstandsfähigere Infrastruktur sorgen.
Wie funktionieren prädiktive Analysemodelle?
Prädiktive Analysemodelle funktionieren, indem Machine Learning-Algorithmen an Datensätzen ausgeführt werden, die für Unternehmen relevant sind. Das Erstellen eines prädiktiven Modells ist ein schrittweiser Prozess, der damit beginnt, dass ein klares geschäftliches Ziel definiert wird. Dieses Ziel wird oftmals als Frage definiert und trägt dazu bei, den Umfang des Projekts und das entsprechende zu verwendende prädiktive Modell zu ermitteln. Von diesem Punkt aus führen Sie die nachfolgend dargestellten Schritte aus.
- Bereiten Sie Ihre historischen Daten für die statistische Analyse vor. Bei den meisten Organisationen verteilen sich die Daten auf viele Quellen, wie z. B. auf Data Warehouses, Online-Datenbanken und damit verbundene Geräte. Sie müssen erfasst und „bereinigt“ werden, um doppelte, fehlende, korrupte oder ungenaue Daten zu entfernen; anschließend müssen sie zu Analysezwecken in ein definiertes Format gebracht werden.
- Unterteilen Sie die Daten in zwei Datasets: Trainingsdaten und Testdaten. Trainingsdaten sind Daten, die bekannten Ergebnissen entsprechen; sie werden in den Machine Learning-Algorithmus eingespeist, sodass sie evaluiert werden können, um auf der Grundlage neuer Daten Vorhersagen zu treffen. Mithilfe der Testdaten wird überprüft, ob mit dem Modell genaue Vorhersagen getroffen werden können.
- Führen Sie einen oder mehrere Algorithmen an dem Dataset aus. Sobald eine Entscheidung über den entsprechenden Modelltyp und die Algorithmen gefällt wurde, wird das prädiktive Modell erstellt und bereitgestellt.
Prädiktive Modellierung (Predictive Modeling) ist ein iterativer Prozess. Sobald ein Lernmodell erstellt und bereitgestellt wurde, muss seine Performance überwacht und verbessert werden. Das bedeutet, dass es kontinuierlich mit neuen Daten aktualisiert, trainiert, evaluiert und anderweitig verwaltet werden muss, damit es auf dem aktuellen Stand bleibt.
Welche verschiedenen Verfahren zur prädiktiven Modellierung gibt es?
Es gibt mehrere häufig eingesetzte Verfahren zur prädiktiven Modellierung, die sich entweder als Regressionsanalyse oder als Klassifizierungsanalyse beziffern lassen. Bei der Regressionsanalyse wird eine abhängige Variable (die Aktion) betrachtet sowie verschiedene unabhängige Variablen (Ergebnisse); ferner wird bewertet, wie eng die Beziehung zwischen ihnen ist. Sie kann zur Voraussage von Trends und zur Vorhersage der Auswirkung einer bestimmten Aktion eingesetzt werden oder um zu ermitteln, ob eine Aktion und ihre Ergebnisse in Korrelation zueinander stehen. Sobald Sie sich entschieden haben, die Regressionsanalyse zu verwenden, stehen Ihnen verschiedene Typen zur Auswahl. Die am häufigsten verwendeten Typen sind u. a.:
- Einfache lineare Regression: Bei der grundlegendsten Form der Regressionsanalyse, der linearen Regression, wird die Beziehung zwischen zwei Variablen bestimmt. Ein einfaches Beispiel könnte sein, dass ein Geschäft mithilfe der linearen Regression die Beziehung zwischen der Anzahl der eingesetzten Verkaufsmitarbeiter und dem generierten Umsatz ermittelt.
- Multiple lineare Regression: Mithilfe der multiplen linearen Regression lässt sich die Beziehung zwischen der abhängigen Variablen und jeder einzelnen der unabhängigen Variablen bestimmten. Ein Gesundheitsforscher kann dieses Verfahren beispielsweise einsetzen, um die Auswirkung von Faktoren wie Rauchen, Ernährung und Sport auf die Entwicklung von Herzkrankheiten zu ermitteln.
- Logistische Regression: Mit dieser Art der Regressionsanalyse wird die Wahrscheinlichkeit ermittelt, mit der bestimmte Faktoren dazu führen, dass ein Ereignis eintritt oder nicht eintritt. Ein Fall, bei dem die logistische Regression häufig eingesetzt wird, ist eine Bank, die vorhersehen möchte, ob ein Antragsteller ein Darlehen bedienen wird oder nicht.
- Ridge-Regression: Mit diesem Verfahren werden mehrere lineare Regressions-Datasets analysiert, bei denen ein hohes Maß an Korrelation zwischen den unabhängigen Variablen besteht.
Mit der Klassifizierungsanalyse werden Daten in Kategorien eingeteilt, um sie genauer analysieren zu können. Dabei kommen unterschiedliche mathematische Verfahren zu Einsatz, wie z. B.
- Entscheidungsdiagramme: Bei diesem Verfahren wird der Entscheidungsfindungsprozess repliziert, indem mit einer einzigen Frage oder Idee begonnen wird und anschließend verschiedene Handlungsweisen und deren mögliche Auswirkungen in Form eines „Verzweigungs“-Prozesses untersucht werden, um zu einer Entscheidung zu kommen.
- Neuronale Netzwerke: Mit diesem Verfahren, das dem menschlichen Gehirn nachempfunden ist, werden Daten zusammengefasst und klassifiziert, um Muster zu erkennen und Trends zu identifizieren, die zu komplex für andere Verfahren sind. Ein Beispiel für ein neuronales Netzwerk in Aktion ist eine Einzelhandels-Website, auf der Produkte basierend auf früheren Einkäufen eines Benutzers empfohlen werden.
Was ist präskriptive Modellierung? Worin besteht der Unterschied zur prädiktiven Modellierung?
Bei der präskriptiven Modellierung werden Daten in Echtzeit analysiert, um eine Vorgehensweise vorzuschlagen. Im Wesentlichen basiert sie auf den Erkenntnissen anderer Analysemodelle zur Berücksichtigung der verfügbaren Ressourcen, der früheren und aktuellen Performance und der potenziellen Ergebnisse, anhand derer vorgeschlagen wird, welche Maßnahmen als Nächste ergriffen werden. In einem IT-Kontext können mithilfe der präskriptiven Modellierung beispielsweise Infrastrukturverbesserungen auf der Grundlage von Überwachungs- und Instandhaltungsdaten vorgeschlagen werden; ferner kann das System sogar in die Lage versetzt werden, dass es die erforderlichen Anpassungen gemäß einem zuvor erstellten Skript selber vornimmt.
Die präskriptive Analyse ist eine Erweiterung der prädiktiven Analyse. Während Sie durch die prädiktive Analyse erfahren, welches Problem wann und warum eintreten wird, geht die präskriptive Analyse einen Schritt weiter und bietet Ihnen bestimmte Maßnahmen an, die Sie zur Lösung des Problems ergreifen können. Durch beide Analysearten können Sie fundiertere Entscheidungen treffen, aber die präskriptive Analyse nutzt Ihre Daten am besten, sodass Sie Prozesse und Systeme sowohl kurz- als auch langfristig optimieren können.
Welche unterschiedlichen Arten von prädiktiven Analysemodellen gibt es?
Es gibt mehrere verschiedene Arten von prädiktiven Analysemodellen. Die meisten von ihnen sind für bestimmte Anwendungen vorgesehen, aber einige können in vielen verschiedenen Situationen eingesetzt werden. Hierzu zählen:
- Prognosemodell: Das Prognosemodell, bei dem es sich vielleicht um das am häufigsten verwendete prädiktive Analysemodell handelt, lernt von historischen Daten und schätzt die Werte neuer Daten. Mithilfe des Prognosemodells können Sie beispielsweise ermitteln, wie viele Anrufe ein Kundenservice-Agent pro Tag annehmen kann, oder wie viele Kopien eines Bestsellers ein Einzelhändler für die bevorstehende Verkaufsperiode bestellen sollte.
- Klassifizierungsmodell: Bei diesem Modell wird mit historischen Daten gearbeitet, um Informationen für Fragen und Antworten zu kategorisieren und umfassende Analysen zu erstellen, damit entschieden gehandelt werden kann. Es wird in vielen verschiedenen Branchen eingesetzt und eignet sich am besten zur Beantwortung von Ja-/Nein-Fragen wie z. B. „Ist es wahrscheinlich, dass dieser Darlehensnehmer in Verzug gerät?“
- Clustering-Modell: Bei diesem Modell werden Daten nach gemeinsamen Attributen sortiert. Eine beliebte Anwendung ist die Kundensegmentierung, bei der das Modell die Kundendaten eines Unternehmens nach gemeinsamen Attributen und Verhaltensweisen gruppieren kann. Im Clustering-Modell kommen zwei Clustering-Arten zum Einsatz – Hard-Clustering und Soft-Clustering. Beim Hard-Clustering gehören Datenpunkte einer Kategorie an oder sie gehören keiner Kategorie an. Beim Soft-Clustering wird nicht jeder einzelne Datenpunkt einem separaten Cluster zugeordnet. Vielmehr wird ihm eine Wahrscheinlichkeit zugewiesen, mit der er in jeden Cluster gehört.
- Ausreißermodell: Im Ausreißermodell werden anormale Einträge innerhalb eines Datasets identifiziert und analysiert; es kommt in der Regel zum Einsatz, wenn nicht erkannte Anomalien die Unternehmen, wie z. B. Finanz- und Einzelhandelsunternehmen, teuer zu stehen kommen können. Beispielsweise kann ein Ausreißermodell eine betrügerische Transaktion erkennen und dabei die Menge, den Zeitpunkt, den Standort, die Einkaufshistorie und die Art des Einkaufs bewerten.
- Zeitreihenmodell: Bei diesem Modell wird die Zeit als Eingabeparameter verwendet, um Trends über einen bestimmten Zeitraum vorherzusagen. Beispielsweise könnte ein Callcenter dieses Modell verwenden, um basierend auf den Anrufen, die in den vorangegangenen drei Monaten eingegangen sind, zu ermitteln, wie viele Support-Anrufe im nächsten Monat zu erwarten sind.
Wie wählen Sie das richtige prädiktive Modell?
Bei der Wahl eines prädiktiven Modells gibt es einige Dinge zu berücksichtigen:
- Was Sie erreichen möchten: Das Prognosemodell eignet sich hervorragend zum Vorhersagen zukünftiger Ereignisse auf der Grundlage vorangegangener Ereignisse, während das Klassifizierungsmodell die richtige Wahl ist, wenn Sie mögliche Ergebnisse untersuchen möchten, um eine wichtige Entscheidung treffen zu können. Welches Modell das richtige ist, hängt im Großen und Ganzen davon ab, welche Informationen Sie aus Ihren Daten gewinnen möchten.
- Menge der Trainingsdaten: Im Allgemeinen gilt, je mehr Trainingsdaten Sie erfassen, umso verlässlicher sind die Vorhersagen. Bei begrenzten Daten oder wenn das, was Sie aus einem Dataset erfahren möchten, nur selten aufgetreten ist, kann es erforderlich sein, dass Sie andere Algorithmen verwenden müssen, ganz anders als es bei einem riesigen Dataset mit vielen Variablen der Fall ist.
- Genauigkeit und Interpretierbarkeit des Ergebnisses: Genauigkeit bezieht sich auf die Verlässlichkeit der Vorhersagen des Modells, während die Interpretierbarkeit sich darauf bezieht, wie leicht sie zu verstehen sind. Idealerweise halten sich beide in Ihrem Modell die Waage.
- Trainingsdauer: Je mehr Trainingsdaten Sie haben, umso länger brauchen Sie, um den Algorithmus zu trainieren. Eine größere Genauigkeit erfordert auch eine längere Trainingsdauer. Diese beiden Faktoren sind in vielen Organisationen vielleicht am wichtigsten, wenn es darum geht, das richtige Modell zu wählen.
- Linearität der Daten: Nicht alle Beziehungen sind zu 100 % linear, und durch komplexere Datenstrukturen wird Ihre Auswahl ggf. auf Verfahren wie z. B. neuronale Netzwerke eingegrenzt.
- Die Anzahl der Variablen: Durch Daten mit vielen Variablen werden einige Algorithmen langsamer und die Trainingsdauer verlängert sich, was bei der Wahl des Modells berücksichtigt werden sollte.
Letztlich werden Sie wahrscheinlich mehrere verschiedene Algorithmen und prädiktive Modelle an Ihren Daten ausführen und die Ergebnisse evaluieren müssen, um die für Ihre Bedürfnisse am besten geeignet Wahl zu treffen.
Welchen Wert hat die prädiktive Modellierung für Unternehmen?
Die prädiktive Modellierung bietet Unternehmen mehrere Vorteile:
- Geringere Kosten: Ein prädiktives Modell, mit dem ein Prozess mit einem hohen Maß an Genauigkeit ausgeführt werden kann, ermöglicht es Ihnen, die Mitarbeiter und Ressourcen neu zuzuweisen, die Sie andernfalls benötigen würden, um den betreffenden Prozess manuell durchzuführen.
- Umsetzbare Erkenntnisse: Prädiktive Analysen liefern Erkenntnisse, die es Ihnen ermöglichen, die Effizienz zu erhöhen, Transaktionen zu optimieren und fundiertere Entscheidungen zu treffen.
- Kürzere Reaktionszeiten: Ob bei einem Systemfehler, einem Sicherheitsvorfall oder einem Anwendungsausfall – die prädiktive Analyse kann schneller reagieren als ein Mensch. Infolgedessen wird das Ereignis geringere Auswirkungen haben.
- Bessere Skalierbarkeit: Durch die Geschwindigkeit und die Automatisierung der prädiktiven Modellierung können Organisationen leichter und schneller skalieren.
Warum ist prädiktive Modellierung wichtig?
Prädiktive Modellierung (Predictive Modeling) ist wichtig, da jedes Unternehmen, ganz unabhängig von der Branche, auf Daten setzt, um bessere unternehmerische Entscheidungen zu treffen. Dank prädiktiver Modellierung können Sie Ihren Entscheidungen mehr Vertrauen schenken, da sie Ihnen zeigt, mit welchen Ergebnissen bei den Aktionen, die Sie in Erwägung ziehen, aller Wahrscheinlichkeit nach zu rechnen ist.
Was sind die Risiken und Annahmen bei der prädiktiven Modellierung (Predictive Modeling)?
Mathematisch ausgeführte, auf Datasets basierende Vorhersagen sind nicht unfehlbar. In der Regel lassen sich Probleme mit prädiktiver Modellierung auf wenige Faktoren eingrenzen. Um genaue Vorhersagen zu treffen, benötigen Sie ein großes Dataset mit vielen Variablen, die als Grundlage für Ihre Vorhersagen geeignet sind. Für viele Organisationen ist es nicht leicht, an diese Daten heranzukommen, da sie keine robuste Datenplattform haben, mit der es möglich ist, alle Daten eines Unternehmens zu korrelieren, Informationen detailliert zu analysieren und verwertbare Erkenntnisse aus großen Datasets abzuleiten. Folglich kann es leicht passieren, dass kleine oder unvollständige Datenproben zu unverlässlichen Vorhersagen führen.
Ein weiteres Hindernis für eine effektive prädiktive Modellierung (Predictive Modeling) ist die Annahme, dass es in Zukunft weitergehen wird wie bisher. Prädiktive Modelle werden mithilfe historischer Daten erstellt. Verhaltensweisen ändern sich jedoch oftmals im Laufe der Zeit, sodass Modelle, die lange in Gebrauch sind, plötzlich nicht mehr gültig sind. Neue und einzigartige Variablen in verschiedenen Situationen führen hingegen zu neuen Verhaltensweisen und Ansätzen, die nicht immer mit früheren Modellen vorhergesehen werden können. Daher müssen prädiktive Modelle fortwährend mit neuen Daten aktualisiert werden, um mit aktuellen Verhaltensweisen Schritt zu halten, damit auf dieser Grundlage genaue Vorhersagen getroffen werden können.
Was bedeutet Modellabweichung für Ihr Unternehmen?
Modellabweichung bezieht sich darauf, dass ein Modell seine Vorhersagefähigkeit tendenziell im Laufe der Zeit verliert. Dies ist in der Regel auf statistische Verschiebungen in den Daten zurückzuführen, und wenn diese unbemerkt bleiben, können sie Unternehmen durch ungenaue Vorhersagen negativ beeinflussen.
Sollte Ihr Unternehmen sich auf prädiktive Modellierung verlassen?
Prädiktive Modellierung ist eine solide Data Science-Methode, aber sie ist nicht unfehlbar. Kein prädiktives Modell konnte z. B. die COVID-19-Pandemie vorhersagen oder wie sie das Verbraucherverhalten in diesem immensen Ausmaß verändern sollte. Abgesehen von diesen einzigartigen Umständen ist prädiktive Modellierung eine äußerst effektive Methode für fundierte unternehmerische Entscheidungen, solange Sie über die richtige Lösung und die richtigen Mitarbeiter verfügen und Ihr Modell kontinuierlich mit neuen Daten aktualisieren.
Was sind die ersten Schritte zum Einstieg in die prädiktive Modellierung (Predictive Modeling)?
Als Einstieg in die prädiktive Modellierung müssen Sie zunächst entscheiden, welche Probleme Ihre Organisation lösen möchte. Wenn Sie sich im Klaren darüber sind, was Sie erreichen möchten, erhalten Sie ein genaues verwertbares Ergebnis, während Sie mit einem Ad-hoc-Ansatz weitaus weniger effektiv sein werden.
Als Nächstes bewerten Sie sämtliche Fähigkeiten und technologischen Schwächen in Ihrem Unternehmen. Während Softwarelösungen das Gröbste für Sie erledigen, erfordert die prädiktive Modellierung Fachwissen, damit sie effektiv ist. Vergewissern Sie sich, dass Sie über die Mitarbeiter, die Tools und die Infrastruktur verfügen, die Sie benötigen, um die Daten für Ihre Analyse zu identifizieren und vorzubereiten.
Führen Sie schließlich ein Pilotprojekt durch. Idealerweise sollte dieses Projekt einen kleinen Umfang haben und nicht geschäftsentscheidend, aber dennoch wichtig für das Unternehmen sein. Identifizieren Sie Ihr Ziel, entscheiden Sie, welche Messdaten Sie verwenden möchten, um dieses Ziel zu erreichen, und wie Sie den Wert quantifizieren. Sobald Sie erste Erfolge erzielen, verfügen Sie über eine Grundlage, auf der Sie größere prädiktive Modellierungsprojekte aufbauen können.
Prädiktive Modellierung (Predictive Modeling) ist das ultimative Tool unter den Analyse-Tools, mit dem Organisationen jeder Größe solide, wirkungsvolle Entscheidungen treffen können. Mit einem systematischen Ansatz und der richtigen Softwarelösung können Sie jetzt die Kraft der prädiktiven Modellierung nutzen, um Ihre drängendsten geschäftlichen Probleme zu lösen und neue Geschäftschancen aufzudecken.
Basisleitfaden Daten
Holen Sie das Maximum aus Ihren Daten heraus und nutzen Sie sie für jede Frage, Entscheidung und Handlung - mit diesem umfassenden Leitfaden für Daten.