Im folgenden Abschnitt werden Beispiel-Anwendungen von Data Science / maschinellem Lernen im Versicherungs- und Bankenbereich etwas detaillierter beschrieben:
Versicherungsbetrug findet bei den meisten Versicherungsarten statt. Für die Versicherung stellt sich die Frage, welche Schadensfälle ein Sachbearbeiter detaillierter prüfen soll. Oder: welche Schadensfälle sind diejenigen mit einer hohen Wahrscheinlichkeit von Betrug.
Anhand von Daten aus der Vergangenheit wie Alter, Familienstand, Kennzahlen über das finanzielle Verhalten von Kunden, Eckdaten von Schadensfällen und deren untersuchter Betrugs-Status (war es Betrug oder nicht) kann man ein Vorhersagemodell für die Betrugswahrscheinlichkeit mit Hilfe des maschinellen Lernens erstellen.
Erfahrungsgemäß erhöhen solche Vorhersagemodelle die Trefferquote von Betrugsfällen um ein Mehrfaches gegenüber menschlicher Einschätzung. Und damit erhöht sich die Effizienz der Sachbearbeiter bei der Aufdeckung von Betrug um ein Mehrfaches.
Bei Banken tritt das Problem auf, aus historischen Kundendaten die Kreditwürdigkeit von neuen Kunden vorherzusagen. Lineare Scoring-Modelle sind weit verbreitet, aber tatsächlich gibt es heute wesentlich bessere Algorithmen des maschinellen Lernens hierfür.
Eine Bank hat Daten über die Kunden, an welche sie in der Vergangenheit Kredite vergab. Die Kundendaten beinhalten das Kundenverhalten bezüglich der Kontoführung, persönliche Merkmale des Kunden und andere Daten, die seine finanzielle Situation zum Zeitpunkt der Kreditvergabe beschrieben. Die Information, welche Kunden einen Kredit pünktlich bedienten und welcher nicht, liegt bei Kunden aus der Vergangenheit ebenfalls vor. Daraus erstellt man ein Vorhersagemodell per maschinellem Lernen für die Wahrscheinlichkeit, dass ein Kunde einen Kredit bedient.
Dieses Vorhersagemodell kann dann bei zukünftigen Kredit-Anträgen automatisiert angewendet werden.
Bei Versicherungen geht es oft um die Abschätzung des Eintretens des Schadenfalls aus historischen Daten. Das Potential des maschinellen Lernens bei Versicherungen ist immens und weitgehend noch nicht genutzt. Auch hier werden derzeit überwiegend, wenn überhaupt, nur recht simple lineare Scoring-Modelle verwendet.
Eine Autoversicherung möchte ein Vorhersagemodell erstellen, das die Wahrscheinlichkeit eines Unfalls innerhalb eines Jahres vorhersagt auf der Basis von Kundenmerkmalen, die zum Zeitpunkt des Vertragsabschlusses zur Verfügung stehen. (Persönliche Merkmale, Merkmale des zu versichernden Autos, Unfallhistorie.) Aus der Vergangenheit ist bekannt, ob ein Kunde in einem Jahr einen Unfall hatte oder nicht. Daraus erstellt man ein Vorhersagemodell für die Wahrscheinlichkeit eines Unfalls anhand dieser Kundenmerkmale und maschinellem Lernen.
Dieses Vorhersagemodell kann dann in der Zukunft automatisiert bei jedem neuen Versicherungsantrag angewendet werden, um die Risikoklasse zu ermitteln.