Konferenz für Big Data,
Data Science und Machine Learning
Heidelberg, Print Media Academy, 25.-28. September 2018

data2day 2018 » Programm »

Smart Matching: Datenintegration mit Advanced Analytics

Der Rückversicherer Munich Re erhält viele geschäftlich interessante Informationen von Erstversicherern und Versicherungsnehmern in Form von tabellarischen Daten, sogenannten Bordereaux. Diese können beispielsweise Informationen zu Einzelschäden (u.a. Geschädigter, Datum, Schadensbeschreibung, Schadenshöhe) oder Prämienzahlungen beinhalten. Häufig liegen diese Daten in Form von Excel- oder CSV-Dateien vor. Diese Daten sind schwer zu verarbeiten und daher im Ursprungsformat einer Analyse unzugänglich.

Der Praxisbericht zeigt, wie bereits im Datenmanagement erfolgreich Machine Learning eingesetzt wird, um eine Vielzahl von heterogenen Daten in eine homogene Zielstruktur zu überführen. Dieser Schritt automatisiert manuelle Prozesse in der Datenaufbereitung und macht anschließende Analysen auf den Daten erst möglich.

Vorkenntnisse
Grundkenntnisse in Machine Learning (Feature Engineering, Supervised Learning) sind hilfreich, aber nicht zwingend notwendig.

Lernziele
* Erhalten Sie Einsicht in Anwendungsmöglichkeiten von Machine Learning zur Datenintegration.
* Lernen Sie Möglichkeiten der Operationalisierung einer Machine-Learning-Anwendung kennen.
* Erfahren Sie, wie das Zusammenspiel zwischen Modell und User-Interaktion bei Teilautomatisierung gelingt.

// Andreas Samberg Andreas Samberg

ist Data Scientist und Projektleiter bei der HMS Analytical Software ' GmbH in Heidelberg. In seiner Promotion in theoretischer Physik entwickelte er Simulationen stark gekoppelter Systeme. Heute beschäftigt er sich vor allem mit der Weiterentwicklung von Datenintegrationsprozessen mit Machine-Learning-Methoden. Dabei liegt sein technologischer Schwerpunkt auf R und Python.


// Clemens Bauer Clemens Bauer

ist Consultant in der Abteilung Data Analytics von Munich Re. Im Rahmen seiner Promotion in theoretischer Physik führte er große numerische Simulationen mit Parallel Computing durch. Er arbeitet an der Schnittstelle von Data Engineering und Data Science und befasst sich mit der Entwicklung und Operationalisierung von Data-Matching-Anwendungen im Kontext semistrukturierter Daten.

l>