Maschinelles Lernen zur Erkennnung personenbezogener Daten

Datengetriebene Geschäftsmodelle gewinnen durch die steigende Nutzung von Informationen aus Daten zunehmend an Relevanz. Für eine rechtssichere Verarbeitung der zugrundeliegenden Datenmengen empfiehlt die DSGVO eine Anonymisierung personenbezogener Informationen. Bisherige Lösungen sind auf strukturierte Datensätze ausgelegt, wodurch die Leistung in den heute vermehrt unstrukturierten Daten (z.B. Chats) unzureichend ist.

Ziel unseres Projekts ist es, eine ML-basierte Lösung zu entwickeln, die unabhängig von der Datenstruktur zuverlässig anonymisiert. Es zeigt sich, dass Ansätze auf NER-Basis (Named Entity Recognition) dies nicht nur erfüllen, sondern durch Klassifizierungen auch den Informationsgehalt beibehalten.

Vorkenntnisse

Grundlagen im Bereich Data Science. Im Speziellen ML, DL, NLP.

Lernziele

Kennenlernen moderner Methoden zur Named Entity Recognition im speziellen Bezug auf Anonymisierung.

 

Speaker

 

Nils Thoma
Nils Thoma ist Masterand an der TU Darmstadt mit dem Schwerpunkt Data Science. Seine Interessen liegen speziell im Bereich Machine Learning. Bereits während seines Bachelorstudiums arbeitete er bei der German Management Consulting GmbH und schrieb seine Bachelorarbeit in dieser Kooperation, welche die wesentlichen Grundlage für das Projekt bildet.

Jacek Haußner
Jacek Haußner ist Teamleiter bei der German Management Consulting GmbH und für den Bereich Data Science zuständig. Zuvor beschäftige er sich unter anderem mit dem Thema Informationssicherheit. Durch diese Kombination erkannte er während seiner Projektarbeit das Potenzial des Projekts und initiierte die interne Entwicklung.

Gold-Sponsoren

HMS
Structr

Silber-Sponsoren

codecentric
Phytec

Bronze-Sponsor

incontext.technology GmbH

data2day-Newsletter

Sie möchten über die data2day
auf dem Laufenden gehalten werden?

 

Anmelden