data2day 2015 » Programm »

Unser Weg zum Freischwimmer im Data Lake: Erste Erfahrungen und Einblicke in die Konzeption und den Aufbau eines globalen Data Lake

Die Datenlandschaft eines global tätigen Marktforschungsunternehmens wie GfK ist gleichzeitig von unschätzbarem Wert wie auch herausfordernd. Granulare Abverkaufszahlen von Händlern in mehr als 100 Ländern, detaillierte Informationen zur Entwicklung des Markenwerts aller erdenklichen Marken in verschiedensten Märkten, Messungen unserer "Single Source"-Panels zu Medien- und Internetnutzung sowie Einkaufsverhalten von zehntausenden Haushalten und komplett erfasste globale Social Media Contents zu markenrelevanten Themen: All diese Daten (und noch viele mehr) ermöglichen unseren Data Scientists die Entwicklung ausgesprochen ausgefeilter Analysemethoden und -modelle. Auf der anderen Seite bringt die Komplexität der Datenlandschaft auch die große Herausforderung mit sich, die Daten transparent und leicht verfügbar zu machen.

Aus diesem Grund hat sich GfK entschieden, die komplette Datenlandschaft in einen Data Lake zu überführen. Die Herausforderungen sind angesichts der schieren Menge, aber auch der Heterogenität der Daten mannigfaltig und reichen von der Auswahl der geeigneten IT-Architektur über das optimale Vorgehen zur effizienten Erfassung der essenziell wichtigen Metadaten bis hin zur Konfiguration des bestmöglichen Analyse-Stacks für die Data Scientists.

Seit Mai 2015 baut GfK einen prototypischen Data Lake auf. Erfahrungen und "Lessons Learned" aus der Konzeptionsphase sowie erste Eindrücke nach dem Aufbau und der initialen Datenbefüllung des Data Lakes sollen Gegenstand dieses Vortrags sein. Vor allem aber wollen wir veranschaulichen, wie unsere Data Scientists mit dem Data Lake interagieren und wie sie explorativ neue Erkenntnisse aus dieser neuen, integrierten Datenlandschaft gewinnen können.

Skills
Ein grundlegendes Interesse an den (bzw. Verständnis für die) Herausforderungen, die eine globale Datenlandschaft wie die der GfK mit sich bringen, erleichtert den Zugang zum Thema.

Lernziele
Fokus des Vortrags wird die Schilderung unserer Erfahrungen und Schwierigkeiten, v.a. aber die Ableitung von Empfehlungen und die Veranschaulichung der Möglichkeiten von Data Lakes v.a. für Data Scientists sein. Dabei werden wir auf die Vermittlung eines Grundverständnisses abzielen, welches für die realistische Beurteilung dieses Feldes nötig ist.

// Referenten

// Dr. Ralph Wirth

arbeitet seit 2005 bei der Gesellschft für Konsumforschung (GfK). Bis 2012 war er im Bereich "Marketing & Data Science" u.a. für die Entwicklung methodischer Ansätze im Bereich Präferenzanalyse und Marktsimulation, danach im Team "Global Innovation & Digital" für das Management der weltweiten Innovationstätigkeiten der GfK zuständig. Seit März 2015 entwickelt und leitet er das neu gegründete "GfK Data Lab" – ein globales Data-Science-Team, das sich u.a. auf die Erforschung neuer Datenquellen und die Entwicklung innovativer Datenprodukte auf Basis der weltweiten Datenlandschaft der GfK fokussiert.

// Frank Rosenthal

arbeitet seit 2013 in der Abteilung "Marketing & Data Science" im Bereich "Data & Technology" der GfK SE. Ein wesentlicher Schwerpunkt seiner Arbeit ist der Einsatz statistischer Modelle und Verfahren des maschinellen Lernens zur Informationsanreicherung und Optimierung in Datenproduktionsprozessen.

News
- Wir freuen uns über diesen freundlichen Bericht zur data2day 2015 von Stefan Kühn.15.10.2015
- Wir bedanken uns bei allen Teilnehmern für eine rundum gelungene Konferenz.06.10.2015
+ / -
- Auftakt der data2day 2015 mit rund 200 Teilnehmern!29.09.2015
- Wir haben heute die Teilnehmerzahl des Vorjahres überboten!18.09.2015
- Jetzt sind es drei Silber-Sponsoren: Herzlich willkommen, intelligent views!15.09.2015
- Wir begrüßen unseren zweiten Silber-Sponsor: Embarcadero!28.08.2015
- Nach dem Ende des Frühbucherrabatts sind es schon knapp 150 Teilnehmer. Die Zeichen deuten darauf hin, dass die data2day 2015 ausverkauft wird.24.08.2015
- Wir begrüßen unseren neuen Bronze-Sponsor Xaxis.18.08.2015
- Wir haben unserer Konferenz-Website eine optische Überarbeitung verpasst. Funktional hat sich glücklicherweise nichts verändert.06.07.2015
- Nun haben wir auch einen Code of Conduct für die data2day.06.07.2015
- Wir freuen uns, als zweiten Keynote-Sprecher Ralf Herbrich von Amazon präsentieren zu können.01.06.2015
- Das Programm der data2day steht nun online. Damit verbunden startet auch die Anmeldung.01.06.2015
- Wir freuen uns als ersten Keynote-Sprecher den bekannten Technologie- und Wirtschaftsjournalisten Thomas Ramge präsentieren zu können.29.05.2015
- Als neuen Bronze-Sponsor begrüßen wir bakdata.28.05.2015
- Etwa 80 Einreichungen haben wir, dafür bedanken wir uns schon mal. Und das sind knapp 30 mehr als letztes Jahr.18.05.2015
- Der Call for Papers der data2day 2015 wurde auf 17. Mai verlängert.11.05.2015
- Wir begrüßen The unbelievable Machine Company als ersten Bronze-Sponsor.05.03.2015
- codecentric ist erneut als Sponsor dabei. Herzlich Willkommen!04.03.2015
- Auftakt für die data2day 2015. Jetzt mit einem Vortrag bewerben!01.03.2015
- Die data2day 2015 wird von 29. September bis 1. Oktober wieder in Karlsruhe stattfinden!12.12.2014
Silber-Sponsoren
Bronze-Sponsoren
Veranstalter
Unser Konferenz-Portfolio

Unser Weg zum Freischwimmer im Data Lake: Erste Erfahrungen und Einblicke in die Konzeption und den Aufbau eines globalen Data Lake

// Referenten

// Dr. Ralph Wirth

// Frank Rosenthal

Kontakt

Unser Konferenz-Portfolio

Impressum

Bilder von der Konferenz