Tools und Methoden für
Big, Smart und Fast Data
Karlsruhe, IHK, 29. September - 1. Oktober 2015

data2day 2015 » Programm »

Einführung in Data Science

Data Science ist in aller Munde, aber wenigen ist klar, was genau dahinter steckt. In diesem Workshop sollen Grundideen und -konzepte von Data Science und in einem konkreten Beispiel typische Arbeitsabläufe und Analysemethoden vorgestellt werden. Zur Verwendung kommen aktuelle Toolboxen für Python, unter anderem pandas, matplotlib und scikit-learn.

Teilnehmer können die Schritte selbst auf ihren Laptops nachvollziehen und werden individuell betreut. Die Teilnehmer lernen die Tricks-of-the-trade der Datenvorverarbeitung und kalibrieren eigene Machine-Learning-Modelle. Ein besonderer Schwerpunkt wird auf der richtigen Validierung der Modelle sowie der Auswahl geeigneter Metriken zur Performance-Messung liegen.

Teilnehmer des Workshops erhalten einen Überblick und einen Startpunkt, um ihr Interesse weiter zu vertiefen.

Skills
* Grundlegende Python-Kenntnisse sind von Vorteil.
* Technisch Voraussetzungen: Anaconda installiert, IPython Notebook getestet.

Lernziele
* Überblick über zentrale Tools des Python-Data-Science-Öksystems
* Basiskenntnisse in den Tools numpy, scipy, pandas, scikit-learn
* Verständnis der Grundbegriffe des Machine Learning
* Erste praktische Erfahrung in der Anwendung von Machine-Learning-Algorithmen anhand eines Beispiels

// Referenten

// Mikio Braun Mikio Braun

arbeitet als Data Scientist und Delivery Lead bei Zalando, einem der größten Onlinehändler im Modebereich in Europa, im Bereich Recommendation und Search, der für Empfehlungen und Suche für die verschiedenen Vertriebskanälen verantwortlich ist.


// Dr. Paul von Bünau Dr. Paul von Bünau

ist Associate bei idalab, einem Berliner Beratungsunternehmen für Predictive Analytics, Data Science, Advanced Analytics und mathematischer Optimierung. Er unterstützt Unternehmen aus den Bereichen Pharma, Finance, E-Commerce und Digital bei der Übersetzung von Business-Fragestellungen in individuellen Analytics-Lösungen sowie deren Implementierung in IT und Prozesse.