Einführung in Data Science
Data Science ist in aller Munde, aber wenigen ist klar, was genau dahinter steckt. In diesem Workshop sollen Grundideen und -konzepte von Data Science und in einem konkreten Beispiel typische Arbeitsabläufe und Analysemethoden vorgestellt werden. Zur Verwendung kommen aktuelle Toolboxen für Python, unter anderem pandas, matplotlib und scikit-learn.
Teilnehmer können die Schritte selbst auf ihren Laptops nachvollziehen und werden individuell betreut. Die Teilnehmer kalibrieren eigene Machine-Learning-Modelle, vergleichen diese miteinander und lernen, wie man geeignete Modelle auswählt. Ein besonderer Schwerpunkt wird auf der richtigen Validierung der Modelle sowie der Auswahl geeigneter Metriken zur Performance-Messung liegen.
Teilnehmer des Workshops erhalten einen Überblick und einen Startpunkt, um ihr Interesse weiter zu vertiefen.
Vorkenntnisse
* Grundlegende Python-Kenntnisse sind von Vorteil.
* Technische Voraussetzungen: Anaconda installiert, IPython Notebook getestet.
Lernziele
* Überblick über zentrale Tools des Python-Data-Science-Ökosystems
* Basiskenntnisse in den Tools numpy, scipy, pandas, scikit-learn
* Verständnis der Grundbegriffe des Machine Learning
* erste praktische Erfahrung in der Anwendung von Machine-Learning-Algorithmen anhand eines Beispiels