Clean Data Science – Die Brücke zwischen Experiment und Produktion
Data-Science-Projekte starten oft im Chaos: unübersichtliche Rohdaten, vage Anforderungen und knappe Deadlines – der ideale Nährboden für die immer gleichen Antipatterns.
Das Dilemma: schnell experimentieren oder sauber für die Produktion entwickeln? Die Lösung liegt nicht im Entweder-oder, sondern darin zu verstehen, wann Clean Code unverzichtbar – und wo kontrolliertes Chaos produktiver ist.
Gemeinsam bauen wir iterativ ein flexibles Code-Fundament, mit dem du experimentieren, sauber zusammenarbeiten und später reibungslos in Produktion gehen kannst. Ich teile echte Codebeispiele aus meinem Alltag, spreche offen über Fehler – und stelle bewährte Lösungsstrategien vor.
Vorkenntnisse
Es werden Grundkenntnisse in Python und SQL vorausgesetzt. Ideal für Data Scientists und Engineers, die in cross-funktionalen Teams arbeiten.
Lernziele
- Du erkennst typische Antipatterns wie falsche Notebook-Nutzung, ausuferndes SQL, fehlende Tests oder die Trennung von Science und Engineering.
- Du lernst, wie du mit Git und MLflow ein schlankes Experimentier-Framework aufbaust.
- Du lernst, wie iterativer, modularer Code und klare Data-Layer Reproduzierbarkeit fördern – und wann bewusstes Chaos erlaubt ist.
- Du siehst, wie du Experimente einfach mit Docker und Kubernetes in Produktion bringst.