Möchten Sie mit Ihrem Team teilnehmen? Ab drei Personen profitieren Sie von unseren Gruppenrabatten! Direkt im Shop buchen!

Robuste Daten-Pipelines mit Spotify Luigi und Python

Das Rollenverständnis von Data Scientists hat sich stark erweitert. Statt Modelle für einmalige Analysen zu erstellen, wird häufiger in konkreten Entwicklungsprojekten gearbeitet, in denen Prototypen in produktive Anwendungen überführt werden. Entsprechende Modelle sind komplex und bedienen sich oft einer Vielzahl von Technologien. Um den Ansprüchen an den Produktionsbetrieb zu genügen hilft das Open-Source-Framework Luigi von Spotify.

In dem Vortrag schauen wir uns kurz die Konzepte von Luigi an und bauen anschließend mit wenigen Zeilen Code eine ML-Pipeline, die Reddit-Posts in ihre Subreddits einordnet – robust und production ready!

Vorkenntnisse

* Programmiererfahrung in Python

Lernziele

* Die Konzepte und Grundlagen von Luigi kennen lernen
* Die wichtigsten Themen für einen produktiven Betrieb erarbeiten
* Wie lassen sich die Punkte mit wenig Aufwand mit Luigi in Angriff nehmen

Speaker

 

Mark Keinhörster
Mark Keinhörster ist Data Architect bei der codecentric AG. Er ist im Big-Data-Zoo zu Hause und beschäftigt sich außerdem mit Docker, Microservices und Cloud-Technologien.

Gold-Sponsoren

InterSystems
INNOQ
PRODATO

Silber-Sponsoren

HMS Analytical Software
inovex

Bronze-Sponsor

andrena

data2day-Newsletter

Sie möchten über die data2day
auf dem Laufenden gehalten werden?

 

Anmelden