Mit Metadatenmanagement hin zu reproduzierbaren und flexiblen Data-Science-Workflows auf Kubernetes

Damit Data-Science-Projekte erfolgreich sein können, werden nicht nur große Datenmengen und für deren Verarbeitung skalierbare Storage- und Computekapazitäten benötigt. Mindestens genauso wichtig ist, dass Data-Science-Pipelines flexibel sind und trotzdem nachvollziehbare und reproduzierbare Ergebnisse erzeugen.

Sebastian Jäger und Kevin Exel zeigen, wie im Kontext der massenspektrometrischen Bildanalyse, welche in Kooperation mit der Hochschule Mannheim umgesetzt wurde, die für Data-Science-Projekte wichtigen Eigenschaften mithilfe eines Metadatenmangements erreicht werden können. Es wurde sowohl auf die Erweiterbarkeit um zusätzliche Domänen geachtet, als auch auf die Integrierbarkeit in eine bestehende Data-Science-Plattform auf Basis von Kubernetes.

Vorkenntnisse

Grundlegendes Verständnis von Data-Science-Workflows und deren Anforderungen, Problemen und Herausforderungen wie Reproduzierbarkeit und Nachvollziehbarkeit, ist von Vorteil.

Lernziele

Überblick über die Möglichkeiten, die durch das Metadatenmanagement erzeugt werden und wie eine konkrete Architektur aussehen kann – einschließlich deren Umsetzung auf Kubernetes.

 

Speaker

 

Sebastian Jäger
Sebastian Jäger studiert im Masterstudiengang Data Science an der Beuth Hochschule für Technik Berlin. Seine Interessen liegen in den Bereichen des maschinellen Lernens und Big Data, in denen er sehr gerne mit neuen Technologien experimentiert. Bei inovex beschäftigt er sich vor allem mit der Implementierung einer Data-Science-Plattform auf Kubernetes-Basis.

Kevin Exel
Kevin Exel ist derzeit Informatikstudent an der Hochschule Karlsruhe, mit Schwerpunkten in Software Engineering und maschinellem Lernen und starkem Interesse an Data Science und verteilten Systemen. Bei inovex hat er seine Bachelor Thesis über Metadatenmanagement für Data-Science-Workflows auf Kubernetes geschrieben und eine Schulung der Linux Foundation zum Kubernetes Administrator absolviert.

Gold-Sponsoren

HMS
Structr

Silber-Sponsoren

codecentric
Phytec

Bronze-Sponsor

incontext.technology GmbH

data2day-Newsletter

Sie möchten über die data2day
auf dem Laufenden gehalten werden?

 

Anmelden