Ihr möchtet mit eurem Team teilnehmen? Ab drei Personen profitiert ihr von unseren Gruppenrabatten! Direkt im Shop buchen!
Teilnehmer sollten mit den grundlegenden Konzepten von Apache Spark vertraut sein und erste praktische Erfahrungen mit dieser Technologie gesammelt haben.
* Arbeitsweise der Anfrageoptimierung und verteilten Ausführung in Apache Spark
* Operatoren der relationalen Algebra und deren Implementierung in Spark
* Interne Darstellung von DataFrames und Datasets
* Verständnis des Zusammenspiels zwischen den Spark-Komponenten Catalyst, Tungsten und Core
* Grundlagen der logischen Anfrageoptimierung
* Vorteile der DataFrame bzw. Dataset API gegenüber RDDs
* Neuerungen in Apache Spark 2.x
Simon Kaltenbacher arbeitet als Senior Data Engineer bei der Alexander Thamm GmbH in München. Dort berät er Kunden beim Aufbau von Datenplattformen und unterstützt sie bei der Implementierung von Daten-Pipelines. Er verfolgt das Apache-Spark-Projekt intensiv seit Version 0.9 und hat bereits mehrere Schulungen zu dieser Technologie gehalten.