Praktische Programmiererfahrung. In der Schulung wird Python verwendet, aber auch bei Nichtkenntnis finden sich erfahrungsgemäß Teilnehmer in die Sprache sehr schnell ein.
• Im Workshop lernen die Teilnehmer die grundlegende Funktionsweise von Apache Spark.
• Mit PySpark und DataFrames lernen sie einfache Transformationen sowie Filtern und Joins.
• Anhand eines frei verfügbaren Datensatzes lernen die Teilnehmer die Konzepte des Machine Learning.
• Mit PySpark werden schließlich auch Pipelines für aufeinander aufbauende Schritte verwendet.
ab 8.30 Uhr: Registrierung und Begrüßungskaffee
9.30 Uhr: Beginn
9.30 - 9.45 Uhr: Organisation und Umgebung
9.45 - 10.00 Uhr: Spark Kurzvorstellung
10.00 - 11.00 Uhr: Spark DataFrame API (hands on training)
11.00 - 11:15 Uhr: Kaffeepause
11.15 - 12.30 Uhr: Data Engineering
12.30 - 13.30 Uhr: Mittagspause
13.30 - 14.00 Uhr: Machine Learning Introduction
14.00 - 15.30 Uhr: ML Example
15.30 - 15.45 Uhr: Kaffeepause
15.45 - 16.30 Uhr: Refining the example
ca. 17.00 Uhr Ende
Kaya Kupferschmidt arbeitet seit über zehn Jahren als freier Entwickler, Berater und Trainer mit Schwerpunkt Big Data und speziell Hadoop-Ökosystem. Er verfügt über vielfältige Erfahrungen unter anderem im Online-Advertising, dem Energiesektor bis hin zu unternehmensweiten Data Lakes in großen Finanzinstituten. Derzeit fokussiert er sich auf Apache Spark und den Themenkomplex Machine Learning.