Ihr möchtet mit eurem Team teilnehmen? Ab drei Personen profitiert ihr von unseren Gruppenrabatten! Direkt im Shop buchen!

Von rohen Daten bis zum Dashboard in der Cloud mit Python, Jupyter, Panel und KI

Der Workshop vermittelt, wie man kollaborativ Daten mit Python analysieren kann, welche Tools zur Verfügung stehen und wie man die Ergebnisse effektiv bereitstellen kann.

Dazu wird ein AirBnB-Datensatz verwendet, um Inserate und Bewertungen von Unterkünften innerhalb Berlins Schritt für Schritt zu verarbeiten und zu analysieren.

Dabei arbeiten wir uns durch gängige Bibliotheken zur Datenverarbeitung und -analyse mit Python sowie fortgeschrittenere Bibliotheken wie etwa Panel, um alles visuell als Web-App zur Verfügung zu stellen. Abschließend werden wir mit Langchain ein LLM einbinden, um die Möglichkeit zu geben, weitere Fragen über den Datensatz zu stellen.

Vorkenntnisse

  • Verständnis von allgemeiner Programmiersemantik wird benötigt.
  • Python-Kenntnisse sind vorteilhaft aber nicht zwingend notwendig.

Lernziele

Teilnehmende lernen

  • das Einlesen und Verarbeiten von Daten mit Python – inkl. Data Preparation und Data Cleaning
  • das Analysieren und Visualisieren von Daten mit Python – inkl. Zeitreihenanalyse, NLP und interaktive Datenplots
  • den Umgang mit Jupyter Notebooks
  • das Erstellen von Webapps aus Notebooks mit Panel
  • das Anbinden und Integrieren von cloudbasierten KI-Systemen

Agenda

  • ab 09:00 Uhr: Registrierung und Vorstellung/Erwartungsabfrage
  • 09:30 Uhr: Beginn
  • 09:30 - 9:45 Uhr: Plattformregistrierung
  • 09:45 - 10:50 Uhr: Data Analytics mit Python
  • 10:50 - 11:00 Uhr: Kaffeepause
  • 11:00 - 12:30 Uhr: Datenvisualisierung und Panel Teil 1
  • 12:30 - 13:30 Uhr: Mittagspause
  • 13:30 - 14:00 Uhr: Panel Teil 2 und Einführung Airbnb Analyse
  • 14:00 - 15:00 Uhr: Airbnb Analyse Teil 1
  • 15:00 - 15:15 Uhr: Kaffeepause
  • 15:15 - 16:45 Uhr: Airbnb Analyse Teil 2
  • 16:45 - 17:00 Uhr: Feedback & Fragen
  • ca. 17:00 Uhr: Ende

 

Technische Anforderungen

Ein Laptop wird zum Mitmachen benötigt, eine All-in-One-Plattform mit Jupyter und allen Abhängigkeiten wird gestellt.
Optional ist auch eine lokale Installation des verwendeten Python-Projekts möglich, dafür benötigen Teilnehmende jedoch einen eigenen API-Zugang zu einem LLM-Provider, da dieser bei der Plattform über Azure mit Workload Identities realisiert ist.

Speaker

 

Patrick Seifert
Patrick Seifert beschäftigt sich seit seinem Wirtschaftsinformatik-Studium immer wieder mit Datenanalyse und Machine Learning, darunter besonders Predictive Maintenance und Natural Language Processing im Automotive Bereich. Bei UL Solutions ist er als Data Analytics Trainer unterwegs und arbeitet an Analyselösungen für Prüflabore in Kombination mit KI und Cloud.

Maximilian Lattka
Maximilian Lattka ist seit 2020 in der Python Data Analytics Community aktiv und arbeitet als Softwareentwickler bei UL Solutions. Sein Alltag dreht sich darum, neue Technologien einzusetzen, um Business-Entscheidungen durch die Auswertung von Datensätzen zu unterstützen. Darüber hinaus gibt er sein praktisches Wissen weiter, indem er Trainings im Bereich Data Analytics entwickelt und leitet.