Interaktive Datenanalyse mit Pandas und Jupyter

Die Open-Source-Bibliothek Pandas ist das "Schweizer Taschenmesser" im Bereich Datenanalyse in Python ohne die Performancenachteile interpretierter Sprachen. Sie punktet mit

* hochperformanter Datenanalyse dank Numpy
* Verarbeitung gängiger Datenformate (CSV, Excel, HDF, SQL, JSON, HTML ...) und
* direktem Zugriff auf Visualisierung, Aggregationen und Statistikfunktionen.

Jupyter ermöglicht die Ausführung von Python im Browser und unterstützt Rich-Text-Elemente sowie auch die direkte Einbindung von Datenvisualisierungen. Der Einsatz von Jupyter und Pandas ist nicht nur für Data Scientists nützlich, sondern auch für Businessanwender (z.B. für Reporting) zugänglich.

Ablaufplan Workshop
-------------------
Teil 1: Grundlagen
* Grundlagen Jupyter Notebooks und Pandas (Informationen)
* Datenein-/ausgabe in verschiedenen Formaten (CSV, Excel, JSON, SQL, HTML ...)
* Übungsteil
* Zugriff und Auswahl von Datenreihen
* Übungsteil
* Aufbau von Pandas: Data Frames & Data Series
* Boolean Indexing
* Zusammenfassung and Q&A

Teil 2: Visualisierung
* Einführung Datenvisualisierung mit Pandas
* Übungsteil
* Datenvisualisierung anpassen & erweitern
* Übungsteil
* Ausblick: Visualisierung jenseits von matplotlib: Bokeh
* Zusammenfassung and Q&A

Teil 3: Datenanalyse und -Aggregation
* Überblick Möglichkeiten Datenaggregation
* Übungsteil
* Erweiterte Analysemöglichkeiten mit Indexing: TimeSeries und Resampling
* Übungsteil
* Zusammenfassung and Q&A

Teil 4: Jupyter und Integration
* Erweitere Funktionen von Jupyter
* Integration mit SciKit-Learn
* Stream Processing
* Integration PySpark
* Zusammenfassung and Q&A

Der Workshop wird den Teilnehmern komplett als Jupiter Notebooks mit Beispieldaten zur Verfügung gestellt.

Technische Anforderungen

Falls Sie ein Gerät Ihrer Firma verwenden, überprüfen Sie vorher bitte, ob eines der folgenden, gelegentlich vorkommenden Probleme bei Ihnen auftreten könnte.
* Workshop-Teilnehmer hat keine Administrator-Rechte.
* Corporate Laptops mit übermäßig penibler Sicherheitssoftware
* Gesetzte Corporate-Proxies, über die man in der Firma kommunizieren muss, die aber in einer anderen Umgebung entsprechend nicht erreicht werden.

Vorkenntnisse
Grundkenntnisse in einer Programmiersprache

Lernziele
Nach dieser Schulung werden die Teilnehmer in der Lage sein:

* Daten mit Pandas einzulesen, zu analysieren, zu aggregieren und zu visualisieren
* Auch werden Techniken zum Resampling und zur statistischen Analyse erlernt
* Jupyter Notebooks: Benutzung und Einsatzmöglichkeiten
* Reports als Excel oder auch in PDF automatisiert zu erstellen

// Alexander Hendorf
@hendorf

ist CTO bei der Königsweg GmbH. Durch seine Vorträge auf internationalen Konferenzen wie MongoDB World NY, EuroPython, MongoDB Days San José oder PyData London ist er ein bekannter Experte im Bereich Datenanalyse. Leidenschaftlich engagiert sich er für Open Source, ist Program Chair der EuroPython, der größten europäischen Python-Konferenz und einer der 25 MongoDB Masters. Bei Königsweg berät er Unternehmen mittels "agiler Datenanalyse" firmenübergreifend, um effizient aus ihren Daten den größten Mehrwert zu schaffen.

News
- Herzlichen Dank an alle Teilnehmer, Referenten und Sponsoren, die die data2day 2017 zu einer tollen Konferenz gemacht haben. Mit 250 Gästen war das die bisher größte data2day. Wir wünschen allen eine gute Heimreise. Bis nächstes Jahr!28.09.2017
- Jetzt ist auch das Vortragsprogramm ausgebucht; es sind nur noch Vormerkungen möglich. Freie Plätze bietet noch ein Workshop: "Interaktive Datenanalyse mit Pandas und Jupyter"22.09.2017
+ / -
- Für alle, die von Big Data nicht genug bekommen können: Im Anschluss an die data2day findet das kostenlose Karlsruhe Big Data Meetup statt – in diesem Jahr in der PMA Heidelberg.21.09.2017
- Zwei Wochen bis zur Konferenz: Es gibt nur noch wenige freie Plätze.13.09.2017
- Wir bieten den Workshop "Machine Learning mit PySpark" jetzt auch am 29. September an.05.08.2017
- Der Frühbucherrabatt geht jetzt noch mal zehn Tage länger - bis 14. August.04.08.2017
- Unser zweiter Keynote-Sprecher ist Ramin Assadollahi.03.08.2017
- Das Programm mit 36 Vorträgen und 5 Workshops ist nun online. Und ab sofort bis 4.8. gibt es Tickets zum Frühbucherrabatt.01.06.2017
- Wir haben unser Call for Proposals noch mal um eine Woche bis 2. Mai verlängert24.04.2017
- Zwei weitere Vortragsvideos der data2day 2016 sind jetzt online. Themen: Datenvirtualisierung und Data Lakes07.04.2017
- Noch bis zum 24. April können Sie Vorschläge für Vorträge und Workshops einreichen.06.04.2017
- Herzlich willkommen: inovex ist als Gold-Sponsor dabei!23.03.2017
- Zwei weitere Vortragsvideos der data2day 2016 sind jetzt online.07.02.2017
- Ab sofort und bis zum 24. April können Vorschläge für Vorträge und Workshops eingereicht werden. Der Call for Proposals ist eröffnet.06.02.2017
- Wir freuen uns über zwei treue Sponsoren codecentric und Opitz Consulting.01.02.2017
Gold-Sponsor
Silber-Sponsoren
Veranstalter
Unser Konferenz-Portfolio

Interaktive Datenanalyse mit Pandas und Jupyter

// Alexander Hendorf
@hendorf

Kontakt

Unser Konferenz-Portfolio

Impressum

Bilder von der Konferenz

Interaktive Datenanalyse mit Pandas und Jupyter

// Alexander Hendorf @hendorf

// Alexander Hendorf
@hendorf