Einführung in Datenanalyse mit Pandas
Die Open-Source-Bibliothek Pandas ist das Schweizer Taschenmesser im Bereich Datenanalyse in Python ohne die Performance Nachteile interpretierter Sprachen. Sie punktet mit:
* Hochperformance-Verarbeitungen großer Datenmengen dank Numpy,
* Verarbeitung gängiger Datenformate (CSV, Excel, HDF, SQL, JSON, HTML ...), und
* direktem Zugriff auf Visualisierung, Aggregationen und Statistikfunktionen.
Der Talk gibt eine Einführung in Pandas insbesondere mit Blick auf DataSeries, DataFrames, Zeitreihenanalyse und zeigt anhand von Beispielen, wie man effizient und schnell mit Pandas tiefen Einblick in seine Daten bekommen kann.
Vorkenntnisse
Programmiergrundkenntnisse - Sprache nebensächlich. Grundkenntnisse Daten-Analyse/Statistik.
Lernziele
* Einführung in das Datenmodell und Funktionsweise von Pandas
* Praxis- und Codebeispiele mittels iPython Notebook
* Besucher sollten nach dem Talk in der Lage sein, schon einfachere Aufgaben in Pandas zu lösen.