Python-Datenanalyse: Marimo statt Jupyter, Polars statt Pandas, Altair statt Matplotlib

In datengetriebenen Projekten spielt die richtige Visualisierung oft die entscheidende Rolle. Data Scientists erledigen das normalerweise in Jupyter-Notebooks und nutzen dazu die pandas-Bibliothek. Visualisierungen werden oft über matplotlib dargestellt. Doch Python bietet als Plattform weit mehr.

  • Die neuen marimo-Notebooks beherrschen ein Abhängigkeitsmanagement und verhindern damit viele Fehler.
  • Die polars-Bibliothek kann mit sehr großen Datenmengen umgehen und bietet viele Filtermöglichkeiten, die in pandas fehlen.
  • Altair erlaubt eine deklarative Visualisierung und die elegante Kombination mehrere Diagramme.

In einem Beispielprojekt stellen wir die Zusammenarbeit dieser Komponenten vor.

Vorkenntnisse

Alle Frameworks basieren auf Python, Vorkenntnisse sind daher wünschenswert. Die Plattform und die Frameworks sind für sich interessant, besonders spannend aber die Unterschiede zu den Standard-Tools (die man aber nicht kennen muss).

Lernziele

  • Reaktive Nutzung von marimo statt Jupyter
  • Vorteile von polars im Vergleich zu pandas
  • Interaktion mit Altair und Widgets

Speaker

 

Christian Winkler
Christian Winkler beschäftigt sich seit vielen Jahre mit künstlicher Intelligenz, speziell in der automatisierten Analyse natürlichsprachiger Texte (NLP). Als Professor an der TH Nürnberg konzentriert sich seine Forschung auf die Optimierung von User Experience mithilfe moderner Verfahren. Er forscht und publiziert zu AI/NLP und ist regelmäßig Sprecher auf Konferenzen.

data2day-Newsletter

Ihr möchtet über die data2day
auf dem Laufenden gehalten werden?

 

Anmelden