Polars: Der Turbo Boost für Dataframes

Wir berichten über unsere Erfahrungen mit dem Wechsel von Pandas zu Polars in einem realen Machine-Learning-Projekt. Polars ist eine neue leistungsstarke Dataframe-Bibliothek für Python, die auf Apache Arrow basiert und in Rust geschrieben ist.

Wir werden die Leistung von Polars mit der beliebten Pandas-Bibliothek vergleichen und zeigen, wie Polars signifikante Geschwindigkeitsverbesserungen bei der Datenmanipulation und bei Analyseaufgaben bietet. Wir werden auch die einzigartigen Eigenschaften von Polars diskutieren, z.B. die Fähigkeit, große Datensätze zu verarbeiten, die nicht in den Speicher passen, und wie sich der Wechsel von Pandas in der Praxis anfühlt und welche Alternative es gibt.

Vorkenntnisse

  • Teilnehmende sollten grundlegende Kenntnisse einer Technologie zur Bearbeitung von strukturierten Daten haben, z.B. Pandas, SQL oder Apache Spark

Lernziele

  • Dieser Vortrag richtet sich an Data Scientists, Machine Learning Engineers und alle, die an schneller und effizienter Datenverarbeitung in Python interessiert sind
  • Teilnehmende können nach dem Vortrag einschätzen, ob Polars eine Alternative für sie ist, um Daten in ihren Projekten schneller und einfacher bearbeiten zu können

Speaker

 

Thomas Bierhance
Thomas Bierhance arbeitet seit 25 Jahren leidenschaftlich gerne mit Daten: von kleinen Datenbanken für KMU über große verteilte Systeme für internationale Unternehmen bis hin zu intelligenten Systemen mit maschinellem Lernen. Er leitet den Bereich Data Science & AI bei BettercallPaul in Stuttgart und unterstützt seine Kunden und Teams auf ihrem Weg, aus Daten einen Mehrwert zu generieren.

data2day-Newsletter

Ihr möchtet über die data2day
auf dem Laufenden gehalten werden?

 

Anmelden