Polars: Der Turbo Boost für Dataframes
Wir berichten über unsere Erfahrungen mit dem Wechsel von Pandas zu Polars in einem realen Machine-Learning-Projekt. Polars ist eine neue leistungsstarke Dataframe-Bibliothek für Python, die auf Apache Arrow basiert und in Rust geschrieben ist.
Wir werden die Leistung von Polars mit der beliebten Pandas-Bibliothek vergleichen und zeigen, wie Polars signifikante Geschwindigkeitsverbesserungen bei der Datenmanipulation und bei Analyseaufgaben bietet. Wir werden auch die einzigartigen Eigenschaften von Polars diskutieren, z.B. die Fähigkeit, große Datensätze zu verarbeiten, die nicht in den Speicher passen, und wie sich der Wechsel von Pandas in der Praxis anfühlt und welche Alternative es gibt.
Vorkenntnisse
- Teilnehmende sollten grundlegende Kenntnisse einer Technologie zur Bearbeitung von strukturierten Daten haben, z.B. Pandas, SQL oder Apache Spark
Lernziele
- Dieser Vortrag richtet sich an Data Scientists, Machine Learning Engineers und alle, die an schneller und effizienter Datenverarbeitung in Python interessiert sind
- Teilnehmende können nach dem Vortrag einschätzen, ob Polars eine Alternative für sie ist, um Daten in ihren Projekten schneller und einfacher bearbeiten zu können