Leichtgewichtige Analysen und Datenpipelines mit duckdb
duckdb - eine leichtgewichtige, schnelle und flexible Datenbank und QueryEngine. Daten auf der Festplatte oder irgendwo im Internet auswerten, egal in welchem Format, auch wenn diese größer sind als der Arbeitsspeicher. Alles kein Problem.
In diesem Vortrag zeige ich anhand von Folien und einer Live-Demo, warum duckdb so beliebt ist und in die Toolbox eines jeden Data Scientists, Data Engineers und Software Engineer gehört.
Ich schaue außerdem auf die Implikationen für Daten- und Softwarearchitekturen, die sich den neuen embedded OLAP-Systeme wie duckdb ergeben.
Vorkenntnisse
Keine besonderen Vorkenntnisse notwendig
Lernziele
- Was duckdb ist und wofür es genutzt werden kann.
- Wie es funktioniert und was der unterschied zu anderen (in-process) Datenbanken ist.
- Wie es die Brücke zwischen Daten und (Analytics-) Anwendungen bauen kann, indem es Compute und Daten näher zusammenbringt.
- Wie es Datenarchitekturen in Zukunft beeinflussen wird.
Gelerntes kann direkt im Arbeitsalltag eingesetzt werden.