Ihr möchtet mit eurem Team teilnehmen? Ab drei Personen profitiert ihr von unseren Gruppenrabatten! Direkt im Shop buchen!

Datenkataloge – die Kontrollinstanz im offenen Data Lakehouse

Datenkataloge sind das Rückgrat moderner Data Lakehouses, sie schlagen die Brücke zwischen Rohdatenspeichern und verwalteten, vertrauenswürdigen Datenplattformen. Sie verwalten technische Metadaten, sichern Data Lineage, Datenqualität und Governance und verwandeln Rohdaten in vertrauenswürdige Plattformen. Doch kein Katalog deckt alle Anforderungen ab.

Anhand eines Praxisbeispiels zeigen wir, wie LakeKeeper (für Iceberg-Optimierung) und OpenMetadata (für Lineage & Governance) in ein Lakehouse integriert werden, um Entdeckbarkeit, Compliance und technische Effizienz zu steigern. Ideal für Architekten, die ihr Lakehouse vom „Data Swamp“ zur kontrollierten Datenplattform machen wollen.

Ich werde eine konkrete Demo zeigen, bei der ein dbt-Modell Daten transformiert und im Data Lake manifestiert, und wie die Metadaten für Lineage dieser Operationen in eine OpenMetadata-Instanz exportiert werden.

Vorkenntnisse

Ein gutes Grundverständnis von Datentransformationen, Lakehouse-Konzepten usw. ist hilfreich, tiefe technische Vorkenntnisse sind aber nicht erforderlich.

Lernziele

Du erhältst einen guten Überblick darüber, was mit einem Datenkatalog geht – aber auch was nicht geht, ohne in erheblichen Mehraufwand zu investieren.

Speaker

 

Sönke Liebau
Sönke Liebau bringt langjährige praktische Erfahrung im Bereich Big Data mit und unterstützt Kunden bei der Konzeption und Implementierung von Lösungen. Durch seine intensive Beteiligung am Aufbau und der Wartung von Infrastrukturen hat er einen umfassenden Einblick in die Anforderungen und Rahmenbedingungen gewonnen, die erstklassige Big-Data-Architekturen prägen. Als CPO bei Stackable lässt er dieses Fachwissen direkt in das Produkt einfließen, um sicherzustellen, dass es den Bedürfnissen jedes Kunden voll und ganz entspricht.
LinkedIn