Ihr möchtet mit eurem Team teilnehmen? Ab drei Personen profitiert ihr von unseren Gruppenrabatten! Direkt im Shop buchen!

Data Contracts in der Praxis

Ihr möchtet euch mit Data Contracts vertraut machen? Wir zeigen euch, wie das geht, anhand des Open Data Contract Standard und der Open-Source-Software Data Contract CLI. Ihr beginnt damit, bestehende Daten unter Vertrag zu nehmen – ihr entwerft einen Data Contract für bestehende Daten, fügt Data Quality Checks hinzu, testet die Daten gegen den Data Contract und erstellt eine HTML-Dokumentation bzw. einen Data-Contract-Katalog.

Dann drehen wir den Spieß um: Ihr arbeitet in Gruppen daran, einen Data Contract von Grund auf neu zu erstellen, basierend auf realen Anforderungen in einem Workshopformat – und nehmt dabei Rollen wie Datenproduzent, -konsument und Moderator ein. Dabei reflektieren wir das Gelernte und schließen mit Ideen ab, wie Data Contracts die Automatisierung vorantreiben können.

Vorkenntnisse

  • Ein Laptop mit Python 3.10 oder neuer sowie installiertem VS Code ist hilfreich.
  • Teilnehmende sollte wissen, was YAML ist.

Lernziele

Teilnehmende

  • erwerben grundlegende Kenntnisse des Open Data Contract Standard und der Verwendung der Data Contract CLI
  • erlernen, wie vorhandene Daten unter Vertrag genommen und validiert werden
  • üben gemeinsames Erstellen von Data Contracts anhand von Anforderungen in einem Team

Agenda

  • ab 09:00 Uhr: Registrierung
  • 09:00 Uhr bis 10:00 Uhr: Ankommen und Data Contract CLI Installation bereits überprüfen
  • 10:00 Uhr: Beginn
  • 10:00 Uhr - 10:30 Uhr: Welcome & Intro: Data First (Approach, Tooling)
  • 10:30 Uhr - 11:30 Uhr: Übung 1: Put Your Data Under Contract (Data-first)
  • 11:30 Uhr - 11:45 Uhr: Kaffeepause
  • 11:45 Uhr - 13:00 Uhr: Theorie zu Data Contracts (Lifecycle, Versionierung, Custom-Fields, Lebensraum, …)
  • 13:00 Uhr - 14:00 Uhr: Mittagspause
  • 14:00 Uhr - 14:30 Uhr: Intro: Contract First (Approach, Excel Template, Workshop-Format)
  • 14:30 Uhr - 15:30 Uhr: Übung 2: „Data Contract Workshop“ (Contract-first)
  • 15:30 Uhr - 15:45 Uhr: Kaffeepause
  • 15:45 Uhr - 16:30 Uhr: Diskussion zu Einführung von Data Contracts im eigenen Unternehmen
  • 16:30 Uhr - 17:00 Uhr: Abschluss-Retro
  • ca. 17:00 Uhr: Ende

 

Technische Anforderungen

Bitte bringt einen eigenen Laptop mit.
Es wird zudem folgendes benötigt:
  • MS Excel und Data Contract CLI (Python-Installation (empfohlen) oder via Docker (Fallback)). Am einfachsten mit uv: uv tool install 'datacontract-cli[all]'.
  • Danach prüfen, ob es funktioniert mit: datacontract –version
  • Alternative Docker: docker run --rm -v ${PWD}:/home/datacontract datacontract/cli –version
  • Wir nutzen Databricks für die Übung. Dazu muss der Laptop eine Netzwerkverbindung zu der Databricks Cloud aufbauen dürfen.
Falls ihr ein Gerät eurer Firma verwendet, überprüft vorher bitte, ob eines der folgenden, gelegentlich vorkommenden Probleme bei euch auftreten könnte.
  • Workshop-Teilnehmer:in hat keine Administrator-Rechte.
  • Corporate Laptops mit übermäßig penibler Sicherheitssoftware
  • Gesetzte Corporate-Proxies, über die man in der Firma kommunizieren muss, die aber in einer anderen Umgebung entsprechend nicht erreicht werden.

Speaker

 

Simon Harrer
Simon Harrer ist Mitgründer des Data Mesh Managers und Senior Consultant bei INNOQ. Er verbindet Data Mesh, Data Governance und GenAI zu praxisnahen Lösungen – aktuell mit GPT-4o zur Umsetzung von Federated Computational Governance.