Automobilhersteller

Konzept und Pilotierung des Alation Data Catalogs

Ausgangsbasis

  • Großer Data Lake mit vielen unterschiedlichen und unstrukturierten Daten
  • Zur Katalogisierung der Daten muss das Wiki bei Änderun-gen manuell gepflegt werden
  • Es existiert keine zentrale Plattform zur Suche im Data Lake
  • Eine zentrale Verwaltung bzw. ein einheitlich etabliertes Data Governance ist nicht vorhanden

Vorgehensweise

  • Aufnahme der User-Anforderungen für alle Rollen durch Interviews
  • Konzeption des Data Governance Prozesses
  • Definition der verpflichtenden sowie der optionalen Metadatenfelder
  • Installation des Alation Data Catalogs
  • Anbindung an einen Teil des Data Lakes zur Pilotierung der Lösung
  • Pflege von Metadaten für einige Datenquellen zur Erprobung der Suchfunktion

Funktionen/Projektergebnis

  • Erstellung und Einbindung eines erweiterbaren Data Governance-Konzepts
  • Implementierung einer lauffähigen Alation Data Catalog Anwendung
  • Funktionsfähige Anbindung an den Data Lake
  • Erstellung eines Piloten mit einigen Datenquellen sowie gültigen Metadaten

Kundenutzen

  • Ganzheitliches Management der Daten im Data Lake durch das Data Governance-Konzept
  • Katalogisierte Datenquellen anhand ihrer Metadaten
  • Schneller Überblick über die Daten durch Suchfunktionen
  • Einfache Wiki-Pflege durch die technische Anbindung des Alation Data Catalogs an den Data Lake
  • Beliebige Erweiterung des Alation Data Catalogs mit neuen Datenquellen und dem wachsenden Data Lake
Nico Inhoffen | Senior Manager