Data catalog to narzędzie lub system, który umożliwia organizowanie, opisywanie i wyszukiwanie zasobów danych w organizacji, pełniąc rolę centralnego „spisu” dostępnych danych.
Data catalog zawiera informacje o danych, takie jak:
- Metadane – opis danych (np. źródło, struktura, właściciel)
- Lokalizacja danych – gdzie dane są przechowywane
- Definicje biznesowe – znaczenie poszczególnych danych
- Historia i pochodzenie danych (data lineage)
- Jakość danych (data quality)
Dzięki katalogowi danych użytkownicy – zarówno analitycy, jak i zespoły biznesowe – mogą łatwo znaleźć potrzebne dane i zrozumieć ich kontekst bez konieczności angażowania działu IT.
Data catalog jest kluczowym elementem data governance, ponieważ wspiera zarządzanie danymi, zwiększa ich dostępność oraz poprawia jakość i bezpieczeństwo pracy z danymi w organizacji.
W nowoczesnych środowiskach analitycznych katalogi danych są często zintegrowane z platformami BI i narzędziami do integracji danych, umożliwiając szybkie odkrywanie i wykorzystanie danych w całej organizacji.