Data lineage to proces śledzenia pochodzenia danych oraz wszystkich etapów ich przetwarzania w systemach informatycznych.
Pozwala on zrozumieć:
-
skąd pochodzą dane
-
jakie transformacje zostały na nich wykonane
-
w jakich raportach lub systemach są wykorzystywane
Data lineage jest kluczowym elementem zarządzania danymi (data governance), ponieważ umożliwia kontrolę jakości danych, identyfikację błędów oraz spełnianie wymagań regulacyjnych.
W środowiskach Business Intelligence analiza lineage pomaga również lepiej zrozumieć logikę raportów i modeli danych, co zwiększa zaufanie do danych wykorzystywanych w procesach decyzyjnych.
W nowoczesnych architekturach danych narzędzia integracyjne, takie jak Talend, pozwalają automatycznie dokumentować przepływy danych i budować pełny obraz ich przetwarzania.