Data quality to stopień, w jakim dane są poprawne, kompletne, spójne i aktualne, dzięki czemu mogą być wiarygodnie wykorzystywane w analizie i podejmowaniu decyzji biznesowych.
Na jakość danych składa się kilka kluczowych elementów:
- Poprawność – dane odzwierciedlają rzeczywisty stan (np. brak błędów i literówek)
- Kompletność – brak istotnych braków w danych
- Spójność – dane są zgodne między systemami i źródłami
- Aktualność – dane są na bieżąco aktualizowane
- Unikalność – brak duplikatów
Wysoka jakość danych jest fundamentem skutecznej analityki, raportowania i projektów BI. Niska data quality prowadzi do błędnych wniosków, problemów operacyjnych oraz spadku zaufania do danych w organizacji.
W praktyce jakość danych jest monitorowana i poprawiana poprzez procesy takie jak data validation, data profiling czy data cleansing, często wspierane przez narzędzia analityczne i integracyjne.