Czy dane mogą być demokratyczne? W czym może pomóc demokratyzacja danych?
Data is the Power. Można nawet zaryzykować tezę, że dostęp do danych i umiejętność wyciągania z nich trafnych wniosków decyduje dzisiaj o pozycji ekonomicznej i społecznej człowieka. Na szczęście nie jest to blog dotyczący zmian społecznych, więc pozwolę sobie tej kwestii nie rozwijać.
Informacja jako narzędzie wpływu
Fundamentalne znaczenie informacji nie jest żadnym nowym odkryciem. Można chociażby sięgnąć do historii Europy w XVII wieku. Gdy zorientowano się, że informacje mają znaczenie dla szerszej publiczności, powstały gazety. Wprawdzie dostęp do nich był ograniczony jedynie do tych, którzy potrafili czytać i dopiero 300 lat później, gdy edukacja stała się powszechna, wolne media stały się źródłem dostępnym dla większości, a informacja została zdemokratyzowana.
W podobnym miejscu jesteśmy dzisiaj. Rewolucja cyfrowa spowodowała nie tylko wykładniczy wzrost wolumenu dostępnych danych, szacowanego dzisiaj na 64 ZetaBajty (64*10^21). Przewagi wynikające z posiadania danych i ich przetwarzania mają nieporównywalnie większe znaczenie, niż miały informacje z kilkunastu państw europejskich dla kupców z Wolfenbüttel (gdzie powstała pierwsza w historii gazeta).
Dostępność wielkich wolumenów danych spowodowała rosnącą przewagę konkurencyjną tych, którzy je posiadają i potrafią wyciągać z nich wnioski. Qlik Sense jest dla takich zadań trudnym do przecenienia narzędziem, przede wszystkim ze względu na swoją efektywność w przetwarzaniu dużych zbiorów oraz rozbudowane funkcjonalności Machine Learning.
Demokratyzacja danych – co to takiego?
Demokratyzacja danych dotyczy zwiększania dostępności danych i ułatwień w korzystaniu z nich przez szersze grono Użytkowników, a nie tylko decydentów i osoby zarządzające. Skoro jednak data is the power, to dlaczego biznes miałby chcieć udostępniać to, co decyduje o jego przewadze nad konkurencją? Dzisiejsza gospodarka ma niewiele wspólnego z XIX wiecznym kapitalizmem i to wiedza jest obecnie najważniejszym kapitałem. Wprawdzie Polska bardziej ma ambicje, aby jej gospodarka była oparta na wiedzy, niż cel ten realizuje. Jednak i u nas rośnie liczba innowacyjnych firm, a w sektorze prywatnym szybko wzrasta poziom inwestycji w R&D, czego można dowiedzieć z European Innovation Scoreboard. W takiej gospodarce pracownik nie jest „siłą wytwórczą”, lecz współtwórcą wartości firmy. To, w jaki sposób jest wykształcony, poinformowany i do jakiej wiedzy ma dostęp, przesądza o jego efektywności.
Dane i zarządzanie nimi to (na razie) domena osób na najwyższych szczeblach
Jednak w wielu przypadkach w firmach dostęp do analityki danych, przedstawianej w wygodny dla użytkownika sposób, jest ograniczony do zarządów i rad nadzorczych. Oczywiście znajduje to uzasadnienie w tym, że w tych miejscach zapadają najważniejsze dla firmy decyzje, a czas na ich podjęcie jest dobrem rzadkim. Upraszczając – dobrze wykonany dashboard daje dokładniejszy i wygodniejszy w korzystaniu wgląd w sytuację firmy, niż odczytywanie danych z arkusza kalkulacyjnego.
Demokratyzacja danych przyda się w biznesie
Decyzje wymagające wiarygodnego i szybkiego dostępu do danych nie są wyłączną domeną top managementu. KPI, będące wyznacznikiem kondycji firmy, są generowane na podstawie danych czerpanych z zasobów przedsiębiorstwa (często połączonych z danymi zewnętrznymi). Zatem manager, który może decydować celniej, łatwiej, wygodniej i szybciej, niż za pomocą arkusza kalkulacyjnego w oczywisty sposób będzie bardziej efektywny. A jeżeli dodatkowo mógłby to robić na danych generowanych w czasie rzeczywistym, to dużo szybciej identyfikowałby sytuacje wymagające jego interwencji.
Właściwie w odniesieniu do wszystkich pracowników można byłoby znaleźć dobry biznesowy powód udostępnienia im wybranych danych posiadanych przez firmę (widziałem ostatnio przykład z dużej firmy, w której w ten sposób pracownicy otrzymywali informację, z czego wynika ich premia). Jestem w stanie pokazać sytuacje, gdy korzystne dla firmy byłoby udostępnianie zakresu danych partnerom, podwykonawcom a nawet klientom.
Ochrona danych osobowych jako bariera w demokratyzacji danych
Przeważnie przeszkodą dla tego typu wykorzystania danych, które i tak są zbierane i analizowane przez firmę, jest obawa o ich ochronę (zarówno z powodu ich wartości rynkowej, jak i RODO). Tu jednak mam dobrą informację dla użytkowników Qlik Sense. Ma on rozbudowane i bardzo skuteczne rozwiązania dotyczące określania dostępu i ochrony danych.
Dostęp do danych wymaga kompetencji w ich obróbce
Drugą barierą są kompetencje niezbędne do przygotowania rzetelnych i wygodnych w korzystaniu analiz. Trzeba mieć wiedzę i umiejętności, których nabycie wymaga czasu, aby profesjonalnie przygotować trafną predykcję wykorzystującą Machine Learning. Wcześniej grupa ta ograniczała się do osób posiadających bardzo wysokie kompetencje analityczne, statystyczne i informatyczne. Dzisiaj istnieją jednak rozwiązania, które ułatwiają przygotowanie zaawansowanych i wartościowych analiz danych. Aplikacje takie jak Qlik Sense automatyzują wiele zadań związanych z ich przygotowaniem – od łączenia zbiorów danych, przez korzystanie z modeli Machine Learning, po wizualizację, a do ich używania nie potrzeba kilku lat studiów, lecz kilkumiesięcznego szkolenia. I znowu, trzeba zwrócić uwagę, że Qlik Sense ma dobre i rozbudowane funkcjonalności dotyczące ułatwień w korzystaniu z ML.
Ten rodzaj demokratyzacji danych nie jest jedyny, o którym warto wspomnieć. Szczególnie należy tu powiedzieć o otwieraniu danych publicznych. Projekt Open Data jest jednym z priorytetów UE i nawet niechęć urzędników do dzielenia się wiedzą oraz informacjami musi przed polityką unijną ustąpić.
Czy ma to znaczenie dla biznesu? Jak najbardziej. Po pierwsze, wiele z danych będących w dyspozycji administracji ma dużą wartość dla podejmowania decyzji w biznesie (szczególnie w połączeniu z danymi posiadanymi przez firmy). Możemy tu wskazać liczne przykłady takich zasobów. Już teraz bezpłatnie dostępny jest szeroki zakres zabiorów GIS, w tym pomiary automatyczne aż do statystyk o niskim poziomie agregacji.
Warto o tym wspomnieć także dlatego, że analizy danych statystycznych o niskim poziomie agregacji mogą pomóc w kształtowaniu evidence based polityk publicznych. Jest to jak na razie możliwość teoretyczna, ale nie dlatego, że takie zbiory nie istnieją, tylko ze względu na postawę decydentów. Gdyby było inaczej mogliby oni uniknąć blamażu i bałaganu związanego z „Nowym Ładem”. A przecież za bałagan ten zapłacił także biznes.
Wiem, że zabrzmi to jak „Bajki z mchu i paproci”, ale jest to kierunek, w którym idzie świat i prędzej czy później, do niego dołączymy. Zresztą prace na takimi rozwiązaniami są zaawansowane (Zintegrowana Platforma Analityczna). Teoretycznie dostępne mogłyby być zbiory danych zawierające indywidualne rekordy z baz ZUS, NFZ czy podatkowe. Z oczywistych powodów kluczowym problemem do rozwiązania jest tu kwestia ochrony danych osobowych. To jednak sprawa warta oddzielnego wpisu na blogu, ponieważ z punktu widzenia statystycznego nie jest ona banalna. Chociażby dlatego, że trzeba byłoby powiedzieć na czym polegają wielowymiarowe kostki statystyczne. Jeżeli jednak ktoś chciałby zobaczyć, jak może to wyglądać, to proponuję zajrzeć na Swedish National Data Service.
Ze wszystkich tych powodów rozwiązania informatyczne, które są efektywne w przetwarzaniu i analizie danych oraz przejrzystym ich komunikowaniu, są trudne do przecenienia w procesie demokratyzacji danych. Zarówno w biznesie, akademii, administracji, jak i dla obywateli. Nie muszę chyba dodawać, że Qlik Sense jest tu jednym z liderów.