Nad czym najwięcej czasu spędza osoba, której specjalnością jest analiza danych? Z pewnością każdy, kto nie jest analitykiem danych, odpowie, że jego zadaniem jest analiza danych i prezentacja jej wyników. W idealnym świecie z pewnością faktycznie by tak było, a raportowanie byłoby lekkim i przyjemny zajęciem. Co w takim razie spędza sen z powiek każdego analityka? Odpowiadając jednym stwierdzeniem: przygotowanie danych.

Każdy raportujący z pewnością chciałby otrzymać zestawy czystych danych, z wystandaryzowanymi nazwami kolumn. Uciążliwe dla analityków są również nietypowe i odstające wartości, niewypełnione w każdym miejscu. Po uporaniu się z tymi problemami pozostaje tylko generować kolejne wizualizacje, interpretować ich wyniki, a na koniec dnia zaskoczyć przełożonych głęboko ukrytymi wnioskami, niespotykanymi odkryciami i wartościowymi rekomendacjami. Następnie nasza firma uzyskuje wzrost na poziomie znacznie przekraczającym wzrosty rynku. Po czasie staje się światowym liderem, a analityk – żywą legendą. Piękna wizja, jednak świat wygląda inaczej. Dlaczego tak ciężko o dobre dane, którym można zaufać? Problem bardzo często pojawia się na początkowym etapie analizy danych.

Braki występujące ze względu na błędy ludzkie wymagają uzgodnienia ich obsługi w zespole/z kadrą zarządczą. Możliwe jest:

  • określenie wartości, która będzie zastępowała braki (np. z góry przypisujemy datę 01/01/2000 dla każdego braku na polu „data zatrudnienia” lub średnią wartość zamówienia dla braku na polu „wartość zamówienia”; alternatywnie braki danych mogą być zastąpione przez imputację zgodną z rozkładami zmiennych);
  • wypełnienie braków odpowiednimi wartościami przez członków zespołu za to odpowiedzialnych (co może okazać się niemożliwe, jeśli skala braków jest znaczna lub dotyczą one oddalonych w czasie wydarzeń);
  • pozostawienie braków (jeśli ich występowanie nie wpływa znacząco na analizy);
  • usunięcie wybrakowanych rekordów z analizy (co wiąże się ze stratą części informacji, jednak czasem może okazać się konieczne, jeśli braki mogą znacznie zniekształcać rzeczywistość).

Marcin Ruciński Consulting oferuje pełen zakres analizy danych będących w posiadaniu Klienta. Wskażemy, w których miejscach występują braki lub są błędy. Pomożemy Tobie w naprawie danych oraz przeszkolimy Ciebie i Twój zespół z prawidłowego zarządzania danymi.