Zbieranie i analiza ogromnych ilości danych, zwanych big data, to przyszłość. Tak przynajmniej twierdzi wielu spośród tych, którzy tego typu działaniami się zajmują. Jeśli jednak przyjrzymy się temu zjawisku z bliska, okazuje się, że big data towarzyszy nam na każdym kroku, a dla wielu firm może być to narzędzie dające ogromną przewagę konkurencyjną. O tym, jak rozwija się ten rynek, przeczytać można w książce Big data – efektywna analiza danych. Rewolucja, która zmieni nasze myślenie, pracę i życie, której autorami są Viktor Mayer-Schönberger oraz Kenneth Cukier.
Podróż w czasie
Ta mająca niecała 300 stron książka to swoisty wehikuł czasu, który stara się przenieść nas w każdy okres, w którym analizowało się i przetwarzało ogromne ilości danych. Wszystko zaczęło się w 2009 roku, kiedy pojawił się wirus H1N1. Zaczęto obawiać się epidemii. W USA lekarze mieli obowiązek przekazywania stosownych informacji do Centrum Zwalczania i Zapobiegania Chorobom. Ta rządowa jednostka zajmuje się między innymi walką z chorobami zakaźnymi. Niestety, pomimo zbierania danych, coś było nie tak. Mapa pandemii była po prostu nieaktualna, często opóźniona nawet o dwa tygodnie. Powodów było wiele. Między innymi to, że ludzie, nim poszli do lekarza, przez kilka dni starali się leczyć domowymi sposobami. Kolejnym powodem był fakt, że CDC zestawiało spływające dane tylko raz w tygodniu. Przy takim zagrożeniu epidemiologicznym to wieczność. Okazało się, że na pomoc przyszło Google.
Google porównał 50 milionów fraz, które były wyszukiwane przez Amerykanów w Internecie, z dostarczonymi przez CDC danymi dotyczącymi rozprzestrzeniania się sezonowej grypy w latach 2003–2008. Pracownicy firmy stworzyli algorytm, który przetworzył ponad 450 milionów różnych modeli matematycznych i wybrał kombinację 45 fraz, które – wykorzystane razem w modelu matematycznym – dawały dużą korelację między przewidywaniami a oficjalnymi liczbami z całego kraju. W ten sposób pracownicy CDC mogli dojść do tego, gdzie pojawi się grypa praktycznie w czasie rzeczywistym.
Od grypy do biletów lotniczych
Oren Etzioni był człowiekiem, którego zaskoczyła informacja, iż jego kupiony na długo przed wylotem bilet lotniczy był dużo droższy niż większości lecących z nim w samolocie pasażerów. Sytuacja ta miała miejsce w 2003 roku. Etzioni doszedł do wniosku, że nie musi odkrywać przyczyn zróżnicowania cen. Zdecydował się działać. Przeanalizował ponad 12 tysięcy cen zbieranych przez 41 dni na stronie internetowej dla podróżujących, stworzył pewien model i nazwał swój projekt Hamletem. Narzędzie spodobało się i wykupił je Farecast, którzy ze swoistej porównywarki stworzył system do zakupów tańszych biletów. Farecast przetwarzał blisko 200 miliardów rekordów dotyczących cen lotów, co pozwoliło klientom zaoszczędzić majątek. Potem pojawił się Microsoft, który przejął Farecast i połączył go z wyszukiwarką Bing, co do 2012 roku pozwoliło klientom zaoszczędzić średnio 50 dolarów na bilecie. Najciekawsze w tym wszystkim jest to, że jeszcze 10 lat wcześniej Etzioni nie mógłby stworzyć takiego narzędzia, ponieważ analiza big data była zbyt droga, by pozwoliły sobie na nią nawet średnie przedsiębiorstwa, a co dopiero klienci indywidualni.
Zagrożenia?
Kontynuując lekturę książki, która napisana jest niesamowicie lekko, napotkamy jeszcze wiele takich historii i analiz. Będzie tutaj o opłacalności tego typu działań, o możliwościach oraz zagrożeniach, jakie za sobą one niosą. Tak naprawdę nasze zachowania, codzienne rytuały, trendy, zakupy są pod stałą kontrolą firm i korporacji. Amazon zbiera dane na temat naszej historii zakupów, Google analizuje słowa kluczowe, Facebook na bazie preferencji dobiera reklamy, które nam dostarcza. W big data kryje się wiele niebezpieczeństw. Istotną kwestią jest to, że zmiana skali prowadzi do zmiany sytuacji. Taka transformacja nie tylko bardzo utrudni ochronę prywatności, ale stworzy również nowe zagrożenie – karanie za posiadanie określonych skłonności. Istnieje możliwość wykorzystania prognoz stworzonych za pomocą big data do osądzenia i skazania pewnych osób, zanim cokolwiek zdążą zrobić. Pamiętacie „Raport mniejszości”? To trochę podobna sytuacja. Trzeba więc pamiętać, że dla podmiotu posiadającego władzę big data może stać się źródłem nacisku, niezależnie czy będzie to zwykłe doprowadzanie do szału klientów i pracowników, czy bardziej niebezpieczne działania na szkodę obywateli.
Niezależnie od tego, jaka będzie przyszłość, to warto poświęcić tej książce trochę czasu. Napisana jest naprawdę świetnie, zawiera ponadto ogromną ilość informacji dotyczących zbierania i analizy danych.