o teraźniejszości i przyszłości mniej lub bardziej poważnie
Wiecie, czym jest internet rzeczy? WIkipedia podaje
definicję (raczej ciężkostrawną na pierwszy rzut oka), mówiąc bardziej ludzkim językiem: to kilka (kilkanaście, kilkaset, tysiące czy miliony) przedmiotów, które mogą komunikować się ze sobą i z człowiekiem. Komunikować między sobą - czyli wymieniać gromadzone dane. Wyobraźcie sobie, że Wasz toster "plotkuje" na Wasz temat z czajnikiem. I wymieniają między sobą zdjęcia. Trochę przerażające, prawda? Sama idea internetu rzeczy miała na celu ułatwianie nam życia. Maksymalne dostosowanie użyteczności do użytkowników. Jako przykład już parę lat temu podawano lodówkę, która skanuje etykiety i gdy jakiś produkt, który w lodówce bywa często - a zostaje zużyty - to online w sklepie lodówka sama zamawia nowy. Ponieważ mam tendencję do zadawania pytań (czym lata temu narażałam się kolejno wszystkim swoim nauczycielom) od razu zjawił mi się pewien problem. Wyobraź sobie, że kupujesz jakiś produkt, który, łagodnie mówiąc, nie spełnia oczekiwań. Trzymasz go w lodówce i trzymasz, aż pewnego dnia w szale sprzątania w końcu go wyrzucasz z ulgą, po czym dwie godziny później lodówka stwierdza, że go brakuje i zamawia Ci nowy...
Oczywiście, to żart - mam nadzieję, że projektanci przewidzieli możliwość akceptacji listy zakupów przez właściciela lodówki. Chociaż... A jeśli nie?
A tak serio to warto się pochylić nad tym szaleństwem, które ogarnia świat. Big Data? Data mining? Znacie te pojęcia? To właśnie one "stoją" za profilowaniem reklam, dobieraniem Wam podpowiedzi w sklepach internetowych czy na portalach społecznościowych takich jak np. Facebook czy Twitter. Algorytmy szufladkują Cię wg odwiedzanych wcześniej stron, tagów z treści, które czytałeś/ aś czy nawet na podstawie obrazów, które ogłądałeś/ aś. Jak to możliwe? A znacie funkcję wyszukiwania obrazem w google? Skoro jest możliwe wyszukanie podobnych obrazów/ grafik, dlaczego nie ma być możliwe stosowanie algorytmów dla celów reklamy/ promocji? Niby internauci już się oswoili z plikami cookies i wiedzą, że jak się czegoś szuka w internecie używając komputera to na tym komputerze się profilują reklamy. Ale to już dawno poszło dalej. Jeśli się na jednym urządzeniu zalogujesz np. na swoje konto google, a potem bierzesz smartfona z Androidem (który przy pierwszym uruchomieniu wymaga podania właśnie konta google), to na nim też już będziesz mieć wyświetlane relamy wg tego, czego szukałeś/ co odwiedzałeś na tym pierwszym urządzeniu. Więcej: jeśli masz kilka kont google (gmail), to przy pierwszej okazji (jakiekolwiek skorelowane dane) google te konta ze sobą skojarzy.
A czy można w 100% zawierzyć algorytmom?
I tu dochodzimy do sedna tego artykułu: danych wejściowych. Trafność zależy właśnie m. in. od jakości danych. Jeśli cokolwiek opieramy na analizie dużej ilości danych, musimy mieć pewność, że dane te są wiarygodne i wysokiej jakości. Dlatego, skoro również w administracji coraz częściej pracujemy na Big Data czy stosujemy data mining, czas najwyższy pomyśleć o stałej kontroli jakości danych. Nie może być tak, że zbiera się co popadnie, a potem na tym robi analizy. Więcej, żeby sensownie tę jakość kontrolować, trzeba znać rozmaite fakty, które mogą mieć wpływ na to co dostajemy w wyniku. Przykład? Z różnych względów taki spoza branży (który zresztą mnie zainspirował do napisania tego artykułu). Pewno zdarzyło się Wam gdy robiliście zakupy, że wybrany produkt "nie wchodził" na kasę. Co robi kasjerka? Często szuka w najbliższym otoczeniu (czyli wokół kasy) czegoś co ma tę samą cenę i to nabija. A co leży blisko kasy? Słodycze albo rozmaite tabletki...
Możecie mi wierzyć na slowo, że każda sieć marketów prowadzi statystyki sprzedaży, używając właśnie data mining. Ciekawi mnie, jak wypadają statystyki sprzedaży leków.
Myślę, że jeszcze długo powinno się weryfikować to, co wyrzucają algorytmy. Ostatnio mnie np. zaskoczyły reklamy namawiające mnie do kupna... traktora, na zmianę z reklamami sukienek. To drugie było oczywiste, jako że przed wiosną zazwyczaj na poczet trzynastki usiłuję odświeżyć zawartość szafy. Ale skąd traktory (nie w sensie butów, tylko w sensie ciągników)?? Okazało się, że gościnnie mój tatuś chciał zobaczyć jaki jest koszt samobieżnej kosiarki w postaci traktorka.
Czy algorytm można oszukać?
Jak widać, zmylić można. Swego czasu próbowałam zdezorientować algorytm Twittera, ponieważ proponował mi obserwowanie kont wyłącznie doradców podatkowych, informatyków i prawników. Pododawałam więc rozmaite konta dotyczące mniejszych i większych zwierzaków. Efekt? Pierwsza kolejna podpowiedź: konto o nazwie prawowet, czyli prawo weterynaryjne...
Niemniej tego już nie uda się nam zatrzymać. Inna rzecz, nie powiem, że nieoczekiwania, ale z pewności niebezpieczna - to wykorzystywanie już dziś na świecie tej technologii, profilującej potencjalnych klientów przez politykę. O tym możecie sobie poczytać
TUTAJ.
Słyszeliście też zapewne takie pojęcie: fake news, czyli fałszywe informacje. To straszliwa broń, bo straszliwą bronią jest właśnie dezinformacja. Coraz głośniej mówi się o tym, że wcale nie tak łatwo w dobie internetu te fałszywki zweryfikować: jeśli coś jest bulwersujące (a one zazwyczaj są) to rozprzestrzenia się znacznie szerzej niż sprostowanie. Dawno nie cytowałam Pratchetta:
Kłamstwo obiegnie cały świat, zanim prawda zdąży włożyć buty
Nie powiem: nie dajmy się sprofilować, bo dziś nie jest to już możliwe. Ale jedyne, co może nas ocalić to pielęgnowanie indywidualności... I zachowanie zdolności do racjonalnego myślenia.
Aha - równie mocno przeraża mnie nieuchronny zapewne pomysł dodania tosterom/ czajnikom/ lodówkom/ żelazkom itp. funkcji robienia selfie właścicielowi. Kiedy to nastąpi, ucieknę na Marsa. Nie wiem jak Wy, ja tam się po przebudzeniu jednak staram ludziom na oczy nie pokazywać...