Dessewffy Tibor: Big Data

Tartsuk szabadságharcos hősnek vagy nemzetárulónak, nagy szolgálatot tett Edward Snowden azzal, hogy ráirányította a média és a nagyközönség figyelmét egy elsöprő erejű változásra.

Ez azonban nem a lehallgatás ténye – amióta világ a világ, a hatalom törekszik erre, s valójában az a kérdés, hogy ezt az ambíciót milyen ellensúlyok tudják kordában tartani. Amerikában a terrorizmus elleni háború meghirdetése óta az ellenőrző mechanizmusok nem nagyon működnek – vagyis a privát szféra védelme, az információkhoz való hozzáférés most végképp komoly és fontos kérdés. Mégis, ha csak erre redukálnánk azt a döbbenetes átalakulást, aminek tanúi vagyunk, akkor körülbelül úgy járnánk el, mintha a szifilisz tünetei felől közelítve próbálnánk megérteni a szerelem mibenlétét.

Nem a lehallgatás ténye, hanem a hogyanja az igazán érdekes: az, amit Big Dataként szoktak leírni – a felfoghatatlan méretű adatmennyiség előállítása, összegyűjtése, rendszerezése és elemzése –, az ennek nyomán átalakuló tudás, a megismerés és a világ új szerkezetei. A Big Data jelenség a marxi forradalmi változás logikáját követi: mennyiségi felhalmozódás után minőségi változás. A mennyiségi változásról könnyű írni, de nehéz felfogni: az IBM szerint ma az összes adatmennyiség kétévente megduplázódik, vagyis huszonnégy hónap alatt annyi adat termelődik, mint előtte a történelemben összesen.

Sőt, Eric Schmidt, Obama bizalmasa, a Google volt főnöke vitatott kijelentése szerint ma két nap alatt keletkezik annyi adat, mint a történelem kezdetétől – akármit jelentsen is ez – 2003-ig. Ez az adatrobbanás elválaszthatatlan a digitális forradalomtól. 2000-ben még a világ adatvagyonának hetvenöt százalékát analóg formában, papíron, filmeken, kazettákon tároltuk. 2013-ban az exponenciálisan növekvő információ nemcsak eléri az 1200 exabyte-ot, de ennek az információtömegnek a 98 százaléka digitális formában érhető el. (Egy exabyte-nak az egyötöde annyi, mint az összes valaha leírt szó.)

Az adatok egyik legfontosabb forrása az internet. Közismert, hogy csak a YouTube-ra több mint egyórányi videót töltünk fel másodpercenként, csak a Facebookon több mint milliárd like és bejegyzés rögzül – naponta. De a Big Data nem csak az internetről szól. Valamennyi digitális formájú jel – a tőzsdei tranzakciók, bankkártyás vásárlások, telefonhívások, szurkolói és hűségkártyák, orvosi diagnosztikai, illetve GPS-adatok értelmezhetőek ezen belül. Ezeket a különböző adatbázisokat adatfúziós módszerekkel tehetjük átjárhatóvá. És ha valaki azt gondolja, hogy ha távol tartja magát az internettől és más modern feneségektől, akkor megúszhatja, el kell szomorítanunk. Az adatgazdagítás révén olyan személyek viselkedését is meg lehet jósolni, akik konkrétan egyik adatbázisnak sem a részesei.

De miért érdekes ez? Miért fontos az, hogy ezeknek az adatoknak a mennyisége megnő? Nos, azért, mert egy teljesen új megismerési, gondolkodási módot hívnak életre, ami aztán Viktor Mayer-Schonberger és Kenneth Cukier, a téma kiváló oxfordi kutatóinak nemrég megjelent könyve címével elvezet a Big Data-forradalomhoz, amely átalakít mindent: ahogy élünk, dolgozunk és gondolkodunk. Vegyük példaképpen a szociológiát, amely legitimitását az elmúlt három-négy évtizedben nagyrészt abból merítette, hogy hipotéziseket fogalmazott meg, amelyeket mérések alapján igazolt vagy elvetett. Ezek a mérések többnyire ezerfős reprezentatív minta révén születtek meg.

Mi történik a BigData korában? Először is nincs minta, az elemszám akár akkora is lehet, mint a vizsgált közösség egésze. Másodszor az „adatfelvétel” nem egyszeri, hanem folyamatos, akár valós idejű. A vizsgált tárgyról nem statikus képet, hanem szakadatlan filmet látunk. Harmadszor ezek az adatok nem a gyakran homályos önbevalláson, hanem valós viselkedésen alapulnak. Negyedszer: ezek az adatok más adatbázisokkal is társíthatók. Nincs hipotézis, nincs mérés, viszont az adatbányászat révén korábban megjósolhatatlan együttjárásokat, mintázatokat tudunk megállapítani. Képzeljük csak el, hogy magyar egyetemistákról mikor tudunk meg többet, ha évente egyszer egy ezerfős mintában megkérdezzük őket értékeikről, vagy ha folyamatosan vizsgáljuk facebookos magatartásukat, kapcsolataikat, kommunikációjuk szerkezetét és tartalmát.

Schmidt szavaival: „Tudjuk, hol vagy. Tudjuk, hol voltál. És többé-kevésbé azt is tudjuk, hogy mit gondolsz”. A Big Data világában az oksági viszonyok leírása nem annyira fontos, sokkal inkább ezeknek a mintázatoknak az előrejelző erejében bízunk. Ha meg lehet mondani, hogy milyen ingatlanszerkezetnél, milyen fogyasztási szokások mellett valószínűsíthető egy lakástűz, a hatóságokat nem fogja érdekelni, hogy ez miért van így, csak az – mint ahogy ezt a New York-i gyakorlat mutatja például –, hogy ennek alapján megelőzzék a halálos tűzeseteket. Szociológusok számára sajnálatos, hogy az adatok egy része csak a Facebook (és a Prism), másik része viszont mindenki számára elérhető, aki tudja használni a megfelelő adatbányászati algoritmusokat. Ugyanakkor ebben az új helyzetben a magyarázó, az összefüggéseket értelmező – a szociológiára jellemző – gondolkodás felértékelődik.

A Big Data valódi jelentősége abban áll, hogy szétrobbantja hamis egészek totemjeit. Ezek a totemek meghatározzák gondolkodásunkat: társadalom, egyén, vásárló, választó fogalmaiban gondolkodva odáig jutunk, hogy primitív alcsoportokat hozunk létre – „nagyvárosi fiatalok”, „bizonytalan választók” „egyetemisták”. A Big Data nem elidegenít, hanem visszavezet az élet sokszínűségéhez és bonyolultságához, vagyis a valósághoz, amikor lehetővé teszi, hogy ezeket a szereplőket a maguk egyediségében és a köztük levő viszonyokat a maguk bonyolultságában vizsgáljuk. Ezt megérteni nem könnyű, de megéri az erőfeszítést, mert nem valamiféle értelmiségi felhőn tipegésről van szó.

Az eddigi kommunikációs világrendben ugyanis alig tudtunk valamit arról, hogy az elküldött üzenetek hová jutnak el. A Big Data lehetővé teszi, hogy az üzenet pontos útját, terjedését, hatását is nyomon kövessük, és a hatékonyság érdekében, ha kell, megváltoztassuk. Ez a modellváltás máshol is meghatározó. A hamis egészek totemjeinek uralma talán sehol sem olyan fájdalmas, mint az egészségügyben: ahol azzal a feltételezéssel élünk, hogy „az embert” x betegség esetén y gyógyszerrel kezeljük – figyelmen kívül hagyva, hogy valójában mennyire különbözőek vagyunk és mennyire sokféleképpen reagálunk egy adott kezelésre. A Big Data korszakában „az embert” információs forrásnak tekintjük. Ma még messze vagyunk attól, hogy a másodpercenként az agyunkba érkező 11 millió ingert pontosan kövessük – de az irány világos.

Az emberi géntérkép évtizedekig tartó és dollármilliárdokba kerülő feltárása után a genetikai szűrőtesztek ma akár 99 dollárért is elérhetők. Angelina Jolie ilyen, ha nem is 99 dolláros verziójú, de Big Data-alapú teszt alapján döntött az operáció mellett. Az egyénre szabott megelőzés mellett a konkrét testi folyamatok monitorozásával a gyógyszerek (mellék)hatásainak megismerésében is új fejezet kezdődik. A Big Data olyan változást jelent, mint a mikroszkóp megjelenése, egy teljesen új világ új fogalmakkal fog feltárulni előttünk. Ez a hagyományos szerkezetek működését is átalakítja, mint ahogy a baktériumok felfedezése is csak ellökdöste az emberiséget a szappanos kézmosás intézményéig. A Big Data a nanogyógyászattól az űrkutatásig, a kultúrakutatástól a kereskedelemig, a politikától a személyközösség megértéséig mindent átalakít majd.

Ugyanakkor a lehetőségekhez monumentális feladatok is társulnak. Mint erre Snowden hősies kiállása is emlékeztet, a szabályozó, ellenőrző garanciák kiépítéséről folyamatos társadalmi vitát kell folytatni – és képeseknek kell lennünk arra, hogy ezeket a normákat aztán be is tartsuk. Másrészt, bár a Big Data korszaka már itt van, még csak a kezdetén járunk: számtalan olyan kutatásra és alkalmazásra van szükség, amely az adott területeket új megvilágításba helyezi. Végül döntő fontosságú, hogy az adott társadalmak és egyes alrendszerek – egészségügy, szociálpolitika, vállalkozások, oktatás – mennyire lesznek képesek a Big Data-logika alapján átalakítani a működésüket. Alighanem ez lesz az előttünk álló évszázad egyik vízválasztója a nemzetek versenyében.

A szerző szociológus

Top cikkek
Érdemes elolvasni
Vélemény
NOL Piactér

Tisztelt Olvasó!

A nol.hu a továbbiakban archívumként működik, a tartalma nem frissül, és az egyes írások nem kommentelhetőek.

Mediaworks Hungary Zrt.