Nagy adat, nagy üzlet, nagy veszély
Az adatmennyiség többszöröződésével kapcsolatban egyáltalán nem az adattárolási kapacitások szűkössége a legnagyobb probléma (bár ez sem elhanyagolható: a „felhő” ebben a megközelítésben tipikus kényszermegoldás, amely a tárolók és a hozzáférési csatornák szűkösségét próbálja kezelni), a valódi kérdés az adatok „realtime” vagy legalábbis szükség szerinti kezelhetősége, illetve az, hogy a feldolgozási képességek kétségtelen fejlődése tudja-e követni az adatállomány bővülését.
Hogy a nyers és a feldolgozott adat (az utóbbit szokás információnak tekinteni) között mi a különbség, azt két történelmi esemény, a 9/11 és a Snowden-kiszivárogtatás példáján lehet a legkönnyebben megvilágítani. A New York és Washington ellen tervezett terrormerényletről az amerikai biztonsági szervek szinte minden fontos adatnak a birtokában voltak ahhoz, hogy a megelőzés sikeres lehessen, ám az említett adatokból csak utólag, a támadásokat követően lett feldolgozott információ, amikor az már legfeljebb az események és az előzmények rekonstruálásában tudott segíteni. A Snowden-ügy viszont azt igazolja, hogy a hatóságok egy bő évtized alatt eljutottak a valós idejű adatfeldolgozás és -értelmezés lehetőségéig, csak éppen az nem világos, hogy ezt a képességet használják-e már üzemszerűen a gyakorlatban (és hogy nem használják-e megengedhetetlen módon a saját polgáraik kontrollálására).
A vonatkozó hírekből úgy tűnik, mintha a Big Data kizárólag (vagy elsősorban) az üzletembereket izgatná. Valójában arról van szó, hogy az információéhség minimum együtt nő az adatmennyiséggel, és a technika inkább csak az előbbivel nem tud lépést tartani. Amikor a levelezőrendszerek – még bőven az előző évtizedben – bizonyos, az elküldött mailekben szereplő kulcsszavak (halál, temetés) nyomán elkezdték temetkezési reklámüzenetekkel bombázni a gyanútlan felhasználókat, már sejthető volt, hogy egyes cégek és szervezetek a magánéletünk minden rejtett zugába belelátnak.
A Google és a Facebook pontosan tudja, hogy mit szeretünk, merre járunk, kikkel tartunk kapcsolatot, mi érdekel minket, a sajtóban „Google for spies” (Google kémeknek) munkacímen bemutatott RIOT rendszer pedig már arra is képes, hogy az aktivitásainkból nagy pontossággal megrajzolja, mi lesz a következő lépésünk – akár napokra vagy hetekre előre is. Mindez egy-egy ember esetében egy mobiltelefon adatfeldolgozási kapacitásának is csak a töredékét veszi igénybe, sokmilliós állampolgári vagy felhasználói közösségek esetében azonban képtelenül nagy tárolási és számítási hátteret igényel.
Mindebben természetesen legális, a magánéletet és az adatbiztonságot semmilyen módon nem fenyegető üzleti lehetőség is van. A Gartner jövőbe tekintő elemzése szerint a vállalati oldalnak meg kell találnia azokat az új, elfogadható (vagyis a személyes adatokig nem lehatoló) adatelemzési módszereket, amelyekkel a Big Data értékteremtési potenciálja maximalizálható. A vállalat kutatási vezetője, Hung LeHong szerint azok a cégek fognak versenyelőnyhöz jutni, amelyek a leggyorsabban beépítik a Big Data-alkalmazásokat a döntéstámogatásba.
A „korai alkalmazók” már most ott tartanak, hogy a döntéshozás során akár a megelőző üzleti hét vagy nap teljes feldolgozott adatbázisára tudnak támaszkodni, ami a reakcióidő korábban elképzelhetetlen lerövidüléséhez, a piaci folyamatok és a pillanatnyi döntések majdnem valós idejű szintetizálásához vezet – ez különösen olyan időszakokban jelent nagy segítséget, amikor a szokásosnál gyorsabbak és gyakoribbak a nagy változások.
A legnagyobb Big Data-felhasználók között ma még olyan cégeket találunk, mint az IBM, a HP, a Dell, az Oracle vagy az SAP – ami teljesen normális –, de gyors ütemben zárkózik fel mögéjük a Google, a Facebook, az Amazon, ami már egy fokkal több okot ad az aggodalomra. És a hivatalos statisztikák egyelőre csak a vállalati júzereket rögzítik – ha nem így lenne, valószínűleg az USA, Kína, Oroszország megfelelő nemzetbiztonsági szervei is az élbolyban lennének. Nem beszélve Magyarországról, ahol – amennyiben a hatóságok a puszta gyűjtőszenvedélyen túl kezdenek is valamit azzal a folyamatosan bővülő adatállománnyal, amely például a fegyveres testületek tagjairól vagy a köztisztviselőkről (a magánéletükről is) a rendelkezésükre áll(hat) – minden bizonnyal szintén az állami Big Brother a Big Data- piac vezető szereplője.