A sötét középkor réme

A web archiválása megoldhatatlannak látszik, de elkerülhetetlen. A weboldalak rövid életciklusa miatt az emberiség által létrehozott információk jelentős része örökre elvész megfelelő mentés hiányában. A feladat teljes körű, rendszeres elvégzéséhez a szakmának meg kell találnia a választ egy sor igen kemény problémára.

A brit nemzet digitális memóriájának megőrzése céljából a londoni British Library virtuális archívumba teszi az összes brit honlapot, elektronikus könyvet, internetes folyóiratot és blogot. A projekt nemrég indult, az intézmény célja, hogy a folyamatosan frissülő digitális archívum a jövő nemzedékek kutatói számára is hozzáférhető legyen – vegyen bármily meglepő irányt a technológiai fejlődés. A könyvtár szerint a munka nem várhat: amióta az ember elkezdte számítógépre és mobiltelefonra cserélni a papírt és a tintát, rengeteg értékes anyag tűnt el a digitális fekete lyukban. Az intézmény reméli: a jövőben sikerül kiterjeszteni az archívum tartalmát olyan külföldi honlapokra is, amelyek a szigetországgal kapcsolatos fontos tartalmakat közölnek, valamint prominens brit személyiségek közösségi oldalakon megjelenő bejegyzéseire is – adta közre az MTI hírét nemrég a HVG.

A net archiválása – szakszerűbben: webaratás és -archiválás – már jó pár éve téma a nagyvilág szakmai berkeiben. Az UNESCO 2003-ban elfogadott „Charta a digitális örökség védelméről” c. anyaga világosan megfogalmazza a webarchiválással kapcsolatos feladatokat, és külön kiemeli, hogy a válogatott archiválás esetén a „born digital” (vagyis digitális születésű) anyagoknak prioritást kell adni. A téma mind a tavalyi, tavalyelőtti IFLA (Könyvtáros Egyesületek és Intézmények Nemzetközi Szövetsége) konferencián, mind a nemzeti könyvtári főigazgatóknak szervezett legutóbbi (múlt évi) éves konferencián (CDNL), valamint az európai főigazgatók konferenciáján (CENL) szóban forgott – tudtuk meg az eseményeken hivatalból részt vevő Sajó Andreától, az Országos Széchényi Könyvtár főigazgatójától.

Rámutatott: a teljes világháló szakszerű könyvtári archiválása gyakorlatilag még sehol sem kezdődött el, a világban 1-2 tucat ilyen nyilvános szolgáltatás, projekt létezik, ezek jellegükben és méretükben is erősen különbözőek. A probléma fontosságát jellemzi viszont, hogy nemzeti szinten nagyon sok országban folytatnak legalább pilot jellegű kísérleteket, és alapozzák meg az adott nyelvterület digitális kincseinek minél teljesebb megőrzését. Az Egyesült Királyság nemzeti könyvtára az első webarchiválási kísérletet 2001-ben végezte, ekkor 100 brit történelmi és kulturális site-ot mentettek le, de a gyűjtemény nem lett nyilvános. Néhány évvel ezelőtt az Országos Széchényi Könyvtár is végzett már egy sikeres kísérletet, begyűjtött kijelölt weboldalakat, indexelte a kapott állományokat, és visszakereshetővé tette ezeket.

A feladat teljes körű, rendszeres elvégzéséhez azonban a szakmának meg kell találnia a választ egy sor igen kemény problémára. Folyamatos polémia tárgya mindenekelőtt például az, hogy milyen online dokumentumokat archiváljanak a könyvtárak, másképpen: hogyan válasszák ki az információtömegből, mit kellene az utókorra hagyományozni. Itt van például a blogok esete: nyilvánvaló, hogy a társadalmi, gazdasági, kulturális közgondolkodásra hatást gyakorló „megmondóemberek” magánoldalait el kell menteni, de mi legyen a névtelen szerzőkkel, mondjuk, Kovács Pistivel, aki meglehetős érdektelenség közepette írja végig ifjúkorát, viszont tizenöt év múlva Kovács István néven ő lesz az ország miniszterelnöke? Gondoljuk csak meg, milyen élvezettel és érdeklődve olvassuk ma írók, költők, politikusok fiatalkori írásait – hívta fel figyelmünket a főigazgató.

A másik probléma annak meghatározása, hogy milyen mélységig gyűjtsenek a könyvtárak. Régen egyszerű volt a feladat, szépen eltették az aznap megjelent újságokat, folyóiratokat, de az online fronton ez egészen másképp működik. Maradjunk a lapoknál, amelyeknek szerves részei egyebek mellett a linkek, az olvasói kommentek is. Vagy ott van a fizetős, jelszóval hozzáférhető adatbázisok sora, valamint az intranet, a vállalatok belső hálózatain futó szürke irodalom (l. még: mélyweb), amelyben ugyancsak rengeteg az archiválásra érdemes anyag. És ott van a sávszélesség, azaz a gyűjtés sebességének kérdése, valamint a tárhelyek problémaköre, amelyek alapvetően határozzák meg a gyűjtés gyakoriságát és módját. Egy online újság percenként változik, szövegek íródnak át, szorgosan dolgozik a moderátor – még a legalaposabb gyűjtéssel is óhatatlanul kimarad egy csomó információ.

Sajó Andrea a legutóbbi nemzetközi konferencián mindezen túl felvetette: a webaratás során – úgy tűnik – alapgondolat, hogy minden nemzeti könyvtár a saját ország doménje (.hu, .de stb.) alá tartozó dokumentumokat kezdi el begyűjteni és archiválni, de mi legyen a sorsa a nemzetközi domének alá tartozó oldalaknak, például az .org vagy a .com végűeknek, – hiszen ezeken is található nemzeti vonatkozású tartalom, amely ugyancsak fontos lehet a holnap kutatói számára. Ami Magyarországot illeti, a képet tovább árnyalja még egy kérdés: az érintettek hagynák-e és mennyire, hogy az OSZK a szervereik anyagához hozzáférjen? A mai kondíciók nem sok reménnyel kecsegtetnek, hogy mást ne mondjunk: a nemzet könyvtárát ugyan minden formában megilleti a kötelespéldányokhoz való jog, a beszolgáltatás az e-fronton azonban nemigen működik. Vegyük csak az elektronikuskönyv-kiadókat, amelyek nem szívesen (tehát nem) adják át kiadványaikat, attól tartva, hogy a bibliotéka az olvasók rendelkezésére bocsátja őket, vagyis konkurenssé válik. (Sajó Andrea leszögezte: ezeknek a dokumentumoknak csak a helybeni olvasását engedélyeznék, letöltését, pláne kölcsönzését csak a kiadó önkéntes hozzájárulásával.) Végül pedig, de nem utolsósorban: hol van a világon az a tárhelymennyiség, amely mindehhez elég nagy volna?

Cikkünk tárgya tehát megoldhatatlan problémának tűnik, pedig a nemzetközi tapasztalatok alapján digitális írott és képi kultúránk szignifikáns részének megmentéséhez elég lenne kezdetben 20 Tbyte-nyi megbízható tárolókapacitás és évi kb. 10 Tbyte-növekmény, ha a mozgóképi anyagok megmentését nem tűzik ki célként.

Sajó Andrea mélységesen egyetért a feketelyuk-hasonlattal. Úgy látja, gyakorlatilag minden eltűnhet vagy veszélyben van, amit szervereken őriznek, az adatvesztés ma, nemzeti szintű megoldás hiányában kivédhetetlen. A weboldalak rövid életciklusa miatt „digitális sötét középkor” fenyeget, amelyben az emberiség – jelen esetben a magyar emberek – által létrehozott információk jelentős része örökre elvész megfelelő mentés hiányában. Úgy látja, hogy a legsebezhetőbbek azok a kiadványok, amelyek korábban nyomtatásban jelentek meg, utóbb azonban csak elektronikusan. A szerver elromolhat, megtámadhatják, a kiadó társaság tönkremehet, ezzel elvesztheti a doménjét, vagyis egyik pillanatról a másikra eltűnhet a monitorokról. Mindehhez jön még, hogy a webes tartalmak konvertálása, vagyis az adott időszakban használt szoftververziókra való átírása sajnálatosan gyakran elmarad, így egy idő elteltével technikailag olvashatatlanná válnak.

Tíz éve kongatják a vészharangot a kutatók, hogy elveszhet, ami a hálón keletkezik
Top cikkek
Érdemes elolvasni
Vélemény
NOL Piactér

Tisztelt Olvasó!

A nol.hu a továbbiakban archívumként működik, a tartalma nem frissül, és az egyes írások nem kommentelhetőek.

Mediaworks Hungary Zrt.