Milline peab olema Vironia arhiivindus eelseisval sajandil?

Informaatika areng viimase kahekümne aasta jooksul on tekitanud vajaduse mitte ainult säilitada, vaid ka süstematiseerida, suurt hulka arvutifaile, luues nendest korralikult sirvitava ehk "navigeeritava" digitaalse kapitali. Kokkupanemist ootava korralikult läbitöödeldud digitaalse kapitali toormaterjal on heterogeenne. Esiteks (kui alata kõige vähemtähtsa ainega) on pidev, Vironia hetkeseisu elavalt peegeldav, elektronposti vool, mõnesaja või mõne üksiku tuhande sõna ulatuses päeval, eeskätt vestluslistil <korp.vironia@lists.ut.ee>. Teiseks (seega märksa tähtsam kategooria) on formaalsemad dokumendid, näiteks konventide koosoleku protokollid, pea alati paberile printitud, kuid koostatud ning salvestatud tekstiredaktorite failidena. Kolmandaks on digitaalne pildimaterjal - eeskätt failid loodud skänneril pimikus toodetud fotodest, kuid alatest umbes 2000. a. ka tunduv hulk digitaalsete kaamerate ülesvõtteid. Neljandaks (kõige tähtsamaks kategooriaks) on kõige suuremad, kõige formaalsemad dokumendid, tervete raamatute elektroonilised failidekogumikud (praegu juba Eestis 2000. a. välja antud uus "Album Vironorum", Torontos käesolev juubelialbum). Tuleb veel loota, et kaugemas tulevikus saab kõige tähtsam osa vanadest materjalidest, eeskätt EAA-s asuvad Edgar Saksa II.A ning II.B seeriad, ehk koosolekute protokollid-lisad, üle kantud digitaalsesse formaati - mitte skännimise ehk digitaalse pildistamise, vaid tegeliku tippimise näol, et digitaalne toodang oleks ka otsingumootoritega käsitletav.

Digitaalne arhiivindus seab arhivaarid huvitavate probleemide ette:

Järelikult on soovitav digitaalses arhiivinduses usaldada küberneetikat nii vähe kui võimalik, olles igas asjas kõige hullemaks valmis. Selle asemel, et sälitada informatsiooni mõnes format du jour'i raamistikus nagu Microsoft Office, tuleb rakendada kõige tugevamat riikidevaheliste lepetega kaitstud, ebakommertsiaalset, tehnikat. Selleks on juba 1986. a. saadik olnud Standard Generalized Markup Language ehk SGML (kui International Organization for Standardization tava ISO 8879; välja antud kommentaariga oma peamise autori poolt kui [Goldfarb 1990]). Praegu, 2001. a., on küll nihe toimumas, kuna SGML-i kõrval võrsub XML. XML on SGML-i lähedane sugulane, sisuliselt SGML mõningate süntaktiliste kitsendustega. (Kus SGML-is on lubatud n. ö. variandid a, b, c, d, e, ... , siis a on alles jäetud XML-is, teised variandid keelatud.) Üldpilt jääb siiski kehtima - XML, või see SGML-i alamhulk, mis on XML-legaalne, on arhiivinduses eelistatud.

Kui arhiiv on peetud SGML/XML-is, siis seda saab igal aastakümnel konverteerida ajutiselt populaarsust võitnud kommertsiaalsetesse formaatidesse. Näiteks 2001. a. Linux'i ühiskonnas levinud "jade" ladumismootor võtab vastu SGML-i, annab välja RTF-i (kui tekstitöötlemise üks format du jour), PostScript'i (kui peenema trükkaritindi tüpograafia format du jour) ning HTML-i (kui veebide format du jour). Sealjuures on SGML-i ühiskond ettevalmistatud RTF-i, PostScript'i ning HTML-i kunagiseks aegumiseks.

Radikaalsem mure kui piiratud ajaks populaarsust võitnud formaatide kadumine on magneetiliste ning optiliste digitaalsete salvestuste degradeerumine. Kaitse salvestusmeediumite hävingu vastu seisab SGML-i allikate väljaprintimises happevabale paberile. Kui siis tekiks vajadus näiteks 2100. a. taastada SGML-i tekstiallikat bait baidi järel, piisaks happevabade paberite laskmisest läbi selle ajastu optiliste karakteride äratundmise ehk Optical Character Recognition seadeldiste.

Mis aga siis, kui juhtuks kõige hullem, s. o., kui eelseisvas ökoloogilises-sotsiaalses-poliitilises keerises küberneetika oskusedki häviksid? Kuna SGML on 7-bitine ASCII (mitte binaarne failiformaat nagu Word ning WordPerfect), on ta ka ilma raalita loetav. Kus laotud tekstis seisab

välja antud kommentaariga oma peamise autori poolt kui [Goldfarb 1990]

on SGML-i allikas veidi eemalepeletav, kuid siiski tavalisele arvutita arhiivitöölisele mõistetav

välja antud kommentaariga oma peamise autori poolt kui <citation>Goldfarb 1990</citation>

Niisiis ka viimse katastroofi stsenaariumis, kus raalinduse oskusedki kaovad, saaksid tulevased põlved kogutud digitaalse kapitali sõnu ja nende ladumistehnika rolle kuidagi (veidi vaevaliselt) deshifreerida.