Korporatsioon Vironia 1900-2000 | ||
---|---|---|
Prev | Chapter 84. [TRÜK=0%] Arhiivindus (B): Arhiivinduse hetkeseis sajandivahetusel Toimetus | Next |
Informaatika areng viimase kahekümne aasta jooksul on tekitanud vajaduse mitte ainult säilitada, vaid ka süstematiseerida, suurt hulka arvutifaile, luues nendest korralikult sirvitava ehk "navigeeritava" digitaalse kapitali. Kokkupanemist ootava korralikult läbitöödeldud digitaalse kapitali toormaterjal on heterogeenne. Esiteks (kui alata kõige vähemtähtsa ainega) on pidev, Vironia hetkeseisu elavalt peegeldav, elektronposti vool, mõnesaja või mõne üksiku tuhande sõna ulatuses päeval, eeskätt vestluslistil <korp.vironia@lists.ut.ee>. Teiseks (seega märksa tähtsam kategooria) on formaalsemad dokumendid, näiteks konventide koosoleku protokollid, pea alati paberile printitud, kuid koostatud ning salvestatud tekstiredaktorite failidena. Kolmandaks on digitaalne pildimaterjal - eeskätt failid loodud skänneril pimikus toodetud fotodest, kuid alatest umbes 2000. a. ka tunduv hulk digitaalsete kaamerate ülesvõtteid. Neljandaks (kõige tähtsamaks kategooriaks) on kõige suuremad, kõige formaalsemad dokumendid, tervete raamatute elektroonilised failidekogumikud (praegu juba Eestis 2000. a. välja antud uus "Album Vironorum", Torontos käesolev juubelialbum). Tuleb veel loota, et kaugemas tulevikus saab kõige tähtsam osa vanadest materjalidest, eeskätt EAA-s asuvad Edgar Saksa II.A ning II.B seeriad, ehk koosolekute protokollid-lisad, üle kantud digitaalsesse formaati - mitte skännimise ehk digitaalse pildistamise, vaid tegeliku tippimise näol, et digitaalne toodang oleks ka otsingumootoritega käsitletav.
Digitaalne arhiivindus seab arhivaarid huvitavate probleemide ette:
Digitaalsed arhiivid peavad olema kindlad formaadimuudatuste vastu ärimaailma arvutipraksises. Viimase kahekümne aasta jooksul on tavaline personaalarvuti olnud esialgu 8-bitise, siis 16-bitise, veel hiljem 32-bitise ja praegu eliitpersonaalarvutite sektoris ka 64-bitise CPU- ehk masinsõnaga. Selle masinarhitektuurilise arenguga rööbiti on toimunud pidev muudatus tekstiredaktorite ja muude tööriistade formaatides (kusjuures näiteks 1980-date WordStar on asendatud 1990-date WordPerfect ning Microsoft Word'iga, ja ka need redaktorid on omakorda läbi elanud korduvaid, segadusttekitavaid, formaadimuudatusi).
Digitaalne arhiivindus peab kuidagi arvesse võtma, et ükski tavaline digitaalne meedium ei pea vastu ajahambale. Nii mõnigi tehnik tahaks loota, et CD-ROM, kui optiline salvestuse vahend, oleks vastupidavam kui magneetilised meediumid (flopid, wintshesterid ja lindid). Tegelikult aga väidetakse praeguste asjatundjate ringides, et ka CD-ROM kaotab oma loetavuse umbes poole sajandi jooksul.
Digitaalne arhiivindus peab arvestama võimaliku sotsiaalse ebastabiilsusega järgmiste aastakümnete jooksul, sajanditest veel rääkimata. Sõdade käigus võib elektromagneetiline pulss madalasse stratosfääri lastud tuumarelvast hävitada tavalised magneetilised salvestusvahendid ja läbi põletada kõik tavalised transistorseadmed (arvutid kaasa arvatud). Ei ole kindel, kas sõdade või muude ökoloogiliste-majanduslikkude äparduste tõttu, inimkonna küberneetika oskusedki säilivad eelseisvate aastakümnete jooksul. (Linnatsivilisatsiooni teoreetik Jane Jacobs on kuskil väitnud, et kui hukkus Rooma impeerium, oli Euroopa tehnoloogia tagasitõmbumine sedavõrd põhjalik, et unustati koguni leiva küpsetamise kunst.)
Järelikult on soovitav digitaalses arhiivinduses usaldada küberneetikat nii vähe kui võimalik, olles igas asjas kõige hullemaks valmis. Selle asemel, et sälitada informatsiooni mõnes format du jour'i raamistikus nagu Microsoft Office, tuleb rakendada kõige tugevamat riikidevaheliste lepetega kaitstud, ebakommertsiaalset, tehnikat. Selleks on juba 1986. a. saadik olnud Standard Generalized Markup Language ehk SGML (kui International Organization for Standardization tava ISO 8879; välja antud kommentaariga oma peamise autori poolt kui [Goldfarb 1990]). Praegu, 2001. a., on küll nihe toimumas, kuna SGML-i kõrval võrsub XML. XML on SGML-i lähedane sugulane, sisuliselt SGML mõningate süntaktiliste kitsendustega. (Kus SGML-is on lubatud n. ö. variandid a, b, c, d, e, ... , siis a on alles jäetud XML-is, teised variandid keelatud.) Üldpilt jääb siiski kehtima - XML, või see SGML-i alamhulk, mis on XML-legaalne, on arhiivinduses eelistatud.
Kui arhiiv on peetud SGML/XML-is, siis seda saab igal aastakümnel konverteerida ajutiselt populaarsust võitnud kommertsiaalsetesse formaatidesse. Näiteks 2001. a. Linux'i ühiskonnas levinud "jade" ladumismootor võtab vastu SGML-i, annab välja RTF-i (kui tekstitöötlemise üks format du jour), PostScript'i (kui peenema trükkaritindi tüpograafia format du jour) ning HTML-i (kui veebide format du jour). Sealjuures on SGML-i ühiskond ettevalmistatud RTF-i, PostScript'i ning HTML-i kunagiseks aegumiseks.
Radikaalsem mure kui piiratud ajaks populaarsust võitnud formaatide kadumine on magneetiliste ning optiliste digitaalsete salvestuste degradeerumine. Kaitse salvestusmeediumite hävingu vastu seisab SGML-i allikate väljaprintimises happevabale paberile. Kui siis tekiks vajadus näiteks 2100. a. taastada SGML-i tekstiallikat bait baidi järel, piisaks happevabade paberite laskmisest läbi selle ajastu optiliste karakteride äratundmise ehk Optical Character Recognition seadeldiste.
Mis aga siis, kui juhtuks kõige hullem, s. o., kui eelseisvas ökoloogilises-sotsiaalses-poliitilises keerises küberneetika oskusedki häviksid? Kuna SGML on 7-bitine ASCII (mitte binaarne failiformaat nagu Word ning WordPerfect), on ta ka ilma raalita loetav. Kus laotud tekstis seisab
on SGML-i allikas veidi eemalepeletav, kuid siiski tavalisele arvutita arhiivitöölisele mõistetavvälja antud kommentaariga oma peamise autori poolt kui [Goldfarb 1990]
Niisiis ka viimse katastroofi stsenaariumis, kus raalinduse oskusedki kaovad, saaksid tulevased põlved kogutud digitaalse kapitali sõnu ja nende ladumistehnika rolle kuidagi (veidi vaevaliselt) deshifreerida.välja antud kommentaariga oma peamise autori poolt kui <citation>Goldfarb 1990</citation>