Muutamia digitaalisen pitkäaikaissäilyttämisen ominaispiirteitä

Teoreettisesti ajateltuna informaation pitkäaikaissäilytys on mahdollista ainoastaan digitaalisessa muodossa. Painetun maailman esineet kun tuppaavat jossain määrin haurastumaan käyttökelvottomaksi vuosisatojen kuluessa. Digitaalinen informaatio taas ei kulu lainkaan. Ainoa fyysisyyden muoto digitaalisessa informaatiossa on alusta, jolle digitaalinen informaatio on tallennettu, ja se voidaan aina vaihtaa.

Digitaalisen informaation säilytys on toistaiseksi onnistunut varsin hyvin tallennusalustaa vaihtamalla. Vielä on mahdollista saada auki kaksi vuosikymmentä sitten kirjoitettu WordPerfect-dokumentti. Olettaen tietysti että itse tiedosto on säilynyt tallessa, vaikka itse tiedostomuotoa ei kukaan käytäkään. Tiedostomuodot muuttuvat ajan myötä, ja ehkä 10 vuoden päästä vanhan dokumentin avaaminen on jo kovan työn takana. Dokumentti onkin ehkä parasta muuntaa ajoissa uuteen tiedostomuotoon, ennen kuin mikään ohjelmisto ei enää suostu avaamaan sitä.

Periaatteessa digitaalisen informaation pitkäaikaissäilytys on kovin yksinkertaista: tallennusalustan vaihdetaan tarvittaessa ja aineisto muunnetaan mahdollisesti tiedostomuodosta toiseen. Aineiston säilyttämiseen ja muuntamiseen liittyy kuitenkin muutama keskeinen seikka, jotka on syytä ottaa huomioon.

Alkuperäisen aineiston olennaiset piirteet

Aineiston muuntamisessa menetetään väistämättä jotain alkuperäisaineiston piirteitä. Siksi on tarpeellista määritellä, mitkä piirteet ovat sellaisia, jotka halutaan ehdottomasti säilyttää. Aineiston olennaisten piirteiden määritteleminen ei ole kuitenkaan mikään helppo tehtävä. Mietittäessä esimerkiksi tutkijoiden tarvetta huomataan toisistaan poikkeavat piirteet olennaisiksi: toinen voi olla kiinnostunut kirjan painoasusta ja toinen pelkästä sanoman sisällöstä.

Periaatteessa ongelma on jo ratkottu. Kansalliskirjasto on profiloitunut julkaistun kulttuurinperinnön säilyttämiseen. Julkaisujen tärkein tehtävä taas on selvästi informaation välittäminen, eli itse teksti on tärkeä. Otetaanhan esimerkiksi kirjoista uusintapainoksia, joiden ilmiasu voi poiketa suuresti alkuperäisestä. Niinpä olennaisinta on julkaisujen intellektuaalisen sisällön säilyttäminen ja muiden piirteiden säilyttämistä pidetään hyvänä periaatteena, mutta ei olennaisena. Jos on kiinnostunut esimerkiksi kirjan alkuperäisestä painoasusta, voi mennä museoon, olettaen että se on jossain museossa tallessa.

Kirjaston tehtävä ei rajoitu kuitenkaan pelkkään tekstikirjojen keräämiseen, säilyttämiseen ja käyttöön saattamiseen. Kirjojakin on erilaisia, kuten taidekirjoja, kuvakirjoja. Lisäksi kirjasto kerää talteen myös monia muita aineistotyyppejä, esimerkiksi musiikkia, karttoja, verkkosivuja. Verkkosivuja on monen tyyppisiä, perinteisiä julkaisun tyyppisiä tekstisivuja, ja toisaalta dynaamisia multimediateoksia sekä kaikkea tältä väliltä. Yleispätevien olennaisten piirteiden määritteleminen eri aineistotyypeille voi olla hyvinkin hankalaa. Kun muuntaminen on aineistojen säilymisen elinehto, yksi iso tehtävä ja haaste kirjastolle on keskittyä säilytettävien aineistojen olennaisten piirteiden määrittelemiseen, jouduttiin sitä sitten tekemään aineistotyypeittäin tai yksittäisten aineistojen tasolla.

Alkuperäisen aineiston ja muunnosten säilyttäminen

Jotain on silti tehtävä vanhentuville tiedostomuodoille, vaikka aineiston olennaisten piirteiden määrittelyn kanssa jouduttaisiinkin umpikujaan. Paras ratkaisu lienee säilyttää alkuperäinen kappale ja tehdä muunnoksesta alkuperäisen kappaleen uusi versio. Vastaavasti uuden muunnoksen lähdekappale säilytettäisiin muunnoksen jälkeen, jolloin muunnosten välille muodostuisi katkeamaton ketju, ja edelliseen versioon tai alkuperäiseen aineistoon voisi aina palata. Jos myöhemmin löydettäisiin parempi muunnostyökalu, jolla alkuperäisen aineiston voisi muuntaa säilyttäen aineiston piirteet uskollisemmin, voitaisiin sitä puolestaan käyttää. (Ks. kuva alla.)

Muunnosketju

Mahdollisesti alkuperäistä aineistoa voitaisiin myös käyttää uudessa teknologiaympäristössä sellaisenaan, myöhemminkin. Tähän museot tähtäävät. Museon yhtenä erona kirjastoon onkin juuri alkuperäisen esineen käyttökokemuksen ja alkuperäisen ympäristön tai kontekstin edes osittainen tarjoaminen. Teknologisen ympäristön jäljittely uudessa teknologiaympäristössä on ikävä kyllä hyvin mutkikasta. Kokonaisen alkuperäisen ympäristön tarjoaminen puolestaan onnistuu säilyttämällä vanha laitteisto, mutta laitteiston säilymiseen ja käyttämiseen sisältyy omat haasteensa, eikä tapaa voida nähdä pitkäaikaisena ratkaisuna.

Aineistojen alkuperäisyys ja muuttumattomuus

Digitaalisuuden etujen, helpon kopioitavuuden, siirrettävyyden ja muokattavuuden mukana tulee haittoja. Digitaalisessa muodossa oleva aineisto on erityisen altis muutoksille, muutosta on mahdoton havaita jälkikäteen ja pienikin muutos voi saattaa aineiston käyttökelvottomaksi.

Digitaalisten aineistojen haavoittuvuus vaivaa erityisesti arkistoja. Arkistoille, jotka säilyttävät viranomaisasiakirjoja, on aineiston autenttisuuden ja luotettavuuden säilyttäminen tärkeintä. Arkistot ovat aina säilyttäneet alkuperäisiä asiakirjoja. Kun aineistoa joudutaan muuntamaan alkuperäisestä muodosta toiseen, moni ei kuitenkaan puhuisi alkuperäisen aineiston säilyttämisestä, vaan pikemminkin alkuperäisen tiedollisen, kuvallisen tai minkä tahansa muun olennaisen sisällön säilyttämisestä.1 Erityisesti tämä tulee ilmi, jos aineistoa alkuperäisessä muodossaan ei enää pystytä käyttämään sen teknologisen vanhentuneisuuden vuoksi. Oleellista on sen sijaan, että alkuperäisen aineiston sisältö säilyy muunnoksia lukuun ottamatta muuttumattomana. Arkiston on todistettava säilyttämänsä aineiston muuttumattomuus jotenkin.

Perinteisesti aineiston tahatonta muuttumista vastaan on varauduttu ensi sijassa kontrolloimalla käyttäjien tekemiä muutoksia esimerkiksi käyttörajoituksin. Aineistosta on otettu varmuuskopioita, jotta aineisto voitaisiin palauttaa esimerkiksi levyrikon tai käyttäjän virheen aiheuttaman tiedonmenetyksen jälkeen entiseen tilaansa. Näiden lisäksi on tärkeää kirjata ylös kaikki muutokset, jotka kohdistuvat aineistoon. Dokumentoimalla muutokset voidaan osoittaa säilytettävien tietojen täsmällisyys ja jäljittää vastuulliset henkilöt.

Kaikilla näillä toimenpiteillä voidaan varmistaa, että kaikki aineistoon liittyvät muutokset ovat hallittuja ja jäljitettäviä. Suurin haaste on se, kuinka arkistoon tulevan aineiston alkuperäisyys voidaan varmistaa. Ei ehkä riitä, että aineiston luovuttajat voidaan tunnistaa, lisäksi itse aineiston autenttisuus olisi pystyttävä varmistamaan. Painetun maailman toimintatavoista on vaikea löytää ratkaisua tähän ongelmaan. Arkistot eivät ole kuitenkaan yksin, saman haasteen edessä kirjasto tai mikä tahansa muu taho, joka väittää säilyttävänsä alkuperäistä materiaalia tai pikemminkin sen tiedollista, kuvallista tai mitä tahansa muuta digitaalisessa muodossa olevaa sisältöä.

1 Itse asiassa digitaalisessa maailmassa käsite “alkuperäinen” on mieletön. Filip Boudrez kirjassa “Digital Archiving: A New Challenge?” (2005) huomauttaa, että tiedosto ja bittijono vaativat aina jonkun ilmiasun jotta niitä voidaan käyttää, ja ilmentymä voi olla erilainen käytettäessä tiedostoa tai bittijonoa. Samaa tiedostoa voidaan käyttää erilaisilla laitteisto- ja ohjelmistokokoonpanoilla, jolloin sen ilmiasut voivat olla täysin toisistaan poikkeavia.

3 thoughts on “Muutamia digitaalisen pitkäaikaissäilyttämisen ominaispiirteitä

  1. Hei Karo,

    en kiistä, etteikö intellektuaalisen sisällön säilyttäminen ole tärkeää. Mutta pidän alkuperäisjulkaisun fyysistä esine-arvoa myös erittäin tärkeänä ja vaalittavana asiana. Objekti on arvokas sinällään – eihän tekstin katselu pöntöstä korvaa sitä tunnetta, mikä syntyy alkuperäisen pullean inkunaabelin tai ihka tavallisenkin kirjan lehteilystä. Eipä saa julistestakaan pöntöstä pientä kuvaa katsellen samaa kokemusta kuin alkuperäisestä.
    Olennaista on huomioida, että historian- ja taidehistoriantutkijoille ei läheskään aina riitä digikopio. Esim. vanhojen rakennuspiirustusten tai karttojen tutkimuksessa voi joutua etsimään vaikkapa neulanjälkiä alkuperäistaitteista ja nekin kertovat tutkijalle asiaa. Vanhojen käsikirjoitusten tutkimuksessa tarvitaan originaaleja, mitä moninaisimmin tavoin, joita en tässä voi kaikkia alkaa luettelemaan. Vanhoista teoksista tutkitaan myös ulkoasua: mustetta, paperia, sidosasua ym. ;
    esim Tuomas Heikkilän vanhoja keskiajan käsikirjotiuksiaammme kirjastossa tutkiva työryhmä tekee juuri tällaista tarkkaa alkuperäiskäsikirjoitusten tutkimusta.
    Heille eivät digikopiot riittäisi alkuunkaan.
    Kyseinen tutkimsu ei ole vain esinetutkimusta, esim. käsikirjoitusten originaaleja voidaan jäljittää eri puolille Eurooppaa ja eri munkki-ja luostarikoulukuntiin ja emoluostareihin tyylin ja alkuperän pohjalta.

    Kaikki paperi ei myöskään ole happamoituvaa eikä tuhoutuvaa, ja usein paras ja säilyvin pakkaus vanhoille teksteille on alkuperäisteos itse.

    Nykyisin puhutaan paljon varastotilojen kalleudesta, mutta lukekaapas British Libraryn Helen Shentonin artikkeli erilaatuisten julkaisumuotojen säilyttämisen kustannuksista, jos huomioidan hankinnasta alkaen julkaisun koko elinkaari.
    http://webdoc.gwdg.de/edoc/aw/liber/lq-3-03/254-272.pdf
    Julkaisussa todetaan mm. että BL:ssa paperisen monografian keskimääräinen elinkaarihinta on 50 euroa, ja elektronisne monografian vastaava hinta on 127 euroa.
    Pitkäaikaistallennus, digitaaliset muunnokset, työvoima yms. eivät ole e-tallennuksessakaan siis halpoja.

    Karo kirjoittaa, että alkuperäiskirjan haluava voi mennä museoon. Niinpä niin ,mutta tuo ei tutkijalle alkuunkaan riitä.
    Toivoisin hieman laajempaa näkökulmaa ja historiallisen tutkimuskentän tuntemusta näistä paperi contra digiaineisto -asioista puhuttaessa.
    Born-digital- aineistot ovat sitten asia erikseen.

    Purevatko omat koirat – miksi kirjastoväki itse vähättelee aineistojaan? Esittäisikö kukaan, että esim. digikopiot Ateneumin tauluista riittävät ja korvaavt täysin alkuperäisteokset? Tuskinpa.

    Tämän kirjoitti kirjojen ja paperiaineiston ystävä,

  2. Hei Sinimarja,

    kiitos paljon puheenvuorostasi. On virkistävää saada aikaan keskustelua aiheesta.

    En kiistä etteivätkö painoesineet olisi korvaamattomia. Itse en edes koske elektroniseen kirjaan kovin mielelläni ellei kyseessä ole vaikkapa tietosanakirja tai hakuteos. Tarkastelin kirjoituksessani digitaalista pitkäaikaissäilytystä kovin teoreettisesta näkökulmasta. Siinä mielessä mikään kirja ei kestä ikuisuuksia, ja digitointi on jossain vaiheessa välttämätöntä jos kirjan sisältö halutaan pelastaa.

    Käytännössä tilanne voi olla toisenlainen, jotkut ovat jopa suositelleet hieman leikkimielellä digitaalisten materiaalien ”analogisointia”, esimerkiksi verkkosivujen tulostamista paperille. Säilyväthän kirjatkin useita satoja vuosia. (Ihan uteliaisuuttani haluaisin tietää, mikä on vanhin vielä luettava ja käyttökunnossa oleva kirja.) Digitaalisten materiaalien säilyttämistä ei ole runsaasti kokemusta, onhan tietotekniikkakin suhteellisen uusi ilmiö. Hankalinta taitaa nykyhetkellä olla vanhan numeraalisen, tieteellisen tutkimusaineiston käyttäminen ja säilyttäminen.

    Kun aineistoa muunnetaan digitaaliseksi tai ihan digitaalisesta muodosta toiseen, on pakko miettiä mitkä ominaisuudet nähdään oleelliseksi. Kirjan alkuperäispainoksen fyysisiä ominaisuuksia on digitoinnissa mahdotonta ottaa mukaan, ja tyypillisesti tyydytäänkin enemmän tai vähemmän uskollisiin kuvadigitointeihin kirjan sivuista. Kirjan mikä tahansa piirre voi olla kiinnostuksen kohteena, ja on ikävä siksi tehdä priorisointia ja menettää jotain digitoinnin seurauksena.

    Palataan vielä museon ja kirjaston erilaiseen rooliin. Jos oletetaan (tämä on hyvin vahva oletus), että kaikki aineisto pitää digitoida jossain vaiheessa aineiston pitkän tähtäimen käytettävyyden vuoksi, on päätettävä mitä kirjasto oikeastaan haluaa säilyttää. Yleensä ottaen se on kirjojen sanoma eli teksti. Mutta mitä sitten tekee museo haurastuneilla kirjaesineillä, joita ei voi enää selailla? Museo laittaa kirjan lasivitriiniin. Kirjaston ideana lienee kuitenkin se, että aineistoa voi käyttää. Toivotaan kuitenkin, että kirjat säilyvät sellaisenaan, mahdollisimman pitkään eikä tällaisten tilanteiden eteen jouduttaisiin. Nykyisellään digitoinnilla voidaan onneksi vähentää käytön aiheuttamaa rasitusta ja kirjat ja muut kulttuuriesineet säilyvät siten pidempään, myös sellaisenaan käytettävänä pienemmälle piirille, joille on tuiki tärkeää esimerkiksi kirjan sidosasu. Museoiden ei voi tietenkään olettaa pystyvän säilyttämään kulttuuriesineitä ikuisesti, mutta kirjastolle ainakin kirjan tiedollisen sisällön säilyttäminen on teoriassa mahdollista – digitaalisessa muodossa.

  3. Hei Karo,

    Sinimarja jo toi esiin että kirja sisältää, painetun tekstin ohella, monenlaista muutakin informaatiota. Ranskalaisen kirjahistorioitsijan Roger Chartierin mukaan kirjailijat eivät kirjoita kirjoja, vaan tekstejä. Kuvailen tässä vanhan käsinpainetun kirjan sisältämää ”esineellistä” informaatiota, jonka avulla kirjasta saadaan paljon sellaista, tekstin tulkintaankin olennaisesti liittyvää tietoa, joka ei käy itse tekstistä ilmi.

    Se, että teksti päätyy kirjaksi on pitkä prosessi, johon osallistuu monen eri ammattikunnan edustajia, paperinvalmistaja, kirjakkeiden valmistaja, latoja, painaja, kuvittaja ja sitoja, näiden lisäksi mahdollisesti vielä kuparikaivertaja ja –painaja. Kaikki nämä ammattilaiset tuovat kirjaan piirteitä, jotka myös sisältävät informaatiota. Kirjan ulkoasu kertoo jo sellaisenaan paljon valmistusaikansa ja –paikkansa olosuhteista, teknisestä tasosta ja yleisestä vauraudesta. Kirja kertoo myös omistajistaan ja siitä miten kirjat liikkuivat luontevasti Euroopan eri maissa – puhun tässä siis vain länsimaisesta kirjasta. Kirjat ilmestyivät, sensuurin vuoksi, usein myös vailla kirjanpainajanmerkintää, mutta tiettyjen ulkonaisten piirteiden perusteella ne on yleensä mahdollista sijoittaa johonkin tiettyyn kirjapainoon tai ainakin johonkin kirjapainokaupunkiin. Pidän tätä informaatiota myös intellektuaalisena, vaikkakaan se ei välity meille tekstin muodossa. Tekstin oikean ymmärtämisen kannalta tämä esineellinen informaatio saattaa olla hyvinkin oleellista.

    Kirjat eivät ole museoesineitä, kirjat kuuluvat kirjastoihin.

    Kysyit vanhimmasta luettavasta käyttökuntoisesta kirjasta. Ohitan tässä 1300-luvulla painetut korealaiset ja kiinalaiset kirjat, samoin pergamentille kirjoitetut käsikirjoitukset. Kansalliskirjaston vanhin painettu kokonainen kirja on vuodelta 1467 Rabanus Mauruksen Opus de universo, hieno paksulle, kermanväriselle paperille painettu ja pergamenttiin sidottu foliantti. Tuulahdus 1400-luvun Strasbourgista, ajalta jolloin käsityötaito ja aidot materiaalit olivat kunniassaan.

    Skotlantilainen kirjahistorian professori John Feather on todennut, että käsinpainetulle paperille käsin painettu kirja on poikkeuksellisen kestävä esine, jos sitä haluaa vahingoittaa, se on tehtävä tahallisesti. Useiden konservaattoreiden käsityksen mukaan kirjan säilymisen kannalta on edullista, että kirjaa käsitellään, sillä ”kirja tykkää, että sitä luetaan”.

    Olen tässä tahallani ohittanut puuhiokepaperille painetut, ”happamat” kirjat, joiden aika Suomessa alkoi noin 1850. Ne on todellakin syytä digitoida, alkuperäiset haluaisin panna käyttökieltoon, mutta eihän niitä hävittää voi. Tämä, hajoavan paperin aika on myös olennainen osa kirjan historiaa, ei kai näitä todistuskappaleita voi hävittää?

Comments are closed.