PAS: yksin ja erillään? (iPres 2010)

Pitkäaikaissäilytyksen kanssa puuhailevana on tottunut ehkä liiankin hyvin pitkäaikaissäilytyksen eli PAS:n paikkaan asialistojen viimeisenä ja organisaatiokaavioiden reunimmaisena huutolaisena. Kenelläkään ei tietenkään koskaan ole mitään pitkäaikaissäilytyksen jaloja periaatteita vastaan, kunhan niiden noudattaminen ei maksa mitään eikä vaikuta arjen askareisiin.

Liiallinen eriytyminen on PAS:n kannalta vahingollista. Digitaalisen objektin säilyttäminen alkaa sen luomisesta, tai oikeastaan luomisen suunnittelemisesta. Pitkäaikaissäilytyksen täytyy joka tapauksessa olla mukana tuotannossa ja sen järjestelmissä.

Toisaalta PAS:tä on myös hyvin tietoisesti paalutettu muusta toiminnasta erilliseksi saarekkeeksi. Syynä on se, että “käyttö on riski”. Digitaalisen aineiston lukeminenja tiedosiirto sisältää aina teknisiä riskejä: Vielä merkittävämpi syy on inhimillisten erehdysten ja tahallisen vahingonteon vaarojen torjuminen. Voidaan myös sanoa, että eriytetyssä PAS:ssä voidaan keskittyä säilyttämiseen eikä se pääse unohtumaan muiden prioriteettien paineessa.

Pitkäaikaissäilyttämisen päämäärä ei kuitenkaan ole säilyttäminen vaan käyttö. Liika erillisyys sisällön jokapäiväisestä tuotannosta, hallinnosta ja käytöstä hankaloittaa käyttöä, siten vähentää käyttöä ja siten on tavoitteiden vastaista. Yhtä lailla “käyttämättömyys on riski”. Teknisesti erillisenä PAS-järjestelmän kehittäminen ja ylläpito tietenkin on täysin oma työsarkansa.

Joachim Korb ja Stephan Strodlin paperissa on tutkittu pientenyritysten digitaalisten aineistojen säilyttämistä. Erityisenä kohteena ovat olleet wikien säilyttäminen, pienyritysten ja yksityisten ihmisten käyttöön sopivat säilytysratkaisut sekä ratkaisut, jotka voidaan liittää olemassa oleviin sisällön ja dokumentien hallinnan järjestelmiin. Osana projektia on tarkasteltu kuiluja tyypillisten sisällönhallintajärjestelmien ja OAIS-standardin asettamien vaatimusten välillä. Toisin sanoen: miten sisällönhallinnan järjestelmiä pitäisi muuttaa tai laajentaa, jos niitä halutaan käyttää säilyttämisen hallinnan välineinä. Paljon järjestelmillä on tietenkin yhteistä, mutta tutkijat listaavat seuraavat seikat, joihin erityisesti pitäisi paneutua:

  1. Sisällönhallinnassa liikkuu paljon aineistoa, jota ei ole laisinkaan tarkoitettu säilymään. On siis tarpeen – luotettavasti ja helposti – tunnistaa ja merkitä, mitkä aineistot kuuluvat säilytyksen piiriin.
  2. Pitkäaikaissäilytyksen riittävä omaehtoisuus on taattava.
  3. Aineistosta on alusta asti kerättävä metadataa kattavasti myös PAS:tä silmällä pitäen.
  4. Sisällönhallinnassa on merkittävää se, että aineisto on nimenomaan muutoksessa, käsittelyn kohteena. OAIS taas lähtee siitä, että digitaaliset objektit ovat lopullisia. Pitäisi olla mekanismi, jolla määritellään esimerkiksi, säilytetäänkö kuva raakamuodossaan vai jossakin myöhemmässä vaiheessaan.
  5. Arkkitehtuuriltaan sisällönhallintajärjestelmät eivät yleensä tyydytä OAIS:n vaatimuksia, jotka liittyvät mm. siihen, miten objektien ja metadatan muodostamat informaatio-objektit säilytetään. Samoin monet muut OAIS:n lähinnä tietoturvaan ja provenienssiin liittyvät vaatmukset täyttyvät puutteellisesti.
  6. Sisällönhallinnan ja PAS:n näkemys aineiston levittämisestä on tietenkin aivan erilainen.
  7. Sisällönhallinnan järjestelmät eivät luonnollisestikaan sisällä säilyttämisen prosesseja tukevia ominaisuuksia.

Mutta kaiken kaikkiaan paperin kirjoittajat eivät pidä pitkäaikaissäilytyksen ja tuotantojärjestelmän integroimista pienyrityksen kokoluokassa mahdottomana.

***

Toinen pitkäaikaissäilytyksen erillisyyden piirre on ollut varova suhtautuminen yhteistyöhön. Kysymys on lähinnä aineistoista tunnetusta vastuusta sekä omistusoikeuksiin liittyvästä arkuudesta. Myös teoreettinen viitekehys lähtee siitä, että PAS-toiminta on yhden toimijan hallussa, näin esimerksiki OAIS-mallissa ja TRAC-tarkistuslistassa. Todellisuudessa kehitys käy kohti entistä läheisempää yhteistyötä hyvnkin erilaisissa muodoissa. Asiasta on hiljattain ilmestynyt mm. K. Skinnerin ja M. Schultzin toimittama A Guide to Distributed Digital Preservation. Näistä Matt Schultz esitteli yhdessä Emily B. Goren kanssa IPres-konferenssissa yhteistyön ja luottamuksen vaikeuksia ja niiden ratkaisemista (The importance of Trust in Distributed Digital Preservation: A Case Study from the Metaarchive Cooperative)

Organisaatioiden on välttämätöntä luottaa toisiinsa, jopa ohjelmistotoimittajiin! Kuinka suuri PAS-vastuu onkin, mikään organisaatio ei voi tehdä kaikkea itse. Kansallisen digitaalisen kirjaston pitkäaikaissäilytysaspektista puhutaan usein “keskitettynä PAS-järjestelmänä”, mutta tämä ei ole aivan tarkkaa. Itse asiassa  osallistuvat organisaatiot ovat säilyttämisessä mukana sekä asiantuntemuksellaan että järjestelmillään, vaikkakin soveliain osin pyritäänkin yhteisiin ratkaisuhin.  Niinpä yllä mainitut julkaisut ovatkin terveellistä selailtavaa ainakin KDK-PAS-kuvioissa liikkuville.