PREMIS:n toinen tuleminen

PREMIS on täällä entistä ehompana, sillä siitä on julkaistu versio 2.0. Aioin kirjoittaa tästä digitaalisen pitkäaikaissäilytyksen virstanpylväästä laajemmin jo vuosi sitten, kun kävin Tukholmassa aiheelle omistetussa koulutuksessa. Jäin kuitenkin odottamaan uuden version julkaisua jonka ennustettiin silloin muistaakseni tapahtuvan vielä saman vuoden kesällä.

Uskon ettei mallin läpikäymiselle ole tarvetta. Ne joiden on tarpeellista tietää asiasta syvällisemmin, ovat siihen varmasti jo tutustuneet aiemmin. Käytännössä PREMIS:n toinen tuleminen ei ole niin merkittävä tapahtuma muiden kuin sen toteuttajien kannalta. Versionumeroinnin käyttäminen paljastaa paljon: muutokset ovat teknisiä ja koskevat mallin yksityiskohtia sekä sen laajentamista. Jos ensimmäisen version julkaiseminen ei mullistanut maailmaasi, ei sitä tee tämäkään.

PREMIS on OAIS:n (Reference Model for an Open Archival Information System) ohella toinen merkittävä digitaalisen pitkäaikaissäilytyksen tukijalka. OAIS-mallissa on jaoteltu erilaisia digitaalisia objekteja (tai vanhoillisesti voidaan kutsua niitä tiedostoiksi) koskevia säilytystietoja, joita ovat mm. tiedot tunnisteesta, objektin alkuperästä, käsittelyhistoriasta ja eheydestä. PREMIS on täysin keskittynyt vaadittavien tietojen kartoittamiseen ja edennyt askeleen pidemmälle. Lyhyesti sanottuna PREMIS määrittelee ne tiedot mitä digitaalisista objekteista on syytä kerätä pitkäaikaisen käytön turvaamiseksi – käytännönläheisellä tavalla. Vaikka PREMIS on tietohakemistona toteutuksensa suhteen neutraali, on se määritelty niin täsmällisesti että se voidaan toteuttaa melkein sellaisenaan.

Itse asiassa työryhmä on laatinut XML-skeemat tietohakemiston pohjalta, mutta sellaisenaan niitä ei taida käyttää kukaan. Tähän on monia syitä. Ensinäkin järjestelmän suorituskyvyn kannalta kaikkia tietoja ei kannata kirjata ylös XML-tiedostoihin. Tyypillisesti monet metatiedoista onkin tallennettu relaatiotietokantaan jolloin suurten tietomäärien käsittely on helpompaa ja huomattavasti nopeampaa. Toiseksi harvassa järjestelmässä on mahdollista kirjata ylös tietoja yhtä kattavasti mitä PREMIS:ssä on mahdollista – tai tiedot voivat olla implisiittisesti järjestelmään rakennettuja, esimerkkinä tästä on käyttäjien oikeudet tehdä muutoksia objekteihin. Kolmanneksi järjestelmien keräämät tiedot ovat tyypillisesti hajallaan ja niitä on vaikea yhdistää toisiinsa.

Mihin PREMIS:iä sitten tullaan käyttämään? Yleisesti olemassa olevien järjestelmien tapauksessa varmasti tarkistuslistana ja lähtökohtana suunniteltaessa uusien järjestelmien tietomalleja, tietynlaisena referenssinä. Näkisin silti myös sen mahdollisuuden, että PREMIS:n XML-skeemoille sinällään löytyisi käyttöä erityisesti arkistojen välisen tiedonvaihdon kannalta. Aineistoa säilyttävä järjestelmä voi sisäisesti tallentaa ja ylläpitää tietoja missä tahansa muodossa, kunhan se kerää objekteista, tapahtumista, toimijoista ja oikeuksista riittävät tiedot. Mutta siirryttäessä järjestelmän ulkopuolelle, olisi suuri tarve saada säilytettäviä aineistoja koskevat säilytystiedot jossain standardinomaisessa muodossa jotta ne voitaisiin siirtää toiseen järjestelmään. Ehkä PREMIS:n skeemat tulevat olemaan tulevaisuudessa yhtenä keskeisenä lyhenteenä METS:n ja OAI-PMH:n rinnalla puhuttaessa arkistojen välisestä tiedonvaihdosta.

Yksi pitkäaikaissäilytyksen tärkeimpiä ohjenuoria on säilytystoiminnan läpinäkyvyys ja tarkka dokumentointi, jotta säilyttäjätahoon ja sen säilyttämien aineistojen oikeellisuuteen voidaan luottaa, ja tässä työssä PREMIS on hyvä apuväline. Luultavasti samoin kuin OAIS:n tapauksessa, monet järjestelmät ja tahot tulevat mainostamaan tulevaisuudessa olevansa PREMIS-yhteensopivia, mutta onneksi PREMIS:n yhteensopivuuden kriteerit ovat tarpeeksi yksityiskohtaisia, jotta yhteensopivuusväitteillä on painoarvoa.