IGeLU09 : Ajankohtaista Rosettasta

Rosetta on Ex Libriksen pitkäaikaissäilytysjärjestelmä. Yaniv Levi esitteli sitä; tässä on referoitu esitystä tuoreeltaan ilman syvällisempää kiritiikkiä.

Rosetta otettiin käyttöön Uuden-Seelannin kansalliskirjastossa vajaa vuosi sitten, ja tulossa käyttöön Singaporen kansalliskirjastossa. Versio 2.0 on luvassa noin puolen vuoden päästä. Uudessa-Seelannissa sillä hallitaan noin puolta miljoonaa tiedostoa eli kymmentä teratavua.

Uuden-Seelannin aineistosta esimerkki: Tee haku “darshan” kansallisbibliografiassa; klikkaa ensimmäistä tulosta (Bharat-Darshan [electronic resource]); klikkaa tietueessa linkkiä “Archived copy”.

Perusasioita Rosettasta

Digitaalinen säilyttäminen on huomattavan aktiivista puuhaa. Siinä ei voi lähteä siitä, että säilytettävä aineisto haudataan holveihin ja vältetään sen koskettamista. Sellainen aineisto muuttuisi nopeasti käyttökelvottomaksi.

Säilyttämisen pääaskelet ovat

  • kerääminen (valinta, karsinta, inventointi)
  • arkistointi (passiivinen säilyttäminen – varmuuskopiot jne.)
  • säilyttäminen (aktiivinen säilyttäminen)

Rosettan on tarkoitus olla kaikenkattava säilyttämisen työväline, jonka kautta aineisto voidaan myös asettaa käytettäväksi.

Vaikka tuotetta on suunniteltu nimenomaan Uudessa-Seelannissa, sitä on myös koko ajan ajateltu laajempaa käyttäjäkuntaa ajatellen. Uuden-Seelanninkaan kannalta ei olisi mukava olla ison ja epäilemättä kalliin tuotteen ainoa käyttäjä. Mukana on ollut asiantuntijaraati, ja standardit (OAIS, TRAC, PREMIS, METS, Dublin Core, ISAD(G) jne.) on otettu huomioon tarkasti. Myös sellaiset hankkeett kuin Planets, Caspar, DPE ja Drambora ovat vaikuttaneet suunnitteluun. Erityisesti tuli esiin, että myös audiovisuaalisten aineistojen säilyttäminen on Rosettan alaa.

Rosettan sydän on “permanent repository”. Mikä tekee siitä pysyvän? Säilytettävän aineiston tulee olla säilössä diskreetteinä kokonaisuuksina, joiden ymmärtäminen ja rekonstruointi ei vaadi sen enmpää Rosettaa kuin tietokantaakaan. Sellaisen kokonaisuuden tulee tietenkin sisältää itse objektin lisäksi sitä koskeva erilainen metadata.

Pysyvän arkiston rinnalla järjestelmä sisältää syöttöjärjestelmän, aineiston esikäsittelyn ja säilytystoimepiteiden alueen sekä aineiston jakelujärjestelmän (haku yms.)

Tyypillinen aineiston syötön työnkulku sisältää seuraavat vaiheet:

  • Haltuunotto (haravointi, vastaanotto jne.)
  • Validointi (alustava oikeellisuuden, oikean alkuperän ja laadun varmistus)
  • Valinta (määritellään, mitä säilytetään, mitä ei)
  • Rikastaminen (luodaan välttämätön metadata, jota ei vielä ole)
  • Arkistointi

Syöttöön voidaan myös integroida muita työkaluja, kuten muuallekin työnkulkuun vaikkapa virustarkistusta ajatellen.Metadataa voidaan tuoda suoraan vaikkapa Voyagerista; ja vieläpä niin, että tietueet on linkattu: korjaukset ja parannukset luettelossa näkyvät myös Rosettassa.

Permanent repositoryn ominaisuuksiin kuuluu myös provenienssin tarkkailu ja suojeleminen: muutoksia valvotaan ja niistä pidetään kirjaa. Arkisto tietenkin myös valvoo aineiston kuntoa ja käytettävyyttä.

Säilyttämisen toimenpiteiden suunnittelua

Perustana on formaattikirjasto, jonka sisältöön liitetään riskitekijät. Niiden avulla arvioidaan riskejä sekä suunnitellan ja toteutetaan tarvittavat toimenpiteet. – Formaattteja ja riskejä ei kaikkien tietenkään tarvitse kerätä itse, vaan niistä ylläpidetään globaalejan tietämyskantoja.

Näin järjestelmä voi pyytää kiinnittämään huomiota vaikkapa menetelmällä A pakattuihin B-formaattisiin tiedostoihin; järjestelmä tietää, paljonko sellaisia taapuksia siinä säilytetään. Tiedon perusteella suunnitellaan säilyttämistoimenpide ja testataan sitä koeaineistoon.