METS-formaatin sovellusohje valmistunut

Kansallinen digitaalinen kirjasto -hanke on määritellyt pitkäaikaissäilytykseen siirrettävän aineiston paketointi- eli niputustavan. Paketoinnissa käytetään METS-formaattia (http://www.loc.gov/standards/mets/). METSiin kyllä kannattaa tutustua, vaikkei KDK-hankkeessa olisikaan mukana. Se on saanut verraten hyvin ilmaa siipiensä alle ja saattaa muodostua tärkeäksi nimenomaan digitaalisten objektien siirtämisessä käytettävänä vaihtomuotona.

KDK-määritys on saatavilla sivulta http://www.kdk.fi/fi/pitkaaikaissailytys/maeaerittely-ja-dokumentit/145-kdkn-hallinnolliset-ja-rakenteelliset-metatiedot-ja-aineiston-paketointi. Tekninen mutta gelposti lähestyttävä METSin esittely on esim. Karin Bredenbergin esityksessä http://www.loc.gov/standards/mets/presentations/METS.ppt

Mikä on METS?

METS on XML:ään pohjautuva “rakenteisen nippuformaatin” standardi. Sen avulla listataan digitaalisen objektin osat eli erilliset tiedostot sekä  määritellään niiden keskinäiset suhteet. Suhde voi olla esimerkiksi digitoidun kirjan sivujen oikea järjestys; tallennetun www-sivuston tiedostojen linkitysten esitys; tai jotakin muuta.

Sen lisäksi METS-paketti sisältää sisällönkuvailun sekä muuta metadataa. Muu metadata on esimerkiksi teknistä ja hallinnollista (tiedostojen tekniset ominaisuudet, niiden omistussuhteet, käyttöoikeudet ja -rajoitukset jne.) METS ei itse määrittele mitään uusia metadatafromaatteja. Sen sijaan METSissä voi joko viitata olemassa olevien formaattien muoton puettuun metadataan; tai sisällyttää metadata itse XML-tiedostoon.

Tämän lisäksi METS voi sisältää tietoja tai apuvälineitä digitaalisen objektin esittämistä varten.

Kaavakuva METS-paketin sisällöstä – klikkaa isommaksi:

Mihin METSiä tarvitaan?

Tarve on kahtalainen: aineistojen siirtämisen ja aineistojen säilyttämisen mahdollistaminen. Tällä hetkellä päällimäinen tarve on aineistojen siirtämisen suunnittelussa, siis siinä, miten mikä tahansa aineisto mistä tahansa voidaan siirtää pitkäaikaissäilytykseen eli PAS-järjestelmään.

KDK-hankkeessahan suunnitellaan monien organisaatioden käytössä olevaa säilytyspalvelua. Palvelun tulee siis asioida hyvin monenlaisten organisaatioiden, aineistojen ja järjestelmien kanssa. Aineistojen liikuttelusta sopiminen kunkin kanssa erikseen olisi tavattoman raskasta. Sopimalla sen sijaan METSin käytöstä PAS-järjestelmä pystyy rakentamaan palveluita järkevästi.

Aineistoa säilytykseen siirtävälle organisaation on tietenkin pystyttävä muodostamaan säilytettävistä aineistoista METS-paketteja. Tämä seikka olisi hyvä ottaa mahdollisimman varhain huomioon prosessien ja järjestelmien suunnittelussa. XML:ään pohjautuvana METS ei sisällä mitään mahdottoman erikoista tai vaikeasti toteutettavaa. Suurempi haaste on varmastikin varmistaa, että organisaatiolla on ylipäätään tallella kaikki säilyttämisen kannalta tärkeä metadata. KDK-hankkeessa on kyllä varauduttu suunnitelmissa siihen, että etenkin pienille organisaatioille tarjotaan myös METS-paketointiin liittyviä palveluja.

KDK-määrittelyssä huomattavaa

  • KDK:ssa on nyt siis määritelty METSiin perustuva suppeampi profiili, joka määrittelee tarkemmin, miten standardia tulee hankkeen piirissä käyttää. Tämäkin on vielä geneerinen; siihen perustuen määritellään jatkossa aineistokohtaiseia profiileita.
  • Oleellista määritystä lukiessa on tietenkin panna merkille, mitä METSin sallimia mahdollisuuksia KDK-määrittely kieltää. Etenkin on kielletty viittaaminen metadataan; se täytyy aina sisällyttää XML-dokumenttiin.
  • METSin ohella nippuformaattina voidaan käyttää MXF:ää digitaalisille AV-aineistoille sekä WARCia verkkoarkistoaineistoille; niiden ohjeistusta on tulossa myöhemmin lisää.
  • PAS-järjestelmään tulevien digitaalisten objektien kelpoisista tiedostomuodoista on blogattu vähän aikaa sitten.
  • Vaikka kyseessö on ennen kaikkea aineistojen niputtamisen tavan määrittely, siinä on jouduttu jossain määrin ottamaan kanstaa myös metadatan sisältöön. Kyse on ennen kaikkea aineistojen eheyden ja ymmärrettävyyden varmistamiseen liittyvästä tiedosta, ei niinkään sisällönkuvailusta.

Kuten sanottu, lisäohjeistuksia ja tarkennuksia on luvassa! Palaute on tietenkin erittäin tervetullutta. METSin rutiinituotanto lienee arkipäivää ainoastaan Kansalliskirjaston digitointikeskuksessa Mikkelissä; muitakin näkökulmia olisi tärkeää saada.