Kokemuksia Saksan kansalliskirjaston e-vapaakappaletoiminnasta

Frankfurt, toukokuu 2014

Kansalliskirjaston kolmihenkinen delegaatio kävi toukokuun lopussa Deutsche Nationalbibliothekin vieraana Frankfurtissa tutustumassa sikäläiseen vapaakappaletoimintaan, erityisesti elektronisten vapaakappaleiden, verkkoarkistoinnin ja pitkäaikaissäilytyksen näkökulmasta.

Halusimme kuulla Saksan kansalliskirjaston kokemuksia verkkoaineistoon liittyvistä kysymyksistä mahdollisimman monipuolisesti. Ajatuksena oli, että voisimme kenties oppia jotakin uutta ja samalla saisimme hyvän vertailukohdan omalle toiminnallemme.

Meille oli järjestetty todella tiivis ja monipuolinen kahden päivän ohjelma, johon kuului esityksiä DNB:n vapaakappaletoiminnasta erityisesti e-vapaakappaleiden osalta, julkaisijametadatan hyödyntämisestä ja muusta yhteistyöstä julkaisualan kanssa, e-vapaakappaleiden asiakaskäytöstä, verkkokeräyksestä sekä digitaalisten aineistojen pitkäaikaissäilytyksestä.

Saksan kansalliskirjaston kokoelmissa olevien elektronisten vapaakappaleiden määrä ylitti miljoonan kappaleen rajan vuonna 2013. Julkaisualan (!) 1912 Leipzigiin perustaman kirjaston kaikkien kokoelmien laajuus ylittää 27 miljoonaa julkaisua. Saksassa vapaakappaleiden luovutusvelvollisuus on aina julkaisijalla, ei julkaisun valmistajalla kuten useimmissa tapauksissa Suomessa. Kaikesta mitä Saksassa julkaistaan luovutetaan kaksi vapaakappaletta – toinen sijoitetaan Frankfurtiin ja toinen Leipzigiin. Lisäksi kirjasto hankkii ostoina tai saa lahjoituksina muualla julkaistua saksankielistä aineistoa.

Elektronista aineistoa on koottu väitöskirjojen ja muiden akateemisten julkaisujen osalta jo 1990-luvulta lähtien, vuonna 2006 tehty lisäys lakiin laajensi sitä koskemaan myös muita avoimesti verkossa olevia elektronisia aineistoja ja kaupallisia e-julkaisuja. Mm. elektronisia sanomalehtiä kirjastoon saadaan nykyisin yli 600 eri nimekettä (kaikki ovat näköislehtiä) – sanomalehtiä ei mikrofilmata kuin siinä tapauksessa että elektronista versiota ei ole saatavissa.

Elektronisten aineistojen kerääminen ja kuvailu perustuu täysin automatisoituun työprosessiin, jossa julkaisujen metadata saadaan suoraan julkaisijoilta – e-aineistojen luettelointia tai sisällönkuvailua ei siis tehdä yleensä lainkaan kirjastohenkilökunnan työnä. Julkaisut ja niihin liittyvä metadata saadaan samalla kertaa, julkaisijoiden käytössä olevia luovutuskanavia on useita (verkkolomakkeet, ”hotfolder”, OAI-PMH). Kirjasto ei kerää sellaisia e-julkaisuja, joista ei saada samalla myös metadataa.

DNB on määritellyt metadatalle minimivaatimukset, jotka saatujen tietueiden on täytettävä. Tällä hetkellä käytössä olevia luovutusformaatteja, joista konvertoidaan tietueet DNB:n tietokantaan ovat Onix 2.1, MARCXML ja tieteellisille julkaisuille kehitetty saksalainen XMetaDissPlus. Julkaisuja saadaan paitsi julkaisijoilta myös välittäjiltä – tällöin kunkin julkaisijan kanssa on erikseen sovittu että luovutukset voidaan saada välittäjältä.

DNB käyttää Deweyn luokitusta, joka annetaan elektronisille julkaisuille automaattisesti (emme tutustuneet siihen, miten tämä käytännössä tehdään). Myös linkitykset auktoriteettitiedostoihin tehdään pääosin automaattisesti. Julkaisut linkitetään automaattisesti myös mahdollisiin niitä vastaaviin painettuihin julkaisuihin (painetut julkaisut kuvaillaan edelleen ihmisvoimin). Kirjasto on myös kehittämässä automatisoitua asiasanoitusta, mutta sen mahdollinen käyttöönotto tapahtuu vasta joskus tulevaisuudessa.

Kirjastolla on käytössään moniportainen asteikko, jolla määritellään saatujen elektronisten aineistojen kelpoisuus pitkäaikaissäilytykseen. Tarkasteltavia seikkoja ovat tiedostojen eheys, tiedostomuodot, mahdolliset suojaukset (kuten DRM), voidaanko formaatista generoida metadataa sekä tiedostojen validointi. Kaikille elektronisille julkaisuille määritellään näiden kriteerien perusteella kelpoisuus-/riskitaso pitkäaikaissäilytystä varten.

Saksan kansalliskirjaston elektroninen vapaakappaleaineisto (kirjasto käyttää johdonmukaisesti termiä Netzpublikationen/ Online publications) on käytettävissä ainoastaan kansalliskirjaston tiloissa olevilla tietokoneilla eikä julkaisuista ole mahdollista tehdä digitaalisia kopioita – näiltä koneilta ei tästä syystä luonnollisestikaan ole pääsyä Internetiin (näiltä osin käytäntö on sama kuin meillä Suomessa). Julkaisusta saa tekijänoikeuslainsäädännön perusteella tulostaa omaan käyttöönsä vain pienen osan (15 % taisi olla tarkka luku).

Verkkojulkaisuja saa tekijänoikeuslainsäädännöstä johtuen käyttää samanaikaisesti vain kaksi eri käyttäjää. Kirjasto on myös sopinut joidenkin julkaisijoiden kanssa etäkäyttömahdollisuudesta rekisteröityneille käyttäjille, mutta palvelua ei ole vielä käytössä. Sen sijaan kokoelmiin kuuluvat Open Access -julkaisut ovat käytettävissä myös verkossa. Tulossa on myös jonkinlainen ”personalized access” -ratkaisu, jolloin aineistoja saa (esimerkiksi maksua vastaan) käyttää myös etänä.

Verkkosivuja Saksan kansalliskirjasto on toistaiseksi kerännyt vain valikoidusti – mm. julkishallinnon, puolueiden ja ammattiliittojen verkkosivustoja. Lisäksi tehdään mm. vaaleihin liittyviä teemakeräyksiä . Käytännön toteutus on ulkoistettu kaupalliselle toimijalle, kirjasto ei siis itse toteuta keräystä (toki valitsee mitä kerätään). Sama ulkopuolinen toimija tekee myös sivustojen kokoteksti-indeksoinnin .

Kerätyt verkkosivustot kuvaillaan suppeasti (URL, mahdollinen URN, sivun otsikko, verkkosivusta vastaava organisaatio, päivämäärä) myös kirjaston tietokantaan ja ne ovat haettavissa samasta käyttöliittymästä muun kirjastoaineiston kanssa.

Parhaillaan DNB suunnittelee pilottihankkeena toteutettavaa .de-domainin keräystä yhdessä Internet Memory Foundationin kanssa. Tässä on tarkoitus kokeilla olisiko vastaava keräys mahdollista toteuttaa säännöllisesti esimerkiksi kerran vuodessa tai kahdessa vuodessa. Pilotissa käytetään tallennustilaa 100 teratavua ja katsotaan mihin se riittää – .de-sivustoja on jopa 20 miljoonaa (vertailun vuoksi: .fi-sivustoja on n. 350 000).

Kaiken kaikkiaan voidaan suomalaisesta näkökulmasta todeta, että verkkoaineistoihin liittyvissä asioissa olemme joiltakin osin (erityisesti verkkosivujen keräyksen osalta) selvästi pidemmällä kuin saksalaiset virkaveljemme, mutta erityisesti monografiatyyppisten e-julkaisujen osalta saksalaiset ovat automatisoituine prosesseineen huomattavasti meitä edellä. Tämä ero perustuu pitkälti varmasti siihen, että saksalainen julkaisuala on hyvin organisoitunut (ja mukana on hyvin suuria kustantajia) ja sillä on yhteinen Books in Print – Verzeichnis Lieferbarer Bücher (VLB) – tietokanta kaikista julkaisuistaan, jota kautta DNB saa metadataa, eikä e-julkaisuja oteta lainkaan vastaan ilman metadataa. Välittäjien kanssa tehtävä yhteistyö e-aineistojen osalta on yhteistä meille ja saksalaisille – tosin meillä kaupallisesta e-aineistosta saadaan välittäjiltä selvästi suurempi osuus (käytännössä lähes 100 %) kuin Saksassa.