Kulttuuriperintö verkkoon – miksi ja miten?

Kansalliskirjasto juhlisti 16.5.2019 kahta digitointihanketta: 2000 digitoidun kirjan julkistamista ja Fredrik Paciuksen teosvalikoimalla toteutettua nuottidigitoinnin pilottia. Sekä kirjat että nuotit on avattu palvelussa digi.kansalliskirjasto.fi. Kirja-aineisto on suunnattu erityisesti tutkimuskäyttöön ja sen kaunokirjallisuus avautuu vain Haka-tunnisteilla. Tekijänoikeudenalainen aineisto on avattu käyttöön kolmeksi vuodeksi. Tässä tekstissä pohdin julkaistun kulttuuriperinnön verkkokäyttöön saattamista, sen merkitystä tutkimukselle ja digitointiin liittyviä eettisiä kysymyksiä.

Kulttuuriperinnöksi määritellään yleensä kansallista tai kansainvälistä merkitystä tuottavat aineelliset tai aineettomat kulttuurin jäljet, jotka katsotaan säilyttämisen arvoisiksi. Suomalaisen kulttuuriperinnön tallentamisesta huolehtii useampikin laitos: museot vastaavat esineistä, arkistot asiakirjoista, kansanrunouden ja -kulttuurin arkistot perinteestä ja kansanrunoudesta.

Saksalaissyntyisen Paciuksen Kaarle-kuninkaan metsästys oli ensimmäinen suomalainen ooppera. Sen lauluista koostuva nuottivihko toimi aineistona nuottipilotille.

Kansalliskirjaston lakisääteinen vastuu on tallettaa ja tarjota käyttöön kaikki Suomessa, suomeksi ja suomalaisille tehdyt julkaisut – kirjoja, lehtiä, pienpainatteita, nuotteja, musiikkia ja pelejä. Nämä saamme kulttuuriaineistolain mukaisesti vapaakappaleina, ja ne muodostavat kansalliskokoelman. Lisäksi haravoimme suomalaisia verkkosivuja verkkoarkistoon.

Viime vuonna vastaanotetuista vapaakappaleista vain 11% oli syntyjään digitaalisia. Painettua aineistoa kirjastoon virtaa edelleen yli 100 000 kappaletta vuodessa. Vaikka kulttuuriperinnön tallennusvastuu on kansallinen, on julkaisuaineistomme luonteeltaan kansainvälistä. Tekstit, sävelmät, ajatukset ja opit ovat virranneet maasta toiseen – samoin materiaalit ja teknologiat.

Miksi kulttuuriperintö halutaan verkkokäyttöön?

Moni odottaa ja toivoo digitalisaatiolta nimenomaisesti säästöjä. Valitettavasti kansalliskokoelman digitointi ei niitä merkittävässä määrin tuota, sillä digitoinnin jälkeenkin painettu kappale on säilytettävä. Paikallispalvelun tarve kirjastossa kyllä jossain määrin kevenee, mutta toisaalta verkkoaineistojen esitysjärjestelmät eivät pysy pystyssä itsestään, vaan niiden kehittäminen ja ylläpito vaatii pysyviä resursseja.

Sen sijaan oikea vastaus kysymykseen ”Miksi kulttuuriperintö halutaan verkkokäyttöön?” on, että verkossa kulttuuriperintö hyödyttää laajimmin. Tavalliselle kansalaiselle se tarjoaa tietoa ja elämyksiä – auttaa hahmottamaan omaa paikkaa historiassa ja yhteiskunnassa. Esimerkiksi tuore 2000 kirjan kokoelma tuo yleisökäyttöön eri aikojen aapisia. Voimme kaivaa esiin oman lapsuutemme aapisen ja miettiä, miten maailma on noista päivistä muuttunut: millainen oli hyvin käyttäytyvä lapsi, millaisena sukupuoliroolit näyttäytyivät, miten kerrottiin muista kansoista?

Sukututkijat ovat perinteisesti ahkeria aineistojemme käyttäjiä. Ikäihmisille tai verkon käytössä harjaantumattomille digi.kansalliskirjasto.fi-palvelu tarjoaa turvallisen ja maksuttoman ympäristön totutella aineistohakuihin ja verkkopalvelun käyttöön. Kouluopetukseen digitoitu aineisto tuottaa mainioita tehtäviä ja tukee ilmiöpohjaista oppimista. Yrityksillä on kiinnostusta etsiä omaa historiaansa sanomalehtiaineistosta ja hyödyntää esimerkiksi omia vanhoja mainoksiaan.  Kaupunkisuunnittelijat tai kotiseutuharrastajat voivat myös ammentaa ideoita historiallisesta aineistosta.

Suurimmat hyödyt digitaalinen kulttuuriperintö tuottaa kuitenkin tutkimuksen kautta. Verkkoaineisto nopeuttaa kaikkien tutkijoiden työtä, avaahan se tutkimusaineistot käyttöön missä ja milloin tahansa sekä helpottaa tiedon hakua ja tallennusta. Datana tarjottu verkkoaineisto mahdollistaa myös tiedonlouhinnan ja muita  digitaalisten ihmistieteiden tutkimusmenetelmiä, joiden avulla voidaan tutkia uudenlaisia, entistä laajempia ja visaisempia kysymyksiä. Julkaisuaineistoja louhimalla tutkija voi etsiä asioita ja asiayhteyksiä, joita perinteisellä lukemisella ei ihmisiässä ehtisi käsitellä, esimerkiksi koota sairauksien leviämiseen, ilmastoon, siirtolaisuuteen, uutisiin tai huhupuheisiin liittyviä tietoja ja yhteyksiä eri aikakausilta ja eri alueilta.

Suurimmat hyödyt digitaalinen kulttuuriperintö tuottaa kuitenkin tutkimuksen kautta. Verkkoaineisto nopeuttaa kaikkien tutkijoiden työtä. Datana tarjottu verkkoaineisto mahdollistaa myös  digitaalisten ihmistieteiden tutkimusmenetelmiä, joiden avulla voidaan tutkia uudenlaisia, entistä laajempia ja visaisempia kysymyksiä.

Digitointiprosessi on pitkä ja polveileva

Kansalliskirjaston digitointikeskus sijaitsee Mikkelissä, ja siellä tuotetaan vuosittain noin kaksi miljoonaa digitoitua sivua. Aineiston skannaus on suhteellisen nopea toimenpide, mutta sitä edeltää ja seuraa pitkiä työrupeamia. Aivan ensiksi on varmistettava, että aineiston mukana verkkoon siirtyvät riittävät kuvailutiedot, eli metatiedot – muuten julkaisut ovat vaarassa kadota verkon sisältöpaljouteen tai jäädä tunnistamattomaksi. Luettelointi tehdään Kansalliskirjaston kokoelmapalveluissa Helsingissä.

Nuorena kuollut Saima Harmaja oli hyvin suosittu runoilija varsinkin tyttöjen keskuudessa. Digin käyttöliittymään voi tallentaa leikkeinä omia suosikkirunoja.

Digitoinnin prosessiin kuuluu myös aineiston turvallinen pakkaaminen ja kuljettaminen Mikkeliin, joskus myös konservointi, jos aineisto on haurasta. Skannauksen tultua tehdyksi aineisto vielä jälkikäsitellään, eli tarkastetaan, että automaattisen tekstintunnistuksen avulla tuotettu tekstidata on eheää. Tämä ei tarkoita oikolukua, vaan sen varmistamista, että kaikki teksti on tunnistettu tekstiksi ja että kaikki sivut ovat tallella. Lopuksi aineisto julkaistaan ja toimitetaan pitkäaikaissäilytykseen.

Verkkoaineistojen käyttöliittymään kohdistuu monia vaatimuksia. Hyvä liittymä tarjoaa mahdollisuuden hakuun ja selailuun, tuottaa viitetietoja, kertoo aineiston käyttöehdot, antaa kirjautuneen käyttäjän tallentaa omia leikkeitä. 2000 kirjaa -hankkeen yhteydessä Digi-aineistopalveluumme kehitettiin kirjojen hakusovellus ja viime vuonna toteutetussa nuottipilotissa mahdollistettiin myös nuottien hakeminen ja selailu.

Digitoinnin eettisiä kysymyksiä

Jos digitoitu verkkoaineisto halutaan saattaa yleisön käyttöön muuallakin kuin vapaakappalekirjastoissa, on tekijänoikeudenalaisen aineiston osalta sovittava käyttöoikeudesta tekijänoikeusjärjestöjen kanssa ja maksettava tästä korvaus. Tekijänoikeudesta vapaa on vain julkaisu, jonka tekijöitten kuolemasta on kulunut yli 70 vuotta. Koska Fredrik Paciuksen kuolemasta on jo ehtinyt vierähtää toista sataa vuotta, hänen sävellyksistään oli helppo löytää vapaita teoksia nuottidigitoinnin pilottiin.

Tekijänoikeudenalaisen aineiston käytöstä on Suomessa mahdollista sopia, sillä lainsäädännössämme on ns. sopimuslisenssijärjestelmä, joka valtuuttaa tekijänoikeusjärjestöt sopimaan käyttöoikeuksista. Juuri digitoidut 2000 kirjaa avattiin yleisölle ja tutkimukseen juuri tämän järjestelmän puitteissa. Sopiminen merkitsee aina kompromisseja niin oikeudenhaltijoiden kuin kirjastojenkin näkökulmasta. 2000 kirjan hankkeesta vain tietokirjallisuus voitiin avata yleisölle, kun taas kaunokirjallisuus on vain tutkimuskäytössä Haka-kirjautumisen takana. Sopimuksella aineisto voidaan avata kolmeksi vuodeksi.

Kuvitusta C. A. Gottlundin Otavaan (1828). Mitä kauemmas historiassa mennään, sitä vähemmän tekijän erilainen maailmankatsomus häiritsee. Karjalaistaustainen blogistikin lähinnä hymyilee Gottlundin kokoamalle kansanrunoudelle, jonka naiskuva #metoo -liikkeen valossa olisi kuitenkin arveluttava.

Tekijänoikeuksien kunnioittaminen on keskeinen osa digitoinnin hyviä käytäntöjä. Mutta muitakin eettisiä kysymyksiä on. Viime aikoina on puhuttu paljon ns. digitaalisesta kolonialismista – siitä, että internetin sisältö vastaa niiden ihmisten maailmaa, joilla muutenkin on valta, eli käytännössä länsimaista maailmankuvaa. Tämä kysymys nousi esille myös Kansalliskirjastossa sekä hankkeessa digitoitavien aapisten että jo aiemmin digitoimiemme kirjojemme osalta.  Jouduimme toteamaan, että osa digitoimastamme sisällöstä on nykynäkökulmasta katsottuna seksististä, rasistista tai jollain muulla tavoin erilaisia ihmisryhmiä loukkaavaa.

Vaikka ihmisarvon ja ihmisoikeuksien kunnioittaminen on ehdottoman tärkeää, on kulttuuriperintöaineistojen suhteen olennaista tarjota käyttäjälle alkuperäinen aineisto täydellisenä ja ehjänä. Julkaistun kulttuuriperinnön keskeinen tarkoitus on kertoa menneisyyden maailmankuvasta kaikkine asenteineen, puutteineen ja virheineen. Aineistoa julkaisevan laitoksen on luotettava käyttäjän kykyyn arvioida teosten luonne ja tahtoon pohtia, miksi asiat esitettiin niin kuin esitettiin. Kulttuuriperintöä tallettavien laitosten on myös tärkeää varmistaa, että erilaiset vähemmistöt – niin etniset kuin sosiaalisetkin – saavat äänensä kuuluviin digitoidussa kulttuuriperinnössämme.

Kulttuuriperintöaineistojen suhteen olennaista tarjota käyttäjälle alkuperäinen aineisto täydellisenä ja ehjänä. Julkaistun kulttuuriperinnön keskeinen tarkoitus on kertoa menneisyyden maailmankuvasta kaikkine asenteineen, puutteineen ja virheineen.

Erityisen vahingollista aineiston sensuroiminen olisi tutkimukselle. Sopimattomien käsitteiden tai kuvien poistaminen vääristäisi tutkimustuloksia.  Yhteiskunta tarvitsee kattavaan aineistoon perustuvaa, kriittisesti arvioitua tietoa historiasta, kielestä, yhteiskunnasta, uskonnosta ja ajattelusta. Tarvitsemme tutkittua tietoa voidaksemme ymmärtää ihmistä, esittää perusteltuja arvioita siitä, miksi ihminen toimii niin kuin toimii. Ilman ihmistieteitten tuomaa ymmärrystä olisimme aika hampaattomia monessa asiassa, esimerkiksi ilmastonmuutoksen ja sen seurausten kohtaamisessa. Jos rajaisimme digitoitavaa aineistoa sen mukaan, mitä tällä hetkellä pidetään hyväksyttävänä, ei tutkijoilla olisi mahdollisuutta saada riittäviä vastauksia kysymyksiinsä.

2000 kirjan hanke on toivottavasti hyödyksi tutkimukselle ja yleisölle. Meille hankkeen parissa puurtaneille se on avannut ja opettanut monia asioita. Seuraamme nyt kiinnostuneena, miten aineistoa käytetään ja millaista keskustelua se käyttäjiensä parissa nostattaa. Tervetuloa tutustumaan 2000 kirjaan ja muuhun aineistoon palvelussamme digi.kansalliskirjasto.fi!


Johanna Lilja (Tutkimusportaali, ORCID) työskentelee palvelujohtajana Kansalliskirjastossa.