Kansalliskirjasto kehittää datalähtöisiä palveluja tutkijoille – tutkimuksen ohella myös opetuskäyttö huomioitu

Kansalliskirjastossa alkoi viime vuonna Digitaalinen avoin muisti (DAM) -hanke, joka tähtää kirjaston digitaalisten aineistojen laajempaan ja monipuolisempaan käyttöön erityisesti digitaalisten ihmistieteiden tutkimuksessa. Ensi vuonna päättyvän hankkeen tulosten pohjalta määritellään, millaisia datapalveluja Kansalliskirjasto jatkossa tarjoaa. Tutkijoille viime keväänä tehdyn kyselyn mukaan erityisesti tiedonlouhinnan mahdollistaville lisäaineistoille on kysyntää. Tässä blogiartikkelissa esitellään kyselyn tuloksia ja Kansalliskirjaston suunnitelmia Louhokseksi nimetyn palvelukonseptin kehittämisessä.

(The abstract of this article is available in English.)

Teksti: Liisa Näpärä (Kansalliskirjasto) & Johanna Lilja (Kansalliskirjasto)

Digiloikan ottamisen paine on ihmistieteilijöiden joukossa viime vuosina kasvanut. Digitaalisuuden odotetaan säästävän aikaa ja rahaa sekä avaavan mahdollisuuden hyödyntää entistä monipuolisemmin entistä suurempia aineistoja.

Digitoitua aineistoa on tuotettu kirjastoissa, arkistoissa ja museoissa jo 1990-luvulta alkaen, mutta viime vuosina on korostunut tarve lisätä yhteistyötä ja tiedonvaihtoa aineiston tarjoajien ja käyttäjien välillä. Kulttuuriperintöaineistoja tarjoavien laitosten tulisikin varmistaa, että tutkijoille on tarjolla monipuolisia ja kattavia sähköisiä aineistokokoisuuksia, jotka mahdollistavat digitaalisten ihmistieteitten menetelmien käytön sekä tutkimuksessa syntyvän datan tallentamisen ja jatkokäytön.

Digitaalisten ihmistieteiden menetelmät kehittyvät jatkuvasti, ja parhaisiin tuloksiin päästään, kun kehittämistyötä tehdään monipuolisella asiantuntemuksella, joka kattaa sekä tutkimusosaamisen että aineistonhallinnan.

DAM-hanke kehittää datalähtöisiä tutkimuspalveluita

Kansalliskirjastossa on meneillään Digitaalinen avoin muisti (DAM) -hanke, jonka tavoitteena on kehittää datalähtöisen tutkimuksen tutkijapalvelua (ks. Tietolinjan artikkeli). Hanke tähtää Kansalliskirjaston digitaalisten aineistojen laajempaan ja monipuolisempaan käyttöön erityisesti digitaalisten ihmistieteiden tutkimuksessa.

Taustatietojen keräämiseksi hankkeessa tehtiin keväällä 2020 kysely Kansalliskirjaston digitaalisista aineistoista ja palveluista ja niiden tämänhetkisestä käytöstä. Kysely kohdennettiin digitaalisten aineistojen ja palveluiden tutkijakäyttäjille, koska DAM-hankkeen tavoitteena on tiivistää Kansalliskirjaston digitaalisten aineistojen ja tutkijoiden kohtaamista.

Kyselyyn tuli yhteensä 130 vastausta pääasiassa humanistisilta ja yhteiskuntatieteellisiltä aloilta, jotka painottuvat myös Kansalliskirjaston aineistopolitiikassa. Vastaajamäärä on samaa luokkaa kuin Kansalliskirjaston paikallisasiakkaille suunnatuissa kyselyissä ja digi.kansalliskirjasto.fi-palvelun käyttäjäkyselyissä, joten voi olettaa, että aktiivisimmat digitaalisten aineistojen tutkijakäyttäjät vastasivat kyselyyn.

Kyselyn perustella Kansalliskirjaston digitaalisten aineiston tyypillinen käyttäjä on suomenkielinen historia-alan väitöskirjan tekijä Helsingin yliopistosta (kuvat 1–2).

Kuva 1: Kansalliskirjaston aineistoja ja palveluita käyttäneiden tieteenala. Suomen Akatemian pääluokkien mukaan, vastaajia 130, valintoja 161.
Kuva 2: Kansalliskirjaston aineistoja ja palveluita käyttäneiden affiliaatio. Vastaajia 129.

Helsingin yliopiston vahva asema kyselyyn vastaajien joukossa selittyy Kansalliskirjaston päärakennuksen sijainnilla ja pitkällä yhteydellä Helsingin yliopistoon, jonka kirjastona se toimi vuoteen 2006 asti. Digitoinnin ja aineiston avaamisen mahdollistavien lisenssisopimusten ansiosta kasvava määrä aineistoa on käytettävissä verkon kautta missä ja milloin tahansa, mutta edelleenkin osa digitaalisten aineistojen käytöstä on tehtävä Kansalliskirjaston seinien sisällä. Kulttuuriaineistolain nojalla tallennettavasta aineistosta mm. Verkkoarkisto, elektroniset kirjat ja tuoreimmat sanomalehdet ovat käytettävissä vain Kansalliskirjastossa ja muissa vapaakappalekirjastoissa tähän tarkoitukseen suunnitelluilla vapaakappaletyöasemilla.

Kysely osoitti, että Kansalliskirjaston digitaalisia aineistoja käytetään edelleen eniten perinteisten ihmistieteiden menetelmin: selaamalla, lukemalla ja tulkiten lähilukua apuna käyttäen, kuten kuva 3 osoittaa.

Kuva 3: Kansalliskirjaston digitaalisten aineistojen käyttötapa. vastaajia 129, valittu 214, prosentit suhteessa kaikkiin vastaajiin.

Metodikysymykseen vastanneista tutkijoista tiedonlouhintaa käytti menetelmänä 35 henkilöä eli hieman yli neljännes. Tämä kertoo toisaalta menetelmän uutuudesta: kaikilla tutkijoilla ei vielä ole riittävää osaamista tai monitaitoista työryhmää toteuttamassa tiedonlouhintaa. Toinen syy on siinä, että kaikki aineisto ei vielä ole louhittavissa. Kuvassa 4 esitetään kirjaston aineistojen kokonaisuutta struktuurina. Vain osa aineistosta on sähköisenä syntynyttä tai digitoitua ja tästä vain hyvin pieni osa on louhittavaa dataa.

Kuva 4: Kansalliskirjaston erilaisia aineistotyyppejä. Kokosuhde on suuntaa antava, sillä eri aineistotyyppien kokoluokkaa ei tarkalleen tunneta sivu- tai nimekemäärinä.

Kansalliskirjaston aineistoja käyttävät tutkijat voivat tällä hetkellä ladata avoimien rajapintojen kautta aineistoa datakatalogista, käyttää valmiita datapaketteja tai luoda omia. Valmiit datapaketit ovat pääasiassa laajasta sanomalehtiaineistosta muodostettuja paketteja.  DAM-hankkeessa tehtävä työ auttaa kehittämään datapaketteja sisällöllisesti ja pyrkii edistämään niiden käytettävyyttä myös opetuksessa.

Kyselyyn jätettyjen avovastauksien perusteella tutkijat toivoivat, että tiedonlouhinnalle olisi jatkossa paremmat mahdollisuudet esimerkiksi uusien valmiiden aineistopakettien muodossa tai tiedonlouhintaan olisi käytettävissä uusia aineistoja. Tällä hetkellä tutkijat kokivat tiedonlouhinnan vielä hieman haasteelliseksi, mutta kuitenkin mahdolliseksi yhteistyössä Kielipankin ja Tieteen tietotekniikkakeskus CSC:n kanssa.

Yleisimmin tutkijat olivat tehneet tiedonlouhintaa tekstiin, mutta myös yllättävän moni oli tehnyt kuviin kohdistuvaa tiedonlouhintaa, vaikka edellytykset siihen eivät vielä ole eurooppalaisten digitaalisia aineistoja tarjoavien verrokkipalvelujen tasolla.  Kuvassa 5 tarkastellaan tiedonlouhinnan kohteita ja menetelmiä.

Kuva 5: Tiedonlouhinta, vastaajia 35, prosentit suhteessa tiedonlouhijoiden yhteismäärään.

Noin 40 prosenttia tiedonlouhijoista edusti historiaa ja 15 prosenttia kielitieteilijöitä. Loput tiedonlouhijat olivat yksittäisten tieteenalojen edustajia. Kyselyn perusteella kirjallisuudentutkijat eivät vielä olleet tehneet lainkaan tiedonlouhintaa Kansalliskirjaston aineistoista. Eniten tiedonlouhijoissa oli muun tutkijakyselyn tyyppivastaajan mukaisesti väitöskirjatutkijoita, mutta mukana oli myös joitakin vapaita tutkijoita ja muutamia professoreja.

Library labit kehittämisen mallina

Monissa maissa on kehitetty datalähtöisiin tutkijapalveluihin labeiksi kutsuttuja toimintaympäristöjä. Labilla tarkoitetaan kontekstista riippuen joko fyysistä tai virtuaalista tilaa sekä niiden hybridiä. Usein labit ovat monitieteisiä ja sijoittuvat toimintaympäristöltään digitaalisten ihmistieteiden läheisyyteen jonkin maan kansalliskirjastossa tai yliopiston kirjastossa. Labit voivat toimia myös erilaisten digitaalisten ihmistieteiden keskuksissa tai osa kirjastosta voi olla profiloitunut sellaiseksi.

Library labit ovat kukin oman näköisiään, eikä mitään yhtenäistä mallia voi antaa. Labeja kuitenkin yhdistävät digitaalisuus, avoimuus, innovatiivisuus, saavutettavuus, yhteistyö, monitieteisyys, käyttäjäkeskeisyys sekä tieteen eettisiin käytäntöihin sitoutuminen. Nämä yleiset avainsanat voisi liittää yleisemminkin tämän päivän tiedekentän arvoihin, mutta labit ovat enemmänkin vuorovaikutteisia kirjastoihmisten ja tutkijoiden tarvitseman digitaalisen aineiston kohtaamispaikkoja.

DAM-hankkeen benchmarking-osuudessa on tähän mennessä haastateltu seitsemän eri labin edustajia, onhan hankkeen yksi keskeinen tavoite suunnitella palvelukokonaisuus digitaalisten aineistojen selkeään ja helppoon käyttöön sekä kestävään tutkijayhteistyöhön.

Louhos tarjoaa datalähtöisiä tutkijapalveluja

Hankkeen tulosten pohjalta määritellään tarkemmin, mitä datapalveluja Kansalliskirjasto jatkossa tarjoaa peruspalveluna, mitä muiden kanavien, kuten Kielipankin kautta ja mitä taas maksullisena palveluna tai osana erikseen rahoitettua tutkimusyhteistyötä. Keskeisiä kysymyksiä tulevat olemaan tutkimuksessa tuotettu rikastettu data ja sen integroiminen olemassa oleviin palveluihin, erityisesti digi.kansalliskirjasto.fi-palvelun osaksi, koska se on digitaalisten aineistojen suosituin käyttöpaikka. Suunnitteilla oleva palvelukonsepti on nimetty Louhokseksi. Avoimen tieteen periaatteiden mukaisesti tutkijoiden tuottama rikastettu data tai aineiston käyttöä helpottavat työkalut tulevat myös digi.kansalliskirjasto.fi-palvelua käyttävän suuren yleisön käyttöön.

Hankkeen tulosten pohjalta määritellään tarkemmin, mitä datapalveluja Kansalliskirjasto jatkossa tarjoaa peruspalveluna, mitä muiden kanavien, kuten Kielipankin kautta ja mitä taas maksullisena palveluna tai osana erikseen rahoitettua tutkimusyhteistyötä.

Tulevaisuudessakin Kansalliskirjasto kehittää palveluita myös sen aineistoa perinteisin menetelmin käyttäville tutkijoille, jotka tällä hetkellä ovat suurin joukko digitaalisten aineistojen käyttäjissä. Yhteiskunta tarvitsee ihmistieteiden menetelmien ja osaajien koko kirjon keskiaikaisten tekstien tulkitsemisesta suurteholaskentaa hyödyntävään tiedonlouhintaan voidakseen vastata ihmisen toimintaa koskeviin kysymyksiin nyt ja tulevaisuudessa. Tiivis yhteistyö kulttuuriperintölaitosten ja tutkijoiden kesken on avain ihmistieteellisten menetelmien kehittämiseen.

Hanketta rahoittaa EAKR

DAM-hanke on Euroopan aluekehitysrahaston rahoittama hanke, jota toteutetaan yhdessä Kaakkois-Suomen ammattikorkeakoulun (Xamk) kanssa. Hanke käynnistyi syksyllä 2019 ja jatkuu syyskuun 2021 loppuun asti.


Liisa Näpärä (ORCID) työskentelee suunnittelijana Kansalliskirjastossa, Digitaalinen avoin muisti -hankkeessa.

Johanna Lilja (Tutkimusportaali, ORCID) työskentelee palvelujohtajana Kansalliskirjaston tutkimuskirjastossa.