Kansalliskirjaston tutkijapalvelut perustuvat aineiston tuntemukseen, datan tarjontaan ja hankeyhteistyöhön

Kansalliskirjaston aineistot ja kokoelmat ovat monikielisiä ja palvelevat tutkijoita niin lähdeaineistoina kuin tutkimuskirjallisuutena. Oli kyse sitten analogisista, digitaalisista tai data-aineistoista, monille ihmistieteilijöille – ja sovelletusti myös muillekin tutkijoille – on tarjolla ammennettavaa Kansalliskirjaston laajoista kokoelmista ja palveluista. Kansalliskirjaston aineistoja voi käyttää itsenäisesti, asiantuntijoiden tukemana, hankeyhteistyössä ja tulevaisuudessa myös residensseissä. Kansalliskirjaston tutkijoille suunnatut palvelut on jaoteltu tutkimuksen ja opetuksen palveluihin ja tutkimusyhteistyöhön.

Teksti: Johanna Lilja (Kansalliskirjasto) & Liisa Näpärä (Kansalliskirjasto)

Kansalliskirjasto tarjoaa tutkija- ja datapalveluita neljällä tasolla.

Kansalliskirjasto tarjoaa tutkimukseen runsaasti alkuperäisaineistoja, kirjallisuutta sekä miljoonia sivuja erilaista sähköistä materiaalia. Kansalliskirjaston hakupalvelu kansalliskirjasto.finna.fi kokoaa aineistot yhteen ja mahdollistaa kokoelmien selaamisen ja varaamisen kotilainaksi tai lukusalikäyttöön. Digitoituja julkaisuja voi lukea ja selata digi.kansalliskirjasto.fi-palvelussa, jossa voi myös kohdistaa hakuja tekstien sisältöön.

Lisäksi Kansalliskirjastossa ja eri puolille Suomea sijoitetuissa vapaakappalekirjastoissa on paikalliskäytössä kulttuuriaineistolain perusteella kerätty suomalainen sähköinen julkaisutuotanto ja verkkoarkisto, joiden käyttö joudutaan tekijänoikeuslain perusteella rajaamaan vapaakappaletyöasemille. Näillä työasemilla voi käyttää myös digi.kansalliskirjasto.fi -palvelun tekijänoikeudenalaisia aineistoja.

Kokoelmien nostoista voi lukea Scripta Selecta -blogista.

Tutkijoiden tarpeet ovat moninaiset, samoin heidän suhteensa digitaalisiin aineistoihin. Perinteisiä menetelmiä – lähilukua ja tulkintaa – käyttävä humanisti hyödyntää lukusalityöskentelyn ohella mielellään myös digitoitua aineistoa, joka nopeuttaa hänen työtään. Digitaalisten ihmistieteiden menetelmiä käyttävälle tutkijalle laajat ja kattavat digitaaliset aineistot ovat välttämätön edellytys. Digitaalisten ihmistieteiden menetelmien skaala on laaja – toisessa ääripäässä perinteistä aineiston hakua ja analyysiä tukevat helpot työkalut, toisessa suurta laskentakapasiteettia vaativa datamassojen analyysi.

Lähitulevaisuuden Kansalliskirjaston keskeisiä kehittämiskohteita on aineiston tarjonta siten, että sitä voidaan hyödyntää moninaisin menetelmin. Palveluja kehitetään niin kirjaston sisällä kuin yhteistyössä muiden toimijoiden kanssa. Kansalliskirjasto on mukana FIN-CLARIAH-konsortiossa, jossa haetaan ratkaisua suurta laskentakapasiteettia vaativan keskitetyn datapalvelun toteuttamiseen. Syyskuussa 2021 päättyneessä Digitaalinen avoin muisti (DAM) -hankkeessa puolestaan keskityttiin digitaalisten aineistojen käytettävyyden kehittämiseen ja kehitettiin käyttäjälähtöisiä työkaluja digi.kansalliskirjasto.fi-palvelun yhteyteen.

Perinteisiä menetelmiä – lähilukua ja tulkintaa – käyttävä humanisti hyödyntää lukusalityöskentelyn ohella mielellään myös digitoitua aineistoa, joka nopeuttaa hänen työtään.

Keskeinen haaste on tekijänoikeudenalaisen aineiston tarjonta tutkimukselle. Aineistojen tutkimuskäyttöä on helpotettu sopimalla tekijänoikeusjärjestöjen kanssa käyttölisensseistä. Esimerkiksi Digissä avoimena olevat 1930-luvun suomenkieliset ja 1940-luvun ruotsinkieliset lehdet ovat verkkokäytössä Kopioston kanssa tehtyjen sopimuksien ansiosta. Tutkain-hankkeessa digitoituja aineistoja on puolestaan avattu 15 korkeakoululle tutkimuskäyttöön aina 2010-luvulle asti. Arvokkaita aineistoja jää kuitenkin sopimuskäytön ulkopuolelle. Esimerkiksi verkkoarkiston aineiston oikeudenhaltijat ovat hajanainen ryhmä, jota mikään suomalainen tekijänoikeusjärjestö ei edusta. Tämän aineiston saaminen tiedonlouhinnan piiriin riippuu suuresti tulevista muutoksista tekijänoikeuslakiin.

Datan itsepalvelukäyttöön lisää työkaluja

Kansalliskirjasto tuottaa digitaalisista kokoelmistaan myös dataa. Merkittävimmät datana saatavat kokonaisuudet ovat digitoiduista sanomalehtiaineistoista tuotetut datapaketit sekä Kansallisbibliografia Fennica. Näihin voi tutustua englanninkielisen Datakatalogin avulla. Datakatalogista pääsee tutustumaan myös käytössä oleviin rajapintoihin. Digitoitujen aineistojen datapaketit löytyvät myös digitoitujen aineistojen yhteydestä.

Digitaalinen avoin muisti (DAM) -hankkeessa kehitettiin tekijänoikeudesta vapaiden digitoitujen sanomalehtiaineistojen lataukseen uudenlainen lataustyökalu. Lataustyökalun yksinkertaisen käyttöliittymän ansiosta käyttäjä voi ladata tarkkaan rajattuja aineistoja toisin kuin valmiissa datapaketeissa, jotka ovat toisinaan liian suuria käyttäjien tarpeisiin. Toisaalta työkalun avulla voi ladata isoja datamassoja ilman Python-ohjelmointiosaamista, jota tarvitaan esimerkiksi rajapintojen käyttöön.

Lataustyökalulla voi ladata suuria tai yksilöityjä aineistoja ilman lataukseen tarvittavaa ohjelmointiosaamista.

Lataustyökalun käyttö perustuu Digin hakutuloksiin. Digissä suoritetaan haluttu haku ja sen URL kopioidaan työkaluun. Datan saa ulos tekstinä, ALTO XML -formaatissa sekä PDF-kuvina. Dataa voi viedä CSV-tiedostoina kätevästi esimerkiksi taulukko-ohjelmaan ja käsitellä haluamallaan tavalla. Työkalu on ladattavissa digitoitujen aineistojen yhteydestä. Mukana tulee myös käyttöohje.

Lataustyökalulla voi ladata sanoma- ja aikakauslehtien, pienpainatteiden, kirjojen, käsikirjoitusten ja nuottien aineistoja siltä osin kuin niiden sisältö katsotaan tekijänoikeudesta vapaaksi. Lehdet ja pienpainatteet ovat ladattavissa vuoden 1910 loppuun asti. Muut aineistot ovat ladattavissa tekijänoikeuden metatiedon mukaan, jolloin aikaraja vaihtelee aineistoittain ja teoksittain. Ohjevideo työkalun käyttöön löytyy YouTubesta.

DAM-hankkeessa kehitettiin myös aiemmassa hankkeessa luotua Jupyter Notebook -työkirjaa, jolla Digin tekstiaineistoja voi ladata. Työkirjan käyttö vaatii hieman edistyneempiä metodisia taitoja kuin lataustyökalun käyttö. Työkalu löytyy GitHubista. Erilaiset työkalut palvelevat erilaisia datan tarvitsijoita, ja tulevaisuuden tavoitteena on palvella heitä entistä paremmin.

Asiantuntijat tukevat aineistojen käyttöä

Kansalliskirjaston asiantuntijat tarjoavat tukea aineistojen käyttöön sekä verkossa että paikan päällä. Kansalliskirjasto esimerkiksi järjestää kokoelmistaan esittelyitä opiskelijoille ja tutkimusryhmille, joille aineistojen käyttö on ajankohtaista.  Opastuksiin ja dataklinikoihin voi tutustua Kansalliskirjaston sivuilla. Tarvittava asiantuntijatuki voidaan räätälöidä tapauskohtaisesti. Tutkija- ja opiskelijaryhmien käynnit ovat maksuttomia, mutta joihinkin muihin asiantuntijapalveluihin saattaa sisältyä maksuja.
Kirjaston asiantuntija-apua kaivataan usein myös silloin, kun tutkijan tarvitsee tietää tietyn kokoelman syntyhistoriaa, kokoelmassa mahdollisesti olevia vinoumia ja puutteita tai saada tietoa siitä, miten kokoelma on kuvailtu ja järjestetty. Datalähtöisessä tutkimuksessa tällainen kokoelmahistorian ja kuvailutiedon asiantuntemus on olennaista metodologian ja aineiston kuvauksessa, ja kirjaston pitää pystyä vastaamaan tähän uuteen tarpeeseen.

Yhteistyötä hankkeissa

Yhteistyötä voidaan tehdä esimerkiksi tutkimushankkeissa. Kuva: Pixabay.

Jos kirjaston peruspalvelu ei riitä tutkimushankkeen toteuttamiseksi, voidaan käynnistää keskustelu siitä, miten Kansalliskirjasto voisi osallistua tutkimukseen peruspalvelua laajemmalla kontribuutiolla. Tutkimusyhteistyöhön liittyviä yhteydenottoja voi lähettää internetsivuilla olevalla lomakkeella. Samalla lomakkeella voi lähettää myös muita Kansalliskirjaston aineistoihin liittyviä tutkimusideoita, joissa toivotaan esimerkiksi normaalia laajempaa asiantuntijapalvelua.

Tutkimusyhteistyö voi tarkoittaa Kansalliskirjaston tuen ilmaisua hankkeelle (Letter of Commitment) tai normaalista poikkeavaa palvelua esimerkiksi aineiston käsittelyn osalta. Jos Kansalliskirjaston rooli hankkeessa edellyttää yhteistä kehittämistä, kirjasto voi osallistua hankkeeseen konsortion osapuolena.

Kansalliskirjasto osallistuu tutkimushankkeisiin, jotka edistävät sen aineistojen saatavuutta ja käytettävyyttä, ja jotka parantavat aineistojen laatua esimerkiksi uudenlaisella sisältötiedolla tai hyödyntämällä tekoälyyn perustuvia sovelluksia. Tutkimusyhteistyö perustuu Kansalliskirjaston strategisiin painopisteisiin ja sen toteutumista arvioivat Kansalliskirjaston asiantuntijat.

Kansalliskirjasto osallistuu tutkimushankkeisiin, jotka edistävät sen aineistojen saatavuutta ja käytettävyyttä, ja jotka parantavat aineistojen laatua.

Tutkimusyhteistyö voi olla painottunut vaikkapa Kansalliskirjaston aineistojen käyttöön tutkimuksessa tai tutkimuksen avulla rikastettaviin Kansalliskirjaston kokoelmiin tai käyttöliittymien kehittämiseen. Tähän mennessä tehdyn tutkimusyhteistyön ansiosta on voitu kehittää automaattista tekstintunnistusta ja parantaa digitoitujen tekstien sisältöhakua. Näin on tehty esimerkiksi Horizon 2020 -ohjelmasta rahoitetussa NewsEye-hankkeessa. Käytännön toteutuksen mahdollisti puolestaan EAKR-rahoitettu Digitaalinen avoin muisti.

Residenssipilotointi

Tulevaisuudessa aineistoja voi käyttää myös residenssissä kirjaston tiloissa. Residenssimalli on ollut eurooppalaisissa kirjastoissa käytössä silloin, kun asiakkaan mahdollisuudet käyttää aineistoja ovat tutkimuksen tarpeisiin nähden liian rajoitetut esimerkiksi tekijänoikeudellisista syistä. Tällöin voidaan kehittää ratkaisu, jossa aineiston käyttäjä työskentelee kirjastossa työntekijänä, ja saa perehdytyksen aineistoihin liittyviin oikeuksiin ja niiden käyttöön.

Residenssimallin soveltamisessa on paljon avoimia kysymyksiä, joten käytäntö vaatii pilotointia. Tällä hetkellä suunnitellaan käynnistettäväksi Mikkelin toimipisteen residenssipilotointia, jonka tarkoituksena on tarjota muutoin vaikeasti käytettäviä aineistoja tutkijan analysoitaviksi. Tällaiset aineistot ovat käytettävissä vain kirjaston tiloissa. Pilotoinnissa selvitetään tutkijan perehdytykseen, tutkimuksen tukemiseen, työn valvontaan, aineiston käyttöön ja jatkokäyttöön liittyviä kysymyksiä sekä tutkijan että kirjaston näkökulmasta. Tekijänoikeudenalaisten aineistojen käyttöön tarkoitettua residenssimallia on kehitetty Digitaalinen avoin muisti -hankkeessa. Lisätietoa residensseistä tulee myöhemmin pilotin edetessä.


Johanna Lilja (Tuhat, ORCID) työskentelee palvelujohtajana Kansalliskirjaston tutkimuskirjastossa.

Liisa Näpärä (Helsinki.fi, ORCID) työskentelee tietoasiantuntijana Kansalliskirjastossa tutkimusyhteistyöhön liittyvissä tehtävissä.


Digitaalisten ja data-aineistojen ympärille kehitettyjen palveluiden suunnittelua ja jäsentelyä rahoitti Euroopan aluekehitysrahaston Vipuvoimaa 2014–2020-ohjelma Digitaalinen avoin muisti (DAM) -hankkeessa. Hankkeessa kerättiin digitaalisia aineistoja hyödyntäviltä käyttäjiltä tietoa heidän tarpeistaan digitaalisten aineistojen kehittämiselle ja tutkijapalveluille niiden ympärillä. Lisätietoja Digitaalinen avoin muisti (DAM) -hankkeesta: Liisa Näpärä (liisa.napara@helsinki.fi).