Data matkalla tunnustetuksi tutkimustuotokseksi – tiekartta ohjaa tiedeyhteisöä kohti parempia dataviittauskäytäntöjä

Tutkimusdata-asioissa otettiin tänä keväänä taas askel eteenpäin, kun ensimmäinen kansallinen ohjeistus dataviittauskäytännöistä julkaistiin. Tuore tiekartta osoittaa, miten viittaamisesta avautuu näkymä moniin keskeisiin datateemoihin, kuten tutkimusdatanhallintaan, datan asemaan tieteellisessä julkaisemisessa ja hyviin tieteellisiin käytäntöihin.

(The abstract of this post is also available in English.)

Dataviittauskäytäntöjen kehittäminen voi tuntua monesta tutkijasta ja tiedeyhteisön toimijasta etäiseltä asialta. Kyse on kuitenkin tutkimusdatan teemaa monella tasolla leikkaavasta asiasta, jonka taustalla on ajatus datan näkemisestä samanarvoisena tutkimustuotoksena kuin tutkimusjulkaisut.

Suomi on eturintamassa datanjulkaisemisen käytäntöjen kehittämisessä. Huhtikuussa julkaistu dataviittaustiekartta on tästä yksi esimerkki.

Huhtikuussa dataviittauskäytännöistä julkaistiin ensimmäinen kansallinen ohjeistus, Tracing Data – data citation roadmap for Finland. Tiekartta rakentuu dataviittauskäytäntöjen nykytilanteen ja tavoitetilanteen kuvauksesta sekä varsinaisesta tiekartasta, jossa esitetään reitti nykytilanteesta tavoitetilanteeseen ja kuvataan dataviittauksen malli.

”Vaikka tiekartasta avautuu hyvin laaja ilmiökenttä, ’data citation’ saattaa kuulostaa hyvin pieneltä ja spesifiltä. Tiekartta koskee käytännössä kuitenkin koko tiedekenttää. Eri toimijoiden pitäisi ottaa näistä suosituksista koppia”, johtava tietoasiantuntija Susanna Nykyri Tampereen teknillisestä yliopistosta sanoo.

Nykyri, joka vuodenvaihteeseen asti työskenteli Helsingin yliopiston kirjastossa, oli laatimassa tiekarttaa työryhmässä, johon kuului edustajia Helsingin yliopistosta – tutkijat Heidi Laine (tiekartan toimittaja) ja Ari Asmi (projektijohtaja) –, Aalto-yliopistosta, Tietotekniikan tutkimuslaitoksesta, Kansalliskirjastosta, Tietoarkistosta ja Data-asiain kansalliskomiteasta.

Meritoitumiskäytännöt eivät tue datan jakamista

Tiekartan perusajatus on yksinkertainen: dataviittauskäytäntöjä parantamalla dataa tuottavat tutkijat ja tutkimusryhmät saavat viittauksia ja tunnustusta työstään. Samalla data on helpommin löydettävissä, jolloin sen käytettävyys parantuu – ja tämä tuo taas lisää viittauksia tekijöille.

Meritoitumiskäytännöt eivät ole toistaiseksi tukeneet tutkimusdatan jakamista, ja sitä kautta dataan viittaamista.

”Se, mitkä asiat meritoivat, on tavallaan standardoitu. Kyse on siitä, mitä CV:hen laitetaan, mistä tulee tulospisteitä ja mistä yliopistot saavat rahoitusta. Se on iso ohjaava tekijä. Tutkijat joutuvat data-asiassa toimimaan vastoin sitä, mistä heitä palkitaan”, Nykyri sanoo.

”Tutkimustuotoksena olisi hyvä hyväksyä, silloin kun se on tarkoituksenmukaista, myös data. Ettei edellytettäisi vain perinteisiä julkaisuja. Jo rahoituksen hakuvaiheessa voitaisiin kertoa, että tämän tutkimuksen yhteydessä syntyy tällaista dataa, jota voidaan jatkokäyttää. Kun tutkija miettii oman datansa uudelleenkäyttöarvoa, hän ei voi ennakoida sitä, millaisia tutkimuskysymyksiä sille voidaan esittää myöhemmin. Digihumanistit ovat oiva esimerkki: he asettavat aineistolle kysymyksiä, joita varten aineistoja ei olla alun perin kerätty. Tutkijan on hyvä nähdä oma työnsä osana laajempaa tieteen kenttää, ei välttämättä edes osana omaa tieteenalaansa, vaan laajemmin”, Nykyri sanoo.

”Ilman tutkijan panosta ei inahdettaisikaan”

Tiekartta pyrkii osaltaan purkamaan dataan liittyviä pullonkauloja. Kopin ottaminen suosituksista on tehty mahdollisimman helpoksi. Keskeiset toimijat on selkeästi määritelty: tutkimusinstituutiot, data-arkistot (data repositories), tiedekustantajat, tutkijat, tieteelliset yhteisöt ja rahoittajat. Myös toimijoiden vastuut on määritelty kohta kohdalta – ydinkohdat on saatu tiivistettyä yhteen sivuun.

Dataviittaussuositusten ydinkohdat eri toimijoille on tiivistetty yhteen sivuun.

”Toimijoiden tärkeysjärjestystä on vaikea määritellä, koska kaikkien panosta tarvitaan. Jonkinlainen marssijärjestys on ehkä olemassa. Näkisin yliopistokirjastojen palvelut ja yliopistoissa kehitettävän infran tärkeinä. Datanhallintataitojen kehittäminen ja opettaminen on todella tärkeää työtä, ja sitä kirjastot tekevät. Infran kehittäminen liittyy julkaisutiedon keruuseen, johon on syytä sisällyttää data mukaan. Tällöin on huolehdittava muun muassa siitä, ettei tutkijan tarvitse syöttää metatieto kuin yhteen paikkaan”, Nykyri mainitsee.

Toimijoista tutkijan rooli on lopulta kaikkein keskeisin, sillä hän toteuttaa viittaamisen käytännössä – kaikki muut tiekartassa mainitut toimijat vain mahdollistavat paremmat dataviittauskäytännöt.

”Vaikka olisi millaiset tukipalvelut, ilman tutkijan panosta käytännöissä ei inahdettaisikaan. Toivon, että tiekartta osaltaan laajentaisi tutkijan näkökulmaa siitä, mistä kaikesta tässä on kyse. Ja että hän näkisi myös oman vastuunsa, ja osaisi kiinnittää huomiota keskeisiin asioihin, kuten hyvään datanhallintaan, metadatan rooliin ja pysyvien tunnisteiden merkitykseen”, Nykyri sanoo.

Hyvä datanhallinta kaiken perusta

Tiekartan ansioihin on laskettava dataviittauskäytäntöjen kontekstualisointi, liittäminen osaksi tieteen hyviä käytäntöjä, kuten tutkimuksen läpinäkyvyyttä, ja avointa tiedettä.

”Sitoisin viittaamisen hyvään aineistonhallintatapaan ja hyviin tieteellisiin käytäntöihin. Vaikka datasta ei Tutkimuseettisen neuvottelukunnan ohjeissa (Hyvä tieteellinen käytäntö) suoraan puhuta, implisiittisesti se on siellä mukana: kunnia on annettava sille, kenelle kunnia kuuluu. Toisaalta juuri se, ettei se ole ollut siellä eksplisiittisesti, on ollut omiaan pitämään asian pimennossa”, Nykyri sanoo.

Susanna Nykyri liittää viittaamisen hyvään aineistonhallintatapaan ja hyviin tieteellisiin käytäntöihin. Kuvaaja: Jussi Männistö

Hyvä datanhallinta taas on edellytys sille, että dataan voidaan ylipäätään viitata. Esimerkiksi Suomen Akatemia on jo jonkin aikaa edellyttänyt datanhallintasuunnitelmaa (data management plan, DMP) rahoitushaussa. Nykyri uskoo, että dataviittausten nostaminen datanhallinnan rinnalle lisää asian kiinnostavuutta tutkijan kannalta.

”Kun asia sidotaan tutkijoiden työn vaikuttavuuteen, näkyvyyteen ja tutkijoiden meritoitumiseen, alkaa hahmottua paremmin se, mitä tarvitaan siihen, että data on viitattavissa”, Nykyri toteaa.

Tiekarttaprojekti on lähtöisin opetus- ja kulttuuriministeriön vuodenvaihteessa päättyneestä Avoin tiede ja tutkimus -hankkeesta. Avoin data ei kuitenkaan nouse hallitsevaan rooliin tiekartassa.

”Taustalla on ymmärrys siitä, että kaikki data ei ole avattavissa. Se, että me hirveästi korostettaisiin sitä, että vain avoin data on arvokasta, olisi vaarallinen kehityspolku. Silloin voitaisiin esittää vain sellaisia tutkimuskysymyksiä, jolle voidaan kerätä avoin aineisto. Se sulkisi kaiken sensitiivisen aineiston pois”, Nykyri mainitsee.

”Ei kannata jäädä odottamaan, mitä muut tekevät”

Datanhallinnan ja dataan viittaamisen käytäntöjen kehittämisessä Suomi on eturintamassa, mutta tiekarttaa ei ole laadittu muusta maailmasta irrallaan. Ohjeistus on sidottu kansainvälisiin FORCE11-suosituksiin.

”Koimme, että FORCE11 on riittävän valmis esitys eikä meidän olisi ollut mielekästä lähteä rakentamaan tätä ristiriidassa siihen. Tiekartta on rikastettu versio FORCE11:sta”, Nykyri toteaa.

Seuraava askel on synnyttää keskustelua tiekartan teemoista, lisätä tietoisuutta aiheesta, ja saada viesti kuuluviin myös yliopistojen strategioissa.

”Kun mietitään yliopiston datapolitiikkaa tai toimenpideohjelmia, toivoisin, että ymmärretään katsoa myös tätä. Sitten toivoisin, että tämä tavoittaisi kotimaisten tiedelehtien toimituskunnat. Kenenkään ei kannata jäädä odottamaan, mitä muut tekevät. Tiekartasta eri toimijat voivat lukea, mihin suunnata huomiota ja kehittämistoimenpiteitä. Peräänkuulutan aktiivisuutta”, Nykyri sanoo.

Yliopistojen politiikoissa Nykyri kiinnittäisi erityistä huomiota toimeenpanoon ja siihen, että data nähtäisiin osana julkaisemista.

”Se, että on täysin erikseen julkaisupolitiikka ja datapolitiikka, on riski. Keskeiset asiat julkaisupolitiikasta pitäisi olla myös datapolitiikan puolella. Politiikat ovat suppeita, niissä tulevat keskeiset asiat ja tahtotila esille. Toimenpideohjelma kuitenkin oikeasti ratkaisee sen, miten politiikkaa toteutetaan. Ja se yliopistoilta yleensä puuttuu. Politiikkapapereita alkaa jo olla, mutta ei toimenpideohjelmaa, johon olisi sitouduttu. Kehitys voi kuitenkin olla tässä hyvinkin nopeaa”, Nykyri arvioi.


Tampereella järjestettiin 18. toukokuuta dataviittaustiekarttaan liittyvä seminaari. Susanna Nykyri ja Heidi Laine käyvät Informaatiotutkimus-lehden kirjoituksessa (2/2018) läpi tiekarttaa keskustelutilaisuuden pohjalta.