”Tutkimuskulttuurin on muututtava, jotta datan jakamisesta tulisi sääntö eikä poikkeus” – Tuuli Toivosen Open Data Champions -haastattelu

Julkisin varoin tuotetun datan saatavuuteen liittyvät monenlaiset esteet – ja datan hyödyntämisen mahdollisuudet – saivat maantieteilijä Tuuli Toivosen aikoinaan kiinnostumaan avoimesta datasta. Open Data Champions -tunnustuksella palkitun Toivosen mukaan tutkijoiden koulutuksessa pitäisi jo varhaisessa vaiheessa kiinnittää huomiota datan jakamisen käytäntöihin.

(English version of this interview is available on Open Data Champions website.)

SPARC Europe -kirjastoyhteisö palkitsi viime vuonna kolme Helsingin yliopiston tutkijaa – Tuuli Toivosen, Ari Asmin ja Mikko TolosenOpen Data Champions -tunnustuksella, joka myönnetään avoimen tutkimusdatan edistämisestä (ks. myös Flamma-uutinen). Think Open -blogissa julkaistaan heinäkuun aikana palkittujen HY-tutkijoiden haastattelut suomeksi.

Sarjan aloittaa maantieteilijä ja geoinformatiikan apulaisprofessori Tuuli Toivonen. Tämä haastattelukäännös on tehty alkuperäisen englanninkielisen haastattelun pohjalta.

Tuuli Toivosen mukaan avoin data vaatii kulttuurin muutosta monella tasolla, tutkijasta hallintoon. Kuva: Noora Piispanen

Miksi pidät datan jakamista tärkeänä? Mikä auttoi sinua ymmärtämään datan jakamisen tärkeyden?

Aloittaessani tutkijana noin 15 vuotta sitten tarvitsin viranomaisten tuottamaa dataa tutkimustyöhöni. Neuvottelut datan saamisesta kestivät pitkään, ja toisinaan tarvittavat datasetit olivat yksinkertaisesti liian kalliita hankittavaksi. Oli turhauttavaa tietää, että arvokasta dataa oli kerätty ilman, että se oli saatavissa. Turhautuminen oli erityisen voimakasta silloin, kun datan keräämisestä oli vastannut julkisin varoin toimiva instituutio, jolla ei ollut omia resursseja datan analysoimiseen. Esitimme silloin, että julkisin varoin tuotetun datan pitää olla tutkijoiden käytössä. Tai vieläkin parempana pidimme sitä, että data olisi kaikkien käytettävissä ilman rajoituksia. Näin vähennettäisiin hallinnollista työmäärää ja madallettaisiin kynnystä tutkijoiden, yritysten ja aktiivisten kansalaisten väliseen yhteistyöhön ja sitä kautta syntyviin innovaatioihin. Myöhemmin, osittain Avoin data -liikkeen ja Euroopan laajuisen toiminnan (esim. INSPIRE-direktiivi) ansiosta, viranomaiset alkoivat jakaa dataansa avoimesti Suomessa. Näin luotiin pohjaa uuden tutkimuksen esiinnousulle ja vähennettiin hallinnollisiin prosesseihin kuluvaa aikaa.

Noista ajoista lähtien olen ollut voimakkaasti sillä kannalla, että mikäli olen tuottamassa dataa julkisin varoin rahoitetussa tutkimusprojektissa, velvollisuuteni on jakaa data muiden kanssa. Näin edistetään tutkimustulosten jatkokäyttöä ja vähennetään päällekkäistä työtä. Tietenkin on myös palkitsevaa nähdä oman datansa vaikuttavan kaupunkisuunnitteluun tai saavan uusia ilmentymiä toisten tutkijoiden tutkimuksissa.

Miten avoin data on mukana omassa työssäsi?

Tavoitteenamme on jakaa avoimesti tutkimuksessa tuottamamme datasetit aina, kun se on mahdollista. Varsinaisen, tutkimuksessa tuotetun ja tutkimusartikkeleiden yhteydessä julkaistavan datan (ks. suojelualueita koskevan tutkimuksen data) lisäksi jaamme myös käyttämämme välineet datan hyödyntämistä varten (ks. MetropAccess-projekti).

Mikä turhauttaa sinua eniten nykykäytännöissä? Jos voisit muuttaa yhden asian, mikä se olisi?

Yksi kiireellisimpiä, jopa avointa tutkimusdataa edeltäviä asioita on julkaisujen avoimuus. Esimerkiksi Suomen on ollut todella vaikeata neuvotella suurten kustantajien kanssa julkaisujen avoimuuden lisäämisestä kohtuuhintaan. Sadat tutkijat boikotoivat Elsevieriä tukeakseen neuvotteluita. Mitä tulee avoimeen dataan, nykyiset rahoitus- ja meritoitumisjärjestelmät kannustavat tutkijoita tavoittelemaan nopeaa henkilökohtaista hyötyä pitkän aikavälin tieteellisten päämäärien sijasta. Datan jakaminen vaatii aikaa, koska datan on oltava huolellisesti dokumentoitua. Data on myös resurssi akateemisessa kilpailussa. Nykysysteemi, joka tähtää nopeisiin hyötyihin, ei aina kannusta käyttämään aikaa datan dokumentointiin ja sen jakamiseen niiden kanssa, jotka voisivat hyötyä siitä tieteellisessä kilpailussa. Monilla aloilla on kuitenkin käynnissä selvä muutos kohti suurempaa avoimuutta, koska pitkällä aikavälillä datan avoimuus on ratkaisevan tärkeää myös tutkimustuloksia arvioitaessa. Toivon, että avoimuudesta tulee ajan myötä tieteellisen prosessin standardi, ja että avointen tutkimustulosten arvostus on yhä enemmän sidoksissa niiden läpinäkyvyyteen. Meillä tutkijoilla, tutkimushallinnon edustajilla ja kustantajilla on kaikki avaimet muutoksen toteuttamiseksi.

Nykysysteemi, joka tähtää nopeisiin hyötyihin, ei aina kannusta käyttämään aikaa datan dokumentointiin ja sen jakamiseen niiden kanssa, jotka voisivat hyötyä siitä tieteellisessä kilpailussa.

Mitä tapahtuu, jos tutkimusdata pysyy suljettuna?

Suljetut datasetit lisäävät päällekkäistä työtä, hallinnollista hässäkkää ja virheellisten tutkimustulosten julkaisumahdollisuutta, ja ne hidastavat tieteen edistymistä. Suljetut datasetit myös lisäävät todennäköisyyttä olemassaolevien resurssien haaskaamiseen. Tulevaisuuden kannalta arvokas data voi hävitä yksittäisten tutkijoiden kiintolevyillä. Virheet voivat myös kasaantua, jos tutkimustuloksia ei voida jälkikäteen tarkistaa.

Kuka tai mikä (projekti tai palvelu) inspiroi sinua ja saa sinut luottavaiseksi avoimen tieteen tulevaisuuden suhteen?

Polymath-projekti Isossa-Britanniassa ja NMRLipids myöhemmin Suomessa ovat viitoittaneet tietä uudenlaiseen tutkimuskulttuuriin. Lisäksi kaikki aloitteet, jotka kannustavat tutkijoita avaamaan menetelmiään ja tutkimusdataa yhdessä artikkelien kanssa, vievät meitä oikeaan suuntaan.

Mitä pitäisi vielä tehdä, jotta yhä useampi tutkija jakaisi ja avaisi tutkimusdatansa?

Sen pitäisi olla paljon helpompaa kuin mitä se on tällä hetkellä. Vie oman aikansa ennen kuin datan jakamisen infrastruktuuri ja käytännöt ovat vakiintuneet, ja tutkijakoulutuksessa täytyy kiinnittää tähän huomiota jo varhaisessa vaiheessa. Tällä hetkellä datan jakamisen aloittamiseen vaaditaan henkilökohtaista innostusta, koska se tuntuu alkuvaiheessa vaikealta ja sotkuiselta. Tarvitaan myös muutosta tutkimuskulttuurissa, mukaan lukien tiedejulkaisujen käytännöissä ja meritoitumisjärjestelmässä, jotta datan jakaminen olisi sääntö eikä poikkeus.

Ja lopuksi, miltä näyttäisi nykyistä avoimemman datan maailma?

Nykyistä avoimemman datan maailma voisi vastata entistä tärkeämpiin tutkimuskysymyksiin, ja tieteen hyödyntäminen yhteiskunnallisessa päätöksenteossa ja liiketoimintamahdollisuuksien luomisessa voisi olla nykyistä nopeampaa. Samalla on kuitenkin tärkeää huomata, että kaikki data ei voi olla avoimesti saatavilla. Yksityisyyttä on kunnioitettava, ja tutkimusyhteisön on luotava selkeät käytännöt tätä varten.