Luonnonvara-alan yhteistyökuulumisia: tavoitteena tutkimusaineistojen avoin saatavuus

Viime vuosina yliopistokirjastoissa on aktiivisesti tuettu ja edistetty avointa julkaisemista, mutta kansainväliset rahoittajien ja julkaisutoimittajien aiheuttamat paineet edellyttävät nykyisin myös tutkimusaineistojen avointa saatavuutta ja jatkokäytön mahdollistamista. Tutkimusaineistojen avoin saatavuus on tärkeää, koska tutkimuksen peruslähtökohtana tulee olla kokeen toistettavuus ja tieteellisen tutkimuksen verifioinnin mahdollisuus.

Julkisin varoin kerätty tutkimusaineisto kannattaa hyödyntää uudelleen myös muissa tutkimuksissa. Globaalien ympäristöongelmien ratkaisemiseksi tarvitaan nopeasti eri puolilla maapalloa kerättyä tutkimusdataa. Esimerkiksi biotieteissä on uusia tutkimusmenetelmiä, jotka edellyttävät jaettavissa olevia aineistoja ja avoimuuteen perustuvia tutkimusinfrastruktuureja. Mm. näiden syiden vuoksi on tärkeää, että keskeinen julkisrahoitteinen tutkimusdata olisi lähtökohtaisesti avoimessa käytössä. Saatavuuden edistämisessä keskitytään nimenomaan digitaalisessa muodossa olevaan dataan. (OECD:n datasuositus, toimeenpanomahdollisuudet Suomessa)

Biologiset tieteet tuottavat runsaasti dataa

Tutkimusaineistot ovat tutkimuksen perusaineistoa. Termiä on pyritty määrittelemään, mutta selvää rajausta ei voida tehdä. Tutkimusaineisto voi olla havaintodataa, jalostettua tietoa, tilasto-, paikka-, tai rekisteritietoa, tekstiä, kaavoja, malleja – mutta ovatko esim. syanobakteerin kantakokoelman näytteet tai verinäytteet dataa? Aineistot ovat toisaalta tutkijoiden itsensä tiettyä tutkimusta varten keräämää dataa ja toisaalta tutkimuslaitoksen tai kenttäaseman jatkuvasti tuottamaa havaintodataa, esimerkiksi tietoja lumen syvyydestä tai ilman hiilidioksidipitoisuudesta.

Ympäristö- ja luonnonvara-alalla on tartuttu tehokkaasti tutkimusaineistojen saatavuuden edistämiseen. Viikin tiedekirjasto on ollut aktiivisesti toiminnassa mukana osana kirjaston koordinoimaa Matri-yhteistyötä (kts. Verkkari 07/2009).

Ongelmaan käsiksi työryhmien avulla

Tutkimusaineistojen avoimen saatavuuden edistämiseksi Suomessa tehdään työtä monella taholla ja monessa eri työryhmässä. Ympäristöministeriön ja maa- ja metsätalousministeriön muodostamassa yhteenliittymässä perustetun ENVDAT-työryhmän tavoitteena on edistää sellaisia aineistohankkeita, joissa eri tutkimuslaitosten yhteistyöstä saadaan konkreettisia hyötyjä mahdollisimman nopeasti. Peruslähtökohtana tietoaineistojen ja tilastojen kehittämisessä on yhteen toimivien avoimien järjestelmien rakentaminen ja yhteisten palvelurajapintojen suunnittelu ja toteuttaminen. Työryhmän raportissa esitetään kehitettäväksi paikkatiedon hyödyntämiseen perustuva palvelu, jossa käyttäjä pystyy rajaamaan alueen kartalta ja saamaan siitä ympäristöä ja luonnonvaroja koskevia tietoja. Tieto saadaan palveluun hajautettuna eri laitoksista.

Yhteenliittymän tavoitteena on myös luoda yhteinen datapolitiikka ja yhtenäistää tilastotiedon tuotantoa. Liittymään kuuluvien tutkimuslaitosten (Geodeettinen laitos GL, Maa- ja elintarviketalouden tutkimuskeskus MTT, Metsäntutkimuslaitos Metla, Riista- ja kalatalouden tutkimuslaitos RKTL, Suomen ympäristökeskus SYKE) lisäksi yhteistyöhön on osallistunut lukuisia muita luonnonvara- ja ympäristöalan aineistoja tuottavia organisaatioita (esimerkiksi Geologian tutkimuslaitos GTK, Ilmatieteen laitos, maa- ja metsätalousministeriön tietopalvelukeskus Tike, Maanmittauslaitos, Metsähallitus, Metsätalouden kehittämiskeskus Tapio, Luonnontieteellinen keskusmuseo).

Toimin Viikin tiedekirjaston edustajana ENVDAT-työryhmässä asiantuntijajäsenenä. Kuulun myös seuraavana esittelemääni Helsingin yliopiston tutkimusaineistojen saatavuutta selvittävään työryhmään.

Kansallisen tason datapolitiikkaa tarvitaan

Helsingin yliopiston tutkimusaineistojen saatavuutta selvittävä työryhmä asetettiin kesäkuussa 2008. Tutkija, dosentti Marjut Salokanteleen vetämä ryhmä järjesti laitosten esimiehille kyselyn arvioidakseen koko yliopiston tutkimusdatan säilyttämiseen tarvittavat resurssit. Datapolitiikan luomista varten tarvitaan lisäksi tietoa datan luonteesta, sen omistajuudesta ja tietosuojakysymyksistä. Työryhmässä havaittiin hyvin pian, että Suomessa tarvitaan kansallista ratkaisua yksittäisten organisaatioiden datapolitiikan lisäksi.

Opetusministeriö perusti keväällä 2009 kansallisen poikkihallinnollisen selvityshankkeen kartoittamaan ja koordinoimaan julkisin varoin luotujen sähköisten tietoaineistojen ja tietovarantojen hyödyntämisen tehostamista. Selvityshanketta varten tietoaineistoja koskeva kansallinen kyselyn tehtiin syksyllä 2009. Kyselyn toteutti opetusministeriön toimeksiannosta CSC Tieteen tietotekniikan keskus.

OPM:n asettaman selvityshankkeen järjestämässä seminaarissa 29.9.2009 kuultiin monia luonnonvara-alaan liittyviä esimerkkejä siitä, kuinka paljon dataa muodostuu esimerkiksi nykyaikaisilla ilmaston seurantalaitteilla. Valtavia määrä tietokoneen muistitilaa täyttävää geeniteknologian sekvenssiaineistoa syntyy jatkuvasti. Suomessa luonnonvara-alalla moni tutkimushanke tai ohjelma on tiedontuottajana kansainvälisissä datapankeissa (esim. ICOS – Integrated Carbon Observation System, BBMRI – European Biobanking and Biomolecular Resources).

Tiedonhallintasuunnitelma auttaa tutkijaa pohtimaan tutkimusaineistonsa elinkaarta

Suomen Akatemia on muita kotimaisia rahoittajia aikaansa edellä, sillä nykyisin se edellyttää apurahan hakijoilta tiedonhallintasuunnitelmaa osana tutkimussuunnitelmaa. Käytännön kokemusta tiedonhallintasuunnitelman laatimisen tukemisesta Viikin tiedekirjasto sai syksyllä 2009 Solmu-hankkeen muutoslaboratoriossa syanobakteerin tutkimusryhmän kanssa työskennellessään. Ryhmän tutkija teki Suomen Akatemialle apurahahakemuksen Itämeren tutkimukseen liittyvästä hankkeesta, jonka tiedonhallintasuunnitelman tekemisessä Viikin tiedekirjaston tietoasiantuntijat auttoivat asiantuntemuksellaan. Kartoitus uusista tarvittavista ja jo olemassa olevista tutkimusaineistoista auttoi tutkijaa selkeyttämään tutkimuksen kokonaisuutta. Aineiston elinkaari hahmottui tarkentavien kysymysten asettelusta, miten aineisto kerätään, miten säilytetään ja miten mahdollistetaan sen jatkokäyttö?

Viikin tiedekirjaston merkkivuotensa kunniaksi 27.10.2009 järjestämässä juhlaseminaarissa keskustelu tutkimusaineistojen saatavuuden edistämisestä oli vilkasta. Tilaisuudessa kuultiin myös Marjut Salokanteleen esitys tutkimusaineistojen avoimuuteen liittyvistä kysymyksistä.

Tuhti tietopaketti luonnonvara-alojen tutkimusaineistojen hallinnasta

Tutkimusaineistojen saatavuuden edistämisestä on järjestetty lukuisia seminaareja ja koulutuksia niin kotimaassa kuin ulkomaillakin. Työryhmiä on perustettu, työpajoja järjestetty ja raportteja kirjoitettu. Monissa kansainvälisissä artikkeleissa on käsitelty kirjastojen ja tietopalvelun roolia tutkimusaineistojen hallinnan tukena. Olemme keränneet luonnonvara-alan tutkimusaineistojen jatkokäyttöön liittyvän aineiston yhteen www-sivustoon: ”Luonnonvara-alan tutkimusaineistoja”. Sivusto on avoimesti kaikkien asiasta kiinnostuneiden käytettävissä.

Kuva: Auli Hovi. – Hiilidioksidipitoisuus ilmakehässä:
http://fi.wikipedia.org/wiki/Tiedosto:Mauna_Loa_Carbon_Dioxide-fi.png

Teksti:
Liisa Siipilehto
Tietoasiantuntija
Viikin tiedekirjasto