Millainen on hyvä tutkimusdatapolitiikka? – Helsingin yliopiston linjausta päivitetään tänä vuonna

Helsingin yliopiston tutkimusdatapolitiikkaa ollaan parhaillaan päivittämässä. Think Open -blogiartikkelissa päivityksestä vastaavaan työryhmään kuuluvat jäsenet kertovat näkemyksiään uuden datapolitiikan tarpeista ja tavoitteista. Vastausten perusteella keskeisenä tavoitteena on, että yhteinen datalinjaus helpottaa tutkijoiden työtä konkreettisella tavalla tutkimusalojen ja tutkimusaineistojen erityislaatu huomioiden. Linjauksen selkeys ja vastuiden määritteleminen toistuvat vastauksissa. Myös palveluiden tärkeys osana linjausta huomioidaan.

(This article is also available in English.)

Vuodesta 2015 asti voimassa ollutta Helsingin yliopiston tutkimusdatapolitiikkaa päivitetään tämän vuoden aikana. Ensi vuonna uudelle datapolitiikalle laaditaan erillinen toteuttamissuunnitelma, jossa kuvataan ne toimenpiteet, joilla datapolitiikan tavoitteisiin päästään.

Datapolitiikan päivitystarpeita ovat tuoneet – sekä kansallisella että kansainvälisellä tasolla – muuttuneet juridiset vaatimukset, kuten EU:n tietosuoja-asetus (2018), tutkimusinfrastruktuurien kehittämistarpeet ja tutkimusaineistojen avoimuuteen liittyvät FAIR-periaatteet.

Helsingin yliopiston vuoteen 2030 ulottuvan strategian toimeenpanosuunnitelma vuosille 2021–2024 (pdf, intranet) nostaa datapolitiikan päivittämisen yhdeksi keskeiseksi avoimen tieteen kehittämistoimenpiteeksi. Päivitystyötä varten on perustettu rehtorin asettama työryhmä, joka aloitti työnsä maaliskuussa. Tässä blogiartikkelissa työryhmän jäsenet vastaavat seuraaviin kysymyksiin:

  1. Mitä muutostarpeita on nykyisessä datapolitiikassa?
  2. Millainen on hyvä datapolitiikka – mikä on sen tarkoitus ja miten se vaikuttaa käytännössä?
  3. Mitkä ovat erityisiä, Helsingin yliopistoa koskevia kysymyksiä datapolitiikan laatimisessa?

Kysymyksiin vastaavat professori Sampsa Hautaniemi (Lääketieteellinen tiedekunta), professori Sasu Tarkoma (Matemaattis-luonnontieteellinen tiedekunta), professori Pirjo Aunio (Kasvatustieteellinen tiedekunta), yliopistonlehtori Merja Kontro (Bio- ja ympäristötieteellinen tiedekunta) ja vararehtori Paula Eerola, joka toimii ryhmän puheenjohtajana. Heidän lisäkseen tutkimusdatapolitiikan päivitystyöryhmään kuuluvat palvelujohtaja Pälvi Kaiponen (Helsingin yliopiston kirjasto) ja tietotekniikkapäällikkö Minna Harjuniemi (Tietotekniikkakeskus). Työryhmän työtä voi seurata Flamma-intranetin työryhmäalueella Tutkimusdatapolitiikan päivitys 2021 -sivulla.

Mikä on tutkimusdatapolitiikka?
”Tutkimusdatapolitiikka on dokumentti, jossa ilmaistaan ne periaatteet ja tavoitteet, jotka ohjaavat tutkimusdatan hallintaa yliopistossa. Siinä kuvataan myös näitä tavoitteita tukevat yliopiston palvelut ja määritellään eri toimijoiden keskinäiset vastuut. Tutkimusdatapolitiikan noudattaminen velvoittaa jokaista yliopistolaista. Dokumentti antaa suuntaviivat myös kaikelle tutkimusdatan hallintaan liittyvälle kehittämistyölle yliopistossa.”
(Rehtorin päätös työryhmän asettamisesta Helsingin yliopiston tutkimusdatapolitiikan päivittämistä varten 11.3.2021, luettavissa Flamma-intranetistä)

1. Mitä muutostarpeita on nykyisessä datapolitiikassa?

”Nykyinen Helsingin yliopiston datapolitiikka on hyvä, mutta yleisellä tasolla. Useat tutkijat tarvitsevat enemmän konkretiaa.” (Sampsa Hautaniemi)

”Tutkimusdatan merkitys tieteelle, tutkimuksen toistettavuudelle ja vastuullisuudelle sekä myös yhteiskunnalle laajemmin on kasvanut merkittävästi sitten vuoden 2015, jolloin nykyinen tutkimusdatapolitiikka hyväksyttiin. Laadukkaat ja saavutettavat tutkimusaineistot ovat yliopistolle strateginen resurssi ja kilpailutekijä, ja tätä myös Helsingin yliopiston 2030-strategia korostaa.” (Paula Eerola)

”Muutostarpeita ovat esimerkiksi selkeämpi tutkimusdataan liittyvien vastuiden määrittäminen sekä tutkimusdatan pitkäaikaistallennukseen ja datan käyttöön liittyvät kysymykset. Suunnitteilla oleva EU:n tekoälyregulaatio tuo myös mahdollisia muutostarpeita.” (Sasu Tarkoma)

”Datojen pitkäaikaistallennusta tarvitaan, jotta tuloksia voidaan verrata aikaisempiin. Tutkimushankkeen jälkeen voi herätä uusia kysymyksiä liittyen aikaisempien tutkimusten tuloksiin joltain uudelta kannalta katsottuna. Näin tuloksien arviointia viedään pidemmälle ja saadaan lisäarvoa tutkimukseen sijoitetuille rahoille. Myös projektien datojen säilytyksessä ja tallennuksessa on nykyisellään heikkouksia, jotka lisäävät riskiä, että joitain tietoja menetetään kokonaan. Datojen saatavuus kaikille asianomaisille pitäisi turvata.” (Merja Kontro)

”Monitieteellisyyden lisääntyessä erilaiset tieteenala- ja yliopistokohtaiset toimintatavat tulevat yhteen ja törmäävät toisiinsa – on hyvä saada yhteinen kenttä haltuun.” (Pirjo Aunio)

2. Millainen on hyvä datapolitiikka – mikä on sen tarkoitus ja miten se vaikuttaa käytännössä?

”Hyvä datapolitiikka on selkeä, ja se kattaa datan keräyksen ja käytön eri vaiheet. Dataa kerätään ja tuotetaan hyvin erilaisissa ympäristöissä, ja on hyvin tärkeää, että datapolitiikka kattaa kaikki tieteellisten tutkimusprosessien käyttötapaukset ja auttaa tutkijoita arjessa dataan liittyvien kysymysten kanssa. Datapolitiikan käyttö arjessa edellyttää helposti lähestyttävää ohjeistusta, esimerkiksi käyttötapausten ja prosessien avaamista diagrammeilla ja kuvauksilla.” (Sasu Tarkoma)

”Olen Sasun kanssa samaa mieltä, ja koen, että erityistä huomiota kannattaisi laittaa siihen, että tutkijat saavat helpot ja käyttöarvoltaan korkeatasoiset ohjeet datapolitiikan toteuttamiseksi.” (Pirjo Aunio)

”Hyvä datapolitiikka on selkeä ja terveen järjen mukainen. Sen tarkoitus on helpottaa tutkijoiden työtä ja sen implementointi käytännössä on suoraviivaista.” (Sampsa Hautaniemi)

”Selkeä ohjeistus ja kaikille tiedossa olevat pelisäännöt. Selkeät kuvaukset dataseteille niin että ne löytyvät helposti. Julkaisuoikeuksien määrittely, jos tallennettuja materiaaleja käytetään.” (Merja Kontro)

3. Mitkä ovat erityisiä, Helsingin yliopistoa koskevia kysymyksiä datapolitiikan laatimisessa?

”Yleisesti Helsingin yliopiston ongelma on se, että pyritään saamaan kaikki samaan muottiin ottamatta huomioon tutkimusalojen erityispiirteitä. Tämä on syytä pitää mielessä myös datapolitiikan laatimisessa. Esimerkiksi sensitiivisen ja ei-sensitiivisen datan käsittelyyn tarvitaan erilaisia käytänteitä, vaikka yleisten FAIR-periaatteiden tulee tietysti molemmissa toteutua.” (Sampsa Hautaniemi)

”Tärkeitä kysymyksiä liittyy esimerkiksi tutkimusdatan vastuiden jakamiseen tutkijan, tutkimusryhmän ja tiedekunnan välillä. Datapolitiikka on osa laajempaa kokonaisuutta, jossa datan käyttöä tuetaan tutkimusdatainfrastruktuurilla ja siihen liittyvillä palveluilla. Hyvä datapolitiikka on linjassa tutkimusdatainfrastruktuurin ja alustojen käytön ja kehityksen kanssa muodostaen toimivan kokonaisuuden.” (Sasu Tarkoma)

Datapolitiikka on osa laajempaa kokonaisuutta, jossa datan käyttöä tuetaan tutkimusdatainfrastruktuurilla ja siihen liittyvillä palveluilla.

”Tämän [Sasu Tarkoman mainitsemien kohtien] lisäksi alleviivaisin vielä monitieteisyyttä – siitä syntyy ihan omanlaisia vaatimuksia.” (Pirjo Aunio)

”Helsingin yliopiston laajuus ja monialaisuus asettavat datapolitiikallemme korkeat vaatimukset, sillä datapolitiikan täytyy toimia sujuvasti ja edistää kaikkia tieteenalojamme.” (Paula Eerola)

”On myös muuta dataa kuin digitaalista. Biologista materiaalia ei usein voi säilyttää loputtomiin. Tarvitaan riittävät kuvaukset, jotta kokeet pystytään haluttaessa toistamaan. Paperimuodossa olevaa dataa tulisi digitalisoida tilantarpeen pienentämiseksi. Tutkijoita myös tulee ja lähtee. Pitäisi pystyä organisoimaan säilytys siten että kaikki oleellinen data voidaan säilyttää lyhyistäkin työsuhteista. Aina ei tiedetä etukäteen, mikä data on tulevaisuudessa tärkeää. Tämä vaikeuttaa valintaa, mitä tarvitsee säilyttää.” (Merja Kontro)