Millaista asiantuntemusta tutkimuksen datanhallinnan tueksi tarvitaan? Katsaus RDM-foorumin esityksiin

Tutkimusdatan merkitys ja rooli osana tutkimusta vahvistuu, mutta millaisia palveluita ja millaista asiantuntemusta tutkijoiden tukena on tutkimusdataan liittyvissä kysymyksissä? Data-asiantuntijoiden (data steward) ammatillinen rooli ja eri maiden käytännöt olivat esillä kaksipäiväisessä Research Data Management Forum (RDMF) -tapahtumassa. Tässä blogiartikkelissa luodaan tiivis katsaus pääpuheenvuoroihin ja muihin esityksiin, ja pohditaan data-asiantuntijuuden ydinkysymyksiä, kuten tehtävänkuvia, koulutusta ja roolia nykyisessä muutostilanteessa.

Teksti: Soile Manninen & Tuija Korhonen (Helsingin yliopiston kirjasto)

Brittiläinen Digital Curation Centre (DCC) on järjestänyt vuodesta 2007 lähtien Research Data Management Forum (RDMF) -nimellä kulkevaa tapahtumaa, jossa keskustellaan datanhallintaan liittyvistä aiheista. Heinäkuussa 2021 päästiin taas pienen tauon jälkeen keskittymään data-asiantuntijuuteen tutkimusorganisaatioissa, ja sen ympärillä tapahtuvaan kansalliseen ja kansainväliseen yhteistyöhön.

Kaksipäiväinen foorumi rakentui esitysten ja pienryhmäkeskustelujen vuorottelulle. Osallistujat olivat pääosin eurooppalaisista korkeakouluista ja tutkimuslaitoksista, mutta myös muilta mantereilta, eli eurooppalaiset käytännöt näyttävät kiinnostavan.

Foorumin osallistujille alkulämmittelynä tehdyn kyselyn mukaan yhä useampi datan parissa työskentelevä haluaisi käyttää nimikettä ”data steward” kuvaamaan työtään. Data steward -nimikkeellä viitataan yleisesti datan kanssa työskenteleviin henkilöihin. Vakiintunutta suomenkielistä käännöstä tälle tittelille ei ole, mutta käytämme tässä tekstissä termiä data-asiantuntija.

Kerromme tässä blogiartikkelissa tarkemmin tilaisuuden kahdesta avauspuheenvuorosta ja kuvaamme lyhyesti muita. Kaikki esitysmateriaalit löytyvät Zenodosta.

Tutkimusrahoituksesta 5 % datanhallintaan

FAIR-data vaatii monenlaisia resursseja. (Kuva Mijke Jettenin esityksestä, CC-BY).

Aloituspuheenvuorossaan Mijke Jetten (Dutch Techcentre for Lifesciences, DTL) kertoi data-asiantuntijoiden ammatillisen roolin muuttumisesta ja kehittymisestä Alankomaissa. Aihe on hyvin ajankohtainen. Missään ei ole selkeästi määritelty, mistä kaikista tehtävistä data-asiantuntijat vastaavat, millaista osaamista tehtävissä vaaditaan ja miten urapolulla voi kehittyä. Alalle ei ole myöskään selkeästi räätälöityä koulutusta. Osalla työnkuva painottuu enemmän tiettyyn tutkimusalaan ja tutkimukseen, kun taas toiset ovat datanhallinnan palveluita ja käytäntöjä tuntevia generalisteja. Monenlaisia osaajia tarvitaan. Tällä hetkellä data-asiantuntijoiden roolina on usein toimia eräänlaisina muutosagentteina.

Monenlaisia osaajia tarvitaan. Tällä hetkellä data-asiantuntijoiden roolina on usein toimia eräänlaisina muutosagentteina.

Alankomaissa on tavoitteena saada jatkossa kanavoitua tutkimusrahoituksesta viisi prosenttia datanhallintaan.  Tavoitteen taustalla ovat kansainväliset suositukset. OECD:n raportin mukaan sataa tutkijaa kohden pitäisi olla resursoituna datanhallintaan kolme henkilötyövuotta, kun taas EOSC:n (European Open Science Cloud) korkean tason asiantuntijaryhmän mukaan vaatimus on viisi henkilötyövuotta per sata tutkijaa. Tämän pitäisi olla lähitulevaisuutta, mutta todellisuus on toinen.

Alankomaat on edelläkävijä tutkimuksen datanhallintaan liittyvissä palveluissa, ja maan eri yliopistojen datapalveluihin viitattiin esimerkkeinä myös muissa esityksissä. Data-asiantuntijuuden kehittämiseksi on tehty paljon yhteistyötä ja osallistuttu kansainväliseen yhteistyöhön, ja tätä Jetten peräänkuulutti myös jatkossa. Muussa tapauksessa tavoitteet tutkimusdatanhallinnan paremmasta resursoinnista jäävät haaveksi.

Ympäristödatat ja -osaajat yhteen

FAIR-datan vaatima infrastruktuuri, linjaukset ja tutkimuskäytännöt Graham Partonin esityksessä (alkuperäinen kuvalähde: Frederike Schmitz, 2020, CC-BY).

Toisen päivän aloitti Graham Parton CEDAsta (Centre for Environmental Data Analysis). CEDA on yksi luonnontieteellisen ja ympäristöalan datapalveluihin keskittyneistä laitoksista Isossa-Britanniassa. Partonin esityksen alku käsitteli data-asiantuntijan roolia yleisesti tutkimuksen elinkaaren eri vaiheissa, ja hän kuvasi myös malleja, joiden perusteella ympäristöalan datapalveluita ja osaamista on kansallisesti kehitetty Isossa-Britanniassa. Parton nosti esille monien muiden tavoin Research Data Alliancen (RDA) Professionalising Data Stewardship -ryhmän. RDAn ryhmässä ongelmaksi on nähty data-asiantuntijoiden työnkuvan hajanaisuus. Jos selkeätä profiilia ei ole, työn ammatillistaminen on vaikeaa.

Partonin esityksessä keskeisessä roolissa oli ympäristöä tutkivien tieteenalojen ja tutkimuslaitosten datapalvelut yhteentuova Environmental Data Services (EDS). Yhteisiä palveluita ovat mm. data-arkisto, datan analysointipalvelut, keskitetty datakatalogi ja yhteiset seurantatyökalut. EDS on osa Iso-Britannian kansallisen tutkimus- ja innovaationeuvoston (UKRI) alaisen Natural Environment Research Councilin (NERC) toimintaa.

NERC on vaatinut rahoittamiltaan tutkimusprojekteilta datanhallintasuunnitelmia vuodesta 1996 lähtien, ja vuodesta 2010 lähtien on edellytetty luonnosta datanhallintasuunnitelmaksi jo rahoituksen hakuvaiheessa. Rahoitusta saavien tutkijoiden pitää tallentaa datansa pitkäaikaiskäyttöä varten ensisijaisesti johonkin kuratoiduista EDS:n data-arkistostoista sekä sitouduttava organisaation datapolitiikkaan. Tutkijalla itsellään on kahden vuoden ensikäyttöoikeus keräämäänsä dataan. Datapalveluiden vastuulla on datan kuratointi ja avoimeen käyttöön saattaminen. Datan pitkäaikaissäilytyksen tarvetta arvioidaan tarkistuslistan avulla (Data value checklist, pdf), ja tämä herättikin monissa osallistujissa kiinnostusta.

Tutkijoiden pitää tallentaa datansa pitkäaikaiskäyttöä varten ensisijaisesti johonkin kuratoiduista EDS:n data-arkistostoista sekä sitouduttava organisaation datapolitiikkaan.

Parempi yhdessä kuin yksin

Pienryhmissä käytyjen keskustelujen perusteella vaikuttaa siltä, että datanhallinnan asiantuntijapalveluihin liittyvät ongelmat ovat hyvin samankaltaisia maasta tai organisaatiosta riippumatta. Tällä perusteella voisi päätellä, että ratkaisujakin saadaan kehitettyä paremmin yhdessä kuin omissa siiloissa. Uusia data-asiantuntijapalveluita lanseeraavat organisaatiot voivat ottaa mallia aiemmin perustetuista palveluista, ja samankaltaisten ongelmien kanssa painivat saavat toisiltaan vertaistukea.

RDMF-tapahtumaa tultaneen järjestämään vaihtuvin teemoin jatkossakin. Jos käytännönläheiset keskustelut eri puolilta maailmaa tulevien data-kollegojen kanssa kiinnostavat, suosittelemme osallistumaan.

Tilaisuuden muut esitykset

Tilaisuuden muiden esitysten sisältöihin voi käydä tutustumassa Zenodossa:

Lisa Otty: Joining up Social Science and Humanities support with Central RDM Services at University of Edinburgh. Edinburghin yliopistoon 2019 perustettu Centre for Data, Culture and Society (CDCS) tukee digihumanistista ja -yhteiskuntatieteellistä tutkimusta ja luo yhteisiä datanhallinnan käytänteitä koko yliopistolle. Instituutti tarjoaa myös datan tallennuspalveluita, lainaa tutkimusvälineistöä, järjestää epämuodollisia aamukahveja ja kuukausittain dataklinikoita.

Paul van Schayck: Enhancing interaction between Data Stewards and Research Software Engineers. Maastrichtin yliopiston terveys- ja biotieteiden tiedekuntaan on vuonna 2016 perustettu DataHub. Data- ja ohjelmistoasiantuntijat kehittävät noin 400 tutkijalle erilaisia palveluita, ja ylläpitävät myös suurille datamäärille tarkoitettua data-arkistoa. Haasteena ovat asiakkaiden moninaiset tarpeet ja niiden priorisointi.

Myriam Mertens: Setting up a Data Steward team at Ghent University in the National and Regional Context in Belgium. Myriam Mertens vetää Gentin yliopiston data steward -tiimiä, joka on perustettu lokakuussa 2019. Tiimin missiona on tutkimusdatanhallintaan liittyvien hyvien käytäntöjen edistäminen ja kehittäminen sekä kulttuurinmuutoksen aikaansaaminen, jotta FAIR-periaatteet, data avoimuus ja datan uudelleenkäyttö toteutuvat.

Helen Clare (Jisc): UK – A Tale of Two Communities. Helen Clare kertoi eri verkostoista, joita Isossa-Britanniassa on tarjolla data-asiantuntijuuden kehittämiseen ja tukemiseen. Näitä ovat esimerkiksi Digital Research Community ja Open Research Competencies Coalition (ORCC).


Soile Manninen (HY) työskentelee tietoasiantuntijana Helsingin yliopistossa kirjaston datatiimissä ja kansallisessa Tuulitoimistossa.

Tuija Korhonen (TUHAT, ORCID) työskentelee tietoasiantuntijana Helsingin yliopistossa kirjaston datatiimissä ja kansallisessa Tuulitoimistossa.