Suunnittelusta apua tehokkaaseen tutkimusaineistojen ja -datan hallintaan

Datanhallinnan suunnittelu (DMP, data management plan) nähdään valitettavan usein taakkana ja byrokraattisena prosessina. Sitä se ei kuitenkaan ole. DMP on erinomainen tutkijan työkalu, joka auttaa muun muassa tutkimusprosessin valmistelussa ja potentiaalisten riskien tunnistamisessa. Datanhallinnan suunnittelulla on myös merkittävä pedagoginen potentiaali, ja DMP:n avulla tutkimusorganisaatiot voivat kehittää tutkimuksessa tarvittavia palveluita tutkijoiden tueksi.

(This article is also available in English.)

Teksti: Mikko Ojanen

Tutkimusaineistojen ja -datan hallinta tunnistetaan yhä enenevässä määrin olennaiseksi osaksi tutkimuksen tekoa. Tehokas datanhallinta (research data management, RDM) puolestaan edellyttää sen systemaattista suunnittelua (data management planning). Etukäteen tehtävän suunnittelun – eli ajoissa aloitetun DMP:n kirjoittamisen – merkitystä ei voi riittävästi korostaa.

Tunne datasi -kirjoitussarjamme edellisessä osassa kuvatut ongelmat tutkimusprosessissa ovat vain jäävuoren huippu datanhallintaan liittyvistä ongelmista. Tyypillisesti, ja aivan liian usein, datanhallintaan liittyvät ongelmat johtuvat datanhallinnan huonosta suunnittelusta. On pikemminkin sääntö kuin poikkeus, että datanhallintaan (RDM) liittyviä tehtäviä ei huomioida ennalta, jolloin tutkijoiden on katettava niistä koituvat kustannukset projektinsa resursseista ​– ja valitettavan usein jopa omista työtunneistaan ja omista rahoistaan. Näiden ongelmien korjaamisessa aineiston- ja datanhallinnan suunnittelulla (DMP) on aivan keskeinen merkitys.

On pikemminkin sääntö kuin poikkeus, että datanhallintaan (RDM) liittyviä tehtäviä ei huomioida ennalta, jolloin tutkijoiden on katettava niistä koituvat kustannukset projektinsa resursseista.

DMP on tutkijan monipuolinen työkalu

Datanhallinnan suunnittelua pidetään valitettavan usein taakkana ja byrokraattisena prosessina. DMP on kuitenkin hyödyllinen työkalu, josta on hyötyä ennen kaikkea tutkijalle itselleen. Datanhallinnan suunnittelulla on myös merkittävä pedagoginen potentiaali, jota voisi hyvin hyödyntää opetusmenetelmänä tutkijoiden yleisten taitojen opettamisessa ja kouluttamisessa eri opiskelutasoilla.

Datahallinnan suunnittelu tarjoaa myös kätevän tarkistuslistan. Se auttaa tutkijoita varmistamaan, että he ymmärtävät esimerkiksi:

  • miten ja milloin on syytä tehdä sopimuksia,
  • miten vastata yleisen tietosuoja-asetuksen (GDPR) yksityiskohtiin,
  • miten arvioida datan arkaluonteisuutta,
  • miten dokumentoida tutkimusdataa systemaattisesti ja miten kaikki projektiin osallistuvat noudattavat samaa dokumentointia,
  • miten pitää tutkimusdata suojattuna ja kuinka jakaa se turvallisesti kollegojesi kanssa,
  • miten arvioida, mikä osa tutkimusdatasta voidaan tuhota ja mikä osa siitä on arvokasta ja säilytettävää jatkotutkimusta silmällä pitäen,
  • miten valmistella tutkimusdata arkistointia, avaamista ja julkaisemista varten ja missä nämä on mahdollista tehdä,
  • ja miten vakuuttaa rahoittajien käyttämät arvioijat, että pystyt hallitsemaan nämä yksityiskohdat ja niihin liittyvät ongelmat.

DMP riskienhallinnan ja organisaation tuen kannalta

Myös tutkimusprojektin riskinhallinnan yksityiskohtien voidaan katsoa liittyvän tutkimuksen datanhallinnan suunnitteluun. Suunnittelemalla datanhallintaa tutkijat voivat tunnistaa, ennakoida ja hallita datanhallintaan liittyviä riskejä. Tässä yhteydessä suunnitelmasta on suuri apu ajoittain vaikeasti ymmärrettävissä olevien eettisten ja lakiasioihin liittyvien yksityiskohtien konkretisoinnissa. Datanhallintasuunnitelma on myös ensimmäinen askel, joka ohjaa tutkijoita kohti tietosuojan vaikutusten arviointia (ks. DPIA, Data Protection Impact Assessment) ja tarvittaessa edelleen eettiseen arviointiin.

Suunnitelmasta on suuri apu ajoittain vaikeasti ymmärrettävissä olevien eettisten ja lakiasioihin liittyvien yksityiskohtien konkretisoinnissa.

Sen lisäksi, että suunnittelemalla datansa hallintaa tutkijat valmistautuvat välttämään ongelmia omissa tutkimusprosesseissaan, he voivat suunnitelmansa avulla valmistella omaa organisaatiotaan auttamaan heitä projektiensa toteutuksessa. Tutkimusprojektin suorituspaikat eli tutkimusorganisaatiot tarvitsevat enemmän tietoja projekteista, joille heidän olisi tarkoitus tarjota kotipaikka. Tässä tutkijan datanhallintasuunnitelma on korvaamaton apu.

Eräs ongelma, joka on hidastanut DMP:n hyödyntämistä riskinhallintavälineenä, organisaatioiden tuen kehittämisessä ja pedagogisiin tarkoituksiin, liittyy suunnittelun resursointiin. Suunnitteluun käytetty aika ja vaiva kuitenkin maksavat itsensä takaisin. Datanhallinta ja sen suunnittelu ovat taitoja, joita voi kouluttaa ja opettaa. Näin ollen ne ajan myötä myös helpottuvat ja sujuvoituvat.

Suunnittelu käytännössä – DMP-ohjeet tukena

Vuosittain päivitettävät kansalliset DMP-ohjeet, jotka perustuvat Science Europen tuottamiin ohjeisiin, auttavat luonnostelemaan datanhallintasuunnitelmia askel askeleelta. Kansallisen ohjeen seuraaminen auttaa sekä tutkijoita että heidän suorituspaikkojensa paikallisia datatukipalveluja tarkistamaan, että kaikki tarvittavat komponentit on otettu huomioon uutta projektia käynnistettäessä.

Suunnittelemalla datanhallintaa ajoissa opit tuntemaan datasi ennen kuin on liian myöhäistä. Huomaa, että suunnittelun pitää pohjautua omaan tutkimusprojektiisi. Toisin sanoen, käsittele suunnitelmassasi omaa projektiasi, älä kopioi lauseita joltakin muulta – kopiointi ei edistä projektinhallintaasi.

Ajoissa aloitettu suunnittelu on ensimmäinen askel kohti eettisesti kestävää tutkimustoimintaa ja tehokasta tutkimusdatan hallintaa!

   Tutkimusdatan hallinta – tunne datasi!

Tutkimusaineistojen ja -datan hallinta (RDM) on tärkeä osa jokaista tutkimusprojektia. Aineistojen ja datan hallinnan ensisijaisena tavoitteena on tehdä tutkimusprosessista mahdollisimman tehokas – toisekseen se auttaa sinua vastaamaan organisaatiosi ja tutkimuksen rahoittajien odotuksiin ja vaatimuksiin. RDM-taidot ovat tutkijan perustaitoja, ja ne koskevat kaikkia, jotka käsittelevät tutkimusdataa tutkimushankkeessa. Oppimalla aineistojen ja datan hallintaa opit TUNTEMAAN DATASI!

Tässä tietoiskusarjassa Helsingin yliopiston Datatuki esittelee kaikki tutkimusaineistojen ja -datan hallintaan ja hallinnan suunnitteluun liittyvät pääkohdat; mitä ne ovat, miksi ne ovat tärkeitä ja mistä etsiä lisäapua RDMP-asioissa. Artikkelisarja koostuu kuudesta osasta:

1) Mitä on tutkimusaineistojen ja -datan hallinta, RDM? (3.9.2020)
2) Tutkimusaineistojen ja -datan hallinnan pääkohdat (17.9.2020)
3) Miksi hallita tutkimusaineistoja ja -dataa? (30.9.2020)
4) Miksi suunnitella tutkimusaineistojen ja -datan hallintaa etukäteen? (22.10.2020)
5) Suunnittelusta apua tehokkaaseen tutkimusaineistojen ja -datan hallintaan (19.11.2020)
6) Mistä apua aineistojen ja datan hallintaan? (8.12.2020)