Miksi suunnitella tutkimusaineistojen ja -datan hallintaa etukäteen?

Mikään aineistonhallinnan osa-alue ei ole merkityksetön, ja jokaista on tarpeen tarkastella ja suunnitella hyvissä ajoin etukäteen. Huonoon suunnitteluun liittyy riskejä, jotka voivat aiheuttaa ongelmia tutkimusprojektin kannalta. Tunne datasi- artikkelisarjan neljäs osa pureutuu siihen, miksi datanhallinan suunnittelu on niin tärkeää.

(This article is also available in English.)

Teksti: Tanja Lindholm & Liisa Siipilehto

Sarjan ensimmäisessä osassa kerroimme, että RDM (research data management) kattaa tutkimusaineistojen ja -datan mekaanisen, teknisen, eettisen sekä laillisiin ja sopimuksiin liittyvien yksityiskohtien käsittelyn. Ongelmat RDM:n elinkaaren eri osissa voivat aiheuttaa vakavia hankaluuksia tutkimusprojektille, ja pahimmillaan projekti voi jopa keskeytyä.

Data on tutkimuksen tärkein raaka-aine.

Voidaan myös ajatella, että data on tutkimuksen tärkein raaka-aine. Mitkä tahansa ongelmat raaka-aineen tuotannossa tai jakeluketjussa aiheuttavat hankaluuksia itse tutkimukselle. Jos raaka-aine ei ole saatavilla, tutkimusta ei voi tehdä. Suunnittelemalla etukäteen, voidaan välttyä hankaluuksilta jakeluketjussa. Ei riitä, että mietit, millaista dataa aiot käyttää. Kaikkia aineistonhallinnan osia tulee miettiä konkreettisesti jo hakuvaiheessa, ja etenkin silloin, kun sinulla on yhteistyökumppaneita. Jos aineistonhallintaa aletaan miettiä vasta myönteisen rahoituspäätöksen jälkeen, voi olla haastavaa saada tuotanto ja jakeluketju helposti käyntiin.

Suunnittelun tärkeydestä – esimerkki

Mietitään esimerkiksi tilannetta, jossa olet saanut yhdessä yhteistyökumppanisi kanssa myönteisen rahoituspäätöksen. Työskentelette eri instituutioissa ja molemmilla on tutkimuksen kannalta arvokasta dataa. Dataa ei kuitenkaan voi jakaa ennen kirjallisia sopimuksia. Olette hakemusvaiheessa olleet tietoisia sopimusten teosta, mutta ette ole kuitenkaan keskustelleet esimerkiksi siitä, mikä osa aineistosta avataan, missä se avataan ja millä lisenssillä. Jo ensimmäisessä keskustelussa huomaatte olevanne eri mieltä, ettekä itse asiassa oikein tunne datan avaamisen periaatteita. Puolen vuoden kuluttua olette kuitenkin päässeet jonkinlaiseen yhteisymmärrykseen sovittavista asioista – tosin ne eivät täysin vastaa rahoittajan vaatimia avoimeen tieteen periaatteita, mutta ovat kuitenkin välttäviä. On siis aika tehdä virallinen sopimus. Sopimuksen tekoon tarvitsette molempien instituutioiden lakipalveluita. Lakipalvelut ovat ruuhkautuneet, ja jotta molemmat puolet ovat tyytyväisiä sopimukseen, vaatii se muutaman kierroksen juristien välillä. Noin puolen vuoden päästä myös lakimiehet pääsevät yhteisymmärrykseen, ja saatte sopimuksen allekirjoitettua.

Usein ongelmat voivat olla pahempiakin ja ilmenevät vasta tutkimuksen loppuvaiheissa, esimerkiksi datan avaamisen yhteydessä. Näin käy varsinkin silloin, jos sopimuksia ei ole tehty lainkaan.

Tämä oli vain yksi esimerkki mitä voi tapahtua – ja on tapahtunutkin – kun ei suunnitella etukäteen. Usein ongelmat voivat olla pahempiakin ja ilmenevät vasta tutkimuksen loppuvaiheissa, esimerkiksi datan avaamisen yhteydessä. Näin käy varsinkin silloin, jos sopimuksia ei ole tehty lainkaan. Sopimusten tekemättä jättäminen voi aiheuttaa muunkinlaista kiistaa tutkimuksen aikana.

Suunnittelun kaikki osa-alueet ovat tärkeitä

Mikään aineistonhallinnan osa-alue ei ole merkityksetön, ja jokaista on tarpeen tarkastella ja suunnitella hyvissä ajoin, mielellään jo hakuvaiheessa. Aineistonhallinnan suunnittelun kaikilla osa-alueilla on tärkeä merkitys tutkimuksen edistymiseen, sen alkuvaiheesta projektin päättymiseen, ja tutkimusdatan osalta myös sen jälkeen. Datanhallinnan suunnittelu tulee siten kytkeä koko tutkimuksen suunnitteluun, koejärjestelystä lähtien ja jatkuen aina tulosten ja datan julkaisemiseen.

Datanhallinnan suunnitelmalla varmistetaan tuotteen ja jakeluketjun toimiminen tutkimuksen kaikissa vaiheissa ja myös sen jälkeen.

   Tutkimusdatan hallinta – tunne datasi!

Tutkimusaineistojen ja -datan hallinta (RDM) on tärkeä osa jokaista tutkimusprojektia. Aineistojen ja datan hallinnan ensisijaisena tavoitteena on tehdä tutkimusprosessista mahdollisimman tehokas – toisekseen se auttaa sinua vastaamaan organisaatiosi ja tutkimuksen rahoittajien odotuksiin ja vaatimuksiin. RDM-taidot ovat tutkijan perustaitoja, ja ne koskevat kaikkia, jotka käsittelevät tutkimusdataa tutkimushankkeessa. Oppimalla aineistojen ja datan hallintaa opit TUNTEMAAN DATASI!

Tässä tietoiskusarjassa Helsingin yliopiston Datatuki esittelee kaikki tutkimusaineistojen ja -datan hallintaan ja hallinnan suunnitteluun liittyvät pääkohdat; mitä ne ovat, miksi ne ovat tärkeitä ja mistä etsiä lisäapua RDMP-asioissa. Artikkelisarja koostuu kuudesta osasta:

1) Mitä on tutkimusaineistojen ja -datan hallinta, RDM? (3.9.2020)
2) Tutkimusaineistojen ja -datan hallinnan pääkohdat (17.9.2020)
3) Miksi hallita tutkimusaineistoja ja -dataa? (30.9.2020)
4) Miksi suunnitella tutkimusaineistojen ja -datan hallintaa etukäteen? (22.10.2020)
5) Suunnittelusta apua tehokkaaseen tutkimusaineistojen ja -datan hallintaan (19.11.2020)
6) Mistä apua aineistojen ja datan hallintaan? (8.12.2020)