FAIR-dataa – politiikoista käytäntöihin IDCC –konferenssissa Barcelonassa

Tutkimusdatan kuratointiin, hallintaan ja tukipalveluihin keskittyvä International Digital Curation Conference järjestettiin tänä vuonna Barcelonassa teemalla ”Beyond FAIR – from principles to practice to global join up”. FAIR-periaatteet alkavat olla kaikille avointa tiedettä seuraaville tuttuja, joten siksi olikin kiinnostavaa päästä kuulemaan, miten periaatteita sovelletaan käytännössä.

Eri aloja yhdistelevän IDCC- konferenssin luonteeseen kuuluu, että osallistujat työskentelevät laajasti eri datanhallinnan alueilla. Noin 250 osallistujan joukosta kolmannes oli kirjastoista, loput data-arkistoista ja muualta eri puolilta organisaatioiden tutkimuksen palveluita. Moniammatillisuuden merkityksen nosti esiin myös MIT:n kirjaston digitaalisen arkiston johtaja Nancy McGovern keynote –puheessaan, jossa hän korosti yhteisöllisyyden, yhteistyön ja poikkiammatillisen osaamisen merkitystä datanhallinnan palveluissa. Eri taustaisten ihmisten törmäyttämisestä on kysymys myös IDCC-konferenssissa.

Varsinaista konferenssia edeltävänä työpajapäivänä osallistuin Pohjois-Carolinan, Yalen ja Cornellin yliopistojen perustaman CURE-konsortion toimintaa esittelevään Curating for Reproducibility -työpajaan, jossa jaettiin käytännön vinkkejä datan hallintaan tutkimuksen toistettavuuden näkökulmasta. Osallistujien tehtävänä oli etsiä puutteita, virheitä ja muita epäloogisuuksia analysoitavista dataseteistä. Joiltakin R- ja Python –taitoisilta tämä tuntui luonnistuvankin melko helposti. Vaikka ulkopuolisen tekemä datan kuratointi on varsin työlästä ja vaatii erityisosaamista, on aihe erittäin tärkeä. Heikkolaatuisella datalla on tuskin arvoa edes tutkijalle itselleen – jatkokäytöstä puhumattakaan.

Ensimmäisenä varsinaisena konferenssipäivänä pidetyssä demosessiossa esiteltiin uutta versiota aineistonhallintasuunnitelmien kirjoittamisesta tukevasta työkalusta DMPOnlinesta. Uutuutena palvelussa on mm. suunnitelmien avaaminen organisaation muiden käyttäjien nähtäväksi. DMPOnlinen uudet ominaisuudet tullaan näkemään myöhemmin keväällä myös DMPTuulissa. Toinen kiinnostava demo oli re3Data.org:n ja Dariah -projektin puitteissa kehitelty humanisteille suunnattu data-arkistoja suositteleva Data Deposit Recommendation Service. Tällä hetkellä palvelussa tarjolla on vielä melko rajallinen määrä arkistoja, mutta on hyvä, jos tämän avulla yhä suurempi osa humanistien keräämistä digitaalisista aineistoista löytävät kotinsa.

Toisena konferenssipäivänä osallistuin ”Data Policy and Guidance” nimellä kulkeneeseen sessioon. Virginia Techin yliopiston esityksessä kuvattiin, miten kirjasto voi edistää datapolitiikoiden (policy) muuntamista käytännöiksi (procedure) maisterivaiheen opiskelijoilla ja mitä haasteita tähän liittyy. Keskeinen viesti oli, että motivointiin on kiinnitettävä erityistä huomiota. On helppo keksiä yleisellä tasolla, miksi datanhallinta on tärkeää, mutta miten saada se prioriteettilistan kärkeen, kun pitäisi valmistuakin ja saada opinnäyte tehtyä. Motivointi onkin sidottava mahdollisimman tiiviisti tutkimusalan käytäntöihin ja kohdeyleisön intresseihin. Kiinnostavia olivat myös TU Delftin kokemukset tutkijataustaisten data stewardien käyttämisestä datanhallinnan käytäntöjen edistämisessä laitoksilla.

Konferenssin perusteella voi sanoa, että datanhallinnan tukemiseen liittyvät palvelut ovat pinnalla yliopistoissa ympäri maailmaa ja kirjastot ovat tiiviisti kehityksessä mukana. Kirjaston verkostot laitoksiin ja tiedekuntiin ovatkin välttämättömiä, jotta hyviä datanhallinnan käytäntöjä saadaan jalkautettua osaksi tutkijoiden ja opiskelijoiden arkea.

Vastaa

Sähköpostiosoitettasi ei julkaista. Pakolliset kentät on merkitty *