”FAIR-periaatteet avain sille, että päästään eteenpäin” – Karoliinisen Instituutin kirjaston johtaja Annikki Roos korostaa datan merkitystä avoimessa tieteessä

Karoliinisen instituutin kirjaston johtaja Annikki Roos oli vauhdittamassa Helsingin yliopiston datatukipalveluiden kehitystä 2010-luvun alussa. Roosin mukaan keskitetyt palvelut ovat vahvuus, josta Ruotsissa voitaisiin ottaa oppia. Avoimen tieteen laajassa kokonaisuudessa tutkimusdatalla on Roosin mukaan avainasema: ”Se helpottaa tutkimuksen toistettavuutta, tutkimusprosessin läpinäkyvyys lisääntyy ja laatu paranee. Tutkimusyhteisö säästää resursseja kun aiemmin tuotettu tai kerätty data saadaan esille ja jopa uusiokäyttöön.”

Helsingin yliopiston Datatuki vietti lokakuussa kymmenvuotisjuhliaan. Yksi juhlavieraista oli Karoliinisen instituutin kirjaston johtaja Annikki Roos, jolla on ollut oma roolinsa siinä, että juhlia vietetään.

Kymmenisen vuotta sitten Roos oli vauhdittamassa datatukipalveluiden kehitystä Helsingin yliopistossa, ensin Viikin ja sitten Meilahden (Terkko) kampuskirjaston johtajana. Datatuen nykytila antaa Roosin mukaan juhlaan aihetta.

”Mielestäni meillä Karolinskassa ei ole muuta kuin opittavaa Helsingin yliopistosta. Meillä keskitetty datanhallinnan tuki on vasta syntyvaiheessa ja keskitetty tekninen infrastruktuuri on valitettavan heikko. Tähän on omat syynsä. Tutkimusta tekevät laitokset ovat hyvin itsenäisiä ja keskitettyyn infrastruktuuriin panostaminen on ollut toissijaista. Helsingin yliopisto on loistava esimerkki siitä, miten yhteistyöllä ja keskittämällä saadaan hyvää aikaan ”, vuonna 2016 Ruotsiin siirtynyt Roos sanoo.

Annikki Roos, Karoliinisen instituutin kirjaston johtaja

      • Annikki Roos (@AnnikkiRoos) on työskennellyt vuodesta 2016 Karoliinisen instituutin (KI) kirjaston (Karolinska Institutet Universitetsbiblioteket) johtajana. KI on lääketieteellinen yliopisto Tukholmassa.
      • Roos toimi Helsingin yliopiston kirjastossa Viikin ja Meilahden (Terkko) kampuskirjastojen johtajana sekä kirjaston saatavuuspalvelujen palvelujohtajana 2009–2016. Tätä ennen hän työskenteli mm. Kansanterveyslaitoksessa (ja sitä seuranneessa Terveyden ja hyvinvoinnin laitoksessa).
      • 1990-luvulla Roos oli Kansalliskirjastossa (silloinen Helsingin yliopiston kirjasto) luomassa FinELib-kirjastokonsortiota: ”Olin yliopistokirjastojen ensimmäinen yhteistyösihteeri. Silloin oli muutamia edistyksellisiä kirjastonjohtajia, jotka seurasivat tilannetta maailmalla. Todettiin, että vastaavaa kehitystä oli tapahtumassa muualla Euroopassa, oli hankittu kansallisia lisenssejä. Academic Press oli ensimmäinen kansallinen lisenssi, ja olin neuvottelemassa sitä Suomelle. Olin sihteerinä opetusministeriön työryhmässä, jonka työn pohjalta päätettiin perustaa ’Kansallinen elektroninen kirjasto’, sittemmin FinElib.”
      • Roos on osallistunut aktiivisesti avoimen tieteen toimintaan Suomessa, mm. tutkijoiden, tiedekustantajien ja yliopistokirjastojen yhteistyötä avoimessa tieteessä toteuttavassa FinnOA:ssa (Finnish Open Access Working Group) ja Tutkimuksen tietoaineistot -hankkeessa (TTA).
      • Roos tutki informaatiotutkimuksen alaan kuuluvassa väitöskirjassaan biolääketieteen tutkijoiden tietokäytäntöjä. Roos väitteli 2016 Hanken Svenska handelshögskolanissa: Understanding Information Practices in Biomedicine: A Domain Analytical Approach.

Visio syntyi tutkijoiden työn seuraamisesta

Datatuen pienoishistoriikissa tietoasiantuntija Mari Elisa Kuusniemi kuvaa Annikki Roosia visionääriksi, ”joka näki datanhallinnan tärkeyden tutkimusprosessissa, ymmärsi haasteet sekä selkeän tarpeen tuelle”.

Käsitys datanhallinnan palveluiden tärkeydestä muodostui Roosin mukaan Kansanterveyslaitoksessa (KTL), josta hän siirtyi Helsingin yliopiston kirjastoon vuoden 2009 lopussa.

”Vastasin KTL:ssa kirjasto- ja tietopalveluista. Siellä minulle avautui tämä ’information environment’ (informaatioympäristö), kun pääsin seuraamaan läheltä osastojen tekemää tutkimustyötä. Huomasin, että se, mitä kirjastot perinteisesti tekevät, on vain rajoittunut osa informaation- ja datanhallintaa.”

”Aloin tehdä aiheesta väitöskirjaa, koska oli kiinnostavaa pureutua syvemmälle siihen, millä tavoin tutkijat työskentelevät. Huomasin, että tämä maailma on jännittävä”, vuonna 2016 molekyylilääketieteen tutkijoiden tietokäytännöistä väitellyt Roos sanoo.

Uusien palveluiden ajaminen vaati sitkeyttä

Esimerkkejä datatukipalveluiden merkityksestä osana kirjastopalveluita löytyi maailmalta. Tärkeänä esikuvana Roos pitää National Center for Biotechnology Informationia (NCBI), joka on osa National Library of Medicineä, joka puolestaan kuuluu National Institutes of Healthiin.

”NCBI aloitti tutkimustyön bioinformatiikan työkalujen kehittämiseksi jo 1980-luvulla. Tuloksena siitä on ollut yhä kasvava joukko toisiinsa integoituja tietokantoja ja työkaluja niiden käyttämiseen. Tutkijat kaikkialla maailmassa käyttivät näitä datatyökaluja osana tutkimustyötään. Näiden resurssien käyttö on mielenkiintoisella tavalla toisiinsa limittynyttä. Tämä havainto auttoi minua ymmärtämään miten rajattu perinteisen kirjastotyön näkökulma on biolääketieteellisen tutkimusprosessin kontekstissa.”

Tutkijat kaikkialla maailmassa käyttivät NCBI:n datatyökaluja osana tutkimustyötään. Näiden resurssien käyttö on mielenkiintoisella tavalla toisiinsa limittynyttä. Tämä havainto auttoi minua ymmärtämään miten rajattu perinteisen kirjastotyön näkökulma on biolääketieteellisen tutkimusprosessin kontekstissa.

Uusien ajatusten ja uusien palveluiden edistäminen vaati vision lisäksi myös sitkeyttä, sillä datapalveluiden kehittäminen kohtasi myös epäilyksiä alkuvaiheessa.

”Se ei istunut siihen käsitykseen, mikä monilla oli kirjastotyöstä – ja tässä myös asetelmat vaihtelevat tieteenaloittain. Meillä ajateltiin, että tietoarkistot, kuten Yhteiskunnallinen tietoarkisto (nykyinen Tietoarkisto), hoitavat tämän puolen. Oli vaikeaa viedä asiaa eteenpäin yliopistossa, siinä sai puskea.”

Miten tutkijat suhtautuivat?

”Voisi sanoa, että suhtautumista oli monenlaista ja se riippui siitä, kenen kanssa keskusteli. Oli laitoksen johtaja, joka ihmetteli, mitä tekemistä kirjastolla on näiden data-asioiden kanssa. Toisaalla oli puolestaan tutkimusryhmän jäsen, joka epätoivoisesti toivoi apua käytännön datanhallintaan liittyviin kysymyksiinsä”, Roos sanoo ja mainitsee myös Viikissä toteutetun tutkimusdataprojektin, jossa kartoitettiin tutkijoiden tarpeita yhdessä tutkimushankkeessa.

Annikki Roos oli Helsingin yliopiston kirjastossa vuoteen 2016, jolloin hän lähti Ruotsiin. ”Karoliininen Instituutti on yksi maailman parhaista lääketieteellisistä yliopistoista. Miksi en olisi lähtenyt kun sopiva paikka avautui sopivalla hetkellä?” / Kuva: Jussi Männistö

Ensin koulutus, sitten verkosto, sitten…

Viikin kampuksella Roos oli otollisella maaperällä. Kirjaston ja tutkimusryhmien yhteinen Solmu-projekti oli luonut pohjaa rakentamalla verkoston kirjaston ja tutkimusryhmien välille. Terkossa Roos pani alulle kirjastolaisten koulutuksen.

”Mari Elisa Kuusniemi oli erittäin keskeinen henkilö silloin, kun lähdettiin kouluttamaan ja oppimaan yhdessä tätä tutkimusdata-asiaa Helsingin yliopistossa. Mari Elisa veti täysin vihreitä kirjastoihmisiä mukaan tähän kuvioon ja organisoi koulutuksen. Muita keskeisiä pioneereja olivat Eva Isaksson Kumpulassa ja Liisa Siipilehto Viikissä. Vähitellen eri tieteenaloilta identifioitui ihmisiä, joiden kanssa lähdettiin yhdessä tekemään tätä työtä.”

Kouluttaminen oli ensimmäinen askel datatukipalveluiden rakentamisessa. Toinen tärkeä askel liittyi yhteistyöverkoston rakentamiseen.

”Heti alkuvaiheessa ymmärrettiin, että tämä on sellainen sarka, jossa yhteistyö on äärettömän tärkeätä. Otimme ensimmäisenä yhteyttä tietotekniikkakeskukseen, sitten tuli juridiikka ja Marjut Salokannel, joka oli ollut mukana alusta asti. Sitten Eeva Nyrövaara tuli tutkimushallintoon, ja hän raivasi tietä yliopiston keskushallinnossa. Kuvio toimi hyvin.”

Heti alkuvaiheessa ymmärrettiin, että tämä on sellainen sarka, jossa yhteistyö on äärettömän tärkeätä.

Kolmantena askeleena voisi pitää kunnianhimoista Mildred-hanketta (2016–2018), jonka tavoitteena oli rakentaa tutkimusdataan liittyvää infrastruktuuria Helsingin yliopistossa. Mildred jäi tavoitteistaan, ennen muuta resurssipulan takia.

Aineistonhallinnan suunnitteluun tarkoitettu DMPTuuli-työkalu saatiin kuitenkin tutkijoiden käyttöön Mildredin aikana. Ja DMPTuulissa Roosillakin oli näppinsä pelissä: hän tiedusteli aikoinaan, josko Data Curation Centerin DMPonline-työkalun koodin voisi ottaa käyttöön myös HY:ssä. Nyt DMPTuuli on kansallinen palvelu.

Data on avoimen tieteen ydinasia

Avoimen tieteen kokonaisuus on laaja, mutta tutkimusdata on Roosin mukaan siinä avainasemassa.

”Se, että data saadaan uusiokäyttöön tai että vähintäänkin metadata, tieto olemassaolevasta datasta saadaan talteen, on ratkaisevaa koko avoimelle tieteelle. Se helpottaa tutkimuksen toistettavuutta, tutkimusprosessin läpinäkyvyys lisääntyy ja laatu paranee. Tutkimusyhteisö säästää resursseja kun aiemmin tuotettu tai kerätty data saadaan esille ja jopa uusiokäyttöön. Avoin data on kuin luuranko ihmiselle, ilman sitä juuri mikään ei toimi.”

”Tällä hetkellä keskeistä on se, että saisimme toteutettua nämä FAIR-periaatteet. Se on avain sille, että päästään eteenpäin. Se on iso ja vaikea asia, siinä on monenlaisia esteitä matkan varrella ja uskallan väittää, että tekniset esteet ovat niistä kaikkein pienimpiä – ne ovat kohtuullisen helposti ratkaistavissa. Käytänteet ja prosessit, jotka helpottaisivat kaikkien osapuolten työtä, on se haaste. Kysymys on tutkijan arjesta, siitä, että sinne saadaan sellaiset työkalut, ettei tutkijoiden tarvitse käyttää järjettömästi aikaa siihen, kun he avaavat datansa, julkaisunsa, koodinsa, menetelmänsä ja protokollansa. Siellä on paljon tehtävää.”

Tällä hetkellä keskeistä on se, että saisimme toteutettua nämä FAIR-periaatteet. Se on avain sille, että päästään eteenpäin. Se on iso ja vaikea asia, siinä on monenlaisia esteitä matkan varrella ja uskallan väittää, että tekniset esteet ovat niistä kaikkein pienimpiä. Kysymys on tutkijan arjesta, siitä, että sinne saadaan sellaiset työkalut, ettei tutkijoiden tarvitse käyttää järjettömästi aikaa siihen, kun he avaavat datansa, julkaisunsa, koodinsa, menetelmänsä ja protokollansa.

Datanhallinnan tukipalveluiden ja infrastruktuurien taso vaihtelee huomattavasti eri maiden välillä. Roosin mukaan myös Suomen ja Ruotsin lähestymistavat ovat erilaisia.

”Ruotsissa ollaan datanhallinnassa Suomea jäljessä, aika paljonkin. Se johtuu mielestäni siitä, että yliopistot Ruotsissa toimivat itsenäisemmin kuin Suomessa. On yliopistoja, joihin yhteisiä palveluita on rakennettu, esimerkkinä SNIC (Swedish National Infrastructure for Computing), jossa on mukana kuusi yliopistoa eri puolilta Ruotsia. Svensk nationell datatjänstissä (SND), joka vastaa Tietoarkistoa, suunnitellaan yhteistä välinettä, jolla datanhallintasuunnitelmia tehtäisiin, mutta tällä hetkellä sellaista ei vielä Ruotsissa ole.”

Ruotsissa rahoittajat mukana OA-kustannuksissa

Avoimen julkaisemisen puolella suurten tutkimusrahoittajien Plan S ja transformatiiviset lehtisopimukset ovat asioita, jotka ovat voimakkaasti esillä Suomessa ja Ruotsissa.

”Julkaisupuolella Ruotsissa on vahva kannatus transformatiivisille sopimuksille, ja gold OA:lle. Se, mitä pelkään, on se, että Plan S ja transformatiiviset sopimukset eivät johda oikeaan, todelliseen muutokseen, vaan tutkijat ja tutkimusta tekevät organisaatiot joutuvat jatkamaan monopolien armoilla. Jatkossa maksetaan enemmän julkaisemisesta kuin lukemisesta, mutta niin kauan kuin julkaisemisen hinnalle ei ole rajoja, ollaan ihan samassa suossa kuin tähänkin saakka.”

”Se, mikä Ruotsissa on edistyksellistä, on se, että täällä on saatu tutkimusrahoittajat mukaan rahoittamaan kansallisia sopimuksia. Tietyt sopimukset eivät olisi syntyneet ilman keskeisten tutkimusrahoittajien osallistumista kustannuksiin. Osa rahoittajista on mukana Plan S:ssä, ja ne ovat katsoneet, että heidän velvollisuutenaan on tästä syystä olla rahoittamassa avointa julkaisemista.”

Se, mikä Ruotsissa on edistyksellistä, on se, että täällä on saatu tutkimusrahoittajat mukaan rahoittamaan kansallisia sopimuksia. Tietyt sopimukset eivät olisi syntyneet ilman keskeisten tutkimusrahoittajien osallistumista kustannuksiin.