Avoin tiede kehittyy, kun ratkaisut tukevat tutkijoiden toimintaa – haastattelussa Mikko Tolonen

Think Open 2018 – avauskuukauden blogijutut uudelleentarkastelussa! Blogin ensimmäinen juttu 7. toukokuuta 2018 oli avoimen tieteen teemoja laajasti kartoittanut dialogihaastattelu vararehtori Jouko Väänäsen ja apulaisprofessori Mikko Tolosen välillä. Tolonen nostaa viiden vuoden takaisesta keskustelusta esiin erityisesti käytännön ratkaisujen merkityksen avoimen tieteen edistämisessä, ja mainitsee esimerkkinä DARIAH-FI-verkoston.

(This article is also available in English.)

Think Open -blogi täyttää toukokuussa 2023 viisi vuotta. Tutustu blogin avauskuukauden 2018 artikkeleiden uudelleentarkasteluihin!

Think Open -blogin ensimmäisessä jutussa, Kamppailu datasta on alkanut – Jouko Väänäsen ja Mikko Tolosen keskustelu digitalisaatiosta ja avoimesta tieteestä (7.5.2018), Helsingin yliopiston tutkimuksesta vastaava vararehtori Jouko Väänänen ja digitaalisten ihmistieteiden apulaisprofessori Mikko Tolonen keskustelivat uuden blogin teemoista, kuten digitaalisuudesta eri tieteenaloilla, avoimen julkaisemisen keinoista ja tutkimusdatan avoimuuden tulevaisuudesta.

Dialogihaastattelun uudelleentarkastelun pohjalta Tolonen hahmotteli kolme pointtia, joista ensimmäinen alleviivaa tutkimuskäytäntöjen ymmärtämisen tärkeyttä.

”Avoin tiede kehittyy, kun tehdään kestäviä valintoja, jotka ohjaavat tutkijoiden ja sidosryhmien toimintaa. Tutkimuksen tulee olla keskiössä, kun tätä tehdään, muuten mennään metsään. Tutkijoiden joukko on monimuotoinen, mistä syntyy keskitettyjen ratkaisuiden yhteismitattomuuden ongelma. Tästä on oltu tietoisia jo edellisen artikkelin kirjoittamisen aikaan, mutta ratkaisut puuttuivat. Osittain ne puuttuvat edelleen, mutta askeleita oikeaan suuntaan on otettu. Esimerkiksi ihmistieteiden puolella on saatu Suomeen pystytettyä DARIAH-FI, joka yhdessä FIN-CLARIN-konsortion kanssa toimii ihmistieteiden avoimen tutkimuksen infrastruktuurina sekä alustana, jonka kautta parhaita käytäntöjä myös avoimen tutkimusdatan osalta voidaan edistää”, Tolonen aloittaa.

Apulaisprofessori Mikko Tolonen ja vararehtori Jouko Väänänen keskustelivat avoimesta tieteestä ja digitalisaatiosta Think Open -dialogihaastattelussa keväällä 2018.

Edistystä on tapahtunut, rakenteita on luotu

Toisena huomiona Tolonen nostaa esiin sen, että tietoisuuden lisäämisestä on siirrytty vähitellen käytäntöjä tukevien rakenteiden luomiseen.

”Aikaisemmin meni paljon aikaa ja energiaa ihmisten herättelyyn. Tutkijoiden tavoittaminen ja herättely on edelleen tärkeää – ja myös hankalaa, koska kenelläkään ei ole ylimääräistä aikaa. Olemme päässeet Helsingin yliopistossa tässä eteenpäin niin, että yliopiston strategisen johdon ja tiedekuntatason väliin on syntynyt avoimen tieteen koordinaatioryhmä, joka pyrkii ohjaamaan avoimen tieteen eri pilareiden implementointia – joka toki on tiedekuntien tehtävä – Helsingin yliopistossa”, Tolonen sanoo.

Eteenpäin on menty monella tasolla – tämä on Tolosen kolmas huomio.

”Kun mietitään Suomen ja Helsingin yliopiston tilannetta kansainvälisesti ja siitä näkökulmasta, miten avoin tiede näkyy tutkimusstrategiassa ja miten se on on viety tutkijan arkeen, niin ei meillä ihan älyttömän huonosti mene. Olen ollut joitain vuosia LERUn (Euroopan tutkimusyliopistojen liitto) avoimen tieteen ad hoc -ryhmässä, joka on hyvä paikka kuulla mitä muualla tapahtuu. Juuri tuon systemaattisen avoimen tieteen edistämisen näkökulmasta olemme aika hyvässä asemassa sekä Suomessa että Helsingin yliopistossa, vaikka matkaa tavoitteisiin vielä onkin.”

Kun mietitään Suomen ja Helsingin yliopiston tilannetta kansainvälisesti ja siitä näkökulmasta, miten avoin tiede näkyy tutkimusstrategiassa ja miten se on on viety tutkijan arkeen, niin ei meillä ihan älyttömän huonosti mene.

Aivan kaikki ei ole kuitenkaan mennyt kuin Strömsössä.

”Ilman lainsäädäntöön liittyvien asioiden hoitamista mikään ei tietenkään onnistu. Esimerkiksi se, että Kansalliskirjaston viime vuosikymmenen aikana keräämää suomalaisen internetin verkkoaineistoa ei vieläkään saada tutkimuskäyttöön, on sekä surullista että surkuhupaisaa. Kaikki olisi periaatteessa valmista, mutta lupaa ei tule tutkimukseen. Tämä on joko-tai-kysymys, ja viidessä vuodessa mikään ei ole sen suhteen muuttunut, valitettavasti.”

Käytännöllisiä ratkaisuja datan jakamiseen

Hyvä esimerkki käytännön tutkimuskäytäntöjen ymmärtämisestä ja tutkimusdataan liittyvien pullonkaulojen tunnistamisesta on muistiorganisaatioiden dataan liittyvä ratkaisuhakuinen yhteistyö. Tolonen viittasi tähän jo viisi vuotta sitten: ”Muistiorganisaatioille on usein vierasta, että koko datasetin voi antaa muille käyttöön. Mutta sitä kohti mennään. Tätä varten tarvitaan alustat, joilla aineiston käsittely voidaan tehdä.”

Mikko Tolosen mukaan on tärkeää, että muistiorganisaatioiden datan jakamiseen on rakenteet. 

”Ihmistieteissä olemme käyttäneet kansallista DARIAH-FI- sekä FIN-CLARIAH-verkostoa siihen, että rakennamme avoimesti käytettävää tutkimusdataklusteria CSC:n (Tieteen tietotekniikan keskus) palveluiden ympärille. Teemme tätä yhdessä muistiorganisaatioiden kanssa, joista tuleva data on ihmistieteissä keskeistä. Yksinkertaistaen, rakennamme kokonaisuutta, jossa muistiorganisaatiot voivat tuoda aineistonsa digitaalisen tutkimuksen ympäristöön CSC:lle, josta DARIAH-FI prosessoi ne eteenpäin tutkijoille. Samalla vastuu tutkimusdatan edistämisestä tutkimuksessa siirtyy tutkijoille, kuten myös vastuu tulosten avoimesta jakamisesta ja skaalaamisesta. Tällä tavalla otetaan muistiorganisaatioilta pois paineita rakentaa joskus kalliitakin tutkimuspalveluita.”

”Esimerkiksi visuaalisen kulttuurin tutkimuksen digitalisaatio vaatii, että aineistot ovat paremmin saatavilla. No, tämän takia yksi DARIAH-FI:n seuraavista askeleista on kuva-aineistojen tuominen Finnan kautta CSC:n palveluun ja DARIAH-FI:n piiriin. Se, mistä puhuin artikkelissa viisi vuotta sitten, on tavallaan polkaistu nyt ihmistieteiden osalta kansallisella tasolla käyntiin. Vaikka tekemistä riittää vielä seuraavillekin viidelle vuodelle, nostaisin esiin DARIAH-FI:n esiin siitä, miten meidän aloilla on menty tutkimusdatan osalta eteenpäin”, Tolonen sanoo.

Yksinkertaistaen, rakennamme kokonaisuutta, jossa muistiorganisaatiot voivat tuoda aineistonsa digitaalisen tutkimuksen ympäristöön CSC:lle, josta DARIAH-FI prosessoi ne eteenpäin tutkijoille.

Yhteistyötä kaupallisten kustantajien kanssa

Viiden vuoden takaisessa artikkelissa, jo sen otsikossa, nostetaan esiin kysymys tutkimusdatan omistajuudesta: ”Kustantajat ovat tunnistaneet, että se, missä raha jatkossa tehdään, on tutkimusdata. Ja koska kyse on niin suurista toimijoista, yliopiston ja tutkijoiden on oltava hereillä, ettemme luovuta sitä roolia heille”, Tolonen totesi. Kamppailu on yhä kesken.

”Kaupallisten tiedekustantajien kanssa toimiminen on edelleen hankala kysymys. Tutkimusdatan kysymykset ylipäätään ovat aihe, jossa kaivataan lisää linjakkuutta yksittäisten tutkimuskeissien tasolla ja laajempaa strategista ajattelua. Onneksi meillä on tässä vahvoja EU-tason toimijoita, jotka vievät asiaa eteenpäin, pyrkivät miettimään parhaita ratkaisuja ja yrittävät tasapainottaa kaupallisten tiedekustantajien toimintaa”, Tolonen sanoo.

Tutkimusdatan kysymykset ylipäätään ovat aihe, jossa kaivataan lisää linjakkuutta yksittäisten tutkimuskeissien tasolla ja laajempaa strategista ajattelua. Onneksi meillä on tässä vahvoja EU-tason toimijoita, jotka vievät asiaa eteenpäin, pyrkivät miettimään parhaita ratkaisuja ja yrittävät tasapainottaa kaupallisten tiedekustantajien toimintaa.

Tolosen hehkuttama DARIAH-FI kelpaa esimerkiksi myös siitä, miten kaupallisten toimijoiden kanssa voidaan tehdä yhteistyötä tutkimusdatan avoimessa tutkimuskäytössä.

”DARIAH-FI-ympäristössä toteutetusta Reception Reader -työkalusta (ks. myös tuore artikkeli, Reception Reader: Exploring Text Reuse in Early Modern British Publications) tehtiin erillinen sopimus aineiston käytöstä Gale-yhtiön kanssa. Tätä pidettiin esimerkiksi Jiscissä (brittiläinen voittoa tavoittelematon IT-palveluyritys) poikkeuksellisena askeleena eteenpäin suljettujen aineistojen tutkimuskäytössä. Ja tästä päästään meidän kannalta olennaiseen kysymykseen tiedekustantajan omistaman datan pohjalta – tutkimuskäytön kautta – syntyvästä johdannaistutkimusaineistosta ja sen avoimesta käytöstä. Mielestäni tutkimusdatan avoimuus menee eteenpäin askel kerrallaan tällaisia keissejä rakentaen. Näiden myötä myös kaupallinen toimija ymmärtää, että heidän aineistoilleen syntyy käyttötapauksia ja tutkimuspalveluita, joita he eivät välttämättä edes pystyisi tai haluaisi itse tuottaa. Tästä hyötyvät kaikki, niin tutkijat kuin kaupalliset toimijat. Tämä ei kuitenkaan välttämättä tapahdu niin, että ensin linjataan ja sitten ehkä voidaan jotain tehdä, vaan niin että yksittäiset toimijat vievät asioita eteenpäin – ja sitten tätä pyritään skaalaamaan”, Tolonen toteaa.

Mikko Tolonen ja Jouko Väänänen keskustelivat vuonna 2018 kaupallisten kustantajien roolista. Vaikka kysymys on yhä hankala, Tolosella on myös hyviä viimeaikaisia kokemuksia yhteistyöstä kaupallisten kustantajien kanssa.

”Paine käyttää dataa tutkimuksessa kasvaa”

Viiden vuoden aikana on saatu aikaan tutkimusta tukevia ratkaisuja, ja infrastruktuurien rakentamisen tiellä on Tolosen mukaan jatkettava.

”Paine käyttää kaikenlaista dataa tutkimuksessa kasvaa, kun menetelmät kehittyvät ja mahdollisuudet kasvavat. Sitä varten tarvitaan infrastruktuuria, joka tämän mahdollistaa. Kuten jo jonkin aikaa on tiedetty, datan päällä istuminen – verrattuna sen tutkimuskäyttöön – ei hyödytä välttämättä pitkässä juoksussa ketään. Tämä koskee moninaista joukkoa muistiorganisaatioita sekä myös kaupallisia toimijoita. Tästä aiheutuu muutospainetta, joka sitten purkautuu eri reittejä.”

Edellä on puhuttu lähinnä datasta, mutta tutkimusjulkaisujenkaan avoimuus – josta Tolonen ja Väänänen 2018 keskustelivat – ei ole vielä ratkaistu kysymys.

”Tiedelehtien avoimuudessa muutos on ollut valitettavan hidasta, vaikka eri toimijat ovat pysyneet päämäärätietoisina ja rahoittajat ovat kiristäneet perusteitaan. Avoimen tieteen yleisen strategian toteuttaminen yliopistotasolla on äärimmäisen tärkeää. Onneksi tässä on otettu järkeviä askeleita, vaikka tutkijan arjen muuttaminen on vaikea tehtävä. Ensimmäinen askel on joka tapauksessa ymmärtää, että käsien heiluttelu ei riitä. Tämän takia olen niin ylpeä DARIAH-FI hankkeesta”, Mikko Tolonen sanoo.


Think Open 2018 – avauskuukauden blogijutut uudelleentarkastelussa: