Avoimen tieteen viidakot ja tiet viidakosta pois – tutkimuspalvelut OpenAIRE-tapahtuman ytimessä

Koko päivän kestävässä OpenAIRE-tapahtumassa Helsingissä etsittiin erilaisia tapoja tehdä avoimesta tieteestä – sen linjauksista, palveluista ja muusta – helpommin lähestyttävää. Tutkijan näkökulma ja tutkijan työn tukeminen nousivat päivän pääteemoiksi. Tässä blogiartikkelissa luodaan tiivis katsaus tapahtuman pääsisältöihin.

(This article is also available in English in the OpenAIRE blog.)

Millainen viidakko avoimen tieteen kansallisista ja kansainvälisistä linjauksista, palveluista ja infrastruktuureista muodostuu? Miten siihen saa selvyyttä ja miten viidakossa voi selvitä?

Mikä on OpenAIRE?
    • OpenAIRE on eurooppalainen avoimen julkaisemisen infrastruktuuri.
    • Sen tehtävänä on rakentaa tieteen avointa saatavuutta edistävä palvelukokonaisuus. Muita tehtäviä ovat mm. verkostoituminen tutkimuspalveluja tuottavien toimijoiden kanssa, koulutus, neuvonta ja tiedotus.
    • Keskeisiä tehtäviä julkaisuarkistojen yhteentoimivuuden edistäminen ja liittäminen OpenAIRE-portaaliin.
    • OpenAIRE aloitti projektina 2009. Pysyvä OpenAIRE-organisaatio perustettiin 2018.
    • Helsingin yliopiston kirjasto toimii OpenAIREn kansallisena tukipalvelupisteenä (NOAD, national open access desk).
    • Lisätietoa OpenAIRE-blogista.

Tällaisiin kysymyksiin etsittiin vastausta OpenAIRE-tapahtumassa Making sense of Open Science jungle – optimizing your use of Open Science services, joka järjestettiin Paasitornissa Helsingissä 12. maaliskuuta. Koollekutsujana olivat Helsingin yliopiston kirjasto, joka toimii OpenAIRE-yhteistyön kansallisena koordinoijana (national open access desk, NOAD) Suomessa, ja avoimen tieteen kansallisesta koordinaatiosta vastaava Tieteellisten seurain valtuuskunta (TSV).

Paasitornin koko päivän kestävään tilaisuuteen osallistui 57 ihmistä 24 tutkimusorganisaatiosta kolmesta maasta. Etäyhteyden päässä tapahtumaa seurasi useita kymmeniä ihmisiä.

Mitkä poliittisista linjauksista ovat tärkeimpiä?

Ylitarkastaja Sami Niinimäki opetus- ja kulttuuriministeriöstä toi avauspuheenvuorossaan selvyyttä eurooppalaisten politiikkalinjausten viidakkoon. Hän listasi tärkeimpiä linjauksia avoimen tieteen kannalta.

Avaintekstinä Niinimäki piti EU:n neuvoston päätelmäpaperia Council conclusions on the transition towards an Open Science system (27.5.2016), joka nimenomaisesti käsittelee avointa tiedettä – monien muiden paperien vain sivutessa teemaa.

18 kohdan paperissa tärkeimmät linjaukset liittyvät Niinimäen mukaan avoimeen julkaisemiseen oletuksena (kohta 10), julkaisujen avoimeen saatavuuteen 2020 mennessä (12), tutkimusdatan avoimuusperiaatteeseen (14), datan FAIR-periaatteisiin (16) ja yhteisten toimenpiteiden tarpeeseen (18).

”Nämä eivät ole vielä lainvoimaista säätelyä , mutta ne on silti otettava vakavaksi”, Niinimäki toteaa.

Niinimäki nosti esiin myös eurooppalaisen tutkimuksen ja innovaation puiteohjelmat Horizon 2020:n ja sitä seuraavan Horizon Europen (vuosille 2021–2027), jossa avoin tiede nähdään perustoimintatapana (modus operandi). Puiteohjelmien merkitys avoimen tieteen politiikan muokkaajana on hyvin merkittävä.

Sami Niinimäki (oik.) poimi eurooppalaisten avoimen tieteen linjausten joukosta keskeisimmät. OpenAIRE-tapahtuman vetäjä Pauli Assinen on kuulolla. Kuvat: Jussi Männistö

Plan S tarvitsee toteutuakseen palveluita ja linjauksia

Niinimäen tiivis esitys poimi avoimen tieteen politiikkaviidakosta vielä yhden ”vakavasti otettavan” EU-komission suosituspaperin (Access to and preservation of scientific information in Europe, 2012), eurooppalaisen tutkimusalueen (European Research Area, ERA) ja ESFRI- strategiafoorumin (European Strategy Forum on Research Infrastructures).

”Kun ESFRIn tapaiset toimijat työskentelevät FAIR-datateemojen parissa, tiedämme, että jotain todella on tapahtumassa”, Niinimäki toteaa.

Eurooppalaisten tutkimusrahoittajien cOAlition S ja sen Plan S -suunnitelma on saanut viime aikoina enemmän huomiota kuin muut linjaukset. Tiedeasiantuntija Jyrki Hakapää Plan S -koalitioon kuuluvasta Suomen Akatemiasta toi esiin palveluita, infrastruktuureja ja linjauksia, joita tarvitaan kunnianhimoisen Plan S:n toteuttamiseksi.

Lista on pitkä: eri alojen avoimet julkaisukanavat, DORA, CC, DOAJ, OpenDOAR, COPE, CLOCKSS, ORCID, I4OC, Sherpa/Romeo, ESAC… Akronyymien lista ei kuitenkaan ole kaikenkattava, ja Hakapää tilasikin yleisöltä lisää Plan S:n tarvitsemia palveluja ja infrastruktuureja – ja sai niitä:

Tilaisuuden osallistujien ehdotuksia Plan S:n tarvitsemista lisäpalveluista ja -infrastruktuureista.

Yleisökeskustelussa Plan S -asetelma kääntyi kiinnostavasti nurinpäin: myös avoimuutta vaativilta cOAlition S -rahoittajilta vaaditaan muutosta. Konkreettinen esimerkki olisi DORA-periaatteiden implementointi: jos julkaisu oikeasti nostetaan julkaisukanavaa tärkeämmäksi tutkimuksen arviointikriteeriksi, tämän pitäisi näkyä myös rahoitushakemusten arvioinnissa. (Pari päivää OpenAIRE-tapahtuman jälkeen Suomen Akatemia tiedotti liittyvänsä DORAan.)

Miten tutkija löytää sopivan avoimen tieteen palvelun?

Politiikkaviidakon lisäksi Paasitornissa paneuduttiin tutkimuspalveluiden viidakkoon. Erityinen kiinnostus liittyi Euroopan avoimen tieteen pilvipalvelun (European Open Science Cloud, EOSC) kokoamiin palveluihin. EOSC-sihteeristöön kuuluva projektipäällikkö Saara Kontro Tieteen tietotekniikan keskus CSC:stä tosin toppuutteli, että EOSC-prosessissa ollaan implementaatiovaiheessa eikä palveluista ole vielä paljon kerrottavaa.

Mutta palveluita on jo nyt tarjolla. Marraskuussa avatussa EOSC-portaalissa on 154 palvelua 17 palveluntarjoajalta. Yhä laajenevalla palveluvalikoimalla EOSC pyrkii Kontron mukaan tukemaan erityisesti dataintensiivistä tutkimusta ja kansainvälistä tutkimusyhteistyötä. Tavoitteena on, että EOSC on täysin toiminnassa 2021 ja eurooppalaisten tutkimuspalveluiden tarjonnassa on siirrytty ”hajanaisuudesta yhtenäisyyteen”.

Saara Kontro oli koonnut käynnissä olevat EOSC-projektit yhteen. Suomi on monessa projektissa mukana (ks. projekteista tarkemmin: Kontron esitys, sivu 8).

Yleisökeskustelussa ja työpajaosuudessa nousi esiin tutkijan näkökulma. Miksi tutkija valitsisi eri palveluista juuri EOSC-palvelun? Saara Kontro näki EOSC-palveluiden etuina laajan tarjonnan ja palveluiden yhteensopivuuden, joka kehittämispäällikkö Pauli Assisen (Helsingin yliopiston kirjasto, OpenAIRE NOAD) mukaan on koko EOSC:n avainkäsitteitä – ja samalla sen suurimpia haasteita.

Työpajassa kartoitettiin EOSC-palveluiden tuntemusta.

EOSC-palveluiden laajuus ja laatu herättivät kysymyksiä. Miten tutkija löytää paisuvasta palvelukatalogista itselleen sopivan palvelun? Miten palveluita voisi arvottaa? Esiin nousi idea palveluiden hakukoneesta (service search engine). Tietotekniikkaprojektipäällikkö Ville Tenhusen (Helsingin yliopiston tietotekniikkakeskus) mukaan myös yliopistot voisivat räätälöidä omia hakusovelluksia palveluiden löytämiseksi.

Tukea palveluiden löytämiseen todella tarvitaan. Työpajaosuudessa tehty selvitys EOSC-palveluiden tuttuudesta osoitti, että peräti kaksi kolmasosaa (66 %) katalogin nykyisistä palveluista ei ollut tuttuja yhdellekään tapahtumaan osallistujista. Tunnetuimpia palveluita olivat Zenodo, Eduroam ja Figshare.

Metadata avainasemassa tutkimustiedon kokoamisessa

Tunnetuimpien EOSC-palveluiden top 10:een mahtui myös OpenAIRE-portaali, joka kokoaa tietoa, kokotekstejä ja dataa eurooppalaisesta tieteellisestä tutkimuksesta. Julkaisuarkistoilla, kuten Helsingin yliopiston Heldalla, on keskeinen rooli tiedon tuottajina. Ja julkaisuarkistojen OpenAIRE-yhteensopivuudessa metadatatiedot ovat avainasemassa.

Jochen Schirrwagen havainnollisti esityksessään, mitä merkitystä on metadatalla.

Projektikoordinaattori Jochen Schirrwagen Bielefeldin yliopiston kirjastosta havainnollisti esityksessään, miten tutkimuksesta saadut metadatatiedot vaikuttavat viime kädessä julkaisuarkistoihin tallennettujen aineistojen löydettävyyteen, uudelleenkäyttöön (ml. tekstin- ja datanlouhinta) ja raportointiin. Laadukkaan metadatan varaan on mahdollista rakentaa myös monipuolisia palveluita, joista Schirrwagen nosti esiin pari uudempaa, metatietojen rikastamiseen tarkoitetun OpenAIRE Brokerin ja datasettejä ja tutkimuskirjallisuutta yhdistelevän Scholexplorerin.

Helsingin yliopiston kirjaston viime vuonna toteuttamassa kyselyssä suomalaiset julkaisuarkistot toivoivat, että OpenAIREn tarvitsemat metadatatiedot kerättäisiin keskitetysti VIRTA-julkaisutietopalvelun kautta. VIRTA kokoaa tiedot suomalaisesta tutkimuksesta, noin 60 000 julkaisusta vuodessa.

Toiveilla on tapana toteutua, ja projektipäällikkö Joonas Nikkanen VIRTA-palvelusta vastaavasta CSC:stä oli kertomassa OpenAIRE-integraatiosta, joka toteutetaan tänä vuonna. Nikkasen mukaan suomalaisten tutkimustietojen keskitetty OpenAIRE-haravointi on paitsi fiksua myös suhteellisen yksinkertaista, koska tekniikka on valmiina – OpenAIREsta tulee vain yksi VIRTA-rajapinnan hyödyntäjistä. Laadukkaan metadatatiedon tuottaminen vaatii silti jatkossakin työtä metadatan tuottajilta.

Entä suomalaiset viidakot?

Ote Sami Niinimäen esityksestä.

Avauspuheenvuorossaan Sami Niinimäki loi eurooppalaisen avoimen tieteen politiikan ohella lyhyen katsauksen myös suomalaiseen avoimen tieteen viidakkoon (ks. kuva). Erityisen tärkeänä hän piti Tieteellisten seurain valtuuskunnan (TSV) koordinoivaa roolia avoimen tieteen toiminnassa Suomessa.

Kehittämispäällikkö Henriikka Mustajoki TSV:ltä esitteli lyhyesti suomalaisen avoimen tieteen koordinointimallin, joka käynnistyi viime vuonna. Yhteisön ja yhteistyön varaan rakentuva koordinaatio on Mustajoen mukaan eurooppalaisittain ainutlaatuinen tapa organisoida avoimen tieteen toimintaa. Tarkemmin koordinaatiomalli on esitelty Avointiede.fi-sivulla ja Think Open -blogin artikkelissa.

Henriikka Mustajoki esitteli avoimen tieteen työsarkaa Suomessa. Ville Tenhunen ja Jari Friman kuuntelevat. Taustalla unkarilaisen János Rozsin seinämaalaus vuodelta 1939.

Mustajoen mukaan avoimen tieteen työlistalla on Suomessa paljon isoja asioita, kuten uuden avoimen tieteen tiekartan, vastuullisen metriikan kansallisen suosituksen, avoimen julkaisemisen strategian ja avoimen datan strategian toteuttaminen.

Data-asioissa Suomi on kansainvälisesti edistynyt maa. Suomessa toimii myös tällä hetkellä Pohjoismaiden ainoa Research Data Alliancen (RDA) kansallinen yhteyspiste (node). Paasitornin tilaisuudessa RDA Finlandin uusi koordinaattori Heidi Laine CSC:stä esitteli datan avoimuutta edistävän RDA:n toimintaa.

Heidi Laine kuvasi esityksessään, miten RDA tukee tutkijaa avoimen datan viidakossa.

Mitä tulee viidakoihin, RDA pyrkii osaltaan auttamaan tutkijoita datan avoimuuteen liittyvissä ongelmissa luomalla yhtenäisiä käytäntöjä ja työkaluja tutkimustyön tueksi. Laine listasi suomalaisesta näkökulmasta neljä keskeisintä RDA:n tuotoslistalla olevaa asiaa, jotka tulisi lokalisoida: metadatastandardien hakemisto (Metadata Standards Directory), muuttuvaan dataan viittaamisen suositukset (Scalable dynamic-data citation methodology), datan julkaisemisen työnkulut (Workflows for Research Data Publishing) ja pysyvien tunnisteiden rekisteri (Persistent Identifier Type Registry).


Making sense of Open Science jungle -tapahtuman esitysten tallenteet ja esitysmateriaalit löytyvät Helsingin yliopiston kirjaston OpenAIRE-blogista.