Helsingin yliopiston kirjasto lähetti huhtikuun alussa 15 suomalaiselle julkaisuarkistolle kyselyn, jonka tarkoituksena oli tuoda esiin näkemyksiä ja kokemuksia OpenAIRE-haravointiin liittyen. OpenAIRE-haravoinnilla tarkoitetaan Suomessa tehdyn tutkimuksen julkaisutietojen ja rinnakkaistallennettujen julkaisujen löytymistä eurooppalaisen OpenAIRE-hakuportaalin kautta.
Kyselyyn vastasi toukokuun loppuun mennessä seitsemän OpenAIRE-haravoinnin piirissä olevaa arkistoa ja seitsemän arkistoa, jotka eivät ole rekisteröityneet OpenAIREen. OpenAIRE-yhteensopivilta julkaisuarkistoilta tiedusteltiin sähköpostitse seuraavia kysymyksiä:
- Milloin ja miksi julkaisuarkistonne liittyi OpenAIRE-haravoinnin piiriin?
- Millaista valmistavaa työtä liittymiseen kuului? Koettiinko liittyminen työlääksi prosessiksi?
- Minkälaisia hyötyjä OpenAIRE-yhteensopivuus on tuonut?
- Mitä muita ajatuksia tai havaintoja teillä on OpenAIRE-yhteensopivuuteen liittyen?
OpenAIRE-haravoinnin ulkopuolella oleville arkistoille lähetettiin seuraavanlaisia kysymyksiä:
- Suunnitteleeko julkaisuarkistonne liittymistä OpenAIRE-haravoinnin piiriin? Miksi?
- Mitkä seikat ovat estäneet tai olleet hidastamassa liittymistä?
- Onko OpenAIRE-liitännän ulkopuolella olemisesta ollut jotain haittaa?
- Mitä muita ajatuksia tai havaintoja teillä on OpenAIRE-yhteensopivuuteen liittyen?
Kyselyyn vastasivat OpenAIRE-haravoinnin piirissä olevista arkistoista Jultika (Oulun yliopisto), Aaltodoc (Aalto-yliopisto), TamPub (Tampereen yliopisto), Theseus (ammattikorkeakoulut), JYX (Jyväskylän yliopisto), LUTPub (Lappeenrannan yliopisto) ja UEF eRepository (Itä-Suomen yliopisto). OpenAIREn ulkopuolella olevista arkistoista vastasivat Jukuri (Luonnonvarakeskus), TUT Pub (Tampereen teknillinen yliopisto), Tietoarkisto, Julkari (sosiaali- ja terveysministeriö), UTUPub/Tutkimusportaali (Turun yliopisto), VTT Publications Register (Teknologian tutkimuskeskus) ja Lauda (Lapin yliopisto).
Tässä blogipostauksessa esittelemme kyselyn tulokset. Tulosten esittäminen etenee siten, että ensin tarkastellaan OpenAIRE-rekisteröityjen julkaisuarkistojen vastauksia. Tämän jälkeen siirrytään OpenAIREn ulkopuolella olevien arkistojen vastauksiin. Lopuksi on lyhyt yhteenveto.
OpenAIRE-yhteensopivien arkistojen vastaukset
Liittymisen taustalla EU-raportointi
Tutkimusjulkaisujen OpenAIRE-haravointi eurooppalaisista julkaisuarkistoista alkoi joulukuussa 2010 Euroopan komission tutkimuksen 7. puiteohjelman (FP7) yhteydessä. Vastaajien edustamia suomalaisia julkaisuarkistoja on liittynyt OpenAIRE-haravoinnin piiriin pitkin 2010-lukua noin vuosi per arkisto tahtia – viimeisimpänä Tampereen yliopiston TamPub tänä vuonna.
Tärkeimpänä yksittäisenä syynä OpenAIRE-rekisteröitymiseen vastaajat pitivät EU:n rahoittamien tutkimusjulkaisujen raportointivelvoitteen toteuttamista (4/7 = 4 vastaajaa 7:stä). Tässä tuli esiin OpenAIRE-haravoinnin merkitys tutkijoille.
”Jotkut tutkijat pyysivät, kun he eivät saaneet tutkimusrahoitusta ulos EU:sta ennen kuin julkaisu löytyy OpenAIREsta.”
”Jo pelkästään EU-rahoitteisten hankkeiden julkaisujen raportointipakollisuuden vuoksi OpenAIRE-haravointi nähtiin tärkeänä toimintona. Tämän lisäksi haravoinnilla ajateltiin olevan rinnakkaistallennukseen kannustava vaikutus: ’tallenna yliopiston julkaisuarkistoon ja hoidamme rahoittajan suuntaan tapahtuvan raportoinnin julkaisujen osalta’.”
Eräs vastaaja toi esiin myös avoimen tieteen eurooppalaiseen yhteistyöhön osallistuminen yhtenä motiivina OpenAIRE-rekisteröintiin. Yhdessä tapauksessa taustalla oli käytännön syy: julkaisuarkiston metadataa oltiin muokkaamassa kansallisen metadatasuosituksen mukaiseksi.
”Tuossa [kansallisessa] metadatasuosituksessa on otettu huomioon myös OpenAire-vaatimukset. Päätimme siis tuossa samalla ottaa myös tarvittavat OpenAiren vaatimat kentät käyttöön ja muokata muut metadatat OpenAiren mukaiseksi. Metadatamuokkausten jälkeen kului vielä tovi, ennen kuin ennätin selvittää, miten tuo OpenAireen liittyminen itseasiassa tehdään.”
Metadatan muokkaus liittymisen työläin vaihe
Vastaajien mukaan suurin työ OpenAIRE-liitännän valmistelussa koski metadatan ja haravointirajapinnan muokkausta. Tähän liittyvä työ tuotiin esiin yhtä lukuun ottamatta kaikissa vastauksissa (6/7). Kansallisen metadatasuosituksen yhteensopivuus OpenAIRE-vaatimusten kanssa nähtiin myönteisenä asiana (2/7).
”DSpacen osalta tuntui kaikki olevan suhteellisen valmiina. Joidenkin [metadata-]kenttien osalta jouduimme hieman muuttamaan käytäntöjä, tämäkin helpottui kansallisen julkaisuarkisto-metadatasuosituksen myötä.”
Julkaisuarkistojen yleisesti käyttämän DSpace-ohjelmiston kerrottiin vaativan lisätyötä erityisesti tutkimustietojen kirjaamisen – ja tutkimusprojektien raportoinnin – kohdalla.
”DSpacen omia julkaisulomakkeita ja soveltuvin osin myös tutkimustietojärjestelmän rinnakkaistallennustoimintoa piti muokata OpenAIRE-yhteensopiviksi. Käytännössä yhteensopivuuden edellyttämä [tutkimus-]projektinumeron kirjaus ei toteutunut alun perin toivotulla tasolla, koska tuolloisessa [tutkimustieto-]järjestelmäympäristössä vastaavaa tietoa ei kerätty kattavasti tutkimustietojen yhteydessä. Myöskään DSpacen käyttöliittymä ei auttanut projektitietojen selvitystä, vaikka kenttä olikin tietomallissa mukana.”
”OpenAIREN uusimman metadatasuosituksen mukaisen metadatan tallentaminen ei ole tämänhetkisillä DSpace-versioilla mahdollista, ja Kansalliskirjaston mukaan on vielä epäselvää onnistuuko tämä DSpace 7:lläkään.”
Yksittäisissä vastauksissa liittymistä pidettiin ”melko selkeänä” mutta hitaana prosessina, jossa arkiston validointiin tarjottiin hyvät välineet (2/7). Toisaalta OpenAIREn rekisteröintiohjeistusta ei nähty ”mitenkään selkeänä” (1/7) ja ongelmatilanteissa kommunikointiin saattoi mennä aikaa (2/7).
”OpenAIRE-portaalin käyttöliittymässä ja tuessa on ainakin ongelma. Emme pysty päivittämään OpenAIRE-portaaliin rekisteröidyn Aalto-käyttäjän sähköpostiosoitetta eikä myöskään portaalissa oleva OpenAIRE helpdesk/support ei ole vastannut kysymykseeni/tikettiin (ollut avoinna pari kuukautta).”
Kansalliskirjaston osuuden korostaminen tuli muutamissa vastauksissa esiin, koska moni julkaisuarkisto hyödyntää sen tarjoamaa DSpace-ohjelmistoon perustuvaa palvelua tai Doria-julkaisuarkistoa (1/7).
”Meiltä puuttuu edelleen varsinainen OpenAiren speksit täyttävä setti. Kansalliskirjastolla on tämä suunnitteilla, mutta ei vielä ihan valmiina. Eli koska meillä on Kansalliskirjaston ylläpitämä julkaisuarkisto, vaatii tämä työtä myös heidän osaltaan.”
Liitännän hyötyinä parempi näkyvyys ja EU-velvoitteiden täyttäminen
OpenAIREn hyötyjä arvioidessaan vastaajat jakautuivat kahteen ryhmään sen perusteella, oliko hyötyjä havaittu vai ei. Hyötyjä havainneiden edustamat julkaisuarkistot olivat olleet keskimäärin kauemmin OpenAIRE-haravoinnin piirissä (4/7). OpenAIRE-liitännän tarjoama parempi näkyvyys (2/7) ja EU-projektin vaatimusten täyttäminen (2/7) korostuivat jonkin verran. Yksittäisiä hajaääniä saivat rinnakkaistallennuksen edistäminen, eurooppalaiseen yhteistyöhön osallistuminen sekä palveluiden tarjoaminen tutkijoille ja kansalaisille. Vastauksissa ei tuotu esiin, miten OpenAIREn tietoja olisi hyödynnetty julkaisuarkistopäässä.
Niissä vastauksissa, joissa OpenAIRE-yhteensopivuuden hyötyjä ei oltu havaittu, korostui epätietoisuus eduista (2/7). Tämän epätietoisuuden toi esiin myös vastaaja, joka aiemmassa vastauksessaan oli maininnut haravoinnin hyödyn aineiston näkyvyyden kannalta.
”OpenAIREn hyödyt ovat yksittäisen julkaisuarkiston kannalta jääneet meille hieman epäselviksi. OpenAIREssa käytetyt skeemat eivät ole täysin yhteensopivia kansallisesti käytettyjen kanssa (erityisesti julkaisutyypit) ja perus-dc-skeemaan [Dublin Core, ks. myös Julkaisuarkistopalveluiden OpenAIRE-ohjeet metadatalle] pohjautuvana metatietomalli ei ole kovin rikas verrattuna julkaisuarkiston muuten tarjoamiin (vrt. esim. Finnan QDC- metatietoihin [Qualified Dublin Core]). Tämä herättää myös kysymyksiä, miten käyttökelpoista OpenAIREn päässä rikastettu metatieto olisi, mutta uusiin rajapintoihin kannattaa varmasti tutustua. Hyviä käytäntöjä tietojen esittämiseen OpenAIRE-yhteensopivasti tarvittaisiin niin, että päällekkäisten tietojen ylläpito saataisiin pidettyä minimissä. Projektinumeroiden merkintä on osoittautunut sen verran työlääksi, että näiden keräämiseen tulisi löytää konkreettisia perusteita – erityisesti niin, että päällekkäisyyttä kansallisen julkaisutiedonkeruun tai tutkimustietovarannon kanssa ei olisi.”
Kansallinen koordinaatio ratkaisuna muuttuviin metadatavaatimuksiin?
OpenAIRE-yhteensopivuuden kehittäminen oli yksi kyselyssä esiinnousseista asioista. Joidenkin vastaajien mukaan OpenAIRE-yhteensopivuusvaatimuksissa on tapahtunut muutoksia liian nopealla tahdilla suhteessa päivitysmahdollisuuksiin (3/7).
Yhtenä ratkaisuna vastauksissa nähdään tehokkaampi kansallinen koordinaatio.
”OpenAIRE-speksi (ja tätä ennen DRIVER) on muuttunut muutaman vuoden sisällä moneen kertaan, mikä on ongelma integroitavuuden suhteen (erityisesti tietojen laadusta tai kattavuudesta voidaan olettaa hyvin vähän) eivätkä järjestelmät pysy perässä (esim. DSpacen asiaa käsittelevää wikisivua päivitetty viimeksi 2012). Sen sijaan, että jokaista julkaisuarkistoa tehtäisiin erikseen OpenAIRE-yhteensopivaksi, tarkoituksenmukaisempaa resurssien käyttöä voisi olla hoitaa asia kansallisesti tutkimustietovarannon kautta – esim. VIRTA-julkaisutietojen mappaus CERIF-yhteensopivaksi (ja periaatteessa myös OpenAIREen) on tervetullutta kehitystä.”
OpenAIRE-haravoinnin ulkopuolella olevien arkistojen vastaukset
OpenAIRE-rekisteröityminen suunnitelmissa liki kaikissa arkistoissa
OpenAIRE-liitännän ulkopuolella olevista julkaisuarkistoista yhtä lukuun ottamatta kaikki vastaajat kertoivat rekisteröitymisen olevan suunnitelmissa (6/7). Myös kielteisen vastauksen antanut vastaaja suhtautui liitäntään myönteisesti, ”jos se onnistuu meidän kannaltamme ’itsestään’ tai hyvin pienellä työllä”.
Aikataulutettuja suunnitelmia oli kolmella julkaisuarkistolla, ja ne ajoittuivat tähän ja ensi vuoteen. Liittymissuunnitelmien taustalla nähtiin käytännön syitä, jotka liittyivät julkaisuarkiston metadatamallia (1/7), tutkimustietojärjestelmää (1/7) tai organisaatiorakennetta (1/7) koskeviin uudistuksiin. Vastaajat katsoivat, että näiden muutosten yhteydessä on luontevaa tarkastella myös OpenAIRE-yhteensopivuutta. Toisena syynä suunniteltuun OpenAIRE-rekisteröitymiseen mainittiin julkaisuarkiston aineistojen näkyvyyden parantaminen (2/7).
Liittymisen pullonkaulana metadatan muokkaustyö
OpenAIRE-liitännän selvästi tärkeimpänä esteenä mainittiin julkaisuarkiston metadataan ja tekniseen järjestelmään liittyvän muutostyön tarve, ja tähän työhön tarvittavien resurssien puuttuminen (5/7). Eräs vastaaja näki myös OpenAIRE-vaatimusten muutokset esteenä rekisteröitymiselle.
”Osittain asiaa on estänyt tai hidastanut OpenAIREn metadataan liittyvät ’epämääräisyydet’. Toisin sanoen, OpenAIRE on tällä hetkellä tietojemme mukaan muun muassa muuttamassa julkaisutyyppi-kentän luokittelua joten emme ole halunneet tehdä esimerkiksi tänä keväänä asialle mitään, koska olemme odottavalla kannalla.”
Organisaatiossa tapahtuneet henkilöstömuutokset (1/7) ja uuden järjestelmän käyttöönottoon liittyvät asiat (1/7) mainittiin myös OpenAIRE-rekisteröintiä hidastaneina seikkoina.
Rekisteröitymiseen houkuttelee parempi näkyvyys
OpenAIRE-haravoinnin ulkopuolella olemisesta ei vastaajien mukaan ole ollut erityistä haittaa julkaisuarkistolle (4/7).
”Emme ole kokeneet varsinaista haittaa. Jos haittaa olisi ollut, olisimme olleet OpenAIREn suhteeen huomattavasti aktiivisempia.”
Arvioiduista hyödyistä selvästi tärkeimpänä pidettiin julkaisuarkiston aineistojen parempaa näkyvyyttä (6/7), vaikka datan näkyvyydestä oli myös epätietoisuutta (1/7). Paremman näkyvyyden toivat esiin lähes kaikki vastaajat, ja muista hyödyistä mainittiin vain avoimen tieteen edistäminen (1/7).
”Haluamme että meidän julkaisuarkistomme tiedot ovat löydettävissä ja saavutettavissa mahdollisimman laajasti. Näemme kyllä että OpenAIRE on paras väline tähän, ja tarkoituksena on tulevaisuudessa olla aktiivisemmin mukana OpenAIREn toiminnassa.”
Kansallinen koordinaatio ratkaisuna päällekkäisen työn ongelmaan?
OpenAIREen liittyvistä kehitystarpeista vastaajat nostivat esiin erityisesti yhden asian: kansallisen koordinaation ja ”kansallisen ratkaisun” tarpeen (3/7). Tähän liittyviä yksilöityjä kehityskohtia olisivat Suomen Akatemian rahoituspäätöksiä koskevien tietojen ja Virta-palvelun kokoamien julkaisutietojen nykyistä tehokkaampi hyödyntäminen.
”Haluamme välttää päällekkäistä työtä ja tutkijaakin hyödyttäisi kun metadata pitäisi syöttää vain kerran. Esimerkiksi Akatemian kanssa tulisi saada aikaan ratkaisu, jolla projektien (rahoituspäätösten) metadatan voisi saada käyttöön rajapinnan kautta.”
”Huhtikuun lopussa kuulimme Virta-julkaisuyhteyshenkilökokouksessa suunnitelmasta, jonka mukaan voisi olla mahdollista se, että tulevaisuudessa kaikkien Virta-palvelussa mukana olevien organisaatioiden julkaisutiedot voisivat lähteä OpenAIRE-haravointiin CSC:n Virta-palvelun kautta. Jos tämä olisi mahdollista, ei [organisaatiossa] tarvitsisi kuin huolehtia muun muassa metadatan laadun varmistuksesta.”
Eräs vastaaja pohtii myös Tutkimustietovarannon roolia.
”Mietimme muun muassa, mikä on OpenAIREn suhde valtakunnalliseen Tutkimustietovarantoon?”
Yhteenvetoa vastauksista
Vastauksissa esille tulleet asiat olivat aiemmin julkaisuarkistojen vastuuhenkilöiltä saadun palautteen mukaisia. Suurin osa vastauksista oli melko suppeita, ja ne olivat sisällöltään samansuuntaisia. Tässä on lyhyt yhteenveto edellä kerrotusta:
Keskeinen OpenAIRE-liitännän taustalla oleva syy liittyi EU:n rahoittamien tutkimusjulkaisujen raportointivelvoitteen toteuttamiseen. Tästä huolimatta OpenAIRE-haravoinnin ulkopuolella olevat arkistot eivät olleet kokeneet haittaa liitännän puuttumisesta – OpenAIRE-liitäntä oli kuitenkin suunnitelmissa käytännössä kaikissa arkistoissa. Parempi näkyvyys nähtiin liitännän tuomaksi hyödyksi, ja parempi näkyvyys oli myös OpenAIRE-haravoinnin piirissä olevien arkistojen kokema tärkein hyöty EU-projektien vaatimusten täyttämisen ohella. Tosin hyödyistä oli myös pientä epätietoisuutta.
Suurin työ rekisteröitymisessä liittyi odotetusti metadatan ja haravointirajapinnan muokkaukseen OpenAIRE-yhteensopivaksi. Vastaavasti OpenAIRE-liitännän ulkopuolella olevissa arkistoissa rekisteröitymisen esteenä pidettiin metadataan ja tekniseen järjestelmään liittyvää muutostyötä, johon ei ollut riittäviä resursseja. Kyselyn kiinnostavinta antia oli kansallisen koordinaation nostaminen esiin ratkaisuna metadatatyön resursointiongelmiin. Kansallinen ratkaisu nähtiin ratkaisuna yhtäältä päällekkäisen työn ongelmaan kotimaisissa arkistoissa (OpenAIRE-liitännän ulkopuolella olevat arkistot), toisaalta muuttuviin OpenAIRE-yhteensopivuusvaatimuksiin ja heikosti resursoituihin päivitysmahdollisuuksiin (OpenAIRE-liitännässä olevat arkistot). Sekä rekisteröityneiden että rekisteröitymättömien arkistojen vastauksissa viitattiin samaan VIRTA-kokoukseen huhtikuussa 2018, jossa hahmoteltiin julkaisutietojen keruuta VIRTA-palvelun kautta.
Keskeinen OpenAIRElle suunnattu viesti liittyy muuttuviin metadatavaatimuksiin, jotka aiheuttavat haravoinnin piirissä oleville päivitystyötä ja toimivat hidasteena rekisteröitymättömille arkistoille. Itse liitäntäprosessissakin nähtiin kehitettävää: vastaajat kokivat sen ”melko selkeäksi” ja validointityökalujen kannalta onnistuneeksi mutta myös hitaaksi (mm. asiakaspalvelun osalta) ja ohjeistukseltaan osin hankalaksi. OpenAIRE-haravoinnin tuoma parempi näkyvyys pitäisi pystyä myös konkretisoimaan paremmin, samoin kuin muut liittymisen tuomat edut – vastauksissa ei esimerkiksi tuotu lainkaan esiin, miten OpenAIREn keräämää dataa voisi hyödyntää julkaisuarkistoissa.
Helsingin yliopiston kirjasto toimii OpenAIRE-yhteistyön kansallisena koordinoijana (national open access desk, NOAD), ja välittää kyselyn keskeiset tulokset eteenpäin OpenAIRE-kehittämisestä vastaaville tahoille.
Pauli Assinen (Helsingin yliopiston kirjasto, OpenAIRE NOAD)
Kimmo Koskinen (Helsingin yliopiston kirjasto, OpenAIRE NOAD)
Juuso Ala-Kyyny (Helsingin yliopiston kirjasto)
3 vastausta artikkeliin “Kansallisesta koordinaatiosta toivotaan tukea julkaisuarkistoille – OpenAIRE-kyselyn tulosten yhteenveto”