Open Repositories 2013: Julkaisuarkistojen tulevaisuus (2/3)

workshopOsallistuin tällä kertaa vain yhteen maanantaina järjestetyn esikonfenssin workshopiin, jonka aiheena oli vaatimattomasti julkaisuarkistojen tulevaisuus. JISC:in vetämän workshopin taustamateriaalina oli useita johtavan Open Access -maan Iso-Britannian esimerkkitapauksia, ja me jakauduimme pöytäkuntiin, jotka saivat tehtäväkseen pohtia tulevaisuuden näkymiä.

Päädyin onnekkaasti pöytään, jossa oli pari ennestään tuttua ihmistä ja muutama muu joiden kanssa juttelin lisää myöhemmin konferenssin aikana. Meille annettu tehtävä oli ihan liian kunnianhimoinen käytettävissä olleeseen aikaan nähden (kamoon, julkaisuarkistojen tulevaisuus reilussa puolessa tunnissa!?), mutta keskustelu muiden maiden ihmisten kanssa oli antoisaa, ja yllättävän hyvin löysimme yhteisen sävelen. Aina yhtä aikaansaava @miren Bram Luyten kyhäsi nopeasti verkosta löytämällään työkalulla keskustelun pohjalta hienon mindmapin, joka päihitti muiden ryhmien fläppitaulut 6-0.

flow-chartsJulkaisuarkistojen ja open accessin tulevaisuudesta on käyty paljon vääntöä kesästä 2012 lähtien. Open access -keskustelun panokset ovat nousseet merkittävästi sekä brittiläisten kannanottojen (Finchin komitean raportti ja RCUK:n Open Access -politiikka) että USA:n hallinnon julkistaman open access -linjauksen ansiosta. Brittiläisten linjausten on yleisesti tulkittu suosivan kustantajia ja Gold Open Accessia. USA:ssa hallinnon asettamia velvoitteita täyttämään on noussut kaksi kilpailevaa toimintamallia, joista toisen (CHORUS) takana ovat pääasiassa kustantajat ja toisen (SHARE) takana kirjastot. CHORUS perustuu kustantajien olemassaolevaan infrastruktuuriin ja pyrkii pitämään avoimet julkaisut kustantajien hallinnassa, SHARE taas rakentuu tutkimusorganisaatioiden omien julkaisuarkistojen varaan. CHORUS on luonnollisesti herättänyt Open Access -väen keskuudessa runsaasti epäluuloja, mutta on vielä liian aikaista sanoa miten kisassa käy. Elämme mielenkiintoisia aikoja.

kommentti

Julkaisuarkisto ja CRIS

Toinen kiivasta keskustelua herättävä kysymys on julkaisuarkistojen suhde tutkimuksenhallintajärjestelmiin (CRIS). Euroopassa alaa ovat vallanneet kaupalliset CRIS-sovellukset (Pure, Converis, Sympletic Elements) kun taas USA:ssa isot yliopistot näyttäisivät ryhmittyvän avoimen lähdekoodin ja semanttisten yhteyksien varaan rakennetun VIVO-konseptin ympärille.

Lähtökohdat ovat Atlantin eri puolilla jossain määrin erilaisia: Euroopassa on lähdetty liikkeelle yliopistojen oman ja kansallisen tason keskitetyn tutkimushallinnon tarpeista, ja tietojen välittämiseen on pyritty luomaan myös yhteinen metadataformaatti (EuroCris-järjestön ylläpitämä CERIF). USA:ssa on päästy vauhtiin hitaammin, sillä siellä ei ole ollut aivan samanlaisia organisaatioiden sisäisiä tai organisaatiorajat ylittäviä hallinnollisia paineita tiedonkeruuseen, vaan tavoitteena on ollut enemmän tutkimusta koskevan tiedon löydettävyyden parantaminen. Osin myöhemmästä aloitusajankohdasta johtuen USA:ssa on lähdetty jo alun pitäen avoimen lähdekoodin ratkaisujen ja semanttisen teknologian suuntaan.

vivo

Julkaisuarkisto-ohjelmien ja CRIS-sovellusten suhde on hankala kysymys: aika monella organisaatiolla on molemmat, mutta CRIS-puolella on myös ollut pyrkimyksiä kehittää järjestelmiä siten, että erilliset julkaisuarkistot kävisivät tarpeettomiksi. Ja toisaalta, julkaisuarkistoja on pyritty laajentamaan vaihtelevalla menestyksellä CRIS-suuntaan – hyvänä esimerkkinä Hong Kongin yliopiston tarpeisiin rakennettu DSpace-CRIS. Järjestelmien lähtökohdat ja käyttötarkoitukset ovat kuitenkin sen verran erilaisia, ettei yhden kaikkia intressejä tyydyttävän järjestelmän rakentaminen ole aivan yksinkertainen tehtävä. Nähtäväksi jää myös se, miten hyvin julkaisuarkistot ja VIVO saadaan limittymään toisiinsa.

ResourceSync, ORCID ja Altmetrics

Muita tämän vuoden kuumia aiheita olivat etenkin ResourceSync, ORCID ja Altmetrics, joista kaksi ensimmäistä oli toki ollut esillä jo viime vuonna Edinburgissa. Nyt oltiin kuitenkin edetty teoriasta käytännön sovellusten rakentamiseen, ja innostus oli sen mukaista. Jaoimme Esa-Pekan kanssa tehtäviä sen verran, että hän osallistui maanantain ResourceSync-sessioon, joka kuulemma olikin oikein inspiroiva.

ResourceSynciä on ollut ideoimassa Herbert Van de Sompel, Carl Lagoze ja monta muuta kirjastoteknologian parissa puuhasteleville ennestään tuttua nimeä, ja julkaisuarkistoihmisille se esiteltiin “teknologiana joka korvaa OAI-PMH:n”. OAI-PMH on jäänyt käytännössä vain kirjastomaailman sisäiseksi rajapinnaksi, mutta nyt tavoitteena on rakentaa yleisemmin tunnetun teknologisen ratkaisun (Sitemaps) varaan ja päästä kirjastomaailmaa laajemmille vesille. ResourceSyncistä kuullaan meilläkin varmasti vielä lisää.

orcid-presentationResourceSyncistä oli jo olemassa alustavia käytännön sovelluksia, ja sama koskee myös ORCID-tunnistejärjestelmää, joka avattiin yleiseen käyttöön viime syksynä. Viime kesästä on siis päästy eteenpäin, vaikka tuolloin askarruttanut ORCID- ja ISNI-tunnistejärjestelmien työnjaon ja yhteistyön toteutuminen käytännössä on julkilausutuista hyvistä aikomuksista huolimatta edelleen jossain määrin hämärän peitossa.

Tutkijoiden tunnistamiseen liittyviä vaihtoehtoja selvitetään parhaillaan myös Suomessa (ks. myös oma viime talven esitykseni), mutta maailmalla ollaan monin paikoin jo askelta tai paria pidemmällä ja sekä yliopistojen omia että monin paikoin myös kansallisia tutkijan tunnistamiseen tarkoitettuja järjestelmiä suunnitellaan ORCID:in infrastruktuurin varaan.

Käytännön sovellusten tekeminen on toki monilta osin vielä kesken, sillä prosessit vaativat huolellista suunnittelua, mutta mitenkään ylivoimaista tämä ei kuitenkaan ole. Esim. OR2013:n Developer Challenge -kilpailussa yksi joukkue kehitti DSpaceen alustavan ORCID-kytkennän, mikä ymmärtääkseni vaati vain muutaman tunnin työn.

Altmerics puolestaan viittaa tieteellisten julkaisujen vaikuttavuuden mittaamista varten kehitettyihin uusiin välineisiin. Altmetricsin ideana on koota perinteisten viittausanalyysien ja julkaisukanavakohtaisten tunnuslukujen rinnalle numerotietoja mm. kunkin artikkelin latauskerroista ja sen sosiaalisessa mediassa (esim. Twitter, Mendeley, jne.) saamasta huomiosta.  Tätä kautta on mahdollista kerätä huomattavasti perinteisiä keinoja nopeammin tietoja siitä, mitkä artikkelit herättävät tiedeyhteisön huomion ja mistä aiheista sen keskuudessa kulloinkin puhutaan. Esim. Altmetric-firman kokoaman datan avulla automaattisesti päivittyvien tunnuslukujen integroiminen kustantajan verkkopalveluun tai julkaisuarkistoon on helppoa ainakin siinä tapauksessa, että artikkeleilla on selkeät tunnistetiedot (esim. DOI).

(Jatkuu seuraavassa merkinnässä…)