Avoimien viittausten yleistyminen mullistaisi metriikan – katsaus nykytilanteeseen

Tutkimusdata on tuttu teema avoimen tieteen keskusteluista, mutta myös viittausdatan avaamiseksi on tehty työtä 2010-luvulla (OpenCitations-projekti, I4OC-aloite) . Viittaukset ovat suurille yrityksille tuottoisa bisnes, mutta tiedeyhteisölle avoin viittausdata antaa uusia mahdollisuuksia tutkimustoiminnan analysointiin. Helsingin yliopiston kirjaston tietoasiantuntijan Eva Isakssonin blogiartikkeli taustoittaa tiiviisti avointen viittausten nykytilannetta ja vaikutusta metriikkaan tulevaisuudessa.

Teksti: Eva Isaksson

Onko artikkelisi julkaistu avoimena? Jos on, niin hienoa – onnittelut! Entä onko saman julkaisun viitteet julkaistu myös avoimina? Alatko saman tien pohtia, mitä kysymys mahtaa tarkoittaa?

Julkaisemisen avoimuus on yllättävän moniulotteinen käsite. Paitsi tutkimusjulkaisujen avoimuudesta, kyse on monesta muustakin samaan kokonaisuuteen liittyvästä asiasta. Tiedämme jo esimerkiksi avoimesta datasta, mutta avoimet viittaukset saattavat monelle olla täysin uusi asia.

Tutkimusjulkaisujen väliset viittaukset ovat erittäin tuottoisa bisnes. Yliopistot maksavat huomattavia summia siitä, että ne voivat seurata omien tutkimusjulkaisujensa impaktia. Markkinoita ovat pitkään hallinneet Clarivaten Web of Science ja Elsevierin Scopus. Nämä ovat käytännössä määritelleet menestystä mittaavat indikaattorit, joilla tiedettä punnitaan muun muassa yliopistorankingeissa. Näiden lisäksi metriikkamarkkinoilla toimii kaupallisia yrityksiä, jotka tuottavat metriikkaa vapaasti saataville. Google Scholar, Microsoft Academic tai Digital Sciencen Dimensions eivät kuitenkaan luovuta vapaasti saatavien palveluidensa dataa vapaaseen jatkokäyttöön.

Markkinoita ovat pitkään hallinneet Clarivaten Web of Science ja Elsevierin Scopus. Nämä ovat käytännössä määritelleet menestystä mittaavat indikaattorit, joilla tiedettä punnitaan muun muassa yliopistorankingeissa.

OpenCitations ajaa viittausten avoimuutta

Avoimien viittausten OpenCitations-projekti aloitti toimintansa Isossa-Britanniassa vuonna 2010. Julkisella rahoituksella käynnistetty OpenCitations on ollut avoimien viittausten merkittävä asianajaja. Se oli yksi 2017 perustetun Iniative for Open Citations (I4OC) perustajista. Tämän aloitteen aloittaessa toimintansa noin 1% viittauksista oli avoimia. Vuonna 2020 arvioidaan, että 59% viittauksista on avoimia.

Avoimien viittausten infrastruktuuri on rakennettu avoimen linkitetyn datan periaattein käyttäen semanttisen verkon menetelmiä. Siinä kahden tutkimusjulkaisun välinen viittaussuhde saa koneluettavan tunnisteen (OCI, open citation identifier). Näitä tunnisteita kerätään korpuksiksi (OCC, open citations corpus), joihin voidaan tehdä kyselyitä ja joista voidaan ladata viittausdataa jatkokäsittelyä varten.

Iniative for Open Citations -aloitteen aloittaessa toimintansa noin 1% viittauksista oli avoimia. Vuonna 2020 arvioidaan, että 59% viittauksista on avoimia.

Moni iso kustantaja jo mukana

Viittausten avaamien on varsin selkeästi kustantajien omaan julkaisupolitiikkaan liittyvä valinta – kyse ei siis ole yksittäisten tutkijoiden artikkelikohtaisista valinnoista tai yksittäisistä lehtinimekkeistä. Käytännössä kustantaja lähtee avoimien viittausten tielle ilmoittamalla DOI-tunnisteita (digital object identifier) hallinnoivalle Crossrefille halukkuudestaan avata viittauksensa. Sen jälkeen, kun tämä lupa-asetus on kunnossa, se koskee kyseisen kustantajan julkaiseman aineistojen viiteluetteloja.

I4OC:n julkaisemassa kustantajalistassa on jo huomattava määrä kustantajia. Isoista kustantajista mainittakoon mm. Springer Nature, Taylor & Francis, Wiley, Cambridge University Press, SAGE ja IOP. Sen sijaan Elsevier loistaa poissaolollaan. Aloitteessa on mukana myös monia vaikutusvaltaisia avoimen tieteen ja bibliometriikan tahoja, ja myös isoja tutkimusrahoittajia.

Mitä tehdä viittauksille, joiden kustantaja ei avaa viitteitään? Näiden indeksointia on lähestytty joukkoistamisen voimalla, siten että kuka tahansa voi ilmoittaa vaikkapa omien artikkeliensa lähdeviitteiden DOI-tunnisteet mukaan CROCI (Crowdsourced open citations index) -tietokantaan. I4OC:n kanta viittausten lisensointiin on, että niiden tulisi olla kaikkien vapaasti käytettävissä C0-lisenssillä (ks. myös blogijuttu lisenssisuosituksista).

Mitä avoimet viittaukset mahdollistaisivat?

On sanomattakin selvää, että avoimien viittausten laajamittainen käyttöönotto mullistaisi nykyisen bibliometriikan. Kuka tahansa pääsisi vapaasti käsiksi viittausdataan ilman monimutkaisia lisenssiehtoja ja kymmenien tuhansien eurojen tilausmaksuja. Bibliometrikot voisivat pyörittää laajoja analyysejä, joista tähän asti ei ole voitu kuin unelmoida. Myös kustantajat, kirjoittajat, kirjastot, rahoittajat, tutkimushallinto, ja monet muut tahot saisivat uutta, ajantasaista tietoa viittauksista. Eikä kyse olisi pelkistä julkaisuista, vaan myös tutkimusdatasta ja muista tutkimuksen tuotteista – mistä tahansa, mihin voi liittää tunnisteen.

On sanomattakin selvää, että avoimien viittausten laajamittainen käyttöönotto mullistaisi nykyisen bibliometriikan.

Viittausten avoimuudesta kertovan ote HUP-Crossref-kyselystä.

Ehkä joku kustantajan edustaja epäröi ajatellessaan mahdollisia kustannuksia. Viittausten avaaminen ei maksa mitään, mutta avaamisen hyödyt antavat kustantajalle yksityiskohtaista tietoa sen julkaiseman aineiston saamista viittauksista. Suomalaista kustantajista mukaan on lähtenyt ainakin Helsinki University Press.

Lue lisää:


Eva Isaksson (TUHAT, ORCID, @eisaksso) työskenteee Helsingin yliopiston kirjastossa tietoasiantuntijana, erikoisalanaan bibliometriikka.