Miten avoimesta julkaisemisesta tuli normaali käytäntö fysiikassa – haastattelussa professori Katri Huitu

”Omassa yhteisössäni julkaisu oli ja on arXivin myötä täysin avointa. Vaikka jotkut lehdet pyrkivät aluksi jarruttamaan julkaisemisen avoimuutta, sen hyödyt nähtiin niin suuriksi, että peruuttaminen avoimuudesta olisi ollut mahdotonta”, Helsingin yliopiston hiukkasfysiikan fenomenologian professori Katri Huitu kertoo. Preprint-artikkelien jakamiseen tarkoitettu arXiv on varhainen open access -innovaatio, joka syntyi käytännön tarpeesta. Tässä artikkelissa Huitu kertoo open access -vaiheista ja kuvaa  julkaisemisen prosessia fysiikan alalla.

Katri Huidun ja Dennis Nemeschanskyn artikkeli julkaistiin arXivissa elokuussa 1991.

Fyysikoille ei ole tarpeen esitelmöidä avoimesta julkaisemisesta, sillä heille julkaisemisen avoimuus on ollut lähtökohta 1990-luvulta lähtien. Erityisesti tähän on vaikuttanut Paul Ginspargin 1991 perustama arXiv-julkaisuarkisto, joka syntyi tieteellisiä dokumentteja jakavasta sähköpostiverkostosta ja on kehittynyt alan keskeiseksi preprint-artikkelien jakopaikaksi.

Kun tarkastelee arXivissa julkaistuja artikkeleita aikajärjestyksessä, kolmantena* tulee vastaan Helsingin yliopiston hiukkasfysiikan fenomenologian professorin Katri Huidun (TUHAT, ORCID) artikkeli elokuulta 1991, Supersymmetric Gelfand-Dickey Algebra, jonka hän kirjoittanut yhdessä Dennis Nemeschanskyn kanssa.

Huitu on siis oikea henkilö kertomaan arXivin synnystä sekä avoimen julkaisemisen varhaisvaiheista ja 2000-luvun kehityksestä fysiikan alalla. Tässä haastattelussa hän pohtii myös avoimeen dataan liittyviä kysymyksiä.

Katri Huitu, millainen on oma tutkijahistoriasi?

”Koko tutkijan urani olen ollut tekemisissä hiukkasfysiikan standardimallia laajentavien mallien kanssa. Toisin sanoen olen omalta osaltani miettinyt, mitkä mielestäni ovat tärkeimpiä ratkaisemattomia kysymyksiä hiukkasfysiikassa ja mikä olisi sopivin tapa lähestyä niitä.”

”Aloitin graduvaiheessa supersymmetriamalleja koskevien simulaatioiden tekemisellä Cernissä valmisteilla olevaan Delphi-kokeeseen. Väitöskirjani tein Los Angelesissa University of Southern California -yliopistossa. Väitöskirjani liittyi tietynlaisiin supersymmetriateorioihin, jotka ovat hyödyllisiä säieteorioiden konstruktiossa. Tutkijatohtorivaiheessa muutin takaisin Suomeen Helsingin yliopistoon Suurenergiafysiikan tutkimuslaitokseen, jossa perustin hiukkasfysiikan fenomenologiaryhmän standardimallin laajennuksia tutkimaan, ja tutkimuksellisesti sillä tiellä edelleen olen, vaikka tehtävät ja laitokset ovat vuosien saatossa vaihtuneet.”

Princetonin yliopistossa oli ohjaajani tuntema aktiivinen henkilö, joka lähetti saamansa esijulkaisut (preprint) yhdessä isossa tiedostossa (ilman kuvia) niitä pyytäneille. Esijulkaisuja ja niitä haluavia alkoi olla runsaasti, ja yhdestä tiedostosta artikkelien poimiminen kävi vaivalloiseksi. Ongelman ratkaisuksi kehitettiin arXiv-tietokanta.

Miten ja milloin avoin julkaiseminen, open access, tuli omaan tietoisuuteesi?

”Väitöskirjavaiheessa oli tarvetta saada nopeasti tietoa alan kehityksestä. Princetonin yliopistossa oli ohjaajani tuntema aktiivinen henkilö, joka lähetti saamansa esijulkaisut (preprint) yhdessä isossa tiedostossa (ilman kuvia) niitä pyytäneille. Esijulkaisuja ja niitä haluavia alkoi olla runsaasti, ja yhdestä tiedostosta artikkelien poimiminen kävi vaivalloiseksi. Ongelman ratkaisuksi kehitettiin arXiv-tietokanta, johon sattumoisin siirryttiin niin, että kolmantena julkaisuna kolmantena julkaisuna arXiv:in hep-th** -tietokannassa on oma julkaisuni. Tietokanta laajeni nopeasti hiukkasfysiikassa käytännössä kaikille osa-alueille ja monelle muullekin alueelle fysiikassa ja muillekin tieteenaloille.”

Miksi fyysikot ovat olleet avoimessa julkaisemisessa niin varhain liikkeellä?

”ArXivin kehittyminen seurasi mainitsemastani tarpeesta saada nopeasti tiedoksi uudet tutkimustulokset. Ala eteni huimaa vauhtia eikä ollut halua odotella postista joskus tulevia esijulkaisuja. Yhteen tiedostoon kokoaminen oli myös selvästi saavuttanut käytännöllisyyden rajansa. Kun arXiv-julkaisuja tuli, niiden hyöty oli selvä. Globaalisti ja kustannustehokkaasti saatiin tieto kaikkien luettavaksi.”

ArXivin kehittyminen seurasi mainitsemastani tarpeesta saada nopeasti tiedoksi uudet tutkimustulokset. Ala eteni huimaa vauhtia eikä ollut halua odotella postista joskus tulevia esijulkaisuja.

Vuosituhannen alussa ilmestyivät open access -julistukset, Budapest Open Access Initiative (2002) ja Berlin Declaration (2003). Oliko näillä mielestäsi vaikutusta tieteellisen julkaisemisen kulttuuriin?

”Omassa yhteisössäni julkaisu oli ja on arXivin myötä täysin avointa. Vaikka jotkut lehdet pyrkivät aluksi jarruttamaan julkaisemisen avoimuutta, sen hyödyt nähtiin niin suuriksi, että peruuttaminen avoimuudesta olisi ollut mahdotonta.”

  • Lue myös: Tietolinjan tuoreimmassa numerossa (1/2022) teemana on avoimen julkaisemisen 2000-luvun historian tarkastelu eri näkökulmista.

Millainen on oma julkaisuhistoriasi avoimen julkaisemisen näkökulmasta arXiv-julkaisun jälkeen?

”Omat julkaisuni – ja sama pätee hiukkasfysiikan tutkijoihin yleensäkin – ovat avoimesti kaikkien saatavilla arXiv-julkaisuina. Suuri osa myös alan julkaisusarjoista on OA-lehtiä. Lehtien merkitys on lähinnä vertaisarvioinnissa, joka antaa laatuleiman julkaisulle, sillä käytettävissä olevissa tietokannoissa julkaisualusta on mainittuna.”

”Jos ei ole erityistä syytä estää julkaisun avoimuus, se palvelee tieteen edistymistä globaalisti ja tarjoaa pääsyn uusimpaan tutkimukseen myös niissä maissa, joissa ei ole ollut mahdollista tilata kalliita julkaisusarjoja.”

Lehtien merkitys on lähinnä vertaisarvioinnissa, joka antaa laatuleiman julkaisulle, sillä käytettävissä olevissa tietokannoissa julkaisualusta on mainittuna.

Voitko kuvata vielä tarkemmin julkaisemisen prosessia alallasi: Mitä tapahtuu sen jälkeen, kun esijulkaisu (preprint) on julkaistu arXivissa?

”Julkaisemisen prosessi etenee seuraavasti: esijulkaisu lähetetään arXiv:iin. Usein tässä vaiheessa odotellaan noin viikko, jona aikana voidaan saada kommentteja aiheesta kiinnostuneilta, ja muun muassa referenssilista voi täydentyä. Sitten esijulkaisu lähetetään julkaisusarjaan (jos se on tarkoitettu julkaisusarjassa julkaistavaksi), jossa se entiseen tapaan referoidaan ja tehdään korjauksia vastaavasti kuin ennen arXiv:in olemassaoloa. Kun lopullinen – korjattu ja täydennetty – esijulkaisu hyväksytään julkaistavaksi, lisätään parempi versio myös arXiv:iin – joskus enemmänkin versioita arXiv:ista löytyy. Eli tällöin ainoa ero aikaisempaan on, että julkaisu on kenen tahansa saatavilla arXiv:ista.”

”Toinen arXiv:in hyöty on, että versioita voi lähettää myöhemminkin. Lehteen/kirjaan painettu tieto voi päivittyä ja uuden version voi lisätä arXiv:iin. Esimerkiksi eräästäkin alani kirjaan painetusta luvusta tällä tavalla on karsittu painovirheitä kaavoista ja uutta tietoa aiheesta on kertynyt. Alkuperäisestä erittäin hyödyllisestä 88 sivusta on parinkymmenen vuoden aikana versioon 7 mennessä tullut erittäin hyödylliset 160 sivua, ja kuka tahansa voi tätä käyttää.”

Miten näet, että tietoisuus avoimesta julkaisemisesta on kehittynyt tutkijayhteisössä 2000-luvun aikana?

”Rahoittajien vaatimus avoimuudesta tuo automaattisesti avoimen julkaisemisen kaikkien tutkijoiden tiedoksi, vaikka omalla alalla ei olisikaan oltu aktiivisia aiemmin.”

Tutkimusdatan avoimuus on noussut entistä enemmän esiin viime vuosina. Millaisena näet siihen liittyvät mahdollisuudet ja haasteet?

”Tutkimusdatan avoimuus on ainakin omalla alallani suuressa murroksessa. Yksi tärkeä ongelma liittyy kerätyn datan oikeaan käyttöön. Kaikki epävarmuudet ja erityisolot pitäisi olla käyttäjän tiedossa, ettei tule virhetulkintoja. Dataa on monenlaista, joten yleisiä sääntöjä on hankala luoda. Fysiikan tutkimuslaitoksen Kati Lassila-Perini on asiantuntija Cernin CMS-kokeen valtaisan datamäärän avaamisessa ja sääntöjen luomisessa datan pitkäaikaissäilytykseen. Viime vuosina tässä on tehty uraauurtavaa työtä.”

Jos sinulla olisi valta muuttaa jokin asia tai joitain asioita nykyisessä julkaisemisen kulttuurissa, mitä muuttaisit?

”Idealistisesti olisi hienoa, jos kaikki julkaisut olisivat avoimia, data ja käytetyt ohjelmat olisivat kaikkien saatavilla ja julkaisun laatu olisi avainasia julkaisujen määrän sijasta. Tähän tietysti pyritään.”


* Huidun ja Nemeschanskyn artikkeli (lähetetty elokuussa 1991) tulee listalla viidentenä. Listan kaksi ensimmäistä artikkelia on kuitenkin lähetetty vasta huhtikuussa 1992, vaikka niille on generoitu heinäkuuhun 1991 viittaava arXiv-tunnus (arXiv:hep-lat/9107001 ja arXiv:hep-lat/9107002). Arkisto aloitti elokuussa 1991.

** Fysiikan teoreetikkojen sähköpostilistan arXiv-versio on nimeltään hep-th, ja se oli ensimmäinen arXivissa.


Julkaisitko arXivissa tai biorXivissa? Kerro siitä kirjastolle

      • Helsingin yliopiston avoimen julkaisemisen periaatteiden mukaisesti kaikki yliopistossa tuotetut tieteelliset tallennetaan julkaisuarkisto Heldaan.
      • Kirjasto tekee tutkijan puolesta rinnakkaistallennuksen käyttäen arXivissa tai biorXivissa olevaa julkaisua.
      • Kun artikkelisi on julkaistu lehdessä tai hyväksytty julkaistavaksi, ja hyväksytty versio on myös tallennettu arXiv/biorXiv-palveluun, lähetä tieto lehden nimestä ja linkki artikkeliin kirjastolle osoitteeseen openaccess-info@helsinki.fi.
      • Kirjasto rinnakkaistallentaa uusimman arXivissa/biorXivissa olevan tiedoston yliopiston tutkimustietojärjestelmään, josta se siirtyy julkaisuarkisto Heldaan.
      • Kirjaston tallennuspalvelu on kaikkien yliopistolaisten käytettävissä.