Avoin tiede koronan aikaan – katsaus avoimuuden ilmentymiin poikkeustilanteessa

Samalla, kun valtiot ovat sulkeutuneet koronaviruspandemian aikana, tiede on avautunut ainutlaatuisella tavalla. Tutkijat jakavat aineistojaan avoimesti muiden saataville ja tekevät tutkimusta yli tieteenalarajojen, kustantajat purkavat maksumuurejaan ja uusia tapoja tieteellisen tiedon luomiseksi ja välittämiseksi kehitetään. Tässä blogiartikkelissa luodaan yleiskatsaus avoimen tieteen ja tiedon avoimuuden ilmentymiin ja teemoihin viimeisen kolmen kuukauden aikana.

(This article is also available in English.)

”Viruksen ominaisuuksien tutkiminen etenee ennennäkemätöntä vauhtia ja tutkijat ympäri maailmaa jakavat myös tutkimustuloksia aivan uudella tavalla. Virukseen on mahdollista keksiä lääke ja tätä kehitystyötä tehdään lukuisissa laboratorioissa”, toteaa uhkaavien infektiotautien tutkija, apulaisprofessori Tarja Sironen Helsingin yliopistosta Yleisradion haastattelussa maaliskuun alussa.

Kiinasta lähteneen koronaviruksen (SARS-CoV-2) levitessä ympäri maailmaa ja ihmisten sairastuessa viruksen aiheuttamaan tautiin (coronavirus disease, covid-19) valtiot ovat sulkeneet rajojaan ja ihmiset eristäytyneet. Samaan aikaan tutkijat ovat ryhtyneet laajamittaiseen globaaliin yhteistyöhön, jossa tieteen avoimuus ja avoimen tieteen toimintatavat ovat saaneet keskeisen roolin.

Tässä blogiartikkelissa luodaan yleiskatsaus avoimen tieteen ja tiedon avoimuuden ilmentymiin pandemian aikana. Jutussa käydään läpi seuraavat teemat:

Aiheesta on kirjoitettu valtavasti ja tämä artikkeli tarjoaa vain tiiviin, esimerkinomaisen katsauksen aiheeseen. Jos sinulle tulee lukiessasi mieleen täydennysehdotuksia tai jatkoartikkelin aiheita, kommentoi viestikenttään tai lähetä sähköpostia (juuso.ala-kyyny@helsinki.fi).

Helsingin yliopiston tutkijat ja covid-19

Tutkijat jakavat tutkimustuloksiaan ja dataansa

Tutkijat eri puolilla maailmaa – suomalaistutkijat ja Helsingin yliopiston tutkijat muiden mukana – ovat osallistuneet viime viikkoina ja kuukausina tavalla covid-19-tutkimukseen tavalla, jota on kutsuttu ainutlaatuiseksi ja ennennäkemättömäksi. Tämä on edistänyt myös tutkimusta, kuten brittiläisen Wellcome Trustin johtaja Jeremy Farrar totesi jo helmikuun lopussa: ”An unprecedented amount of knowledge has been generated in 6 weeks.”

Erityiseksi tutkimuksen on tehnyt se, miten laajasti tutkijat ovat jakaneet tutkimustuotoksia – sekä tuloksia että niiden taustalla olevaa tutkimusdataa – avoimesti muiden käyttöön. Pandemia on tehnyt näkyväksi tieteellisen tiedon avoimuuden hyötyjä ja lisännyt osaltaan myös tietoisuutta avoimen tieteen toimintatavoista ja avoimuuden edellytyksistä, kuten datan avaamisen FAIR-periaatteista (ks. lisää Fairdata.fi-sivuilta).

Tiedon jakaminen yhteisen tietämyksen edistämiseksi on toki tieteen perusasioita – ”just science” – mutta käytännössä tämän tiellä on ollut monenlaisia esteitä tai hidasteita, kuten julkaisupaikan valintaan liittyvä kilpailuasetelma meritoitumisineen, ja siitä seuraava kallis julkaisemisen kulttuuri. Yksi näkökulma avoimeen tieteeseen onkin, että se pyrkii muuttamaan kulttuuria (eli toimintatapoja) ja palauttamaan tieteen juurilleen: ”open science is just science done right”. Pandemian myötä tieteen peliasetelma näyttää ainakin hetkeksi väistyneen yhteistä hyvää ja parempaa tietoa tavoiteltaessa.

Tutkimusta yli tieteenalarajojen

Kuten tieteelliseen julkaisemiseen, myös tieteenalojen väliseen yhteistyöhön liittyvät omat kulttuurilliset jäykkyytensä. Tieteenalakeskeistä lähestymistapaa tukee tapa, miten tutkimusta arvotetaan ja resursoidaan. Tieteellistä tiedonmuodostusta ja julkaisemisen kulttuuria tutkineen Benedikt Fecherin mukaan covid-19-tutkimusta luonnehtii ongelmakeskeinen lähestymistapa, joka on tarkoittanut tieteenaloihin liittyvien raja-aitojen madaltumista. Mikään yksittäinen tieteenala ei pysty kattavasti ymmärtämään kompleksia tutkimusongelmaa:

”Especially in such acute crisis situations, it is important for researchers to collaborate across disciplines and to work together with doctors, nurses, politicians and public administrators. What vaccines might be developed? How can we ensure the continued provision of medical care? How can we avoid an economic collapse? None of these questions can be answered by a single discipline. – – What strikes me is that, when things get difficult, researchers step up to the game. At the moment, we are seeing researchers who are embracing complexity and overcoming institutional complex avoidance mechanisms. – – Researchers lead by example. They are ignoring artificial disciplinary boundaries, skipping the journal publication system and making themselves heard whenever and however they can.” (Fecher 17.3.2020)

Tutkimusyhteistyötä tehdään nyt eri puolilla tiedekenttää, ja uusia projekteja on syntynyt vauhdilla, esimerkkinä vaikkapa tutkimusdataan liittyvät kollaboraatiot tai erilaiset hackathonit. Suomessa huomiota ovat saaneet muun muassa tutkimusyhteistyö koronaviruksen leviämiseen liittyen ja Hack the crisis Finland, jotka molemmat laitettiin alulle nopeassa aikataulussa.

Infrastruktuuri tukee nyt paremmin avointa tiedettä

Nykyinen pandemia on laajuudessaan poikkeuksellinen, mikä osaltaa selittää tutkijoiden yhteistyötä: se yhdistää tutkijoita laajasti. Verrattuna 2000-luvun aiempiin epidemioihin, kuten vuosituhannen alun SARS-epidemiaan, myös edellytykset avoimeen tieteeseen ovat paremmat kuin aiemmin. Digitalisaatio ja tutkimusinfrastruktuuri tukevat aiempaa paremmin tutkimustulosten ja datan jakamista. Suomessa keskeinen infrastruktuuripalvelujen tarjoaja on CSC – Tieteen tietotekniikan keskus, joka kertoo varanneensa resursseja covid-19-tutkimukseen.

Avoimen tieteen infrastruktuurin, kuten avointen julkaisukanavien ja repositorioiden merkitys on kasvanut kuluvien kuukausien aikana. Yhdysvaltain terveysviraston alaisen NCBI:n GenBank ja China National Genomics Data Centre ovat olleet keskeisiä väyliä tutkimusdatan avaamisessa. Repositoriot, kuten PubMed Central ja GisAid, ja pre-print-palvelut, kuten BioRxiv ja MedRxiv, ovat niin ikään olleet avaintekijöitä tieteellisen tiedon jakamisessa ja tutkimuksen edistämisessä. Covid-19-tutkimukseen liittyvää tietoa ja avointa dataa on koottu myös yhteen erilaisilla alustoilla, kuten seuraavilla:

  • Virus Outbreak Data Network pyrkii tarjoamaan kaiken koronavirukseen liittyvän datan FAIR-periaatteita noudattaen.
  • CSSEGISandData on Johns Hopkinsin yliopiston useista lähteistä koottu datarepositorio Githubissa.
  • COVID-19 Open Research Dataset (CORD-19) on Allen-instituutin päivittyvä aineistokokonaisuus, jossa on myös tutkimusartikkeleita aiheeseen liittyen.
  • WHO kokoaa covid-19-tutkimustietoa omaan päivittyvään tietokantaansa.

Yleiskatsauksia pandemian etenemisestä on koottu Johns Hopkinsin yliopiston reaaliaikaiseen raportointinäkymään ja maailman terveysjärjestö WHO:n päivittäisraportteihin. WHO:n aineistojen kohdalla on tosin nostettu esiin myös järjestön rajoittava lisenssipolitiikka. Käyttöoikeudet ratkaisevat, miten tietoa voidaan käyttää, ja WHO:n käyttämät CC BY-NC-SA -lisenssit eivät parhaalla mahdollisella tavalla tue tiedon avointa jakamista.

”NC-ehto (non-commercial) on ongelma, koska ei-kaupallisen käytön määrittely on hankalaa. Artikkeleita ei esimerkiksi saisi jakaa kaupallisilla tai mainosrahoitteisilla alustoilla, kuten ResearchGatessa, tai maksullisessa koulutuksessa. Tieto ei siis leviä niin tehokkaasti kuin voisi toivoa. Kun tähän yhdistetään SA-ehto (share alike), niin kaikki muutetut teokset (derivate works) pitää jatkossa jakaa samalla lisenssillä. Yleishyödylliset organisaatiot jakavat aineistonsa yleensä CC BY -lisenssillä, Euroopan komissiokin on määrittänyt CC BY:n ja CC 0:n standardilisensseiksi”, tekijänoikeusasioihin erikoistunut tietoasiantuntija Soile Manninen Helsingin yliopiston kirjastosta sanoo.

Pre-printit nopean tieteellisen tiedon välittäjinä

Viimeistään koronavirus on tuonut pre-print-artikkelit – eli tutkimusartikkelien vertaisarvioimattomat käsikirjoitusversiot – laajempaan tietoisuuteen. Tutkimusartikkelien arviointi- ja käsittelyprosessien kestäessä jopa kuukausia pre-printit on tarkoitettu nopeaan ja avoimeen tiedonjakamiseen, mikä pandemian tapauksessa on erittäin tärkeää:

”[P]reprints sped up data dissemination during the Zika epidemic of 2015–16 and the West African Ebola outbreak of 2014–16. Most of the preprints appeared more than 100 days before a journal published the work. But overall, less than 5% of the journal articles about the two epidemics were first posted as a preprint. The COVID-19 outbreak has broken that mold.” (Science 26.2.2020)

Pre-printtien tarkoitus on tuoda tutkimustulokset nopeasti tiedeyhteisön saataville, jonka jälkeen ne ovat tavanomaisen tieteellisen arvioinnin kohteena. Pre-print-palveluilla on myös omia, tosin resursseiltaan rajallisia, tarkistusmekanismeja laadun varmistamiseksi ja väärinkäytösten estämiseksi. Pandemian myötä on perustettu myös pre-printtien evaluointikanavia, esimerkkinä Outbreak Science Rapid PREreview. Koska pre-printtien arvo liittyy avoimuuden ohella nopeuteen, ne ovat kytköksissä tutkijoiden väliseen kilpailuun, minkä vuoksi kriittinen tarkastelu on tarpeen.

”Pre-printeihin sisältyy myös riskejä – niillä pyritään varmistamaan omien tutkimustulosten prioriteetti tieteen aikajanalla, jolloin tutkijalla voi olla suuri kiusaus julkistaa alustavat tuloksensa ennenaikaisesti ja epävarmuustekijöistä huolimatta”, bibliometriikkaan erikoistunut tietoasiantuntija ja arXiv-käyttäjäyhteisön jäsen Eva Isaksson Helsingin yliopiston kirjastosta huomauttaa.

BioRxiv- ja medRxiv-pre-print-repositorioihin on ladattu yli 1200 covid-19-aiheista artikkelia – määrä kasvaa kymmenillä päivittäin. Tutkimuspaperien paljouden takia bioRxiv ja medRxiv ovat lisänneet sivujensa ylälaitaan bannerit, joissa muistutetaan tieteen toimintatapoja heikommin tunteville pre-print-artikkelien roolista tieteellisessä kommunikaatiossa.

Julkaisijat purkavat maksumuurejaan

Maailman terveysjärjestö WHO julisti 30. tammikuuta koronavirusepidemian kansainväliseksi terveysuhaksi. Seuraavana päivänä tiedelehtien kustantajat julkaisivat tiedeyhteisölle suunnatun vetoomuksen, jossa esitettiin tutkimustuotosten – datan, julkaisujen, pre-printtien – avointa julkaisemista periaatteella ”as rapidly and widely as possible”. Vetoomuksen allekirjoittajat, joita on pitkälti toistasataa, sitoutuvat myös tulevaisuudessa vastaavanlaiseen toimintaan.

11. maaliskuuta WHO kertoi koronaviruksen laajentuneen pandemiaksi. Pari päivää myöhemmin kahdentoista maan tieteestä vastaavat johtajat vetosivat tieteellisiin kustantajiin, jotta kaikki koronavirukseen liittyvä tutkimus avattaisiin, datatieteen menetelmät huomioiden (mm. koneluettavuus, lisensointi). Pandemiajulistuksen ja tiedejohtajien vetoomuksen jälkeen 16. maaliskuuta yli 30 kustantajaa kertoi avaavansa koronaan liittyvät julkaisunsa ja datansa. Avoimuudella jopa hieman kilpailtiin, esimerkiksi STM-kustantajat kertoivat paitsi tehostavansa arviointiprosessia myös tarjoavansa analysointivälineet vapaaseen käyttöön.

Nämä ovat olleet luontevia ja kannatettavia askelia maailmanlaajuisessa kriisissä, ja tehneet suuristakin kustantajista, kuten Elsevieristä, Springer Naturesta, Taylor & Francisistä ja Wileysta, hetkellisesti avoimen tieteen tukijoita. Pitkämuistisemmat kriitikot ovat tosin huomauttaneet, että suuria kustantajia ei näkynyt talkoissa aiempien epidemioiden, kuten ebolan tai zika-viruksen, aikana, vaikka vastaavia julkilausumia julkaistiin silloinkin. Ja tässä artikkelissa jätämme kokonaan käsittelemättä maksumuureihin liittyvän yleisemmän problematiikan.

Miten paljon tutkimusta pitäisi avata?

Kustantajien avatessa covid-19-aineistojaan on herännyt myös kysymys, millaisen tutkimuksen pitäisi olla avoimesti saatavilla tässä tilanteessa. Tutkija ja avoimen punctum books -kustantamon johtaja Vincent W.J. van Gerven Oei pohdiskeli asiaa blogikirjoituksessaan:

”The Wellcome Trust statement raises the fascinating question concerning what type of research is exactly “relevant” to the outbreak. As the outbreak of the COVID-19 pandemic is not only tied to the DNA of the SARS-CoV-2 virus, its protein structures, and the way interacts with the human body, but also the field of medicine, and therefore also healthcare, and healthcare funding, and health education, and thus also much broader questions of state organization, economic structures, educational resources – in brief, all the ways in which humans have ordered the world. If we want to come to a full understanding of the outbreak, all peer-reviewed research in medical, STEM, social science, and the humanities is potentially ’relevant’ and should therefore be made open. But that is certainly not how Elsevier c.s. see it.” (van Gerven Oei 19.3.2020)

Geoscience Communication -lehden pääkirjoituksessa näkökulmaa koronaan laajennettiin muun muassa ilmastotutkimuksen, geotieteiden, hydrogeologian ja geokemian piiriin. Myös käyttäytymistieteen datanäkökulma on nostettu esiin, koska ihmisten käyttäytyminen ei ole ollut vähäisin tekijä pandemian leviämisessä.

Van Gerven Oei esittää myös kysymyksen siitä, miten pitkään covid-19-tutkimuksen pitäisi olla avoimesti saatavilla – niin pitkään kuin on tarpeen vai niin pitkään kuin maailman huomio on taudin leviämisessä?

Poikkeustilan oikeuttaminen – eli avoin tieto päätöksenteossa

Tuomas Aivelon tviitti 1.4.2020.

Valtiot ovat ryhtyneet poikkeuksellisiin toimiin koronapandemian rajoittamiseksi. Samalla on herännyt kysymys päätöksenteon avoimuudesta, siitä, millaiseen tietoon poikkeukselliset koronatoimet perustuvat. Kiinan kohdalla on kerrottu tietojen panttaamisesta alkuvaiheessa, Yhdysvalloissa tietoa koronatilanteesta on piiloteltu, Suomessa on ruodittu THL:n arvioita taudin etenemisestä – ja ihmetelty Ruotsin toimia. Päätöksenteon avoimuus ja läpinäkyvyys on nostettu myös tieteen näkökulmasta esiin; Nature-lehden pääkirjoituksessa tarkasteltiin Ison-Britannian erilaista strategiaa koronatoimissa:

”[T]he evidence behind this approach was not revealed. Not unexpectedly, the approach was questioned by scientists, including epidemiologists and other infectious-disease specialists, and is no longer part of UK policy. Researchers understand that sudden changes in policy will be necessary in a rapidly evolving situation in which there are many unknowns. But governments risk losing their trust by announcing those policies before the underlying data, models and assumptions have been released. – – Politicians and their science advisers need to get with the times and embrace open research.” (Nature 17.3.2020)

Kiinnostavan käytännön esimerkin avoimuudesta tarjosi Lontoon Imperial Collegen professori Neil Ferguson, joka taustoitti Twitterissä Ison-Britannian strategian ja lukujen taustalla olevaa, pandemian etenemistä kuvaavaa koodia. Samalla hän tuli kertoneeksi, että koodia ei oltu kuvattu ja dokumentoitu, vaikka oli kulunut 13 vuotta sen kehittämisestä. Koodia ei oltu myöskään avattu, vaikka se oli julkisrahoitteisesti tuotettu. Nämä luultavasti tavanomaiset toimintatavat näyttivät akuutin koronakriisin valossa ongelmallisilta.

Avoimuuden konkreettisia vaikutuksia

Pandemian aikana tieteen avoimuus on osoittanut merkityksensä ja hyötynsä käytännössä. Avoimen tieteen perusmantra nopeudesta, hinnasta, saatavuudesta, laadusta, tehokkuudesta ja vaikuttavuudesta tuntuu pätevän poikkeusoloissa varsin hyvin:

”Open science aims to share scientific information almost in real time online and free of charge to the user by providing free access to research publications and open access to scientific data. Open Science increases the quality and impact of science by placing all information in one, easy access area. This can make science more efficient through better sharing of resources, more reliable through better verification and more responsive to society’s needs.” (EOSC Secretariat 23.3.2020)

Tiedeyhteisön yhteistyö ja tiedon avoin jakaminen on tarkoittanut parempaa tutkimusta, johon sisältyy tulosten varmistaminen ja virheiden havaitseminen. Viruksen koko genomi eli perimäaines kuvattiin jo tammikuussa, ja se laitettiin vapaasti saataville GenBankiin. Testikehitys on ollut nopeata, kun perimä tunnettiin. Samalla myös lääketutkimus ja rokotekehittely pääsivät käyntiin. Vaikka rokotteen kehittämiseen kuluu kuukausia, lääkkeen arvioidaan syntyvän ennätysajassa.

Menestystarinoiden ohella on myös muistutettu, että tieteellisen tiedon karttumisen näkökulmasta myös epäonnistuneet kokeet ja menetelmät kuuluvat tieteen avoimuuteen, sillä ne voivat lisätä tietoa kompleksisesta ilmiöstä:

”To speed up research, it’s also crucial to share things that don’t work, [Dave] O’Connor [Wisconsin National Primate Research Centerin tutkija] says – for instance, when experiments show an animal species can’t be infected with the novel virus. ’That’s important information that is not typically shared through traditional channels,’ he says – – .” (Science 26.2.2020)

Avoimuus edellyttää vastuullisuutta

Tutkimusinfrastruktuurit tukevat avoimen tieteen toteuttamista, mutta avoimuus edellyttää myös vastuullisuutta ja hyvän tieteellisen käytännön noudattamista. Avoimuuden pelisääntöjen ja arkisten toimintatapojen – kuten vaikkapa datan kuvailemisen ja siihen viittaamisen – on oltava selkeitä, koska kilpailun säännötkin ovat yhä voimassa.

”When information can be misused, skewed or misinterpreted at the global level so quickly, we also need scientists and the public to treat open science with great care and responsibility. Without care and responsibility, there is a danger that open science can contribute to the spread of misinformation.” (EOSC Secretariat 23.3.2020)

Kyse ei ole vain tutkijoista. Esimerkiksi kysymys pre-printtien luonteesta on noussut pandemian aikana esiin. Tutkijoiden ohella tieteellistä tietoa ovat olleet kärkkymässä myös muut toimijat, joille tieteellisen kommunikaation käytänteet eivät välttämättä ole tuttuja. Tunnettu esimerkki on bioRxivissa julkaistu pre-print-artikkeli, jonka mukaan SARS-CoV-2-viruksen DNA:ssa oli samankaltaisuuksia AIDS-taudin aiheuttavaan HI-virukseen. Tulos sai bioRxivissa parissa vuorokaudessa kymmenittäin kriittisiä kommentteja ja tutkimusyhteisö hylkäsi tuloksen nopeasti – myös vertaisarvioidun tutkimuksen muodossa. Leviämään lähtenyt väärä tutkimustulos ei kuitenkaan maailmasta helposti katoa, ja Altmetric-verkkopalvelun vertailussa BioRxivista nyt poistettu pre-print-artikkeli on ehtinyt kerätä yli 20 000 mainintaa enemmän kuin sen tulokset hylkäävä vertaisarvioitu tutkimus. Koronapandemian aikana huhuja ja salaliittoteorioita on levitetty myös aivan tarkoituksella. Tällaisen hälyn määrä tieteellisessä kommunikaatiossa sai tutkijat laatimaan vetoomuksen sen hillitsemiseksi.

Muuttuuko tiede ja mihin suuntaan?

Avointa tiedettä tukevien tutkimusinfrastruktuurien merkitys on kasvanut pandemian myötä. Se on nostanut esiin pysyvän avoimuuden asialla olevia rahoittajia ja hankkeita. Mutta kuten jo Plan S -suunnitelmaa laadittaessa. huomattiin, avoimen tieteen infrastruktuuri ei ole valmis. Sitä on yhä rakennettava; tämä on huomioitu myös Helsingin yliopiston strategiassa. Eräs viime vuosien suurisuuntaisimmista avoimen tieteen infrastruktuurihankkeista on ollut eurooppalainen avoimen tieteen EOSC (European Open Science Cloud), jonka tavoitteena on tieteen avaaminen palveluita ja erityisesti palveluiden välistä yhteensopivuutta kehittämällä.

”The goal of EOSC is to open up all scientific data and publications and combine the results to drive new discoveries and tackle key societal challenges. EOSC is an ideal tool to respond to public emergencies such as the COVID-19 virus by opening up scientific data on the virus and sharing live on-the-ground data on the spread of the virus.” (EOSC Secretariat 23.3.2020)

Entä tutkimuksen ja julkaisemisen kulttuuri? Jos ja kun tieteellisen tiedon avoimuus ja avoimen tieteen käytännöt ovat osoittaneet merkityksensä kriisitilanteessa, seuraako siitä jotain pysyvää – tai jopa: onko vanhaan enää paluuta? Tätä on kysytty. Myös moni kotiinsa eristetty tutkija tai opiskelija on saattanut havahtua siihen, että valtaosa tieteellisestä tiedosta ei ole avoimesti saatavilla, vaikka avoimen tiedon kanavia löytyykin.

Aika näyttää, mitä tapahtuu – siihen asti voidaan visioida vaikkapa tutkija Benedikt Fecherin tavoin, miten viruspandemia edistää uuden ja paremman tutkimuskulttuurin luomista:

”And as serious as the situation is, when the crisis is over and its history is being written, COVID-19 could go down as a turning point for open science and purposeful science communication. And it could awaken our dormant institutions from their slumber and prompt a long overdue change. The questions that spring to mind are the following: how can we strengthen problem-oriented, interdisciplinary research? What could open and innovative publication forums that go beyond disciplinary closed access journals look like? How can we design effective forms of evaluation that interfere as little as possible with researchers’ work and the natural flow of knowledge? How can we foster meaningful science communication? What can research funding agencies, economic policy and science management do to ensure that complexity is reflected in the social order of science?” (Fecher 17.3.2020)