Miksi koronaepidemiaa kuvaavia lukuja käytetään, vaikka niihin ei voi luottaa?

Kun A-studion Katri Makkonen grillasi pääministeri Marinia koronarajoitusten lieventämispäätöksen jälkeen, hän tivasi päätöksen perustana olevia lukuja. Kun Marinin vastauksessa vilahti maininta R0-luvusta, Makkonen kysyi, mikä on se raja-arvo, mitä korkeammalle se ei saa nousta. Edellä kuvattu liittyy koronaepidemiaan, mutta se voisi olla osa mitä tahansa poliittista keskustelua. Eikä vain poliittista. Oli sitten kyseessä arkinen ostospäätös tai tieteellinen artikkeli, johtopäätösten tekemiseen tarvitaan lukuja. Ne ohjaavat maagisella tavalla ajatteluamme, vaikka tiedämme, että niihin ei voi luottaa. Ne ovat meille faktoja, vaikka ne ovat harvoin totta.

Koronaepidemian vaatimien toimenpiteiden tueksi tarjotaan usein juuri tuota R0-lukua, koska sen uskotaan kuvastavan parhaiten tartuntojen kehityskulkua. Se yksinkertainen ja uskottava, kertoohan se, kuinka monta muuta ihmistä yksi tartunnan saanut tartuttaa keskimäärin. Jos luku on yli yhden, tartuntojen määrä on nousussa, kun se on alle yhden, se on laskussa. Siis todella selkeä indikaattori kuvaamaan taudin kehitystä. Ei ihme, että se vilahti myös hallituksen perusteissa, kun se lähti purkamaan rajoituksia.

Ikävä kyllä näppärä tapa laskea yhteen lukuja ja jakaa niitä keskenään ei muuta sitä tosiasiaa, että luku on vain näennäisen tarkka, koska kaavaan heitettävät pohjaluvut tartuntojen määristä ovat karkeita arvioita. Tästä saatiin osviittaa jo epidemian alkuvaiheessa, kun näytti siltä, että tauti on jostain kumman syystä levinnyt nopeasti Euroopan pienimmissä maissa, kuten Islannissa, Färsaarilla ja Andorrassa. Kun sitten ruvettiin julkaisemaan myös suoritettujen testien määriä, totuus paljastui: näissä maissa oli todettuja tautitapauksia paljon sen vuoksi, että niissä testejä oli tehty ripeästi suurelle joukolle kansalaisia.

Aluksi Suomessa arveltiin, että taudin sairastaneita on ”20-30 kertaa enemmän” kuin testeillä todennettuja tartuntoja. Nyt on kuitenkin käynyt ilmi, että – jos vasta-ainetesteihin on luottamista – heitä on merkittävästi vähemmän. Loppupäätelmä siis on: riippumatta R0-luvun nerokkuudesta taudin kehityksen kuvaajana, se antaa kovin epätarkan kuvan todellisuudesta, koska epäluotettavat luvut eivät muutu luotettavaksi, kun ne sijoitetaan johonkin kaavaan. R0-lukua voidaan luotettavasti käyttää vain kuvaamaan taudin kehitystä maan sisällä – edellyttäen että pohjalukujen laskennallinen tarkkuus on pysynyt samana. Kahden maan vertailussa luvussa on todennäköisesti jo niin paljon klappia, että niiden vertailu ei ole mielekästä.

Kuolleisuusluvut nyt ainakin ovat tarkkoja. Toki jossakin Kiinassa ja Venäjällä niitä voidaan vääristellä, mutta ei Suomessa. Näin me kuvittelimme. Aluksi, kunnes saimme kuulla, että eri puolilla Suomea koronan piikkiin oli kirjattu kuolleita eri perustein. Tämä ei sinänsä ole ihme, koska kuolinsyyn määrittely ei ole yksiselitteistä. Tässä tapauksessa tilasto-ongelman muodosti varmuus koronaviruksesta. Toisen tulkinnan mukaan kuolinsyynä oli korona, vaikka keuhkokuumeeseen kuolleelle ei oltu tehty virustestiä. Toinen tulkinta taas otti mukaan vain varmennetut tapaukset.

Jos siis Suomessa kuolleitten kirjaaminen ei ole ollut yksiselitteitä, niin miten se voi olla maailmanlaajuisesti? Tähän vetosivat myös belgialaiset, kun heillä oli paljon enemmän kuolemantapauksia kuin rakkaassa naapurissa Hollannissa. Belgialaiset selittivät syyksi sen, että heillä lasketaan mukaan myös hoivakodeissa kuolleet, kun taas Hollannissa kirjatuiksi tulevat vain sairaalassa menehtyneet. En tiedä, pitääkö väite paikkansa, mutta se kuvastaa hyvin sitä, kuinka isoja eroja voi olla tavassa tilastoida koronaan menehtyneitä.

Absoluuttiset luvut ovat selkeitä, suhdelukuja on vaikeampia ymmärtää. Selittääkö tämä median tavan uutisoida koronatartuntojen ja kuolemien määristä. Jatkuvasti kerrotaan, että Etelä-Amerikan maista Brasiliassa tilanne on kaikkein pahin. Toki siellä on paljon tartunnan saaneita ja menehtyneitä – koska se on niin valtava maa asukasluvultaan. Tautitilanteen vakavuudesta eivät kuitenkaan kerro kokonaismäärät vaan se, kuinka suuri osa väestöstä on saanut tartunnan tai kuollut koronaan. Näin laskettuna menehtyneitä on Ecuadorissa merkittävästi enemmän kuin Brasiliassa. Euroopassakin uutistulvassa on jäänyt melkein huomiotta, että suhteellisesti laskettuna eniten kuolintapauksia on Belgiassa,

Faktat sinällään eivät ohjaa ihmisen toimintaa, vaan niiden pohjalta syntyvät mielikuvat. Sen vuoksi lukujen esitystavalla on merkitystä, kuten Kahneman ja monet muut tutkijat ovat osoittaneet. Jos haluamme, että kansa havahtuu toimimaan uudella tavalla, sille on kerrottava, että tartunnan saaneista viisi prosenttia kuolee. Jos taas tavoitteena on ihmisten rauhoittaminen, heille pitää sanoa, että tartunnan saaneista 95 prosenttia selviytyy. Otsikot tunnetusti pistävät lukijan aivot jo tiettyyn odotustilaan. THL otsikoi hiljattain tiedotteensa ”Koronavirukseen menehtyneistä lähes 90 prosenttia on yli 70-vuotiaita”. Toinen yhtä totuudenmukainen otsikko ”Koronaviruksen on kuollut jo yli 25 alle 70-vuotiasta” olisi antanut hyvin erilaisen mielikuvan asiasta.

Se, että THL julkaisee sivullaan lukujen taustat ja myös niihin liittyvät epävarmuudet, ei vähennä ihmisten uskoa niihin, koska meihin on sisään rakennettu usko lukuihin. Ne ovat kouriintuntuvia ja selkeitä. Hetken voimme tajuta niiden epätarkkuuden, mutta kun aivomme alkavat työstää asioiden syitä ja seurauksia, ne käyvät faktoista. Ne ovat kättä pidempää johtopäätösten raaka-ainetta, jollaiseksi epämääräiset ”ehkä”, ”näyttää siltä että” -totuudet eivät kelpaa. Tähän sorrun itsekin joka ilta, kun silmäilen erilaisten nettisivustojen tarjoamia tilastoja eri maiden epidemiatilanteesta. Aivoni poimivat niitä lukuja, jotka tiedän epäluotettaviksi. Mutta hetken päästä huomaan vertaavani niitä ikään kuin ne olisivat totta.

Lukujen tenhovoima ulottuu omiin tutkimuksiinikin. Kun olen tutkinut väärinymmärtämisen syitä, olen havainnut yhdeksi merkittäväksi tekijäksi sen yksinkertaisen seikan, että ihmiset eivät useinkaan keskity vuorovaikutustilanteeseen. Kuulijana ajatuksemme harhailevat muualla ja puhujan roolissa emme mieti, miten puheemme menee perille. Olin riemuissani, kun löysin tutkimustuloksen, joka osoitti, että ihminen on vain 46,9 prosenttisesti läsnä siinä tilanteessa, jossa on ulkoisesti. Tutkimusmetodi oli mielenkiintoinen, mutta siihen liittyi runsaasti virhelähteitä. Siitä huolimatta siteeraan tutkimusta ja muutenkin levitän tätä lukua muille ihmisille – niin kuin tässä, vaikka tiedän, että kyseinen luku ei ole missään nimessä tarkka eikä kovin luotettavakaan.

2 thoughts on “Miksi koronaepidemiaa kuvaavia lukuja käytetään, vaikka niihin ei voi luottaa?

  1. Niinhän sitä sanotaan valhe, emävalhe, tilasto. Taitaa pitää aika hyvin paikkansa.
    ”Tutkimuksissa” luvut kuvataan monella desimaalilla, ikäänkuin se lisäisi niiden uskottavuutta ja absoluuttisuutta.. Itse käytit vain yhtä desimaalia 46,9 %, millä ihmeellä se on noin tarkasti mitattu. Onko olemassa joku ”läsnäololämpömittari”, josta saa edellämainitun lukeman.
    Yleensäkin ihmistieteissä mittarit ovat aika epäluotettavia. Ehkä se on syy, miksi tulokset ilmoitetaan suurella matemaattisella tarkkuudella hämäyksen vuoksi.

  2. Tuo luku perustuu Harvardin yliopiston tutkijoiden Killingsworthin ja Glbertin Sciencessa julkaistuu artikkeliin. Voidaan aiheellisesti kysyä, millä ihmeellä se on laskettu. Laskutapa itsessään antaa tarkan tuloksen, mutta itse metodi sisältää paljon subjektiivisia elementtejä.

Vastaa

Sähköpostiosoitettasi ei julkaista. Pakolliset kentät on merkitty *