Vale, emävale, tilasto?

Jari Lipsanen, psykometriikan yliopisto-opettaja

”Vale, emävale, tilasto” – lausahdus, jonka Mark Twain popularisoi teoksessaan Chapters from My Autobiography jo vuonna 1907, on ollut viimeisten vuosien aikana ehkä enemmän ihmisten huulilla kuin aikaisemmin. Yhdysvalloissa erilaiset salaliittoteoriat ovat nousseet esiin haastamaan tieteellistä tietoa.

Terveyden ja hyvinvoinnin puolella erilaiset ”someinfluensserit” ovat nousseet merkittäviksi viestijöiksi sekä hyvässä että osin pahassa. Professori Anu-Katriina Pesonen kirjoitti omassa ajankohtaisessa Viikon jutussaan salaliittoteorioiden psykologiasta.

Vähemmän kuitenkaan on pohdittu tutkimuksen ja tieteen popularisointiin liittyviä tilastollisia näkökulmia.

Mikä on sattuman rooli tieteessä?

Olen valmis uskomaan, että sattuma on yksi maailman vaikuttavampia ilmiöitä. Vaikka emme lähtisikään pohtimaan sattumaa kausaalisesti esimerkiksi kaaosteorian pohjalta, on syytä pohtia, mikä on sen rooli tieteessä ja erityisesti tilastollisessa tutkimuksessa. Suurin osa on varmasti kuullut yleisimmät kritiikit tilastollista tutkimusta vastaan. Esimerkiksi tiedämme varsin hyvin, että keskimääräistä ihmistä ei ole olemassa. Keskiarvo on muutenkin varsin huono tunnusluku kuvaamaan yleisesti mitään: ”Jos pää uunissa ja jalat pakastimessa ei ole keskimäärin hyvä olla”, sanotaan.

Suurin osa tuntee myös sen, että korrelaatio ei kuvaa kausaalisuutta. Esimerkiksi ”Jäätelön syönti ja hukkumiskuolemat” -tapauksessa havainnollisesti todetaan jäätelönkulutuksen ja hukkumiskuolemien lukumäärän korreloivan keskenään, mutta taustalla vaikuttava tekijä onkin lämmin kesä, joka vaikuttaa molempiin.

Vaikkei näiden esimerkkien oikeellisuutta ole syytä kiistää, niin tilastollisen tiedon arvioinnissa on kuitenkin syytä päästä syvemmälle. Tilastollisessa tutkimuksessa kiinnostuksen kohteena on, tai ainakin pitäisi olla, hyvin harvoin yksittäinen tunnusluku, kuten keskiarvo tai korrelaatio. Keskeistä on ilmiössä tapahtuvan vaihtelun mallintaminen ja systemaattisen ja satunnaisvaihtelun erottaminen toisistaan. Voikin sanoa, että jos tilastotieteessä pitäisi valita yksi tunnusluku, joka olisi tärkeämpi kuin jokin muu, niin ainakin oma valinta osuisi varianssiin, joka kuvaa tietyssä aineistossa olevaa vaihtelua.

Popularisoinnissa voi unohtua satunnaisuuden voima

Tutkijoina ja tieteentekijöinä me yliopistolaiset luonnollisesti luotamme tutkittuun tietoon. Tiedämme varsin hyvin, että ihmisen oma kokemus on altis kaikenlaisille virhepäätelmille, joita kutsutaan myös kognitiivisiksi vinoumiksi.

Uskon, että me ihmiset tyypillisesti haluamme nähdä systematiikkaa ja tarkoitusta kaaoksessa. Haluamme löytää merkityksiä ja syy-seuraussuhteita tapahtumista, jotka kuuluvat normaalivaihteluun ja joissa tilastollinen tarkastelu suurella todennäköisyydellä paljastaisi ilmiön todellisen luonteen.

Tämän takia en itse ole kovinkaan yllättynyt siitä, miten syvälle ei-tieteellinen tieto on elämässämme juurtunut. Me tutkijoina työskentelevät pyrimme taistelemaan tätä vastaan popularisoimalla tiedettä, mutta välillä ainakin itselleni on noussut huoli, pahentaako se vain ongelmaa, sillä popularisoinnissa joskus päteviltäkin tutkijoilta unohtuu juuri satunnaisuuden voima.

Yksittäinen tutkimus on vasta hyvä alku

Ihmistieteitä, erityisesti psykologiaa, on viimeisen vuosikymmenen ajan puhuttanut paljon niin sanottu replikaatiokriisi, sillä useaa arvostettuakaan tutkimusta ei ole saatu toistettua, eli replikoitua. Vaikka kohun keskellä on ollut psykologia, niin samanlaisia havaintoja on tehty myös lääketieteessä.

Tällainen keskustelu on omiaan herättämään ajatuksen: eikö tiede lopulta olekaan niin luotettavaa, kuin tutkijat väittävät?

Vaikka ensimmäinen ajatus saattaa hyvinkin olla, että replikaatiokriisi on esimerkki tieteen ongelmista, niin lopulta ainakin itse näen sen pikemminkin osoituksena tieteellisen prosessin toimivuudesta. Juuri toistettavuus ja kriittisyys myös omia tuloksia kohtaan on tieteen keskeisin ominaisuus, joka erottaa tieteellisen tiedon muista tietolähteistä. Tätä näkökulmaa valitettavan vähän kuitenkaan edes tutkijat itse tuovat esiin.

Jo aiemmin mainittu tarve tieteen popularisoinnille typistyy valitettavan usein yksittäisen viimeisimmän tutkimustuloksen esittelyksi. Kuitenkin tuntien sattuman voiman ja kaikki mahdolliset virhelähteet, joita tutkimusprosessin aikana voi tapahtua, on pakko tunnustaa, että lähtökohtaisesti yksittäinen tutkimus on vasta hyvä alku, ei lopullinen todiste jollekin asialle. Juuri tämän takia olisinkin syytä myös popularisoinnissa korostaa koeteltua tieteellistä tietoa, ei yksittäisiä tutkimuksia, jotka tällä hetkellä vaikuttavat olevan huomion keskipisteenä.

Tällaiselle fokuksen siirrolle on myös tilastollisesti erittäin vahvat perustelut, sillä lähtökohtaisesti tilastollisen tutkimuksen piirissä ei ole olemassa mitään menetelmää, jonka avulla voitaisiin 100 prosentin varmuudella varmistaa, että yksittäisen tutkimuksen tulos on totta. Kuitenkin tutkimukset antavat viitteitä siihen, että asiantuntijat pystyvät arvioimaan varsin hyvin, onko tietyn tutkimuksen tulos sellainen, että sen tulos on pysyvä ja toistettava. Joskin myös niin sanotut maallikot ovat tutkimuksissa päässeet vastaavissa arvioinneissa sattumaa parempiin tuloksiin, vaikka oikein osumisen suhteellinen osuus olikin selkeästi heikompi asiantuntijoihin verrattuna. Luonnollisesti vaikka nämäkin tulokset vaativat vielä replikoitumista, antavat ne kuitenkin suuntaa sen suhteen, miten uusia tutkimustuloksia mahdollisesti tulisi julkisuudessa arvioida.

Koronan myllertäessä tutkimusperusteisille päätöksille on ollut vahva tarve

Viimeisen vuoden aikana koronaepidemian myllertäessä ympäri maailmaa tutkimukselle on tullut aivan erilainen tilaus. Tutkimusperusteisia päätöksille on ollut vahva poliittinen tarve, ja nämä päätökset ovat vaikuttaneet voimakkaasti ihmisten arkipäiväiseen elämään. Tutkimuksia on myös tuotettu aihepiiriin liittyen enemmän kuin koskaan, hyvin nopealla tahdilla.

On selvää, että luotettavuuden arviointiin liittyy paljon myös ilmiökohtaisia tekijöitä. Esimerkiksi useat viruksiin liittyvät tekijät ovat lähtökohtaisesti hyvin tunnettuja perusmekanismit somaattisella, eli elimellisellä puolella, tunnetaan jo varsin hyvin. Siksi lähtökohta on hyvä. Kuitenkin on paljon asioita, joissa erilaisia väliin tulevia tekijöitä on huomattava määrä.

Vuoden 2020 lopulla Saksassa julkaistiin tutkimus, jossa koronaviruksen leviämistä mallinnettiin konserttisalissa. Tulosten perusteella viruksen leviämistä saatiin ehkäistyä muun muassa tehostamalla ilmastointia. Toisaalta vastaavassa tutkimuksessa Ranskassa parhaaksi keinoksi viruksen leviämisen ehkäisemiksi osoittautuikin ilmastoinnin tehon vähentäminen puoleen. Kumpaa tulosta siis pitäisi uskoa? Ainakin näin tilastotieteilijänä ajattelen toistaiseksi vakuuttavamman hypoteesin olevan, että molemmat voivat olla oikein ja positiivinen asia on, että viruksen leviämistä voidaan ehkäistä. Kuitenkin mahdollisesti jokin tilaan vaikuttava tekijä muokkaa leviämistä niin voimakkaasti, että keinot voivat olla tilasta riippuen hyvinkin erilaiset, mikä luonnollisesti on huono uutinen.

Tämä osoittaa tieteen haasteet ja vaihtelun merkityksen myös tutkimustuloksia arvioitaessa. Ei siis ihme, että Nobel-palkinnot myönnetään keskimäärin tutkimuksille, jotka ovat julkaistu kaksikymmentä vuotta aikaisemmin. Näin niiden merkitys totuusarvo on koiteltu ja tieteen itseään korjaava mekanismi, joka on toimiva, mutta nykyisen hektisen some-maailman mittakaavassa lopulta varsin hidas, on päässyt vaikuttamaan. Ehkä paras ratkaisu olisikin maltti koitella tuloksia, mikä ehkä on varsinkin populaarimediassa hieman unohtunut.

Lisää pohdintaa tilastotieteen merkityksestä erityisesti ihmistieteissä psykologian opiskelijoiden ainejärjestö Kompleksi ry:n juuri alkaneessa podcastissa.

Jari Lipsanen
Psykometriikan yliopisto-opettaja, Helsingin yliopisto

 

Yksi ajatus artikkelista “Vale, emävale, tilasto?”

  1. Ellei jakautuma ole tasainen, niin yleensä keskiarvon tai mediaanin kohdalla havaintoja on enemmän kuin sen äääripäässä, miksi silloin ei voisi olla tai jopa ole, useammin keskimääräisiä yksilöitä kuin ääripään yksilöitä.

    Jos vaikkapa suomalaisen miesten keskipituus jonakin ajankohtana on 1.75345 metriä, niin eikö ole paljon todennäköisempää, että löytäisit aineistostasi jonkun mitatustarkkuuden puitteissa, sanotaan vaikka +/- 0.5 cm kuin jokun ääripäätä edustavan 2.15 tai tai 1.30 cm mittaisen miehen?

Kommentit on suljettu.