Luottamusväleistä

Luottamusvälit, maailman yksinkertaisin asia! Niiden avulla ilmaistaan sitä tarkkuutta, jolla piste-estimaatin arvo on saatu laskettua. Mutta käytäpä pieni hetki vastaamalla kysymykseen: “miten 95 %:n luottamusväli määritellään?”

Jos vastasit: “95 %:n luottamusväli ilmaisee välin, jolla tuntemattoman populaatioparametrin arvo sijaitsee 95 %:n todennäköisyydellä”, teit yleisen tulkintavirheen, mutta ei hätää! Tämä ei ole tilastotieteen koe. Frekeventistisen tilastotieteen käsitteet vain ovat usein monimutkaisia, eikä luottamusvälin käsite ole poikkeus.

Luottamusvälit saavat oikean merkityksensä vasta, kun samaa koetta toistetaan useita kertoja. 95 %:n luottamusväli tarkoittaa väliä, joka peittää tuntemattoman populaatioparametrin arvon 95 %:ssa tapauksista koetta toistettaessa. Koska emme tiedä, minkä luottamusvälin äärettömästä sarjasta olemme juuri tässä kokeessa poimineet, edellä esittämäni yleinen tulkinta on virheellinen.

Mietitkö nyt: “Olkoon, ehkä on noin, mutta käytännössä asialla ei ole väliä: SPSS kertoo kätevästi luottamusvälit, ja viivat on helppo piirtää Excelissä kohdilleen”? Hyvä, mietitään käytäntöä, ja erityisesti keskiarvoon liittyvien luottamusvälien visuaalisen esittämisen tapoja. Tähän hyvä apu on Cummins & Finchin paperi, jonka olennaiset pointit olen tiivistänyt seuraavaan.

1. ohje: Lukiessasi tiedeartikkelia, mieti, mitä virhepalkit kuvaavat. Onko kyse luottamusväleistä ensinkään, vai onko palkkien avulla kuvattu keskivirheitä tai peräti keskihajontoja? Millaista koeasetelmaa on käytetty – ovatko mittaukset esimerkiksi riippuvia vai riippumattomia toisistaan? Mikä vertailu on erityisen kiinnostuksen kohteena, ja miten tämä liittyy esitettyihin keskiarvoihin ja luottamusväleihin? Jos esimerkiksi kiinnostuksen kohteena on parittainen vertailu samojen koehenkilöiden kahden mittauskerran tulosten välillä, ei keskiarvojen itsensä ympärille piirretyillä luottamusväleillä ole paljon virkaa: tällöin havainnollisempaa olisi esittää kuvan avulla vaikkapa keskiarvojen erotus luottamusväleineen.

2. ohje: Pidä mielessä, että havaitsemasi luottamusväli tulkitaan vain yhdeksi luottamusväliksi äärettömästä koetoistojen sarjasta! Jos siis teemme paljon kokeita tietystä aiheesta, ja raportoimme luottamusvälit rutiininomaisesti, voimme olettaa, että pitkässä juoksussa CIt tavoittavat tuntemattomat parametrien arvot. Miten sitten kuvata luottamusväliä sanallisesti artikkeleissa? Ehkä jotenkin seuraavasti: “Luottamusväli on joukko uskottavia arvoja tuntemattoman populaatioparametrin arvolle. Luottamusvälin ulkopuolelle jäävät arvot ovat melko epäuskottavia” tai “Aineistomme sopii yhteen sen ajatuksen kanssa, että tuntematon populaatioparametrin arvo on missä tahansa luottamusvälillä, mutta melko huonosti yhteen sen ajatuksen kanssa, että parametrin arvo on luottamusvälin ulkopuolella”.  Toki nämä kuvaukset ovat välttämättä hiukan epämääräisiä – jos keksit paremman, ehdota!

3. ohje: Vielä muutama sana luottamusväleistä parittaisten vertailujen tapauksessa. Kuten sanottua, tässä tilanteessa tarvitaan erotusten keskiarvon luottamusväli, ja siihen liittyvä virhemarginaali riippuu laskennassa käytettävien keskiarvojen välisestä korrelaatioista. Korkea korrelaatio kaventaa erotuksen luottamusväliä, joka lasketaan parittaiset, jossa w-termit ovat luottamusvälien leveyksiä (virhemarginaaleja) tilanteissa A ja B, ja r viittaa Pearsonin korrelaatiokertoimen arvoon mittaustulosten välillä. Kaava osoittaa, että positiivinen korrelaatio johtaa kapeaan luottamusväliin, ja negatiivinen korrelaatio (jos sellainen jossain tapauksessa esiintyisi, mikä on epätodennäköistä) leveään luottamusväliin. Näin ollen korrelaation suuruudesta riippuen erotuksen luottamusväli voi olla melkein mitä tahansa käytännössä nollasta n. tuplasti kummankaan yksittäisen keskiarvon virhemarginaalin leveyteen nähden. Tästä syystä keskiarvojen luottamusvälien piirtäminen itsessään ei auta päätelmien teossa parittaisten vertailujen tapauksessa. Sen sijaan, jos jotain luottamusvälejä halutaan piirtää, niin kahden keskiarvon erotus ja erotuksen luottamusväli on hyvä ehdokas: tällaisesta kuvasta näkee, onko erotuksen arvo nollahypoteesin mukainen (erotuksen arvo “0” luottamusvälillä) vai ei.

Mihin toistomittausasetelman keskiarvojen luottamusvälejä sitten voisi käyttää? Ne kertovat vain between-subjects -eroista, eli esimerkiksi koe- ja kontrolliryhmän eroista jossain tietyssä koetilanteessa. Jos kiinnostuksen kohteena ovat koe- tai kontrolliryhmän sisäiset vertailut, niistä voi olla jopa enemmän haittaa kuin hyötyä.

4. ohje: Luottamusvälien tulkinnassa kannattaa pitää mielessä, että niitä muodostettaessa ei sovelleta minkäänlaista monen vertailun korjausta (kuten Bonferroni-korjaus), joten ne kertovat hiukan erilaista tarinaa kuin korjatut p-arvot.

Tämä luottamusväleistä tältä erää. Huomasitko virheitä tai epätäsmällisyyksiä? Jätä kommentti, korjaan virheet ja arvostan keskustelua aiheesta!

Leave a Reply

Your email address will not be published. Required fields are marked *