Pohdintaa länsi- ja itähaaran mallintamisesta

Pohdin aikaisemmin mallin kehittämisen näkökulmasta mahdollisuutta mallintaa erikseen joen länsi- ja itähaaraan päätyvien smolttien määrää. Tämä olisi hyödyllistä mikäli halutaan jatkossa selvittää esimerkiksi kuinka suuri osa smolteista joutuu länsihaaraan ja kuinka paljon voimalan läpi kulkeminen vaikuttaa niiden kuolleisuuteen. Olen nyt yrittänyt hieman hahmotella mitä tämänkaltainen mallinnus edellyttäisi. Ongelma ei sinänsä varmastikkaan olet teknisesti mitenkään hankala, mutta omalle hahmottamiselleni löytyy siitäkin runsaasti haastetta ja on siksi hyvää pohdintaa pelkästään oppimista ajatellen.

Tällä hetkellä vedessä on taas kaksi pyydystä, rysä ja smolttiruuvi. Ruuvi pyyntää joen itähaaraa, jossa siis kulkevat kalaportaat. Ruuvin sijainti on haarautumiskohdasta alavirtaan. Rysä on nyt siirretty pyytämään länsihaaraa, eli voimalan puolta, mutta se sijaitsee haarautumiskohdasta hieman ylävirtaan. Sijainnista johtuen ei voida olettaa varmasti, etteivät kalat voisi vielä rysän ohitettuaan siirtyä itähaaraan ja otaksuisin että voi olla jopa mahdollista smolttien ruuvin ohitettuaan palata vielä ylävirtaan ja mahdollisesti toiseen haaraan. Tämä varmasti lisää tuntematonta vaihtelua, mutta pohdintani oletuksena onkin nyt tilanne, jossa molemmat pyydykset sijaitsisivat selkeästi haarautumiskohdasta alavirtaan.

Millä tavalla tätä ongelmaa voitaisiin sitten mielestäni mallintaa?

Päivittäin vaeltavan smolttimäärän muutujan n[i]:n suhteen ei muutoksia tarvittaisi. Smoltteja saapuisi siis haarautumiskohtaan n[i]:n suuruinen määrä, jonka jälkeen ne valitsivat joko itäisen, tai läntisen haaran. Näille voisimme valita priorijakaumat tutkimuksen alussa tehdyn mandariinkokeen perusteella. Jakaumana käyttäsin tuttua beta-jakaumaa:

prob_w~dbeta(7,3)       #prioriodennäköisyys länsihaaran päätymiselle
prob_e~dbeta(3,7)       #prioritodennäköisyys itähaaraan päätymiselle

Nämä valitisin parametreiksi eri haaroihin päätyvien smolttien määrää kuvaavan binomijakaumaan:

nw[i]~dbin(prob_w, n[i])     #jakauma länsihaaraan matkaaville smolteille
ne <- n[i]-nw[i]                  #itähaaraan matkaavat smoltit

Saalis mallinnettaisiin molemmille haaroille erikseen binomijakaumana:

FykeX[i]~dbin(Fyke_q[i], nw[i])         #jakauma länsihaaraan saaliismäärälle
ScrewX[i]~dbin(Screw_q[i], nw[i])    #jakauma itähaaran saalismäärälle

Pyydystävyyden prioriarvoja pitäisi hiukan muuttaa. Rysälle prioritietoa mandariinikokeesta ei ole, ruuvin suhteen on huomiotava että nyt pyydystävyys mallintaisi vain itähaaran osuutta, ei smolttien kokonaismäärän pyydystävyyttä. Mandariinkokeen mukaan itähaaraan päätyi kaksi mandariinia, joista kaksi jäi pyydykseen:

q_S~dbeta (2,1)       #prioritodennäköisyys ruuvin pyydystävyydelle
q_F~dbeta (5,3)       #prioritodennäköisyys rysän pyydystävyydelle, mielivaltainen arvio

Näiden päivittäminen voisi tapahtua mielestäni samaan tapaan kuin ennenkin.

Priorien miettiminen on tässä tapauksessa suhteellisen helppoa. Itselleni alkoi tässä vaiheessa muodostua ongelmaksi juurikin ongelman laskennallinen ja looginen puoli. Itselleni on hankalaa hahmottaa jakaumien välillä tapahtuvia matemaattisia operaatiota ja yhdistää mallin osia loogisesti toisiinsa. Nyt minusta tuntuu, ettei malli näin päivitä ollenkaan eri haaroihin päätymismahdollisuuksien todennäköisyysjakaumia. Joudun vielä pohtimaan tarkemmin miten tämä tapahtuu. Myös kyseisten jakaumien suhteellisuus tulisi ottaa huomioon, kävisikö tämä vain jakamalla kukin molempien summalla? Näinkö saataisiin myös itähaaraan pyydystettävyys siirtymään posteriorijakaumiin?

Neuvot ovat tervetulleita!

Milloin malli on oikeasti valmis?

Olemme blogissa pohtineet paljon mallin kehittämiseen liittyviä kohtia, kuten lisäpyydyksen huomioimista ja vaelluspoikasten muuttointensiteetin mallintamista. Varovainen arvioni on, että kaikesta malliin liittyvästä epävarmuudesta huolimatta, olemme olleet tyytyväisiä sen kehittymiseen. Edelleen mielessämme on ollut useita parannusehdotuksia, kuten veden lämpötilan ja korkeuden sekä vaellusmatkan pituuden huomioiminen. Blogipohdinnat ovat siirtyneet enemmän päätöksentekoon liittyviin kysymyksiin, mutta palaan vielä hetkeksi takaisin mallintamisen maailmaan ja aiheeseen, joka on jäänyt itselleni hyvin epäselväksi, ja jota ei vielä ole nostettu blogissa tarkemmin esille: Milloin malli on oikeasti valmis?

Tutkijana painii jatkuvasti omaan työhön kohdistuvan epävarmuuden kanssa. Työstä pitäisi sanoa jotain konkreettista, mutta samalla joutuu tiedostamaan, että työhön liittyy enemmän tai vähemmän epävarmuutta. Kurssilla olen ensimmäistä kertaa harjoittelemassa todennäköisyysmallintamista, ja oppiminen on kohdistunut perusasioiden haltuun ottamiseen ja BUGS-ohjelman ymmärtämiseen. Bayes-maailma on minulle vielä hyvin uusi, mutta kurssin edetessä olen pohtinut, milloin mallin kehittäjä voi olla tyytyväinen aikaansaannokseensa ja valmis esittelemään sen yleisölle.

Biologina jotenkin kuvittelisi, että malli on valmis silloin, kun se kuvaa luonnossa tapahtuvia prosesseja parhaiten. Miten tämä voidaan varmistaa, onkin sitten toinen tarina. Tuleeko kaikki mahdolliset (ympäristö)tekijät olla mukana mallissa? Tilastotiedettä opiskelevat kurssikamut ovat kuitenkin saaneet minut pohtimaan asiaa toisesta näkökulmasta. Ehkä malli onkin valmis silloin, kun se on rakennettu ”oikein ja ammattitaidolla”. Aiemmissa blogipostauksissa on nostettu esiin myös asiantuntijatieto. Olettaen, että asiantuntijatieto on lähellä ”oikeaa totuutta”, onko valmis malli sellainen, joka vastaa asiantuntijan tietoa tai näkemystä?

Myönnettäköön, että kysymys on tällä erää ehkä lähinnä filosofinen, mutta käsitys kehitysprosessista kokonaisuutena on minulle vielä melko tuntematon. Varsinkin kun olemme jättämässä mallin kehittelyn, jotta voimme käsitellä päätösanalyysiä loppukurssin ajan. Pääsimmekö kunnolla edes vauhtiin vai raapaisimmeko vasta pintaa?

Mallipäivitys 13.5.

Viimeisimmät muutokset käytössä olevaan malliin

  • Vaihtoehtoisen smolttien lähtemistodennäköisyyden luonnetta kuvaavan Beta-jakaumamallin lisääminen
  • Mallitekniset muutokset pyydystettävyyden laskemisessa

Käytössä oleva mallimme perustuu pääpiirteittäin edelleen alkuperäiseen rakenteeseen ja eri malliversioiden yhdistämiseen BMA:ta hyödyntäen. Seuraavassa esitellään mallin eri osat ja tehdyt muutokset (kiitos Leolle selkeistä kommenteista BUGS-skriptissä!).

Vuosittainen kokonaisvaellusmäärä

Muuttavien smolttien kokonaismäärän (N) odotusarvon priorina käytössä on edelleen kolmen asiantuntijaarvion keskiarvo (2600), jonka on odotettu tulevan ainoastaan positiivisia arvoja tuottavasta katkaistusta, kokonaisluvuiksi pyöristetystä normaalijakaumasta.

N<-round(cN)

cN~dnorm(2600, prec_N)I(1,)

prec_N<-pow(sd_N, -2)

sd_N<-2000

Kokonaisvaellusmäärän priorin määrittelemiseksi voisi myös asiantuntijaarvioiden sijaan tai lisäksi hyödyntää tietoa edellisvuosina jokeen nousseiden meritaimenten määristä, joko laskemalla nousukkaiden smolttituotantopotentiaali mortaliteettitekijät huomioiden, tai takautuvasti merikuolleisuuden kautta arvioiden aikaisempien vuosien mereen päätyneiden smolttien määriä.

Lähtemistodennäköisyys

Muuttointensiteetin tai päivittäisen lähtemistodennäköisyyden (p) kuvaamiseksi on tähän mennessä käytetty kolmea eri todennäköisyysjakaumaa; tasajakauma, normaali ja log-normaali. Vaihtoehtoisia malleja on ajettu erikseen rinnakkain ja myöhemmin yhdistettynä mallikeskiarvoistamista (BMA) käyttäen. Nykyisessä mallissa näiden kolmen jakauman lisäksi neljäntenä vaihtoehtona on käytetty beta-jakaumaa. Beta-jakauma (Beta distribution – Wikipedia) on intervallille [0,1] määritelty, melko mukautuva todennäköisyysjakauma, jonka muodon määrittää tiheysfunktion alfa ja beta parametrit. Beta-jakauma sopii usein osuuksien sattumanvaraisen käytöksen mallintamiseen.

d1c8bb0654c111cd0a16d1aafd8b970a

Mallissa on tarkastelujakson jokaisen päivän (1,2,3,…60) huomioivan silmukan (“for-loop”) sisällä määritelty lähtemistodennäköisyys neljällä vaihtoehtoista muodolla( p[i,1], p[i,2], p[i,3] ja p[i,4]). Eri p-funktioiden indeksöinti (1–4 hakasulkeiden sisällä) tulee mallissa myöhemmin käyttöön, kun vaihtoehtoiset, ainoastaan muuttointensiteetin muodon määrittelyssä toisistaan eroavat neljä osamallia sisällytetään päämalliin. Kaikissa muissa p:n funktioissa, paitsi tasajakauma-muodossa, on käytetty yhteistä odotusarvon parametriä (myy_p), joka on määritelty skriptin lopussa yhdessä eri funktioden hajontaparametrien kanssa.

for(i in 1:60) {

# p tasajakaumalla

p[i,1]<-1/60

# p normaalijakaumalla

pl[i] <- exp(- pow((i-myy_p)/sd_p,2)*0.5)

p[i,2] <- pl[i] / sum(pl[1:60])

# p log-normaalijakaumalla

pn[i] <- (1/i)*exp(- pow(log(i)-location, 2) / scale)

p[i,3] <- pn[i] / sum(pn[1:60])

# p beta-jakaumalla

pbi[i]<-pow(i/60,myy_p*b_eta/60)*pow(1-i/60,(1-myy_p/60)*b_eta)

Koska yllä olevasta beta-jakauman funktiosta puuttuu normalisointivakio B (beta-funktio) nimittäjästä, varmistetaan että beta summautuu yhteen yli päivien, näin:

p[i,4]<-pbi[i]/sum(pbi[])

Lähtevien smolttien määrät

Seuraavaksi mallissa määritellään lähtevien smolttien päivittäiset (i) määrät (n) kokonaismäärästä (N) binomijakaumalla eri lähtemistodennäköisuusmalleille 1,2,3,4, ja varmistetaan, ettei päivittäiset lukumäärät ole nolla, koska se aiheuttaisi ongelmia kokonaispyydystettävyyn määrittelyssä käytettävässä binomijakaumassa.

n2[i]~dbin(p[i,model],N)

n[i]<-n2[i]+1

}

Saalis ja pyydystettävyys

Dataa on tähän mennessä kerätty kahdella eri pyyntivälineellä (smolttiruuvi ja rysä), ja niiden vaikutukset on huomioitu mallissa jo aikaisemmin. Ruuvi on ollut käytössä koko tarkasteluajan tähän asti kun taas rysä otettiin käyttöön vasta myöhemmin, jonka jälkeen se otettiin pois mutta on nyt taas pyynnissä. Periaate kahden eri välineen kokonaispyyntihehon laskemisessa on edelleen sama kuin aiemmin:

P(kala jää ruuviin TAI rysään) = P(kala jää rysään) + P(kala jää ruuviin) – P(kala jää ruuviin JA rysään)

Muutokset päivittäisen kokonaissaaliin ja pyydystettävyyden arvionnissa ovat malliteknisiä, tehden koodista elegantimman ja mallista mahdollisimman kevyen. Uuden rakenteen myötä myös datan taulukkomuoto on muuttunut, sisältäen seuraavat sarakkeet: ScrewX[] (ruuvin saalis), FykeX[] (rysän saalis), tagged[] (merkityt kalat), Screw_op[] (ruuvin käyttöstatus), Fyke_op[] (rysän käyttöstatus), ScrewR[] (ruuvin takaisinpyyntisaalis), FykeR[] (rysän takaisinpyyntisaalis) ja TotalX[] (kokonaissaalis). Mallissa on tarkasteluajan jokaisen tähänastisen ja seuraavan päivän (1,2,3,…days+1) huomioivan silmukan sisällä määritelty päivittäinen kokonaissaalis (TotalX[d]), päivittyvä kokonaispyyntiteho (Total_q[d]), ruuvin päivittäinen saalis (ScrewX[d]), ruuvin päivittyvä pyyntiteho (Screw_q[d]) ja rysän päivittyvä pyyntiteho (Fyke_q[d]) seuravanlaisesti:

for(d in 1:days+1) {

# Kaikkien havaittujen smolttien yhteenlaskettu määrä päivänä d noudattaa binomijakaumaa parametreilla kokonaispyydystettävyys (Total_q[d]), päivittäiset muuttavat smoltit (n[d])

TotalX[d]~dbin(Total_q[d],n[d])

Total_q[d]<-Screw_q[d]+Fyke_q[d]-Screw_q[d]*Fyke_q[d]

# Ruuvin havainnot noudattavat poisson -jakaumaa parametrilla odotusarvoiset lähtevät smoltit (binomijakaumalla tulee ongelmia, sillä päivittäiset lähtevät määrät saattavat saada arvoja nolla)

ScrewX[d]~dpois(screw_muX[d])

# Odotusarvoiset lähtevät smoltit päivänä d (screw_muX[d]) määrittyvät ruuvin suhteellisella teholla (Screwprop[d])*kuinka moni jää kaiken kaikkiaan kiinni (TotalX[d])

screw_muX[d] <- Screwprop[d]*TotalX[d]

#Ruuvin suhteellinen teho on ruuvin teho jaettuna kokonaisteholla (ruuvi JA rysä)

Screwprop[d]<-Screw_q[d]/Total_q[d]

# Ruuvin suhteellista tehoa päivitetään vain kun ruuvin on käytössä (indikaattorifunktio screw_op saa arvoja 0, kun ei käytössä, arvoja 1 kun käytössä)

Screw_q[d]<-q_S*Screw_op[d]

# Rysän pyydystettävyys päivittyy samalla indikaattorifunktion logiikalla

Fyke_q[d]<-q_F*Fyke_op[d]

# Priori määrälle merkittyjä kaloja (tämä on joku tekninen eli laskennallinen yksityiskohta)

tagged[d]~dbin(1,1000)

}

Seuravaksi mallissa määritellään, kuinka pyydystettävyys päivittyy uudelleenpyydettyjen havainnoilla. Päivät (d) kulkevat toisesta päivästä, koska vasta siitä lähtien on mahdollista pyydystää päivänä 1 merkitty kala.

for(d in 2:days+1) {

# Rysän uudelleenpyytämien kalojen havaintojakauma noudattaa binomijakaumaa parametreilla rysän pyyntiteho(Fyke_q[d]) , edellisenä päivänä merkityt kalat (tagged[d-1])

FykeR[d]~dbin(Fyke_q[d],tagged[d-1])

# Ruuviin voi periaatteessa jäädä kaikki ne kalat, jotka on edellisenä päivänä merkitty, mutta jotka eivät jääneet ruuviin

Screw_nR[d]<-tagged[d-1]-FykeR[d]

# Ruuvin pyydystettävyyden havaintojakauma noudattaa binomijakaumaa parametreilla ruuvin pyydystettävyys (Screw_q[d]), ja edellisessa kaavassa määritellyt mahdolliset määrät (Screw_nR[d])

ScrewR[d]~dbin(Screw_q[d],Screw_nR[d])

}

Rysän pyydystettävyyden prioria (q_F) muutettiin säilyttäen pseudohavaintojen suhteet. Arvoilla 1 ja 4 voidaan tehdä prioriarvio epävarmemmaksi siksi, ettei mandariinikoetta ole toistettu rysälle. Samat suhteet mallintavat kuitenkin ennakkokäsitystä, jonka mukaan rysä ja ruuvi pyydystävät yhtä hyvin. Tämän oletuksen uskottavuudesta voidaan kuitenkin olla eri mieltä, vaikka pyydysten ominaisuuksien eroja ei tiedetäkään, koska rysä pyydystää eri kohdassa jokea ruuviin verrattuna ja koska on epätodennäköistä että smoltit ovat tasaisesti jakautuneita koko virran leveydeltä jo mandariinikokeen tulostenkin perusteella.

q_F~dbeta(1,4)

q_S~dbeta(2,8)

Eri osamallejen sisällyttäminen ja mallikeskiarvoistaminen

Viimeisessä tätä edellisessä versiossa yhdistettiin jo eri lähtemistodennäköisyyksien määrittelemät osamallit yhdeksi malliksi Bayesilaisella mallikeskiarvoistamisella (BMA). Ainoa muutos tämän suhteen tähän malliin, on neljännen mallin, eli lähtemistodennäköisyyden beta-jakaumamallin lisääminen, joka tehtiin seuraavanlaisesti:

# Priori mallin BMA:lle

model~dcat(z[1:4])

# Tässä määritellään prioritodennäköisyys eri mallien totuudelle

z[1]<-1/4 # Tasajakaumamalli

z[2]<-1/4 # Normaalijakaumamalli

z[3]<-1/4 # Log-normaalijakaumamalli

z[4] <-1/4 # Beta-jakaumamalli

# Tästä saadan eri mallien posterioritodennäköisyydet

Z[1]<-equals(model, 1)

Z[2]<-equals(model, 2)

Z[3]<-equals(model, 3)

Z[4] <- equals(model,4)

Lähtemisintensiteettien priorit

myy_p~dnorm(25,tau_myy)I(0.01,)

tau_myy<-pow(7,-2)

sd_p~dnorm(10, tau_sd)I(0.01,)

tau_sd<-pow(5, -2)

scale <- log(1 + pow(sd_p/myy_p,2) )

location <- log(myy_p) -0.5*scale

b_eta~dunif(5,100)

}

Data

list(days=33)

ScrewX[] FykeX[] tagged[] Screw_op[] Fyke_op[] ScrewR[] FykeR[] TotalX[]

0 0 0 1 0 0 0 0

0 0 0 1 0 0 0 0

0 0 0 1 0 0 0 0

1 0 0 1 0 0 0 1

2 0 3 1 0 0 0 2

2 0 2 1 0 0 0 2

0 0 0 1 0 0 0 0

0 0 0 1 0 0 0 0

0 0 0 1 0 0 0 0

1 0 0 1 0 0 0 1

1 0 0 1 0 0 0 1

1 0 3 1 0 0 0 1

0 0 0 1 0 0 0 0

2 0 2 1 0 0 0 2

1 0 1 1 0 0 0 1

0 1 1 1 1 0 0 1

0 1 0 1 1 0 0 1

0 1 0 1 1 0 0 1

1 1 3 1 1 0 0 2

3 2 5 1 1 0 0 5

6 2 8 1 1 0 0 8

4 0 4 1 0 0 0 4

2 0 2 1 0 0 0 2

2 0 2 1 0 0 0 2

1 0 1 1 0 0 0 1

3 0 3 1 0 0 0 3

2 0 2 1 0 0 0 2

1 0 2 1 0 1 0 1

3 0 3 1 0 0 0 3

1 0 1 1 0 0 0 1

1 0 1 1 0 0 0 1

1 0 1 1 0 0 0 1

2 0 2 1 0 0 0 2

NA NA NA 1 1 NA NA NA

NA NA NA 1 1 NA NA NA

NA NA NA 1 1 NA NA NA

NA NA NA 1 1 NA NA NA

NA NA NA 1 1 NA NA NA

NA NA NA 1 1 NA NA NA

NA NA NA 1 1 NA NA NA

NA NA NA 1 1 NA NA NA

NA NA NA 1 1 NA NA NA

NA NA NA 1 1 NA NA NA

NA NA NA 1 1 NA NA NA

NA NA NA 1 1 NA NA NA

NA NA NA 1 1 NA NA NA

NA NA NA 1 1 NA NA NA

NA NA NA 1 1 NA NA NA

NA NA NA 1 1 NA NA NA

NA NA NA 1 1 NA NA NA

NA NA NA 1 1 NA NA NA

NA NA NA 1 1 NA NA NA

NA NA NA 1 1 NA NA NA

NA NA NA 1 1 NA NA NA

NA NA NA 1 1 NA NA NA

NA NA NA 1 1 NA NA NA

NA NA NA 1 1 NA NA NA

NA NA NA 1 1 NA NA NA

NA NA NA 1 1 NA NA NA

NA NA NA 1 1 NA NA NA

END

#BUGS:iin ladattavat eri mallien alkuarvot, hyvä käyttää eri alkuarvoja

list(model=1)

list(model=2)

list(model=3)

list(model=4)

Huomioita lopuksi

Vaikka mallin aktiivinen kehittäminen jäänee lähiaikoina hieman vähäisemmäksi, voisi tulevaisuudessa edelleen yrittää sisällyttää tietoa ympäristömuuttujista (lämpötila, vedenkorkeus, ym) ja niiden vaikutuksista, sekä vaellusmatkan pituudesta ja eri smolttituotantoalueiden (koskien) kapasiteetistä ja sijoittumisesta. Lähiaikoina jatkamme mallin sisällyttämisellä päätösanalyysiin, joka koskee kysymystä Vanhankaupunginkosken padon mahdollista purkamista.

 

Asiantuntijatiedon keräämisestä

Jatkan nyt edellisestä postauksestani, jossa mietin Bayes-mallintamista päätöksenteon työkaluna. Bayes-mallinnus on omiaan epävarmuuden ollessa tutkimuskohteen osalta suuri, ja jolloin asiantuntijatiedon rooli on tärkeä. Asiantuntijatietoa voidaan käyttää priorien määrittämiseen, mutta asiantuntijatiedon avulla voidaan myös paremmin hahmoittaa tutkimuksen aihetta sekä suurempia kokonaisuuksia ja kokonaiskuvaa (Uusitalo, 2007).

Kuvailenkin nyt lyhyesti ja pääpiirteittäin, miten asiantuntijatietoa voidaan kerätä. Alla oleva malli kuvaa hyvin yksinkertaisella tasolla asiantuntijatiedon keräämistä. Ensimmäinen askel on tietenkin taustatyö ja ongelmanasettelu, sekä itse asiantuntijoiden valitseminen. Onkin mielenkiintoista pohtia, kenet määritellään asiantuntijaksi? Omasta mielestäni asiantuntija voi olla kuka vaan, joka on jollain tasolla kyseessä olevaan asiaan linkittynyt: Vanhankaupunginkosken meritaimenen kohdalla asiantuntija voi olla niin kalastamisesta vastaava viranomainen, kuin vapaa-ajan kalastajakin. Asiantuntijan voisikin uudelleenmääritellä, ja mielestäni “asiantuntijan”  (expert) sijaan voisi olla hyödyllistä käyttää neutraalimpaa sanavalintaa, ”sidosryhmän jäsentä”(stakeholder), tai pelkästään ”tekijää” (actor).

elicit

Malli 1. Asiantuntijatiedon kerääminen. (O’Hagan et al., 2005).

Seuraava vaihe on itse haastattelu. Haastattelu painottaa asiantuntijan sen hetkistä tietoa aiheesta. Tutkijan roolina haastattelussa on lisätä sujuvuutta ja fasilitoida prosessia: tutkijan tulee valmistella haastateltavaa Bayes-mallintamisesta ja varmistaa, että haastateltava ymmärtää mallintamisen pääpiirteittäin. Jos näin ei tehdä, asiantuntija saattaa suhtautua epäluuloisesti mallintamiseen, eikä haastateltavan ja tutkijan välille synny jo tutkimuksenkin kannalta tärkeää luottamuksen tunnetta (Uusitalo, 2007). Eräänlaista koehaastattelua on hyvä harkita, jota voidaan sitten haastateltavien palautteen kautta muokata sujuvampaan ja ymmärrettävämpään muotoon. Haastattelu on myös hyvä videoida tai dokumentoida, jotta siihen voi palata tutkimuksen myöhemmissä vaiheissa. Haastateltavien mahdolliset henkilökohtaiset intressit tulee myös tiedostaa ja ottaa huomioon. (O’Hagan et al., 2005).

Kolmannessa vaihessa asiantuntijoiden antamat priorit ja arvot voidaan mukauttaa muiden asiantuntijoiden lausuntoihin sekä kerättyyn dataan. Tässä voidaan käyttää myös muissa blogipostauksissa viitattua Bayesilaista keskiarvoistamista, missä eri malleille voidaan antaa eri painoituksia. Viimeisessä vaiheessa mietitään tiedonkeruun kattavuutta ja riittävyyttä, jonka jälkeen voidaan päätyä keräämään vielä täydennystä ja lisää asiantuntijatietoa. (O’Hagan et al., 2005).

Asiantuntijatiedon keräämisessä ja käyttämisessä esintyy erinäisiä ongelmia. Ihmisillä on usein rajallinen kyky ymmärtää todennäköisyyksiä ja asettaa niille tietty numerinen arvo, jolloin erilaisten vääristymien syntyminen on tavanomaista. Haastattelun, eri tehtävien, ja kysymysten asettelu vaikuttavat kaikki haastatteluprosessin tuloksiin. Onnistumista on vaikea määrittää, koska annetut arvot kuvaavat haastateltavan subjektiivistä ”totuutta”, joka vaihtelee haastateltavien kesken. Koehaastattelun järjestäminen ja kysymysten uudellenasettelu voivat auttaa todennäköisyyksien hahmoittamisessa.

Lisäksin, niin kuin jo aikaisemmin mainittu, asiantuntijoilla voi mahdollisesti olla erilaisia henkilökohtaisia intressejä, jotka mallintamisessa pitää tiedostaa ja huomioida. Asiantuntijat voivat niin sanotusti pelata omaa peliään, eli antamalla väärää tietoa määrittelemällä prioreja tai tekijöitä omaksi edukseen. Mallien keskiarvoistamisella vääristymää voidaan korjata: keskiarvoistaessa mallit, jotka eivät tue kerättyä dataa, saavat vähemmän painoarvoa. Sen sijaan, asiantuntijoiden antamia tavoitteita ja arvoja päätösmallintamisessa ei voida, eikä tulekaan, tässä vaiheessa keskiarvoistaa (Mäntyniemi et al., 2013).

Vaikka mallintamisen onnistuminen on tärkeää, ehkä tärkeintä on kuitenkin haastateltavan ja tutkijan välisen dialogin ja yhteistyön mahdollistaminen, sekä mahdollisimman avoin ja läpinäkyvä ongelmanasettelu. Näin voidaan varmistaa, että tutkija ei tutki vaan tutkiakseen, vaan hänen työllään on myös yhteiskunnallinen merkitys ja ulottuvuus.

Mäntyniemi, S., et al., 2013. Incorporating stakeholders’ knowledge to stock assessment: Central Baltic Herring. Can. J. Fish. Aquat. Sci, 70.

O’Hagan, A., et al., 2005. Statistical Methods for Eliciting Probability Distributions. Journal of the American Statistical Association, 100: 470.

Uusitalo, L., 2007. Advantages and challenges of Bayesian networks in environmental modelling. Ecological Modelling, 203.

 

Rysä jälleen käytössä

Ajaessani tänään Vanhankaupunginkosken yli, huomasin sivusilmällä smolttirysän olevan jälleen käytössä tauon jälkeen. Rysä oli asennettu nyt pyytämään eri kohtaan jonkin matkaa ylävirtaan edellisestä paikasta ja tällä kertaa enemmän uoman länsipuolelle. Liekö virtaus jälleen käynyt epäsuotuisaksi ruuvipyydyksen käytölle.

 

Kuten porukalla keskustelimme edellisellä kokoontumiskerralla, olisi pyydysten pyyntitehon määrittämisen kannalta paras vaihtoehto, mikäli pyydykset olisivat mahdollisimman ”tasapaksussa” kohdassa jokea, mistä kalat laskeutuisivat mahdollisimman sattumanvaraisesti ohi. Tällöin voitaisiin arvioida pyydyksen pyyntitehoa suoraan osuutena uoman poikkileikkauksen pinta-alasta, jonka pyydys kattaa. Ruuvin pyytäessä tällä hetkellä hyvin epätasaisessa kohdassa jokea itähaaran puolella, selkeän päävirran kohdalla, ei pystytä näin selkeätä laskelmaa tekemään. Epätasaisessa, leveydellään virtauksien puolesta vaihtelevassa uomassa saattaa laskeutumisreiteissä etenkin eri virtaamilla esiintyä suuriakin vaihteluita. Smolttiruuvin asentamispaikkaan vaikuttaa pyydyksen tekniset edellytykset, sen vaatiessa tietyn virtauksen ja hiljaa virtaavan, tasaisen suvannon virtaus ei riitä pyörittämään ruuvin rumpua. Rysällä puolestaan ei ole vastaavia vaatimuksia virtauksen suhteen. Rysän edellinen pyyntipaikka oli kuitenkin heti saarekkeen yläpuolella, missä ainakin silmämääräisesti näyttää, että virta alkaa vaihdella enemmän, kuin ylempänä suvannossa ja esimerkiksi toista haaraa suosivat kalat ovat saattaneet jo ryhmittyä tietylle puolelle jokea epäsattumanvaraisesti.

 

Rysän uusi pyyntipaikka hieman ylempänä vastaa paremmin kalojen koko uoman leveydelle satunnaisesti levittäytymisen edellytyksiä. Muuttamalla pyydysten paikkoja tutkimusjakson aikana, tulee kuitenkin pyydysten tehon ja hierarkkisesti edelleen myös vaeltavien smolttien kokonaismäärän arvioimiseen mukaan lisää epävarmuustekijöitä.

 

Tietysti huolellisellakaan tutkimussuunnittelulla ei pystytä aina vaikuttamaan muuttuviin olosuhteisiin ja suunnitelmia joudutaan muuttamaan. Meidän osalta hommahan etenee lähtökohtaisestikin melko nurinkurisesti. Parempaan lopputulokseen varmastikin päästäisiin, mikäli koko projekti olisi aloitettu mallien alustavalla suunnittelulla ja tutkimusasetelmaa olisi lähdetty kehittelemään mallien ehdoilla.

Yhteismitattomia hyötyjä kaikissa mahdollisissa maailmoissa?

Helsingin Vanhankaupunginkosken padon purkamisen hyödyistä ja haitoista on väitelty viime vuoden syyskuusta lähtien. Tuuli bloggasi asian tiimoilta viime sunnuntaina (https://blogs.helsinki.fi/taimenlaskenta/?p=163.); Helsingin Sanomat kirjoitti aiheesta viimeksi eilen (http://www.hs.fi/kaupunki/a1305954428529).

Kaupunginhallituksen kokouksessa päätettiin vastikää yksimielisesti palauttaa padon purkuehdotus uudelleen valmisteltavaksi.  Nähtiin tarpeelliseksi lisäselvitysten tekeminen padon purkamispäätöksen mahdollisista vaikutuksista ennen kaikkea alueen kalastoon, vuollejokisimpukoihin sekä Pikkukosken uimarannan vapaa-ajankäyttöön.

Näiden tekijöiden lisäksi kaupunginhallituksen päätöksen (purkaa tai jättää purkamatta pato) vaakakupissa tulee varteenotettavina arvoina painamaan ainakin padon ja voimalan museaalinen ja esteettinen arvo, sekä jossain määrin myös voimalan tuottama sähkö (http://jukkarelander.puheenvuoro.uusisuomi.fi/177564-miksi-vanhankaupunginkosken-pato-kannattaa-purkaa).

Päätös siitä, mitä tulisi tehdä, on määritelmällisesti normatiivinen ja siten luonteeltaan myös eettinen. Jos eettinen tarkastelu rajataan seurausetiikkaan (intuitionistiset, velvollisuus- ja hyve-eettiset pohdinnat sivuuttaen), voidaan rationaalinen eettinen päätös padon purkamisesta palauttaa seurausten haittoihin (tai kääntäen hyötyihin) ehdolla vaihtoehtoiset, mutta toteutettavissa periaatteessa olevat toimintamallit. Yksinkertaisimmillaan käsillä oleva päätöksentekotilanne voitaisiin siis hahmottaa seurausten hyödyillä/haitoilla ehdolla padon purku versus padon säilyttäminen (käytännössä ehdotetut toimintamallit ovat toki hienosyisempää mallia: padon purku JA .. versus padon säilyttäminen JA..).

Mutta: omenia ja appelsiineja; esteettisiä, luonnonsuojelullisia ja vapaa-ajanvietollisia arvoja: miten näitä voidaan vertailla keskenään?

Jos ei voitaisi, kaupunginhallituksen päätös kerätä lisätietoa potentiaalisten toimintamallien mahdollisista seurauksista olisi lähtökohtaisesti älytön. Jos hyödyt nähtäisiin yhteismitattomina – tai yhtä lailla jos tiedettäisiin jokin hyöty painoarvoltaan dominoivaksi kaikissa mahdollisissa maailmoissa – ei keskustelua erilaisista skenaarioista tarvitsisi käydä (jolloin väittäisin sitä ironisen paradoksaalisesti todennäköisesti käytävän loputtomiin). Riittäisi todeta joko: ”minä pidän padoista, sinä kaloista – siinä kaikki!” tai: ”padon museoarvo on suurempi kuin suurin kuviteltavissa oleva kalakantahävikki”. End of discussion.

Lisäinformaatio olisi yhtä lailla hyödytöntä, jos jo tiedetään, mitä toimintaskenaarioille ehdollisista seurauksista voidaan ylipäänsä tietää. Tällainen tilanne on vastassa kahdessa ääripäässä: 1) jos toimintamalleihin liitettäviin mahdollisiin maailmoihin ei liity epävarmuutta lainkaan, tai 2) päätöksenteko on luonteeltaan niin toivottoman epävarmaa, että mahdolliset maailmat voivat olla yhtä hyvin aivan mitkä tahansa. Näiden ääripäiden välissä tulee pohtia lisäinformaatiosta saatavia päätöksenteolle suhteellisia kustannushyötyä.

Juuri koskaan ei tiedetäkään kaikkea (eikä varmuudella juuri muuta kuin analyyttiset totuudet, kuten: “jos pato puretaan, patoa ei enää ole“). Lähes yhtä harvoin päätöksentekotilanne on toivottoman epävarma. Harvojen preferenssit ovat myöskään täysin ehdottomat, vaan jossain tulee myös äärimmäisellä henkilöllä vastaan vaihtosuhde yhden versus toisen preferenssin suosimisen välillä. Näin on aina, kun padon esteettinen hyötyarvo ei ylitä äärettömän kalan hyötyarvoa jne (huono esimerkki siinä mielessä, että hyötyfynktion yli kalojen tulee olla vahvasti laskeva siihen pisteeseen, että äärettömän monen kalan lisä olisi äärettömän epämukavaa).

Siksi lähes kaikissa päätöksentekotilanteissa on kyse 1) vaihtoehtoisten maailmojen sisältämien hyötyjen vertailemisesta keskenään, sekä 2) näiden hyötyjen painottamisesta maailmojen todennäköisyyksillä ehdolla valittu toimintamalli. Tähän päättelytilanteeseen voi bayesilainen päätöksentekotiede tarjota parhaat mahdolliset välineet. Esimerkiksi Vantaanjoen smoltteja estimoidessa voidaan arvioida, kuinka paljon taimenia muuttaa Vantaanjoesta mereen ehdolla pato versus ehdolla ei patoa. Mahdollisten maailmojen todennäköisyyksien määrittämiseen liittyvä mallivalinnan epävarmuus voidaan huomioida keskiarvoistamalla yli käytettyjen todennäköisyysmallien (https://blogs.helsinki.fi/taimenlaskenta/?p=133).

Julkisessa päätöksenteossa maailma monimutkaistuu entisestään: huolella estimoidut mahdollisten maailmojen todennäköisyydet tulisi liittää henkilöittäin vaihteleviin hyötyihin aggregaattitasolla siten, että sosiaalinen hyötyfunktio kuvaa parhaalla mahdollisella tavalla yksittäisiä preferenssejä. Bayesilainen päätöksentekotiede kykenee määrittämään mahdollisten maailmojen posterioritodennäköisyydet ehdolla havaittu aineisto. Jos näihin maailmoihin liitettäviä hyötyjä haluttaisiin painottaa perustellulla tavalla yli demokraattisesti validien preferenssien, tulisi bayesilainen teoria edelleen yhdistää sosiaalisen valinnan teoriaan.

 

Huomioita tulosten raportoinnista

Tilastollista päättelyä voidaan harrastaa kahdesta hieman filosofisesti toisistaan poikkeavasta näkökulmasta. Tämä blogi keskittyy ns. Bayeslaisen koulukunnan tarjoamiin menetelmiin. Toinen päättelyn koulukunta on ’perinteisempi’ ja suositumpi frekventistinen päättely. Teoreettisesti ero näiden kahden välillä muodostuu pienestä yksityiskohdasta: Bayes-päättelyssä kiinnostuksen kohteena oleviin mallin parametreihin kiinnitetään todennäköisyysjakauma, kun taas frekventisessä päättelyssä ne ajatellaan tuntemattomiksi, mutta kiinteiksi.

 

Tämä yksityiskohta osoittautuu hyvin merkitykselliseksi ja määrittelee oikeastaan kaksi hyvin toisistaan poikkeavaa näkökulmaa tilastolliseen päättelyyn. Frekventistisessä näkökulmassa aineiston tuottaneen tilastollisen mallin parametrit ajatelleen siis kiinteiksi, jolloin kaikki käsiteltävä satunnaisuus liittyy itse aineistoon. Aineisto ajatellaan satunnaiseksi leikkimällä sillä mahdollisuudella, että oltaisiin voitu kerätä/havaita myös toisenlaisia aineistoja, mikäli sama koe oltaisiin toistettu samoissa olosuhteissa.

 

Bayeslaisessa näkökulmassa tilastollisen mallin parametreille kiinnitetään todennäköisyysjakauma, jota päivitetään havaitun aineiston perusteella. Tämä ns. priorijakauma kvantifioi ilmiöön liittyvän enakkotiedon ja siihen liittyvän epävarmuuden. Asetelma on siis päinvastainen kuin frekventistisessä päättelyssä; aineisto on kiinteä ja sen tuottaneen tilastollisen mallin parametrit satunnaisia (epävarmoja).

 

Tyypillisesti tilastotieteilijöille opetetaan lähinnä pelkästään frekventististä päättelyä. Sellainen asetelma, jossa kaikki onkin toisinpäin aiheuttaa hieman totuttelemista. Olemme esimerkiksi tässä blogissa raportoineet laskentamallimme tuloksia osittain epäselvästi johtuen omalta osaltani kokemattomuudesta analysoida bayslaisen laskentamallin tuloksia. Puutun nyt muutamaan virheelliseen ilmaisuun ja selvennän, mitä yritettiin sanoa ja mitä olisi pitänyt sanoa.

 

Kokonaismäärän odotusarvon piste-estimaatti

 

Laskentamallimme tarkoituksena on tuottaa taimenten kokonaismäärän todennäköisyysjakauma. Kun olemme onnistuneet tämän jakauman tuottamaan, on sen odotusarvo meille tunnettu. Käytämme kuitenkin laskennallisia menetelmiä, joten emme aivan täsmälleen pysty tuottamaan haluamaamme jakaumaa, vaan BUGS-ohjelmiston tuottaman estimaatin siitä. On aivan oikein puhua piste-estimaatista, mutta on syytä ymmärtää, että kysymyksessä on estimaatti laskennallisista syistä. Tämä liittyy alempaan kohtaan.

 

Odotusarvon piste-estimaatin 95% luottamusväli

 

Luottamusväli on frekventistisen päättelyn termi. Frekventistisessä päättelyssä 95% luottamusväli tarkoittaa, että muodostettu väli sisältää todellisen parametrin arvon 95 kertaa sadasta, perustuen sellaiseen mielikuvitusleikkiin, jossa kerätään vastaavia aineistoja ja muodostetaan uusia välejä.  Tällä nimikkeellä olemme raportoineet kokonaismäärään liittyviä todennäköisyysvälejä (Näistä käytetään Bayeslaisessa analyysissa joskus termiä uskottavuusväli, engl. credible interval), eli sellaisia välejä, joiden sisällä kokonaismäärä on 95% todennäköisyydellä.

 

Vaikkakin oletettavasti lukijat ovat tienneet mitä näillä luvuilla on tarkoitettu, on niiden kohdalla tarkalleen ottaen tehty paha virhe liittyen edellisen kohdan huomioihin. Kuten todettu, liittyy odotusarvon piste-estimaattiin laskennallista epävarmuutta, joka on tunnettua, sillä laskentaohjelmistot kuten BUGS raportoivat samplaykseen liittyvän epävarmuuden (MCMC error), joka kunkin tunnusluvun kohdalla kuvaa siihen liittyvää laskennallista epävarmuutta. Tämä epävarmuus voitaisiin (ja kuuluisikin) raportoida, jolloin voitaisiin esimerkiksi kertoa piste-estimaattiin liittyvä 95% todennäköisyysväli (uskottavuusväli). Tämä väli on kuitenkin aivan eri asia, kuin mallin antama todennäköisyysväli kokonaismäärälle, sillä piste-estimaatin todennäköisyysvälissä kysymyksessä on parametriin liittyvä laskennallinen epävarmuus, ei mallin epävarmuus.

 

Raportoimamme luvut ovat siis olleet kokonaismäärän 95% todennäköisyysvälejä – välejä, joiden sisällä kokonaismäärä on mallimme mukaan 95% todennäköisyydellä.

 

Mietteitä Bayes-mallintamisesta ja päätöksenteosta

Tässä blogipostauksessa on luvassa alustavia mietteitäni Bayes-mallintamisen roolista ja hyödyllisyydestä ympäristöä koskevassa päätöksenteossa, tässä tapauksessa erityisesti Vantaanjoen meritaimenen kohdalla. Toisin sanoen, mihin Bayes-mallintamista tarvitaan, ja mikä mallintamisen hyöty on/voi olla?

Oma taustani on ympäristötieteissä ja kehitysmaatutkimuksessa. Kehitysmaatutkimuksessa painotetaan mahdollisimman yksinkertaisen ja helppokäyttöisen teknologian arvoa, jonka nähdään olevan omiaan lisäämään itse teknologian käyttöä, ja sitä kautta myös hyvinvointia globaalin etelän maiden eri yhteisöissä. Esimerkkinä voisi pitää vaikka aurinkopaneeleiden käyttöä: jos yhteisö ei pysty omaksumaan paneeleiden käyttöä, eikä osaa niitä itse käyttää tai huoltaa, aurinkopaneeleiden edut jäävät pieniksi. Samalla tavalla myös osallistavaa päätöksentekoa lisäävien eri työkalujen ja välineiden nähdään edesauttavan yhteisöiden hyvinvointia ja päätöksenteon oikeudenmukaisuutta. Oletuksena siis on, että nykyisen muotoisen ylhäältä alaspäin toimivan säännöstelyn lisäksi, horisontaalisen päätöksenteon sekä yhteisöstä käsin lähtevä päätöksenteon lisääminen edesauttaisi säännöstelyn legimiteettiä ja toimivuutta.

Myös täällä Itämeren rannikkolla on tarvetta alhaalta ylöspäin suuntautuvalle päätöksenteolle, ja olenkin kiinnostunut osallistavasta päätöksenteosta, jossa tarkoituksena on eri sidosryhmien ja tekijöiden osallistaminen mahdollisimman yksinkertaisin työkaluin. Tälle kurssille tulin miettimään, miten Bayes-mallintaminen voisi toimia yhtenä osallistavan päätöksenteon välineenä. Itselläni ei ole matemaattista taustaa, ja suhtauduinkin mallintamiseen aluksi epäilevästi. Bayes-laskennan hienous piilee kuitenkin siinä, että koko universumia mallintamista ei nähdä välttämättömänä ennen itse tekoihin ryhtymistä, vaan päätöksenteko voi perustua todennäköisyyksille ja niiden mallintamiselle.

Vanhankaupunginkosken meritaimenia ja muita vaelluskaloja koskeva päätöksenteko eri sidosryhmien välillä on hankalaa: kaikki eivät luonnollisestikaan ole samaa mieltä vaelluskaloja koskevista toimenpiteistä. Aiemmissa blogipostauksissa (Juhani ja Mikko) on jo kiinnitetty huomiota Vanhankaupunginkosken padon haittoihin meritaimenien ja muiden vaelluskalojen kohdalla. Vaikka asiaa vaelluskalojen kohdalla on tutkittu vähän, haitoista merkkinä ovat suvannosta kesäaikana löytyneet turbiinien katkomat ankeriaat1. Vanhankaupunginkosken padon purkamisesta on puhuttu viime syksystä, ja tällä hetkellä purkupäätös on saanut jatkoaikaa2. Vastakkain ovat kaksi osapuolta, joista toinen haluaa säilyttää padon sen kulttuurihistoriallisen arvon takia, ja toinen suojella vaelluskaloja.

Vaelluskaloja suojellaan ja säädellään Vanhankaupuginkoskella lähinnä paikallisella tasolla. Vanhankaupunginkosken kalavesien hoidosta vastaa kalastuslain määrämänä Helsingin kalastusalue, jonka tehtävänä on myös kalastuksen säätely ja valvonta, sekä toimiminen yhteistyössä kalavesien omistajien, ammattikalastajien ja vapaa-ajankalastajien kanssa. Helsingin kaupungin liikuntavirasto sen sijaan vastaa kosken kalastusjärjestelyistä. Taimen ja lohi ovat rauhoitettuja ajalla 11.9- 15.11, jolloin niitä ei saa nostaa edes kuvattavaksi. 3

Myös koko Vantaanjoen valuma-alue ja siihen liittyvä päätöksenteko vaikuttavat meritaimeniin. Joka vuotiset kuntien jätevesipuhdistamoilta ja pumppaamoilta tapahtuvat puhdistamattomien jätevesien päästöt, ja maataloudesta huuhtoutuvat ravinteet ja kiintoainekset aiheuttavat pahimillaan kala-ja eliöstökuolemia ja kuormittavat Vantaanjokea, sekä viime kädessä myös Itämerta. Vantaanjoen vedenlaatu olikin 1980-luvulla vielä huono, mutta on siitä lähtien kehittynyt parempaan kuormituksen vähenemisen myötä, ja Vantaanjoen vedenlaadun ekologinen tila on nykyään EU-kriiterein kuvattu ”tyydyttäväksi”. 4

Vantaanjoen varrella ja Vanhankaupunginkoskella on siis monenlaista toimintaa ja monenlaisia toimijoita. Bayes-mallinnus voi toimia yhtenä työkaluna meritaimeniin liittyvässä eri sidosryhmien välisessä keskustelussa ja päätöksenteossa. Eri sidosryhmät ja asiantuntijat voidaan ottaa mukaan jo Bayes-mallin kehittelyvaiheessa, ja heidän avullaan voidaan pohtia eri prioreja (tässä projektissa meritaimenten vuosittaisen määrän priorit on asiantuntijoiden antamia), eri tekijöiden vaikuttavuutta, sekä eri päätösmalleja ja niiden hyödyllisyyttä. Olisikin mielenkiintoista pohtia vielä lisää, miten tarkalleen ottaen asiantuntijat voivat olla mukana kehittelyvaiheessa ja mikä heidän panoksensa mallintamisessa voikaan olla.

Osallistavassa päätöksenteossa työkalujen pitää olla helppokäyttöisiä ja kustannustehokkaita, ja vaikuttaa, että parhaimmillaan Bayes-mallinnus on molempia. Tutkijoiden ja haastateltavien välinen yhteisymmärrys on mallintamisessa tärkeää, ja haasteena on kehittää mallintamisen selkokielisyyttä. Tästä kuitenkin lisää vasta seuraavissa blogipostauksissa….

  1. Virtavesien hoitoyhdistys Ry, 2015. Vantaanjoen vesistö. Available online: http://www.virtavesi.com/index.php?upperCatId=4&catid=4
  2. Vihreä Lanka, 05.05. 2015. Kohuttu patopäätös sai jatkoaikaa. Available online: http://www.vihrealanka.fi/uutiset-kotimaa/kohuttu-patop%C3%A4%C3%A4t%C3%B6s-sai-jatkoaikaa
  3. Vanhankaupunginkoski, 2013. Vanhankaupunginkoski. Available online: http://www.vanhankaupunginkoski.ota.fi/
  4. Vantaanjoen ja Helsingin seudun vesiensuojeluyhdistys ry, 2015. Vedenlaatu. Available online: http://www.vhvsy.fi/content/fi/1007/1048/Jokiluonto.html

 

 

Tulokset 3.5.2015

Päivä: 25

Pyydettyjä smoltteja: 38

Merkattu: 37

Takaisinpyydettyjä merkittyjä smoltteja: 0

Seuraavassa esitellään tuoreella havaintoaineistolla päivitetyt päivän 25 (3.5.) tulokset käytössä olevista kolmesta eri mallista missä muuttointensiteettiä on kuvattua 1) log-normaali-, 2) normaali- ja 3) tasajakaumilla. Taustat N:n prioriin löytyvät aikaisemmasta tulosbloggauksesta ja lähtokohdat malleihin tästä.

Merkittävin muutos seuranta-asetelmissa, ja tarkemmin kokonaispyyntitehon määrittelemisessä, on Smolttirysän poistaminen käytöstä päivästä 21 eteenpäin. Eli tällä hetkellä pyynnissä on taas ainoastaan ruuvi. Tämän osalta malleja on päivitetty seuraavasti:

lambda[i] <- q_s*n[i]*step(15-i) + q*n[i]*step(i-16) + q_s*n[i]*step(i-22) – q*n[i]*step(i-22)

 

Malli 1 – “log-normaali

Log-normaalimalli lähtemisintensiteetille tuottaa taimenten kokonaismäärän odotusarvon piste-estimaatiksi 1411 kappaletta, jolle 95% luottamusväli on 402–3722 (Taulukko 1). Todennäköisin yksittäinen arvio kokonaismäärästä on (posteriorijakauman moodi) on jossain 500 ja 1000 välissä (Kuva 1).

Maanantaina 4.5. vaeltavien taimensmolttien lukumäärän (n[26]) odotusarvon piste-estimaatti on 33 ja 95 % luottamusväli 7–90 (Taulukko 1). Todennäköisin yksittäinen arvio (posteriorijakauman moodi) vaeltavien smolttien määrästä on 16 (Kuva 2).

Maanantaina 4.5. ruuviin jäävien taimensmolttien lukumäärän (x[26]) odotusarvon piste-estimaatti on 1 ja 95 % luottamusväli 0–4 (Taulukko 1). Todennäköisin yksittäinen arvio (posteriorijakauman moodi) on, että ruuviin ei jää yhtään taimensmolttia (Kuva 3).

Kokonaispyydystettävyyden (q) estimaatti on mallissa 0,073, eli 7,3 % pyydystettävissä olevista kaloista joutuu pyydykseen (Taulukko 1). Toistaiseksi pyydykset eivät ole onnistuneet uudelleenpyydystämään ainuttakaan 37 merkatusta kalasta.

 

 

Kuva 1. Malli 1:n posteriorijakauma vaeltavien taimensmolttien kokonaismäärästä 2015.

Kuva 2. Malli 1:n posteriorijakauma vaeltavien taimensmolttien määrästä maanantaina 4.5.2015

 

Kuva 3. Malli 1:n posteriorijakauma ruuviin jäävien taimensmolttien määrästä maanantaina 4.5.2015

Taulukko 1. Parametrien Nn[26]x[26] ja q posteriorijakaumien tunnusluvut malli 1:ssa.

  mean sd MC_error val2.5pc median val97.5pc start sample
N 1411.0 873.2 19.46 402.0 1177.0 3722.0 51 161900
n[26] 32.53 21.87 0.4414 7.0 27.0 90.0 51 161900
x[26] 0.9503 1.053 0.00358 0.0 1.0 4.0 51 161900
q 0.07326 0.03892 6.637E-4 0.02079 0.06546 0.1682 51 161900

 

Malli 2 – “normaali”

Normaalijakauma lähtemisintensiteetille tuottaa taimenten kokonaismäärän odotusarvon piste-estimaatiksi 2359 kappaletta, jolle 95% luottamusväli on 707–5075 (Taulukko 2). Tulos on selvästi korkeampi kuin log-normaalin mallin saman päivän tulos (1411) ja kuin saman mallin edellinen tulos (1199). Todennäköisin yksittäinen arvio kokonaismäärästä on (posteriorijakauman moodi) on jossain 1500 ja 2000 välissä (Kuva 4).

Maanantaina 4.5. vaeltavien taimensmolttien lukumäärän (n[26]) odotusarvon piste-estimaatti on 68  (95 % luottamusväli 20–150, Taulukko 2), joka on yli kaksinkertainen log-normaalin mallin vastaavaan estimaattiin (33) verrattuna. Todennäköisin yksittäinen arvio (posteriorijakauman moodi) vaeltavien smolttien määrästä on 31–32 (Kuva 5).

Maanantaina 4.5. ruuviin jäävien taimensmolttien lukumäärän (x[26]) odotusarvon piste-estimaatti on 2 ja 95 % luottamusväli 0–6 (Taulukko 2). Todennäköisin yksittäinen arvio (posteriorijakauman moodi) ruuviin jäävien smolttien määrästä on 1 (Kuva 6).

Kokonaispyydystettävyyden (q) estimaatti on mallissa 0,074, eli 7,4 % pyydystettävissä olevista kaloista joutuu pyydykseen (Taulukko 2).

tasaN

Kuva 4. Malli 2:n posteriorijakauma vaeltavien taimensmolttien kokonaismäärästä 2015.

tasapikkun

Kuva 5. Malli 2:n posteriorijakauma vaeltavien taimensmolttien määrästä maanantaina 4.5.2015

tasax

Kuva 6. Malli 2:n posteriorijakauma ruuviin jäävien taimensmolttien määrästä maanantaina 4.5.2015

Taulukko 2. Parametrien N, n[26], x[26] ja q posteriorijakaumien tunnusluvut malli 2:ssa.

  mean sd MC_error val2.5pc median val97.5pc start sample
N 2359.0 1154.0 19.21 707.0 2163.0 5075.0 51 125850
n[26] 67.57 33.88 0.5517 20.0 61.0 150.0 51 125850
x[26] 2.292 1.716 0.007054 0.0 2.0 6.0 51 125850
q 0.07382 0.03459 4.894E-4 0.02592 0.06734 0.1582 51 125850

 

Malli 3 – “tasa”

Tasajakauma lähtemisintensiteetille tuottaa taimenten kokonaismäärän odotusarvon piste-estimaatiksi 2506 kappaletta, jolle 95% luottamusväli on 707–5075 (Taulukko 3). Tulos on korkeampi kuin normaali-mallin saman päivän tulos (2359) ja kuin saman mallin edellinen tulos (1578). Todennäköisin yksittäinen arvio kokonaismäärästä on (posteriorijakauman moodi) on jossain 1500 ja 2000 välissä (Kuva 7).

Maanantaina 4.5. vaeltavien taimensmolttien lukumäärän (n[26]) odotusarvon piste-estimaatti on 42 (95 % luottamusväli 13–90, Taulukko 3), joka on pienempi kuin normaali-mallin tulos (68) mutta suurempi kuin log-normaalin mallin vastaava estimaatti (33). Todennäköisin yksittäinen arvio (posteriorijakauman moodi) vaeltavien smolttien määrästä on 31–32 (Kuva 8).

Maanantaina 4.5. ruuviin jäävien taimensmolttien lukumäärän (x[26]) odotusarvon piste-estimaatti on 1 ja 95 % luottamusväli 0–4 (Taulukko 2). Todennäköisin yksittäinen arvio (posteriorijakauman moodi) ruuviin jäävien smolttien määrästä on 1 (Kuva 9).

Kokonaispyydystettävyyden (q) estimaatti on mallissa 0,082, eli 8,2 % pyydystettävissä olevista kaloista joutuu pyydykseen (Taulukko 2). Tämän estimaatti on korkeampi kuin mallin 1 ja 2 vastaavat tulokset.
tasaN

Kuva 7. Malli 3:n posteriorijakauma vaeltavien taimensmolttien kokonaismäärästä 2015.

tasapikkun

Kuva 8. Malli 3:n posteriorijakauma vaeltavien taimensmolttien määrästä maanantaina 4.5.2015

tasax

Kuva 9. Malli 3:n posteriorijakauma ruuviin jäävien taimensmolttien määrästä maanantaina 4.5.2015.

Taulukko 3. Parametrien Nn[26]x[26] ja q posteriorijakaumien tunnusluvut malli 3:ssa.

  mean sd MC_error val2.5pc median val97.5pc start sample
N 2506.0 1134.0 11.63 902.0 2302.0 5232.0 10000 3420903
n[26] 41.78 19.97 0.1914 13.0 38.0 90.0 10000 3420903
x[26] 1.109 1.096 6.281E-4 0.0 1.0 4.0 10001 3150900
q 0.08204 0.03619 2.966E-4 0.03185 0.07518 0.1702 10000 3420903

 

Seuraavissa malliajoissa tulisi tarkemmin kiinnittää huomiota simulaatioketjujen konvergoitumiseen, autokorrelaatioon ja MC-error:iin, ja näiden seikkojen tarkastelemiseen. Sen pohjalta tulisi tehdä tarvittavat toimenpiteet (burn-in, thin, iteraatioiden määrän lisääminen) tulosten laadun parantamiseksi.

 

Bayesiläinen mallikeskiarvoistaminen

Bayesiläinen keskiarvoistaminen yleisesti

Bayesilaiseen mallivalintaan kuuluu käytännössä kaksi osaa: ”havainnot generoineen” uskottavuusfunktion sekä tämän funktion parametrien priorin määrittäminen. Ensin mainittuun kuuluu epävarmuutta siinä missä jälkimmäiseenkin. Klassisessa tilastotieteessä on tapana kritisoida priorivalinnan subjektiivista luonnetta antaen ymmärtää tämän valinnan olevan jossain määrin tutkijan omista epätieteellisistä mieltymyksistä riippuvaista. Kuitenkin myös uskottavuusfunktion valinta on tutkijan enemmän tai vähemmän perusteltu valinta siinä missä priorikin. Molemmat valinnat perustuvat (yhtä lailla) tutkijan henkilökohtaiseen ennakkokäsitykseen havainnot tuottaneesta (fysikaalisesta) mekanismista. Uskottavuusfunktion valinta onkin harvoin jos koskaan aukottomasti perusteltu, vaan myös siihen liittyy käytännössä aina huomionarvoista epävarmuutta.
Bayesilaisessa mallin keskiarvoistamisessa (bayesian model averaging BMA) voidaan huomioida mallivalinnan epävarmuus kokonaisuudessaan pitäen sisällään sekä uskottavuusfunktion että priorin tutkijan subjektiiviseen harkintaan perustuneen mallivalinnan pätevyyden. Bayesilainen keskiarvoistaminen perustuu mallikokonaisuuden johtamiselle keskiarvoistamalla malli yli osamalliensa painotten kunkin osamallin vaikutusvaltaa niille datan valossa päivitettyjen posterioritodennäköisyyksien suhteessa (bayesin teoreeman avulla). Posterioritodennäköisyydeltään suurempi malli saa enemmän, pienempi malli vähemmän painoarvoa mallikokonaisuutta johdettaessa.
Tällöin oletetaan (kokonaistodennäköisyyden kaavassa), että jokin esitetyistä malleista on tosi. Esimerkiksi, jos jompikumpi kahdesta mallista M1 tai M2 on tosi ja on havaittu aineisto d, tällöin mallin yksi posterioritodennäköisyys saadaan kaavasta: p(M=1|d)=[p(d|M=1)*p(M=1)]/[p(d|M=1)*p(M=1)+ p(d|M=2)*p(M=2)]. BMA painottaa esimerkiksi posterioriennustavaa jakaumaa johdettaessa kutakin mallia edellä laskettujen posteriorien suhteissa.
Kun bayesilainen päättely yhdistetään toimintaan valitsemalla se toimintamalli, joka tuottaa parhaimman odotusarvoisen hyödyn, keskiarvoistetuilla malleilla saadaan oletettavasti parempi päätöksiä aikaisesti kuin yksittäisillä mallikokonaisuuden osamalleilla. Tämän voisi pyrkiä hahmottamaan siten, että keskiarvoistaminen huomioi paitsi useaan malliin liittyvän epävarmuuden, myös niihin liittyvän informaation. Suuremmalla määrällä informaatiota voidaan oletettavasti tehdä perustellumpi päätöksiä.
Kuten informaatioteoriaan perustuvat mallivalinnan kriteeri DIC ja BIC, myös BMA huomioi mallien yksinkertaisuuden (parsimony) arvona sinänsä mallin dataan sopivuuden (goodness-of-fit) rinnalla. Jälleen – kuten informaatioteoreettiset mallivalinnan kriteerit – myöskään BMA ei kykene huomioimaan sitä, jos kaikki estimointiin käytetyt/vertaillut mallit ovat huonoja. Roskan keskiarvo on keskimääräinen roska.
Siksi mallivalinnan perusteltavuuteen tarvitaan ennustavia jakaumia, joiden avulla voidaan mallin toimivuutta vertailla aitoon kerättyyn aineistoon. Ei voida tyytyä olettamaan, että joku osamalleista on tosi ja että mallikokonaisuus siksi toimii. Tulee tarkastella, kuinka hyvin (keskiarvoistetun) mallin ennusteet vastaavat todellisuutta. Paras tilanne on, jos voidaan ennustaa tulevia todellisia havaintoja, kuten Vantaanjoen smoltteja arvioitaessa johtamalla seuraavan päivän havaintojen posterioriennustava jakauma. Ennusteiden ja havaintojen yhteensopivuuden tarkastelu voidaan suorittaa paitsi visuaalisella tarkastelulla, myös määrämittaistamalla arvio esimerkiksi laskemalla niin sanottuja ”bayesilaisia p:n arvoja” (bayesian p-values). Logiikka toimii analogisesti nollahypoteesin testauksen logiikan kanssa, ainoastaan, että nollahypoteesi koskee (keskiarvoistettua) mallivalintaa sisällöttömän nollahypoteesin sijaan. Voidaan siis arvioida todennäköisyys havaita havaitun kaltainen (tai harvinaisempi/oudompi) aineisto, jos (keskiarvoistettu) mallivalintamme olisi oikea. Jos posterioriennusteet ovat huonoja, on malli todennäköisesti huono.
Smolttien totaalia estimoitaessa on keskeisenä ongelmana ollut juuri mallivalinta liittyen smolttien lähtötodennäköisyyksien jakauman muodolle tarkasteluaikavälin päivien yli. Tällä mallivalinnalla on myös kohtalaisen paljon vaikutusta saatuihin totaaliestimaatteihin. Kuten aina, yhtäkään mallivalintaa ei voida tässäkään varmuudella pitää totena tai epätotena, vaan ne ovat kaikki enemmän tai vähemmän epävarmoja. Lisäksi keskiarvoistamisen toimivuuden kannalta hyvänä asiana voitaneen pitää sitä, että mallit huomioivat ikään kuin hieman erilaisia vaihtoehtoisia näkökantoja smolttien muuttokäyttäytymiseen. Näin ollen on oletettavaa, että BMA -menetelmää soveltamalla saadaan mallivalinnan epävarmuuden paremmin huomioiva ja oletettavasti luotettavampi estimaatti mereen Vantaanjoesta muuttavien smolttien kokonaismäärälle.

Malliparametrien vertailu BMA-menetelmällä

Osana päivän tehtävänantoa yritimme soveltaa oppimaamme Carling & Chib-menetelmää omaan malliimme. Muodostimme vertailevan mallin kolmesta vaihtoehtoisesta smolttien lähtemistodennäköisyyttä kuvaavasta p-jakaumastamme.

Jakaumat muotoiltiin seuraavasti:

#p for the linear distribution
p[i,1]<-1/60

#p for the normal distribution
pl[i] <- exp(- pow((i-myy_p)/sd_p,2)*0.5)
p[i,2] <- pl[i] / sum(pl[1:60])

#p for the log-normal distribution
pn[i] <- (1/i)*exp(- pow(log(i)-location, 2) / scale)
p[i,3] <- pn[i] / sum(pn[1:60])

# Number of leaving trouts at day i
n[i]~dbin(p[i,model],N)

Muodostettiin jakaumia vertaileva malli. Painot eri malleille annettiin omiin kokemuksiimme niiden toiminnasta perustuen. Log-normaali jakauma sai pienimmän painon, sillä sen toimivuus on ollut kyseenalaista.

#prior for the model BMA for p

model~dcat(z[1:3])
z[1]<-2/5 #weight for the uniform distribution
z[2]<-2/5 #weight for the normal distribution
z[3]<-1/5 #weight for the log-normal distribution
Z[1]<-equals(model, 1)
Z[2]<-equals(model, 2)
Z[3]<-equals(model, 3)

Lisättiin vielä alkuarvot ladattavaksi ketjuille ennen mallin ajoa.

#Inits: use different initial value for each chain
list(model=1)
list(model=2)
list(model=3)

Alkuarvojen antamisessa ennen ajoa oli pieni ongelma, joka poistui kuitenkin, kun ne generoitiin ensin ja ladattiin vasta sitten.

1

Ajon aikana todennäköisyyksien Z[1] ja Z[2] havaittiin selkeää ketjujen hyppimistä. Miksi Z[3] ei toiminut samoin?

2

Myös statistiikka Z[3]:n osalta näytti oudolta. Sen arvo oli tasan nolla.

Model-jakaumakin näytti sivuuttavan Z[3]:n kokonaan. Mistä tämä johtuu?

4

 

Opittavaa BMA:sta – teoria ja käytäntö

Tämän kappaleen alkuun on rehellisyyden nimissä todettava, että harva asia Bayeslaisen analyysin teoriassa tuskin tuntuu yhdellekään kurssilaiselle vielä täysin selkeältä. Bayesin kaavaan ja todennäköisyyksien päivittämiseen perustuva Bayeslaisen mallin perusajatus on toki suhteellisen suoraviivainen, mutta käytännössä on vaikeaa intuitiivisesti ymmärtää, miten esimerkiksi erilaiset priorivalinnat vaikuttavat posteriorijakaumiin. Lisäksi, koska käytännössä laskukaavoja ei koskaan voida soveltaa suoraan ja joudutaan turvautumaan laskennallisiin menetelmiin, tulee rakennetun mallin ymmärtämiseen mukaan uusi välivaihe – ohjelmisto, jolla itse laskenta suoritetaan, kuten projektissa käyttämämme BUGS.
Erilaisten mallin parametrien priorijakaumien vaikutus mallien posterioritodennäköisyyksiin BMA-analyysissa aiheutti ryhmässä pohdintaa. Lukemamme mukaan malleja vertailtaessa epäinformatiiviset priorijakaumat johtavat ’hyvin suuriin’ posterioritodennäköisyyksiin yksinkertaisten mallien tapauksessa. Miksi näin on? Millä perusteella eri mallien prioritodennäköisyydet täsmälleen päivittyvät?
Pohdimme myös erilaisten mallien prioritodennäköisyyksiä ja sitä, millä perusteella ne kannattaa määrittää. Kannattaako esimerkiksi aina käyttää tasaista prioria, vai kannattaako mieluummin käyttää omaa asiantuntija-arviota eri mallien sopivuudesta? Jos on jo havaittu tuloksia, voiko näitä huomioida arviossa vai pitääkö ne jättää huomioimatta?
Bayeslaisten p-arvojen käsite jäi myös toistaiseksi hieman hämäräksi.
Carlin & Chib – metodin käyttö BMA:n implikoinnissa BUGS – koodiin vaikutti mielestämme jokseenkin intuitiiviselta, mutta herätti silti useita kysymyksiä BUGSin muuttujiin ja funktioihin liittyvistä yksityiskohdista. Ymmärsimme, että eri mallien todennäköisyyksien päivittyminen varmasti tapahtuu samalla tapaa, kuin mallin muidenkin prioritodennäköisyyksien päivittyminen, mutta silti tähän liittyvä uusi syntaksi aiheutti pohdintaa siitä, miksi ja mitä kautta päivittyminen oikeastaan tapahtuu.
model –muuttujan määrittely tuntui esimerkkikoodeissa epäintuitiiviselta ja tuntui tapahtuvan hieman salaa allaolevan rakenteen mukaisesti
x ~ dnorm(mu[model],tau)
mu[1] < – a
mu[2] <- b

Tulkintamme mukaan ylläoleva määrittele model nimisen (1,2) vektorin.

Tämän lisäksi pohdimme BUGSin equals() –funktion toimintaa. Mitä täsmälleen tarkoittaa koodi P <- equals(model,1)

Luentokalvoilla myös sanotaan, että malli-indokaattoria ei yleensä tarvita sellaisille prioreille, jotka ovat malleille yhteisiä. Onko siis olemassa tilanteita, jossa tälle on kuitenkin tarve?