About Deleted User

Special user account.

Päätöksen tekoa

Kurssilla ollaan nyt tilanteessa, jossa mallin rakentamisesta on siirrytty päätöksentekoanalyyseihin. Suurimmalta osin ainakin. Rysän ollessa padon edessä, saadaan kerättyä tietoa, kuinka moni taimen joutuu mahdollisesti turbiinien rattaisiin ja sushina padon alla odottavien kalojen suihin. Tai näin ainakin oli ajatus kurssilaisten mielissä.

 

Rysä otettiin pois käytöstä jo muutamia päiviä sitten, eikä dataa saatu kerättyä juuri yhtään. Rysä kerkesi olla padon edessä vain kahdeksan päivän ajan. Tänä aikana n. 25 % pyydetyistä kaloista päätyi padon edessä olevaan rysään. Mikäli luku olisi sama myös todellisuudessa, olisi merelle vaeltavilla taimenilla suuri mahdollisuus päättää vaelluksensa tähän esteeseen.

 

Padon purkamisen päätöksentekoanalyysia rakentaessamme törmäsin itse monesti ongelmaan, jossa osa osioista tuli ehkä ylimietittyäkin, tämän johtaen hyvin yksityiskohtaiseen ongelman tarkasteluun, osan taas jäädessä hyvin yleiselle tasolle. Jotta päätöksenteko ”kartta” olisi toimiva, pitäisi kaikki kohteet saada suunnilleen samalle tarkastelutasolle.?!

 

Toinen ongelma muodostui hyödyn (utility) ajattelusta. Analyysissä pitäisi pystyä arvottamaan kartan eri osiot erilaisilla hyödyillä tai vaihtoehtoisesti haitoilla. Jotta tämä onnistuisi, pitäisi mallissa pystyä jotenkin valitsemaan vaalikonemaisesti näkeekö asiat hyötyinä vai haittoina ja antamaan näille, erilaisia painoarvoja.

Tulokset 21.5.2015

Päivä: 42

Pyydettyjä taimenen smoltteja kaiken kaikkiaan: 70

Merkattuja taimenen smoltteja kaiken kaikkiaan: 70

Uudelleen pyydettyjä taimenen smoltteja kaiken kaikkiaan: 2

Vähän pienempien ja suurempien teknisten ongelmien jälkeen valmistui päivän 42 (21.5.) tulokset. Tässä mallissa olemme päivittäneen pyydystettävyyden prioria, koska pyydystettävyyttä testaava mandariinikoe uusittiin. Kuten myös edellisessä tulospostauksessa, kaikki seuraavat tulokset perustuvat yli neljän mallimme keskiarvostettuihin posterioriestimaatteihin.

Malli tuottaa lähtemisintensiteetille totaaliestimaatin (Kuva 1), jossa 95 % todennäköisyydellä vaeltavien taimensmolttien kokonaismäärä on välillä 483–5035 (Taulukko 1). Todennäköisin yksittäinen arvio kokonaismäärästä on 500 ja 1500 välissä.

N26052015

Kuva 1. Posteriorijakauma vaeltavien taimensmolttien kokonaismäärästä 2015.

Perjantaina 22.5. vaeltavien taimensmolttien lukumäärä (n[43]) on 95% todennäköisyydellä välillä 3–81 (Taulukko 1). Todennäköisin yksittäinen arvio vaeltavien smolttien lukumäärästä on 9 (Kuva 2).

pikkun26052015

Kuva 2. Posteriorijakauma vaeltavien taimensmolttien määrästä perjantaina 22.5.2015.

Perjantaina 22.5. pyydyksiin jäävien taimensmolttien lukumäärä (x[26]) on 95% todennäköisyydellä välillä 0–5 (Taulukko 1). Jälleen kerran todennäköisin yksittäinen arvio on, että pyydyksiin ei jää yhtään taimensmolttia (Kuva 3).

Edellisellä kurssikerralla puhuimme toisen pyydyksen (rysän) uuden sijainnin huomioimisesta mallissa. Aihetta on käsitelty myös aiemmin blogissa, mutta ehdotusta ei ole huomioitu vielä tässä mallissa.

TotalX26052015

 

Kuva 3. Posteriorijakauma pyydyksiin jäävien taimensmolttien määrästä perjantaina 22.5.2015.

 

Taulukko 1. Parametrien N, n[26] ja TotalX[26] posteriorijakaumien tunnusluvut.

mean sd MC_error val2.5pc median val97.5pc start sample
N 1985.0 1212.0 35.16 483.0 1694.0 5035.0 51 164900
n[43] 25.76 20.81 0.5681 3.0 20.0 81.0 51 164900
TotalX[43] 1.363 1.66 0.02455 0.0 1.0 5.0 51 164900

 

Missä kalat on?

Pyydettyjä smoltteja on tällä hetkellä vain 60 kappaletta vaikka oletettu vaellus mereen piti asiantuntija tiedon mukaan käynnistyä vedenlämpötilan saavuttaessa 8 astetta. Ympäristö.fi sivuilta katsottaessa vesi on tällä hetkellä Pirttinrannan mittauspisteessä jo 11 asteessa. Lämpötilan nousu olisi siis pitänyt jo näkyä pyydyksissä, suurimpina saalismäärinä. Tällä hetkellä mitään piikkiä ei ole havaittavissa, vaan pyydettyjen smolttien määrä vaihtelee satunnaisesti 1 – 6 smoltin välillä, vaikka pyydysten määrä on tuplattu. Alkujaanhan pyydyksenä toimi vain joensivuhaarassa oleva ruuvi. Nykyään käytössä on myös rysä. Toisen pyydyksen lisääminen luulisi jotenkin näkyvän pyydettyjen smolttien määrässä.

Vanhassa mallissamme päivitimme pyydysten ”tehoa” sitä mukaan kun kaloja saatiin pyydyksiin. Pyydetty kala oli ensin failure ja sitten succes mikäli merkattu kala saatiin pyydettyä uudestaan. Priorit saatiin malliin Vesi- ja Kalatutkimus Oy:n mandariinikokeesta. Mandariini kokeessa mandariineista pyydykseen päätyi 20 %. Jos mandariineja ajateltaisiin merkattuina smoltteina, olisi uudelleenpyydettävyys riittävällä tasolla, jotta voitaisiin arvioida smolttien kokonaismäärää luotettavasti. Tällä hetkellä uudelleen pyydettyjä kaloja on vasta 1, joten kahdella pyydyksellä päästään vain 1,7 % uudelleenpyydettävyyteen. Kurssilla oli tosin puhetta, että smoltit saattavat kuitenkin tulla pyydykseen uudestaan vasta 1-2 viikon päästä siitä, kun ne on edellisen kerran saatu pyydettyä. Pyydykset ovat nyt kuitenkin pyytäneet jo 40 päivän ajan, joten viiveen ei enää pitäisi vaikuttaa siihen, että merkattuja kaloja ei onnistuta pyytämään takaisin. Tällä hetkellä vanhan mallin pyydysteho olisi niin alhaalla, että en tiedä olisiko sillä voinut antaa luotettavaa arvioita vaelluskannan koosta.

Itseäni on myös ihmetyttänyt pyydysten sijoittaminen. Jo kokeen alkaessa puhuttiin, että ruuvi ei toimi kunnolla, koska virtaus on niin pieni, että ruuvi ei pyöri kunnolla. Sitten rysä asetettiin aluksi joen haaraumaan. Ymmärtääkseni pyydykset toimivat sitä paremmin mitä kovempi virtaus on. Tällöin smolttien on vaikeampi välttää ”omituista kapistusta”. Tästä syystä pyydys tulisi sijoittaa joen ”päävirran” kohdalle. Toki pyydysten sijoittamiseen on vaikuttanut moni asia, ja juurikin kovasta virrasta johtuen sitä, ei ehkä ole voitu sijoittaa juuri sinne minne se olisi haluttu.

Uudessa mallissamme otimme mallia kurssinvetäjämme pyydysmallista ja siinäkin pyydysten teho päivittyy ymmärtääkseni samaan tapaan, kuin vanhassakin mallissa, näin ainakin teoriassa. Koodia katsoessani, ei jotkut kohdat tästä kuitenkaan aukea minulle kuten ei myöskään ehkä muillekaan ja toivoisinkin, että seuraavalla kerralla palattaisiin vielä tähän, vaikka olemmekin siirtyneet jo päätöksentekoanalyysin maailmaan. Tässä kohta, mikä on vielä epäselvä tagged[d]~dbin(1,1000)}. Mistä nämä numerot tulevat?

Milloin malli on oikeasti valmis?

Olemme blogissa pohtineet paljon mallin kehittämiseen liittyviä kohtia, kuten lisäpyydyksen huomioimista ja vaelluspoikasten muuttointensiteetin mallintamista. Varovainen arvioni on, että kaikesta malliin liittyvästä epävarmuudesta huolimatta, olemme olleet tyytyväisiä sen kehittymiseen. Edelleen mielessämme on ollut useita parannusehdotuksia, kuten veden lämpötilan ja korkeuden sekä vaellusmatkan pituuden huomioiminen. Blogipohdinnat ovat siirtyneet enemmän päätöksentekoon liittyviin kysymyksiin, mutta palaan vielä hetkeksi takaisin mallintamisen maailmaan ja aiheeseen, joka on jäänyt itselleni hyvin epäselväksi, ja jota ei vielä ole nostettu blogissa tarkemmin esille: Milloin malli on oikeasti valmis?

Tutkijana painii jatkuvasti omaan työhön kohdistuvan epävarmuuden kanssa. Työstä pitäisi sanoa jotain konkreettista, mutta samalla joutuu tiedostamaan, että työhön liittyy enemmän tai vähemmän epävarmuutta. Kurssilla olen ensimmäistä kertaa harjoittelemassa todennäköisyysmallintamista, ja oppiminen on kohdistunut perusasioiden haltuun ottamiseen ja BUGS-ohjelman ymmärtämiseen. Bayes-maailma on minulle vielä hyvin uusi, mutta kurssin edetessä olen pohtinut, milloin mallin kehittäjä voi olla tyytyväinen aikaansaannokseensa ja valmis esittelemään sen yleisölle.

Biologina jotenkin kuvittelisi, että malli on valmis silloin, kun se kuvaa luonnossa tapahtuvia prosesseja parhaiten. Miten tämä voidaan varmistaa, onkin sitten toinen tarina. Tuleeko kaikki mahdolliset (ympäristö)tekijät olla mukana mallissa? Tilastotiedettä opiskelevat kurssikamut ovat kuitenkin saaneet minut pohtimaan asiaa toisesta näkökulmasta. Ehkä malli onkin valmis silloin, kun se on rakennettu ”oikein ja ammattitaidolla”. Aiemmissa blogipostauksissa on nostettu esiin myös asiantuntijatieto. Olettaen, että asiantuntijatieto on lähellä ”oikeaa totuutta”, onko valmis malli sellainen, joka vastaa asiantuntijan tietoa tai näkemystä?

Myönnettäköön, että kysymys on tällä erää ehkä lähinnä filosofinen, mutta käsitys kehitysprosessista kokonaisuutena on minulle vielä melko tuntematon. Varsinkin kun olemme jättämässä mallin kehittelyn, jotta voimme käsitellä päätösanalyysiä loppukurssin ajan. Pääsimmekö kunnolla edes vauhtiin vai raapaisimmeko vasta pintaa?

Rysä jälleen käytössä

Ajaessani tänään Vanhankaupunginkosken yli, huomasin sivusilmällä smolttirysän olevan jälleen käytössä tauon jälkeen. Rysä oli asennettu nyt pyytämään eri kohtaan jonkin matkaa ylävirtaan edellisestä paikasta ja tällä kertaa enemmän uoman länsipuolelle. Liekö virtaus jälleen käynyt epäsuotuisaksi ruuvipyydyksen käytölle.

 

Kuten porukalla keskustelimme edellisellä kokoontumiskerralla, olisi pyydysten pyyntitehon määrittämisen kannalta paras vaihtoehto, mikäli pyydykset olisivat mahdollisimman ”tasapaksussa” kohdassa jokea, mistä kalat laskeutuisivat mahdollisimman sattumanvaraisesti ohi. Tällöin voitaisiin arvioida pyydyksen pyyntitehoa suoraan osuutena uoman poikkileikkauksen pinta-alasta, jonka pyydys kattaa. Ruuvin pyytäessä tällä hetkellä hyvin epätasaisessa kohdassa jokea itähaaran puolella, selkeän päävirran kohdalla, ei pystytä näin selkeätä laskelmaa tekemään. Epätasaisessa, leveydellään virtauksien puolesta vaihtelevassa uomassa saattaa laskeutumisreiteissä etenkin eri virtaamilla esiintyä suuriakin vaihteluita. Smolttiruuvin asentamispaikkaan vaikuttaa pyydyksen tekniset edellytykset, sen vaatiessa tietyn virtauksen ja hiljaa virtaavan, tasaisen suvannon virtaus ei riitä pyörittämään ruuvin rumpua. Rysällä puolestaan ei ole vastaavia vaatimuksia virtauksen suhteen. Rysän edellinen pyyntipaikka oli kuitenkin heti saarekkeen yläpuolella, missä ainakin silmämääräisesti näyttää, että virta alkaa vaihdella enemmän, kuin ylempänä suvannossa ja esimerkiksi toista haaraa suosivat kalat ovat saattaneet jo ryhmittyä tietylle puolelle jokea epäsattumanvaraisesti.

 

Rysän uusi pyyntipaikka hieman ylempänä vastaa paremmin kalojen koko uoman leveydelle satunnaisesti levittäytymisen edellytyksiä. Muuttamalla pyydysten paikkoja tutkimusjakson aikana, tulee kuitenkin pyydysten tehon ja hierarkkisesti edelleen myös vaeltavien smolttien kokonaismäärän arvioimiseen mukaan lisää epävarmuustekijöitä.

 

Tietysti huolellisellakaan tutkimussuunnittelulla ei pystytä aina vaikuttamaan muuttuviin olosuhteisiin ja suunnitelmia joudutaan muuttamaan. Meidän osalta hommahan etenee lähtökohtaisestikin melko nurinkurisesti. Parempaan lopputulokseen varmastikin päästäisiin, mikäli koko projekti olisi aloitettu mallien alustavalla suunnittelulla ja tutkimusasetelmaa olisi lähdetty kehittelemään mallien ehdoilla.

Mandariineja ja vaelluspoikasia

Olemme useaan eri otteeseen pohtineet ruuvin pyydystystehokkuuden määrittämisestä nousevia kysymyksiä. Alkuoletuksemme taimenruuvin pyydystystehokkuudelle perustui mandariinikokeeseen, jossa 100 mandariinia laskettiin joen yläjuoksulle. Mandariineista 20 päätyi ruuviin ja 80 ruuvin ulkopuolelle, joten määritimme taimenruuvin pyydystystehokkuudeksi 20 %. Päivitämme ruuvin pyydystystehokkuutta jatkuvasti uusien havaintojen pohjalta, ja koska yhtään merkittyä vaelluspoikasta ei ole saatu pyydettyä uudelleen, pyydystystehokkuutta koskeva oletus heikkenee jatkuvasti.

Aikani googlailtuani aikaisempia vaelluspoikaspyyntiraportteja minulle selvisi, että mandariinikoe on suoritettu aiemmin ainakin Ingarskilanjoella. Koe toistettiin kahdesti eri veden korkeuksilla ja ruuvin pyydystystehokkuudeksi saatiin 17-27 %. Samassa tutkimuksessa pyydystystehokkuuskoe suoritettiin myös merkityillä kaloilla vaellushuipun aikana, jolloin kahdeksasta merkitystä kalasta kaksi päätyi ruuviin (eli 25 %). Raportin mukaan n. 20 % pyydystystehokkuutta voidaan pitää luotettavana kokonaisarvion laskemiseen (lähdettä ei kerrottu). Vaikka pyydystystehokkuuskoe kaloilla toistettiin vain kerran, kalojen ja mandariinien uimista/päätymistä ruuviin pidettiin riittävän samanlaisena, ja kokonaismäärän laskemisessa käytettiin mandariinikokeesta saatua tehoa (17-27 %).

Vantaanjoen vaelluspoikaspyynnissä ensimmäisinä 19 päivän aikana kaloja merkittiin maksimissaan 3 kappaletta päivässä. Jos kaksi kalaa kymmenestä ui pyydykseen (mandariinikoe), kolmesta merkitystä kalasta todennäköisesti vain yksi (jos sekään) ui pyydykseen olettaen, että merkityt kalat ohittavat pyydyksen vuorokauden aikana eivätkä esimerkiksi jää uimaan yläjuoksulle. Jokainen merkattu vaelluspoikanen, joka ei ole uinut pyydykseen uudelleen, on heikentänyt arviotamme ruuvin pyydystystehokkuudesta. Varmastikin pyydystystehokkuuden päivittäminen tähän mennessä on tehty perustellusti, mutta intuitiivisesti arvion tarkentuminen perustuen muutamaan merkittyyn kalaan/päivä tuntuu epätarkalta ja sattumanvaraiselta. Toivoisinkin, että meillä olisi mahdollisuus tarkentaa oletustamme suuremmalla määrällä merkittyjä kaloja ja mahdollisesti toistaa myös mandariinikoe.

Kurssilaisen mietelmiä 4.5., henkilökohtainen blogipostaustehtävä

Tehtävänantomme kurssin kokoontumiskertojen välille oli melko löyhästi ohjeistettu henkilökohtainen blogipostaus koskien projektia ja siinä mahdollisesti askarruttavia tai kiinnostavia asioita, sekä omia tuntemuksia kurssilta.

 

_DSF4472-2

Vanhankaupunginkosken itähaaran kalatie 20.4.2015.

 

Kurssilla olevat opiskelijat ovat hyvin eri taustoista lähtöisin. Monella heistä on huomattavasti vahvempi tekninen osaaminen tilastotieteellisistä perusasioista, sekä mallintamisohjelmien käyttämisestä, kuin itselläni. Kurssin alussa tämä tuntui hankalalta, sillä etenemistahti oli reippaan puoleinen valtaosalle kurssilaisista perusasioiden ollessa jo entuudestaan selviä. Minä puolestani ympäristötieteelliseltä pohjalta ponnistaessani taistelin yrittäessäni yhdistää eri todennäköisyysjakaumia sekä parametreja konkreettisiin, ymmärrettäviin asioihin ja laahasin koko ajan askeleen perässä. Kurssipäivän lopuksi olo tuntui kaikkensa antaneelta ja tyhjältä, kun yritti viimeisillä pään voimilla miettiä, mitä jonkin mallissa esiintyvän todennäköisyysjakauman keskihajontaa kuvaava todennäköisyysjakauma nyt sitten oikeassa elämässä kuvastaa tai mistä lähteä purkamaan, jos tietokoneohjelma herjasi toimimattomasta mallista.

 

Tässä kohtaa nostan hattua kurssimme vetäjälle, joka päätti parin ensimmäisen kurssikerran jälkeen tarttua tilaisuuteen ja muuttaa kurssimme suoritustapaa käytännönläheisempään suuntaan huomattuaan Vantaanjoella alkavan meritaimenprojektin. Nyt kurssin asioita sovelletaan suoraan käytännön asioihin ja yhteydet mallien ja todellisten kosketeltavien asioiden välillä ovat huomattavasti helpompia hahmottaa. Tämä lisää myös merkittävästi motivaatiota ymmärtää, mitä malleissa ja niiden sisällä tapahtuu.

 

_DSF4691

Smolttirysän sivusaaliina pyytämä laskutaimen mitataan ja siltä otetaan suomunäyte.

 

Vieläkään en koe puhuvani edes ontuvaa ”Bayesia” ja yksinkertaisienkin BUGS -mallien yksin puhtaalta pöydältä kirjoittaminen (siten, että myös BUGS –ohjelma minua ymmärtäisi) tuntuu mahdottomalta tehtävältä. Nyt kuitenkin hahmotan valmiiden, tässä vaiheessa käyttämiemme verraten yksinkertaisen mallien eri osat ja mitä ne kuvastavat.  Kun isommat asiat teknisten yksityiskohtien ympäriltä hahmottuvat paremmin, on varmasti myös mallien kieltä lopulta helpompi opetella ja ymmärtää. Uskon, että paljon kerkeän vielä kurssin loppupuoliskon aikana oppimaan.

 

Jotta saisin postaukseen muutakin sisältöä, kuin omaan oppimisprosessiini liittyviä pohdiskeluita, esitän joitakin projektiin liittyviä mietelmiä. Minulla ollessa hyvin rajallisesti annettavaa vaelluspoikasten kokonaismäärää arvioivan mallimme teknisessä kehittämisessä, katson nyt mallista eteenpäin. Malli tulee laskemaan ja posteriorijakauma kuvastamaan käsitystämme kauden aikana Vantaanjoesta mereen vaeltavien taimensmolttien kokonaismäärästä (mallissa kuvastettuna kirjaimella N). Olisi luontevaa mallia, sekä tutkimusta eteenpäin kehittämällä saada myös tietoa tapetilla olevan länsihaaran voimalapadon aiheuttamasta tappiosta mereen asti lopulta pääsevien smolttien lukumäärässä. Tästä saataisiin paljon kaivattua tietoa päätöksenteon tueksi padon mahdollista purkamista koskien. Mikäli esimerkiksi padon aiheuttama lovi Vantaanjoen taimentuotantopotentiaaliin arvotetaan tarpeeksi korkealle muiden purkamisen tuomien etujen lisäksi verrattuna vaakakupin toisella puolella mm. padon sähköntuotanto-, sekä kulttuuriarvoihin on päätöksentekijöiden helpompaa toimia padon purkamisen puolesta.

 

_DSC9462

Vanhankaupunginkoskella kalassa oleva isokoskelo.

 

Kuten mallin kehittelystä kertovissa aiemmissa postauksissa on kerrottu, saatiin tutkimuksessa käytetyn pyydyksen tehoa alustavasti arvioitua mandariinikokeella, jossa ylävirrasta lasketuista 100 mandariinista 70 ajautui padolle ja 30 itähaaraan, joista edelleen 20 päätyi ruuviin. Smoltit uivat toki mandariineja ketterämmin, mutta voidaan olettaa mandariinien antavan suuntaa myös laskeutuvien kalojen jakautumisesta joen haaroihin. Tästä saamme alustavan oletuksen padolle päätyvistä smolteista. Uutta dataa tarvittaisiin padon aiheuttamasta kuolevuudesta, jotta arvioissa sen aiheuttamasta hävikistä mereen asti pääsevien smolttien määrässä päästäisiin eteenpäin.

 

Ensimmäisen mallin tulokset 28.4.

Malli ajettiin OpenBugs-ohjelmalla (versioilla 3.2.2 ja 3.2.3) käyttämällä Markov Chain Monte Carlo (MCMC) –metodia (http://en.wikipedia.org/wiki/Markov_chain_Monte_Carlo).

Taimensmolttien vaellusajaksi määritettiin 60 päivää ja kokonaismäärän priorin odotusarvoksi 5000 ja hajonnaksi 3000.

Ensimmäisestä malliversiosta ajettiin kaksi eri malliajoa tiistaina 28.4.2015 (d 20) saatujen havaintojen jälkeen. Ensimmäisellä kerralla iterointimäärä oli pieni (10 000) ja toisella suuri (n. 89 000). Molemmissa ajoissa käytettiin kahta simulaatioketjua.

Vaeltavien taimensmolttien kokonaismäärä 2015 (N)

Pienellä iterointimäärällä (sample size 19 000, burn in 0-501) kokonaismäärän odotusarvoksi saatiin 2042 ja 95 % luottamusväli 153-7015. Suurella iterointimäärällä (sample size 177 026, burn in 0-5000) kokonaismäärän odotusarvo oli 2020 ja 95 % luottamusväli 152-7683 (Taulukko 1). Odotusarvot eivät juuri muuttuneet suuremmasta iterointimäärästä huolimatta. MC-error pienellä iterointimäärällä oli n. 130, kun taas suurella iterointimäärällä MC-error oli n. 68. MC-erroria voidaan käyttää kuvaamaan estimaatin tarkkuutta, ja sen tulisi pienentyä iterointimäärän kasvaessa. Tästä syystä tarkastelemme lähemmin tuloksia, jotka on saatu suuremmalla iterointimäärällä. Burn in –toimintoa käytetään, jotta simulaation alusta saadaan poistettu konvergoitumaton osa. BGR-diagnostiikka vertaa simulaatioketjujen sisäistä ja välistä varianssia ja kertoo ketjujen konvergoitumisesta. Simulaation konvergoiduttua vihreän ja sinisen viivan tulisi stabiloitua ja punaisen viivan liikkua lähellä arvoa 1 (Kuva 1). Tämän perusteella burn in-jaksoa olisi pitänyt kasvattaa. Todennäköisin yksittäinen arvio kokonaismäärästä on (posteriorijakauman moodi) 200-300 (Kuva 2). Tätä arviota vetää alas ruuviin joutuneiden smolttien vähäinen määrä.

pic1

Kuva 1. BGR-diagnostiikka posteriori-N:lle; vihreä viiva = yhdistettyjen simulaatioketjujen 80 % intervallileveys, sininen = keskimääräinen leveys 80 % simulaatioketjujen intervalleille, punainen = vihreän ja sinisen viivan suhde.
pic2

Kuva 2. Posteriorijakauma vaeltavien taimensmolttien kokonaismäärästä 2015.
Vaeltavien taimensmolttien määrä keskiviikkona 29.4.2015

Odotusarvo vaeltavien taimensmolttien lukumäärästä keskiviikkona 29.4.2015 (n[21]) on 46 ja 95 % luottamusväli 2-186. Todennäköisin yksittäinen arvio (posteriorijakauman moodi) vaeltavien smolttien määrästä on kuusi taimensmolttia (Kuva 3).

Odotusarvoja tarkasteltaessa havaitaan, että vaellushuippu olisi osunut jo 13 päivää sitten (n[9]=126). Arvioimme, että tulos ei ole realistinen, vaan vaellushuippu olisi tulossa vasta myöhemmin, koska lämpötila on vielä alle 8 °C (asiantuntija-arvio vaelluksen käynnistymislämpötilasta). Tästä syystä mallia tulisi muokata seuraavissa malliversioissa.

Miksi todennäköisyysjakauman muoto on lognormaali?

pic3

Kuva 3. Posteriorijakauma vaeltavien taimensmolttien määrä keskiviikkona 29.4.2015

Taulukko 1. OpenBugs malliajon posterioristatistiikka N:lle ja n[1:22]:lle.

tab1

Ruuviin jäävien taimensmolttien määrä keskiviikkona 29.4.2015

Odotusarvo ruuviin jäävien taimensmolttien määrästä keskiviikkona 29.4.2015 (x[21]) on 0 ja 95 % luottamusväli 0-2. Todennäköisin yksittäinen arvio (posteriorijakauman moodi) on, että ruuviin ei jää yhtään taimensmolttia (Kuva 4).

pic4

Kuva 4. Posteriorijakauma ruuviin jäävien taimensmolttien määrästä keskiviikkona 29.4.2015

 

 

Ensimmäisen mallin rakentaminen

Bayesin teoreema (myös Bayesin sääntö tai Bayesin laki) on ehdolliseen todennäköisyyteen liittyvä matemaattinen teoreema. Teoreeman voidaan tulkita kuvaavan käsitysten päivittämistä uuden todisteaineiston valossa, eli priorin päivittämistä datan ja mallin avulla posterior-tiedoksi. Tutkittaessa asiaa myöhemmin uudestaan: vanha posterior-tieto voidaan käyttää uutena priorina.

bayes teoria

 

Priori kuvaa alkukäsitystä tutkittavasta asiasta, eli meidän tapauksessamme arviota mereen vaeltavien smolttien määrästä. Saimme asiantuntija-arvion Vesi- ja Kalatutkimus Oy:ltä. Heidän arvion mukaan mereen vaeltaisi n. 5000 taimensmolttia. Käsityksemme populaatiosta on normaalistijakautunut. Arvioon sisältyi reilusti epävarmuutta ja siksi hajonta määräytyi 3000.

 

Alla priori koodin pätkänä.

model {

#P(N)
# N = ‘True number of leaving trouts this year’
N<-round(cN)
cN~dnorm(5000, prec_N)I(1,)
prec_N<-pow(sd_N, -2)
sd_N<-3000

 

Veden lämmetessä kahdeksaan asteeseen, smoltit aktivoituvat ja lähtevät vaeltamaan merta kohti. Veden lämpötila oli datan keräämisen alkuhetkellä (9.4.2015) 4,2 astetta. Oletamme lämpötilan nousevan muutamassa viikossa 8 asteeseen, joten vaelluksen huippu ajoittuisi datan keruun alkupuolelle. Tällä oletuksella päädyimme käyttämään lognormal jaukaumaa.

Alla pätkä mallin koodista

#P(p[i])
# p[i] = ‘Daily probability of leaving’.
# We can use any function p = f(i) that satisfies:
# 1) sum(p) = 1

# Here we use a scaled version of lognormal density
for(i in 1:m) {
pi[i] <- (1/i)*exp(- pow(log(i)-location, 2) / scale)
p[i] <- pi[i] / sum(pi[1:60])

# Number of leaving trouts at day i
n[i]~dbin(p[i],N)

# Priors for the distribution of p
myy_p~dnorm(25,tau_myy)I(0.01,)
tau_myy<-pow(7,-2)
sd_p~dnorm(10, tau_sd)I(0.01,)
tau_sd<-pow(5, -2)

scale <- log(1 + pow(sd_p/myy_p,2) )
location <- log(myy_p) -0.5*scale

 

Mereen vaeltavien smolttimäärien arvio perustuu Vesi- ja Kalatutkimus Oy:n tekemään merkitse ja takaisinpyynti metodiin. Merkityillä smolteilla saadaan myös päivitettyä pyydysten/pyydyksen tehoa. Pyydyksen tehoa arviotiin selvittämällä sille priori. Priori selvitettiin vapauttamalla 100 mandariinia joen ylävirtaan, joista 70 meni patouomaan, 20 jäi kalatieuomassa olevaan ruuviin, ja 10 meni kalatieuomassa ruuvin ohi (kts. kuva).

mandariinikoe

Mallissamme pyydys noudattaa betajaukaumaa, jossa pyydyksen teho saa todennäköisyysarvon nollan ja yhden väliltä. Mikäli merkitty kala pyydetään uudestaan merkitään se koodissa onnistumiseksi(alpha). Jos kala ei päädy pyydykseen uudestaan, merkitään se epäonnistumiseksi (beta). Onnistumiset päivittyvät sitä mukaan malliin, kun niitä saadaan pyydykseen. Mandariinikokeen perusteella saimme alphaksi 20 ja betaksi 80. Alpha ja beta voidaan kuvitella pseudohavaintoina. Koska prioriin sisältyy reilusti epävarmuutta, käytimme alphan ja betan määrinä suhteellisia lukuja jotka olivat alkutietoja pienempiä, eli alpha 2 ja beta 8. Tämä kuvastaa epävarmuutta siitä, että kalat käyttäytyisivät samalla tavalla kuin mandariinit.

Pyydyksen malli alla:

 

# q = the effectiveness of the sampling device following a bete
# distribution with parameters alpha (=success) and beta (=failure)

q~dbeta(alpha,beta)
alpha<-2 # mandarines in the sampler, “less precise” (but with the #same ratio)
beta<-28 # mandariines elsewhere “less precise” (but with the same #ratio)

Kalojen määrää pyydyksessä päädyimme kuvaamaan ensin binomijakaumalla, koska kala joko on tai ei ole pyydyksessä. Populaation koko voi kuitenkin tällöin saada hetkellisesti x:ää pienempiä arvoja, joten teknisenä ratkaisuna käytimmekin poissonjakaumaa, jolloin kyseinen onglema ei häiritse mallia. Tähän asiaan kaipaisimme vielä lisäselvitystä. Q liittyy kiinteästi x:ään, kuten mallista huomaamme.

 

Pyydykseen päätyvien kalojen malli:

# x[i] = the daily catch (num. of fish caught at day i)
lambda[i] <- q*n[i]
x[i]~dpois(lambda[i])

Kalojen määrä pyydyksessä per päivä, tiistaihin 28.4.2015 asti.

list(m=60)
x[]
0
0
0
1
2
2
0
0
0
1
1
1
0
2
1
0
0
0
1
3
NA
NA
NA
NA
NA
NA
NA
NA
NA
NA
NA
NA
NA
NA
NA
NA
NA
NA
NA
NA
NA
NA
NA
NA
NA
NA
NA
NA
NA
NA
NA
NA
NA
NA
NA
NA
NA
NA
NA
NA
END

 

smolttitikussa