Tulokset 30.04-01.05

Image

Ennustukset päiville

22 ja 23

(eli ajalle 30.04-01.05)

 

Eilen (päivä 21) oli saatu yhteensä kuusi taimenta! Vappuluvut ennustetaan tässä nyt uusimmalla mallilla, jossa siis on otettu huomioon edellisessä postauksessa selitetyt tekijät: toinen pyydys (taimenrysä), muutosintensiteetin jakauman uudellenarviointi (käytössä nyt normaali-ja tasamalli), sekä uudet asiantuntijoiden antamat priorit kokonaismäärälle (kokonaislukumäärän odotusarvo 2600, keskihajonta 2000).

Tulokset:

Kuvio 1. Kokonaismäärän posteriori-jakauma normaalimallissa 1

 

 


1

 

Taulukko 1: mallin 1 antamat estimaatit taimenten kokonaismäärän jakauman tunnusluvuille (N Sample size = 147600):

mean
sd MC_error 95% interval
1199.0 834.3   26.68 283-3261

Kokonaismäärän odotusarvon piste-estimaatiksi normaalimallilla on siis laskettu 1199 kappaletta (95% luottamusväli 283-3261), joka, niin kuin saatettiin olettaa, on hieman korkeampi kuin edellisen päivän 1086.

 

Tasajakaumalla (malli 2) kokonaismäärän tulokset näyttävät hieman korkeammilta:

 

Kuvio 2. Kokonaismäärän posteriori-jakauma tasajaukamalla, eli mallissa 2
2

Taulukko 2: mallin 2 antamat estimaatit taimenten kokonaismäärän jakauman tunnusluvuille

mean
sd MC_error 95% interval
1578 1021 36.82 459-4274

 

Ennustukset päiville 22 ja 23 sen sijaan ovat seuraavanlaiset:

Normaalimallilla (malli 1)

Taulukko 3. Posteriorijakauma vaeltavien taimensmolttien määrä torstaina 30.4.2015 (n(22)) ja perjantaina 01.05 (n(23)).

n(i),sample size 147600                       mean sd MC_error 95% interval
n(22) 28.83 18.24 0.5629 7.0-76.0
n(23) 29.83 19.03 0.5872 7.0-79.0

JA

Tasamallilla (malli 2)

Taulukko 3. Posteriorijakauma vaeltavien taimensmolttien määrä torstaina 30.4.2015 (n(22)) ja perjantaina 01.05 (n(23)).

n(i),sample size 156200

  

mean           

 

sd MC_error 95% interval
n(22) 26.30 17.75 0.6137 6.0-73.0
n(23) 26.31 17.76 0.6137 6.0-73.0

 

Viimeiseksi vielä luvut pyydyksiin jäävien taimensmolttien määrästä torstaina 30.4.2015 (x(22)) ja perjantaina 01.05 (x(23)).

 

Normaalimallilla (malli 1):

Kuvio 3 ja 4. Posteriorijakauma ruuviin jäävien taimensmolttien määrästä torstaina 30.4.2015 (x(22)) ja perjantaina 01.05 (x(23)).

4, 5

Mallin mukaan keskiarvo (mean) oli siis:

x(22)= 3,463 ja x(23)= 3,595

Tasamalli (malli 2):

Kuvio 5 ja 6. Posteriorijakauma ruuviin jäävien taimensmolttien määrästä torstaina 30.4.2015 (x(22)) ja perjantaina 01.05 (x(23)).

5,6

Eli tasamallin mukaan keskiarvo (mean) oli:

x(22)= 2,664 ja x(23)= 2,670

Tässä siis esimakua uusimman mallin tuloksista! Mallissa on vielä paljon kehitettävää, ja esim. vieläkin mietimme, miten ruuvin ja rysän vaikutusta voisi parhaiten mallintaa. Nyt kun viime päivinä on satanut paljon ja vedenkorkeus on noussut, rysä otetaan mahdollisesti pois käytöstä, mutta ruuvin pitäisi toimia sitäkin paremmin…

Nyt toivotamme kaikille kuitenkin hauskaa (ja toivottavasti aurinkoista) vappua!!

 

 

 

Tuloksia tuplateholla

  • Päivä: 20
  • Smoltteja saatu yhteensä: 21

 

Tässä postauksessa esittelemme lyhyesti uuden mallin antamia tuloksi. Mallin nykytilasta voit lukea tarkemmin täältä: https://blogs.helsinki.fi/taimenlaskenta/?p=32

Tärkeät rakenteelliset muutokset malliin ovat: 1) toisen pyydyksen (taimenrysä) huomioiminen, sekä 2) muuttointensiteetin jakauman uudelleenarviointi. Muuttointensiteettiä, eli todennäköisyyttä muuttaa tiettynä päivänä, mallinnetaan nyt log-normaalin jakauman sijaan tasajakaumalla ja normaalijakaumalla. Syyt muutoksiin löytyvät ylläviitatusta postauksesta.

Lisäksi päivitimme asiantuntijaprioriamme muuttajien kokonaismäärän odotusarvosta. Meillä on nyt käytössä kolme asiantuntija-arviota, jotka ovat ’5000’, ’1940’ ja ’alle 1000’. Optimistisesti tulkitsimme alle 1000 tarkoittamaan 999 ja saimme näin kokonaislukumäärän priorijakauman odotusarvoksi (5000+1980+999) / 3 = 2600 ja keskihajonnaksi sd(5000,1980,999) = 2000. Mallina tälle priorille on edelleen kokonaisluvuiksi pyöristetty normaalijakauma, joka on katkaistu tuottamaan ainoastaan positiivisia arvoja.

Sitten tuloksiin!

 

Malli 1. normaalimalli muuttointensiteetille

 

 

Taulukko 1: mallin 1 antamat estimaatit taimenten kokonaismäärän jakauman tunnusluvuille

mean sd MC error 95% conf
N 1086.0 814.3 18.81 219 – 3307

 

Kuvio 1: kokonaismäärän posteriori-jakauma mallissa 1

  normal_N

 

 

Normaalimalli lähtemisintensiteetille tuottaa taimenten kokonaismäärän odotusarvon piste-estimaatiksi 1086 kappaletta, jolle 95% luottamusväli on 219 – 3307. Luonnollisesti uusi pienempi asiantuntijapriori vetää odotusarvoa alaspäin. Myöskään data ei toistaiseksi tue normaalioletusta lähtemisintensiteetille kovinkaan hyvin, sillä taimenia on pyydystetty tasaisen pieniä määriä, minkä johdosta tasajakaumapriori lähtemistodennäköisyydelle tuottaa (vielä toistaiseksi) suuremman estimaatin kokonaislukumäärälle, kuin normaalipriori. Tästä lisää alempana.

 

Taulukko 2: Kokonaispyydystettävyys mallissa 1.

mean sd MC error 95% conf
q 0.139 0.074 0.001 0.034 – 0.318

 

Kokonaispyydystettävyyden  estimaatti on mallissa 0.139, eli odotamme, että 13.9% kaloista joutuu jompaankumpaan pyydykseen. Toistaiseksi pyydykset eivät tosin ole onnistuneet uudelleenpyydystämään ainuttakaan 17 merkatusta kalasta, joten pyydysten pyydystettävyys päivittyy priorioletuksista jatkuvasti huonompaan suuntaan. Tämän(kin) johdosta kokonaismäärän odotusarvon estimaatti tulee todennäköisesti päivittymään suuremmaksi tulevina päivinä, kun dataa saadaan lisää.

 

Malli 2. Vantaanjoesta muuttavien smolttien totaalin posterioriestimaatti, kun muuttointensiteettien oletetaan noudattavan tasajakaumaa päivien funktiona.

 

Olettaen muuttointensiteetin seuraavan tasajakaumaa saadaan seuraava posteriorijakauma seurantajakson aikana muuttavien smolttien kokonaismääräksi N.

Taulukko 3. Vantaanjoesta muuttavien smolttien kokonaismäärän posteriorijakauma.

Mean Sd MC_error val2.5pc median val97.5pc start sample
N 1346.0 873.5 9.441 364.0 1105.0 3694.0 66301 2827470

 

Kuvio 2. Muuttavien smolttien kokonaismäärän posteriorijakauma

Unif_N

 

Paras yksittäinen posterioriestimaatti liikkuu jossain reilun tuhannen paikkeilla. Mielestäni tämä vaikuttaa uskottavalla yksittäiseltä arviolta. Voidaan kuitenkin todeta, että arvio smolttien kokonaismäärästä on vielä kovin epävarma.  95% todennäköisyydellä totaali olisi mallin perusteella välillä (360; 3700).

Samaan hengenvetoon voidaan kyseenalaistaa, onko posterioriarvio riittävän epävarma? Aineistoa on nimittäin saatu kovin vähän, eikä sen ja prioritiedon valossa uskaltaisi välttämättä mennä väittämään, ettei smoltteja varmasti muuta esimerkiksi yli 6000. Itse en menisi tästä takuuseen: hyvin paljon nimittäin riippuu tehdyistä mallioletuksista. Kenties luotettavin arvio saataisiinkin keskiarvoistamalla posterioriestimaatit yli rakennettujen mallien. Palataan asiaan myöhemmässä blogipostauksessa.

Näkisin mallivalinnassa esiintyvän kaksi erityisen suurta epävarmuustekijää: 1) mitä jakaumaa smolttien muuttointensiteetti (ajan funktiona) noudattaa (ks. viimeisin mallit -osion blogipostaus)? sekä 2) mikä on ruuvin ja rysän pyydystystodennäköisyys?

Molempien suhteen priorioletuksemme päivittyy koko ajan melko vinhaa vauhtia. Ensimmäistä koskien olemme joutuneet jo luopumaan epärealistiseksi todetusta lognormaalijakaumasta: kyseinen priorioletus asetti liian paljon todennäköisyysmassaa ensimmäisten havaintopäivien kohdalle. Jälkimmäistä koskien oletuksemme ovat siirtyneet vahvasti kohti heikompaa pyydystettävyyttä, mikä on varsin perusteltua, sillä vielä emme nimittäin ole saaneet yhtään smolttia uudelleenpyydettyä. Lähtökohtainen joka viidennen smoltin jääminen ruuviin on muuttunut noin 7% odotusarvoksi kunkin pyydyksen pyydystettävyydelle. Kenties tämän suhteen beta-jakauma priorimme oli turhan informatiivinen vastatessaan kymmentä pseudosmolttihavaintoa.

 

Taulukko 4. Posterioriestimaatti yhteenlasketulle (ts. smoltti jää rysään TAI ruuviin) pyydystettävyydelle

Mean Sd MC_error val2.5pc median val97.5pc start sample
q 0.1248 0.0666 5.534E-4 0.03345 0.1122 0.2854 152121 2570010

 

Pyydystettävyyden estimointia tulisi parantaa varsinkin suhteessa rysän ja ruuvin suhteelliseen pyydystehoon. Nythän oletamme rysän ja ruuvin saalistavan samalla teholla: oletus, jonka paikkansapitävyydelle ei ole juuri perusteita. Samanaikaisesti pyydystettävyystehot päivittyvät ainoastaan uudelleenpyydettyjen smolttien aineistolla. Voidaan kuitenkin hyvin olettaa, että kaikki (muutkin kuin merkatut smoltit) kalat tuovat mukanaan informaatiota pyydystettävyydestä jäädessään kuhunkin pyydykseen. Jos esimerkiksi alkaisi vaikuttaa siltä, että yhteen pyydykseen jää kaksi kertaa niin paljon kaloja kuin toiseen, tulisi mallin kyetä päivittämään pyydysten suhteellisia tehoja havainnon mukaisesti. Tämä voitaisiin kenties tehdä laskemalla aineiston mukaan päivitettävät painot pyydyskohtaisille todennäköisyyksille. Näiden painojen keskiarvon tulisi olla 1. Jatkossa tämän näkökulman huomioimista on syytä edelleen kehittää.

 

 

 

Lisäpyydyksen huomioiminen ja lähtemisintensiteetin uudelleenmallintaminen

Muutoksia malliin: uusi pyydystystapa sekä priorioletusten päivittäminen

Pyydystystavan muutoksen huomioiminen mallissa

Päivän 16 kohdalla tapahtui tutkimusasetelman kannalta mielenkiintoinen muutos, kun datan lähteeksi joelle lisättiin Taimenruuvin lisäksi Taimenrysä, joka sijaitsee joen haaraumassa suunnilleen kuvan osoittamalla tavalla.

Kuva 1. Pyydysten sijainnit

Position of the samplers

 

Tämä tietysti vaikuttaa oleellisesti päivittäisen saalismäärän jakaumaan. Koko mallimme rakenne on karkeasti kuvattuna suunnilleen seuraavanlainen:

N & p -> n , n & q -> x

N = lähtevien taimenten kokonaismäärä

p = päivittäinen lähtötodennäköisyys

n = päivittäisten lähtijöiden lukumäärä

q = pyydystystodennäköisyys

x = pyydystettyjen taimenten lukumäärä

 

Eli kokonaislukumäärä ja päivittäinen lähtötodennäköisyys määräävät päivittäisten lähtijöiden lukumäärän jakauman, joka taas yhdessä pyydystystodennäköisyyden kanssa määrittää kiinnijääneiden lukumäärän jakaumaan. Tämä hierarkisen rakenteen ansiosta pyydykseen jääneiden kalojen lukumäärä päivittää esimerkiksi arviotamme kokonaislukumäärästä (N).

Taimenrysän tullessa peliin mukaan, täytyy pyydystystodennäköisyys määrittää uudestaan. Rysä ja ruuvi eivät vaikuta toistensa toimintaan, mutta sama kala ei voi jäädä kiinni molempiin. Siis:

P(kala jää ruuviin TAI rysään) = P(kala jää rysään) + P(kala jää ruuviin) – P(kala jää ruuviin JA rysään)

BUGS-koodilla tämä näyttää seuraavalta. (En käy läpi koodin yksityiskohtia; jos BUGS ei sinua kiinnnosta, siirry alas muuttointensiteettiä käsittelevään kappaleeseen!)

# Total cathability

q <- q_f + q_s – q_f * q_s

 

#separate catchabilities for both catching methods

# a=number of recaptures

# b=number of marked smolts not recaptured on the next day

# q_s=catchability of the smolt screw

q_s~dbeta(alpha,beta)

alpha<-(2 + sum(a[1:m[2]]))

beta<-(8 + sum(b[1:m[2]]))

# q_f=catchability of the fyke, that has been operational from day 15

q_f~dbeta(alpha2,beta2)

alpha2<-(2+(sum(a2[15:m[2]])))

beta2<-(8+(sum(b[15:m[2]])))

 

Nyt kun pyyntitodennäköisyys on uudelleenmääritelty, täytyy vielä mallissa huomioida, että muutos tapahtui tiettynä päivänä. Toteutimme tämän step-funktion avulla seuraavasti:

for(i in 1:m[1]) {

.

.

.

# catchability changed from day 16

lambda[i] <- q_s*n[i]*step(15-i) + q*n[i]*step(i-16)

 

# x[i] = the daily catch (num. of fish caught at day i)

x[i]~dpois(lambda[i])

}

Data näyttää mallissa nyt seuraavalta:

list(m=c(60,20))

x[]  a[]  a2[]      b[]

0    0    0    0

0    0    0    0

0    0    0    0

1     0    0    0

2     0    0    0

2     0    0    3

0    0    0    2

0    0    0    0

0    0    0    0

1     0    0    0

1     0    0    1

1     0    0    1

0    0    0    1

2     0    0    0

1     0    0    2

1     0    0    1

1     0    0    1

1     0    0    1

2     0    0    1

5     0    0    3

 

Muuttointensiteettiä koskevan priorioletuksen päivittäminen

Yhtenä oleellisena haasteena – sekä tarkkailuaikana kokonaisuudessaan Vantaanjoesta mereen siirtyvien smolttien totaalin posterioriestimoinnissa, että seuraavan päivän muuttomäärän estimoinnissa – on määrittää, kuinka muuttointensiteetti vaihtuu päivien kuluessa. Tämän suhteen asiantuntijatietoon perustuvana priorina käytettiin arviota, jonka mukaan a) muutto lähtee (luonnon olosuhteissa) toden teolla käyntiin noin 7 celsius -asteessa sekä b) muutto saavuttaa huippunsa 8 asteen tienoilla. Arvelimme intensiteetin huipun tämän perusteella saavutettavan siis jo seurannan alkuvaiheilla hahmotellen, että päivittäiset muuttomäärät laskevat huipun saavutettuaan hitaammin kuin olivat nousseet, hiipuen pikkuhiljaa lähtötasolle seurannan loppuessa noin 60 päivän jälkeen. Oletamme, että kaikki joessa majailevat smoltit lähtevät liikkeelle seuranta-ajan kuluessa. Tämä olettamus tuskin kirjaimellisesti pitää paikkansa, sillä jo ensimmäisinä päivinä saimme haaviin muutamia havaintoja, mikä antaa ymmärtää, että oletettavasti smoltteja on kulkenut vanhankaupunginkosken ohi jo ennen seurannan aloittamista.

Ennen kaikkea yllä tehdyn priorioletuksen b) perusteella päätimme arvioida yksittäisen smoltin todennäköisyyttä lähteä liikkeelle päivänä i vahvasti oikealle vinolla funktiolla. Tämän kaltaista jakaumamuotoa voitaisiin lähteä approksimoimaan esim. jonkinlaisella muunnelmalla Pareto-, Gamma- tai lognormaalijakaumasta. Päädyimme lognormaalin kaltaiseen funktioon, jonka varmistimme täyttävän todennäköisyysjakauman määritelmän määrittelyjoukossaan jakamalla funktion antamat arvot kaikkien arvojen summalla.

Havaitsimme kuitenkin pian, että lognormaalijakaumalla tullaan olettaneeksi aivan liian suuren osuuden smolteista lähteneen liikkeelle seurannan alkupäivinä. Tämän oletuksen seurauksena yksittäisten päivien muuttoestimaatit vaikuttivat liian korkeilta jo havaituille päiville. Samaisesta syystä totaaliestimaatti vaikutti arvioivan todellista muuttomäärää alakanttiin. Uumoilimme, että muuttohuippu ollaan vasta saavuttamassa ja joko että 1) kasvu huipulle tultaessa ei ole niin jyrkkään – ainakaan seurannan ensimmäisinä päivinä – kuin lognormaalijakauma olettaa, tai 2) että kasvu on vielä jyrkempää, mutta täysin äkillistä. Ehkäpä tiettyjen biologisten ennakkoehtojen kuten sopivan lämpötilan ja valonmäärän osuessa kohdalle, lukemattomat smoltit lähtevät liikkeelle samanaikaisesti.

Kuvio 1. Smolttien ennustetut odotusarvoiset muuttomäärät päivien funktiona mallivalinnalla lognormaali

log_n

Kuten kuviosta 1 havaitsee, mallioletuksella lognormaali smolttien muuton huipun pitäisi jo olla takanapäin, sillä tänään 29.5. olemme päivässä nro 21. Tämä on ristiriidassa asiantuntijatiedon kanssa, jonka mukaan muuttaminen saavuttaa huippunsa noin kahdeksassa asteessa, mikä lämpötila saavutettiin eilen. Samaisesta syystä mallin estimoima suhteellinen muuttaneiden osuus kaikista joen smolteista vaikuttaa liian korkealta.

Korjausliikkeenä em. haasteeseen 1) päätimme muuttaa oletustamme muuttointensiteetistä. Lähdimme mallintamaan asiaa kahdella vaihtoehtoisella tavalla. Ensinnäkin datavetoisesti olettaen muuttotodennäköisyyden vakioksi yli päivien (ts P[i] = 1/60). Toiseksi olettaen jakauman normaaliseksi saavuttaen huippunsa odotusarvoisesti 25 päivän kohdalla. Saimme seuraavat estimaatit päiväkohtaisille muuttomäärien odotusarvoille:

Kuvio 2. Smolttien ennustetut odotusarvoiset muuttomäärät päivien funktiona mallivalinnalla tasajakauma ja normaalijakauma

 Unif_nNormal_n

Nähdäksemme kyseisillä mallivalinnoilla on realistisemmat oletukset jo mereen muuttaneiden smolttien suhteellisesta osuudesta. Datavetoisella tasajakaumapriorilla saamme suhteessa havaittujen smolttien aineistossa esiintyneeseen tasaiseen trendiin perustellun oloisia estimaatteja. Normaalijakaumaoletuksella muuttohuippu on vasta edessä, minkä lisäksi pienempi osuus smolteista oletetaan jo muuttaneen kuin lognomaalioletuksella.

Edellä arveltiin, että menneiden tutkimusten perusteella saattaisi käydä niin, että muutto tapahtuu muutamassa harppauksessa sitten, kun se lähtee käyntiin. Näin ollen päivien yli oletetun muuttointensiteetin jakaumaan saattaa olla perusteltua tehdä yhä joitain kyseiset arviot paremmin huomioonottavia muokkauksia. Esimerkiksi voitaisiin olettaa, että muutto on tasaista (sitä kuvaa tasajakauma) tiettyyn päivään asti, jolloin jakauman muoto muuttuu ikään kuin kategorisena muuttointensiteetin tilan muutoksena. Tämä voidaan sisällyttää malliin olettamalla eri muuttoajanjaksoille (korkea / alhainen intensiteetti) omat niitä parhaiten kuvaavat todennäköisyysjakaumat esimerkiksi edellä jo esiintyneen step -funktion logiikkaa hyödyntäen.

Ensimmäisen mallin tulokset 28.4.

Malli ajettiin OpenBugs-ohjelmalla (versioilla 3.2.2 ja 3.2.3) käyttämällä Markov Chain Monte Carlo (MCMC) –metodia (http://en.wikipedia.org/wiki/Markov_chain_Monte_Carlo).

Taimensmolttien vaellusajaksi määritettiin 60 päivää ja kokonaismäärän priorin odotusarvoksi 5000 ja hajonnaksi 3000.

Ensimmäisestä malliversiosta ajettiin kaksi eri malliajoa tiistaina 28.4.2015 (d 20) saatujen havaintojen jälkeen. Ensimmäisellä kerralla iterointimäärä oli pieni (10 000) ja toisella suuri (n. 89 000). Molemmissa ajoissa käytettiin kahta simulaatioketjua.

Vaeltavien taimensmolttien kokonaismäärä 2015 (N)

Pienellä iterointimäärällä (sample size 19 000, burn in 0-501) kokonaismäärän odotusarvoksi saatiin 2042 ja 95 % luottamusväli 153-7015. Suurella iterointimäärällä (sample size 177 026, burn in 0-5000) kokonaismäärän odotusarvo oli 2020 ja 95 % luottamusväli 152-7683 (Taulukko 1). Odotusarvot eivät juuri muuttuneet suuremmasta iterointimäärästä huolimatta. MC-error pienellä iterointimäärällä oli n. 130, kun taas suurella iterointimäärällä MC-error oli n. 68. MC-erroria voidaan käyttää kuvaamaan estimaatin tarkkuutta, ja sen tulisi pienentyä iterointimäärän kasvaessa. Tästä syystä tarkastelemme lähemmin tuloksia, jotka on saatu suuremmalla iterointimäärällä. Burn in –toimintoa käytetään, jotta simulaation alusta saadaan poistettu konvergoitumaton osa. BGR-diagnostiikka vertaa simulaatioketjujen sisäistä ja välistä varianssia ja kertoo ketjujen konvergoitumisesta. Simulaation konvergoiduttua vihreän ja sinisen viivan tulisi stabiloitua ja punaisen viivan liikkua lähellä arvoa 1 (Kuva 1). Tämän perusteella burn in-jaksoa olisi pitänyt kasvattaa. Todennäköisin yksittäinen arvio kokonaismäärästä on (posteriorijakauman moodi) 200-300 (Kuva 2). Tätä arviota vetää alas ruuviin joutuneiden smolttien vähäinen määrä.

pic1

Kuva 1. BGR-diagnostiikka posteriori-N:lle; vihreä viiva = yhdistettyjen simulaatioketjujen 80 % intervallileveys, sininen = keskimääräinen leveys 80 % simulaatioketjujen intervalleille, punainen = vihreän ja sinisen viivan suhde.
pic2

Kuva 2. Posteriorijakauma vaeltavien taimensmolttien kokonaismäärästä 2015.
Vaeltavien taimensmolttien määrä keskiviikkona 29.4.2015

Odotusarvo vaeltavien taimensmolttien lukumäärästä keskiviikkona 29.4.2015 (n[21]) on 46 ja 95 % luottamusväli 2-186. Todennäköisin yksittäinen arvio (posteriorijakauman moodi) vaeltavien smolttien määrästä on kuusi taimensmolttia (Kuva 3).

Odotusarvoja tarkasteltaessa havaitaan, että vaellushuippu olisi osunut jo 13 päivää sitten (n[9]=126). Arvioimme, että tulos ei ole realistinen, vaan vaellushuippu olisi tulossa vasta myöhemmin, koska lämpötila on vielä alle 8 °C (asiantuntija-arvio vaelluksen käynnistymislämpötilasta). Tästä syystä mallia tulisi muokata seuraavissa malliversioissa.

Miksi todennäköisyysjakauman muoto on lognormaali?

pic3

Kuva 3. Posteriorijakauma vaeltavien taimensmolttien määrä keskiviikkona 29.4.2015

Taulukko 1. OpenBugs malliajon posterioristatistiikka N:lle ja n[1:22]:lle.

tab1

Ruuviin jäävien taimensmolttien määrä keskiviikkona 29.4.2015

Odotusarvo ruuviin jäävien taimensmolttien määrästä keskiviikkona 29.4.2015 (x[21]) on 0 ja 95 % luottamusväli 0-2. Todennäköisin yksittäinen arvio (posteriorijakauman moodi) on, että ruuviin ei jää yhtään taimensmolttia (Kuva 4).

pic4

Kuva 4. Posteriorijakauma ruuviin jäävien taimensmolttien määrästä keskiviikkona 29.4.2015

 

 

Ensimmäisen mallin rakentaminen

Bayesin teoreema (myös Bayesin sääntö tai Bayesin laki) on ehdolliseen todennäköisyyteen liittyvä matemaattinen teoreema. Teoreeman voidaan tulkita kuvaavan käsitysten päivittämistä uuden todisteaineiston valossa, eli priorin päivittämistä datan ja mallin avulla posterior-tiedoksi. Tutkittaessa asiaa myöhemmin uudestaan: vanha posterior-tieto voidaan käyttää uutena priorina.

bayes teoria

 

Priori kuvaa alkukäsitystä tutkittavasta asiasta, eli meidän tapauksessamme arviota mereen vaeltavien smolttien määrästä. Saimme asiantuntija-arvion Vesi- ja Kalatutkimus Oy:ltä. Heidän arvion mukaan mereen vaeltaisi n. 5000 taimensmolttia. Käsityksemme populaatiosta on normaalistijakautunut. Arvioon sisältyi reilusti epävarmuutta ja siksi hajonta määräytyi 3000.

 

Alla priori koodin pätkänä.

model {

#P(N)
# N = ‘True number of leaving trouts this year’
N<-round(cN)
cN~dnorm(5000, prec_N)I(1,)
prec_N<-pow(sd_N, -2)
sd_N<-3000

 

Veden lämmetessä kahdeksaan asteeseen, smoltit aktivoituvat ja lähtevät vaeltamaan merta kohti. Veden lämpötila oli datan keräämisen alkuhetkellä (9.4.2015) 4,2 astetta. Oletamme lämpötilan nousevan muutamassa viikossa 8 asteeseen, joten vaelluksen huippu ajoittuisi datan keruun alkupuolelle. Tällä oletuksella päädyimme käyttämään lognormal jaukaumaa.

Alla pätkä mallin koodista

#P(p[i])
# p[i] = ‘Daily probability of leaving’.
# We can use any function p = f(i) that satisfies:
# 1) sum(p) = 1

# Here we use a scaled version of lognormal density
for(i in 1:m) {
pi[i] <- (1/i)*exp(- pow(log(i)-location, 2) / scale)
p[i] <- pi[i] / sum(pi[1:60])

# Number of leaving trouts at day i
n[i]~dbin(p[i],N)

# Priors for the distribution of p
myy_p~dnorm(25,tau_myy)I(0.01,)
tau_myy<-pow(7,-2)
sd_p~dnorm(10, tau_sd)I(0.01,)
tau_sd<-pow(5, -2)

scale <- log(1 + pow(sd_p/myy_p,2) )
location <- log(myy_p) -0.5*scale

 

Mereen vaeltavien smolttimäärien arvio perustuu Vesi- ja Kalatutkimus Oy:n tekemään merkitse ja takaisinpyynti metodiin. Merkityillä smolteilla saadaan myös päivitettyä pyydysten/pyydyksen tehoa. Pyydyksen tehoa arviotiin selvittämällä sille priori. Priori selvitettiin vapauttamalla 100 mandariinia joen ylävirtaan, joista 70 meni patouomaan, 20 jäi kalatieuomassa olevaan ruuviin, ja 10 meni kalatieuomassa ruuvin ohi (kts. kuva).

mandariinikoe

Mallissamme pyydys noudattaa betajaukaumaa, jossa pyydyksen teho saa todennäköisyysarvon nollan ja yhden väliltä. Mikäli merkitty kala pyydetään uudestaan merkitään se koodissa onnistumiseksi(alpha). Jos kala ei päädy pyydykseen uudestaan, merkitään se epäonnistumiseksi (beta). Onnistumiset päivittyvät sitä mukaan malliin, kun niitä saadaan pyydykseen. Mandariinikokeen perusteella saimme alphaksi 20 ja betaksi 80. Alpha ja beta voidaan kuvitella pseudohavaintoina. Koska prioriin sisältyy reilusti epävarmuutta, käytimme alphan ja betan määrinä suhteellisia lukuja jotka olivat alkutietoja pienempiä, eli alpha 2 ja beta 8. Tämä kuvastaa epävarmuutta siitä, että kalat käyttäytyisivät samalla tavalla kuin mandariinit.

Pyydyksen malli alla:

 

# q = the effectiveness of the sampling device following a bete
# distribution with parameters alpha (=success) and beta (=failure)

q~dbeta(alpha,beta)
alpha<-2 # mandarines in the sampler, “less precise” (but with the #same ratio)
beta<-28 # mandariines elsewhere “less precise” (but with the same #ratio)

Kalojen määrää pyydyksessä päädyimme kuvaamaan ensin binomijakaumalla, koska kala joko on tai ei ole pyydyksessä. Populaation koko voi kuitenkin tällöin saada hetkellisesti x:ää pienempiä arvoja, joten teknisenä ratkaisuna käytimmekin poissonjakaumaa, jolloin kyseinen onglema ei häiritse mallia. Tähän asiaan kaipaisimme vielä lisäselvitystä. Q liittyy kiinteästi x:ään, kuten mallista huomaamme.

 

Pyydykseen päätyvien kalojen malli:

# x[i] = the daily catch (num. of fish caught at day i)
lambda[i] <- q*n[i]
x[i]~dpois(lambda[i])

Kalojen määrä pyydyksessä per päivä, tiistaihin 28.4.2015 asti.

list(m=60)
x[]
0
0
0
1
2
2
0
0
0
1
1
1
0
2
1
0
0
0
1
3
NA
NA
NA
NA
NA
NA
NA
NA
NA
NA
NA
NA
NA
NA
NA
NA
NA
NA
NA
NA
NA
NA
NA
NA
NA
NA
NA
NA
NA
NA
NA
NA
NA
NA
NA
NA
NA
NA
NA
NA
END

 

smolttitikussa