About Deleted User

Special user account.

Tuloksia 25.5

Päivä           Smoltteja
22.5             0
23.5             2
24.5             0
25.5             0

Päiviteltiin taas hieman mallia viimeisimmällä, joskaan ei niin kovin tuoreella saatikka runsaalla datalla. Smoltittomia päiviä on sattunut tässä jo useampi, joko rupeaa kalat vedestä loppumaan??

Kokonaismäärän N keski- ja hajontalukuja

Kokonaismäärän N keski- ja hajontalukuja

Arvoi saatiin noin 120 000 iteraatiolla, joista poistettiin 24 000 ensimmäistä ja valittiin joka 15:sta iteraatio konvergoitumisen varmistamiseksi ja autokorrelaation pienentämiseksi. Kuvaajassa näkyvä piikikkyys johtuu arvojen pyöristämisestä mallin sisällä.

N255

Kokonaismäärän N posteriorijakauma

Uusin mallin antama arvio kokonaismäärän todennäköisyysjakauman keskiarvosta on 2272, keskihajonnalla 1181. 95 % todennäköisyysväli löytyy arvojen 582 ja 4975 väliltä. Arvio on siis edelleenkin hyvin varovainen, mutta arviot tarkentuvat kun tieto lisääntyy!

Päätöksen tekoa

Kurssilla ollaan nyt tilanteessa, jossa mallin rakentamisesta on siirrytty päätöksentekoanalyyseihin. Suurimmalta osin ainakin. Rysän ollessa padon edessä, saadaan kerättyä tietoa, kuinka moni taimen joutuu mahdollisesti turbiinien rattaisiin ja sushina padon alla odottavien kalojen suihin. Tai näin ainakin oli ajatus kurssilaisten mielissä.

 

Rysä otettiin pois käytöstä jo muutamia päiviä sitten, eikä dataa saatu kerättyä juuri yhtään. Rysä kerkesi olla padon edessä vain kahdeksan päivän ajan. Tänä aikana n. 25 % pyydetyistä kaloista päätyi padon edessä olevaan rysään. Mikäli luku olisi sama myös todellisuudessa, olisi merelle vaeltavilla taimenilla suuri mahdollisuus päättää vaelluksensa tähän esteeseen.

 

Padon purkamisen päätöksentekoanalyysia rakentaessamme törmäsin itse monesti ongelmaan, jossa osa osioista tuli ehkä ylimietittyäkin, tämän johtaen hyvin yksityiskohtaiseen ongelman tarkasteluun, osan taas jäädessä hyvin yleiselle tasolle. Jotta päätöksenteko ”kartta” olisi toimiva, pitäisi kaikki kohteet saada suunnilleen samalle tarkastelutasolle.?!

 

Toinen ongelma muodostui hyödyn (utility) ajattelusta. Analyysissä pitäisi pystyä arvottamaan kartan eri osiot erilaisilla hyödyillä tai vaihtoehtoisesti haitoilla. Jotta tämä onnistuisi, pitäisi mallissa pystyä jotenkin valitsemaan vaalikonemaisesti näkeekö asiat hyötyinä vai haittoina ja antamaan näille, erilaisia painoarvoja.

Tulokset 21.5.2015

Päivä: 42

Pyydettyjä taimenen smoltteja kaiken kaikkiaan: 70

Merkattuja taimenen smoltteja kaiken kaikkiaan: 70

Uudelleen pyydettyjä taimenen smoltteja kaiken kaikkiaan: 2

Vähän pienempien ja suurempien teknisten ongelmien jälkeen valmistui päivän 42 (21.5.) tulokset. Tässä mallissa olemme päivittäneen pyydystettävyyden prioria, koska pyydystettävyyttä testaava mandariinikoe uusittiin. Kuten myös edellisessä tulospostauksessa, kaikki seuraavat tulokset perustuvat yli neljän mallimme keskiarvostettuihin posterioriestimaatteihin.

Malli tuottaa lähtemisintensiteetille totaaliestimaatin (Kuva 1), jossa 95 % todennäköisyydellä vaeltavien taimensmolttien kokonaismäärä on välillä 483–5035 (Taulukko 1). Todennäköisin yksittäinen arvio kokonaismäärästä on 500 ja 1500 välissä.

N26052015

Kuva 1. Posteriorijakauma vaeltavien taimensmolttien kokonaismäärästä 2015.

Perjantaina 22.5. vaeltavien taimensmolttien lukumäärä (n[43]) on 95% todennäköisyydellä välillä 3–81 (Taulukko 1). Todennäköisin yksittäinen arvio vaeltavien smolttien lukumäärästä on 9 (Kuva 2).

pikkun26052015

Kuva 2. Posteriorijakauma vaeltavien taimensmolttien määrästä perjantaina 22.5.2015.

Perjantaina 22.5. pyydyksiin jäävien taimensmolttien lukumäärä (x[26]) on 95% todennäköisyydellä välillä 0–5 (Taulukko 1). Jälleen kerran todennäköisin yksittäinen arvio on, että pyydyksiin ei jää yhtään taimensmolttia (Kuva 3).

Edellisellä kurssikerralla puhuimme toisen pyydyksen (rysän) uuden sijainnin huomioimisesta mallissa. Aihetta on käsitelty myös aiemmin blogissa, mutta ehdotusta ei ole huomioitu vielä tässä mallissa.

TotalX26052015

 

Kuva 3. Posteriorijakauma pyydyksiin jäävien taimensmolttien määrästä perjantaina 22.5.2015.

 

Taulukko 1. Parametrien N, n[26] ja TotalX[26] posteriorijakaumien tunnusluvut.

mean sd MC_error val2.5pc median val97.5pc start sample
N 1985.0 1212.0 35.16 483.0 1694.0 5035.0 51 164900
n[43] 25.76 20.81 0.5681 3.0 20.0 81.0 51 164900
TotalX[43] 1.363 1.66 0.02455 0.0 1.0 5.0 51 164900

 

Rysän uuden pyyntipaikan huomioiminen mallin sisällä

Tänään tuli puheeksi rysän uusi sijainti ja sen huomioiminen mallin sisällä. Rysä on aikaisemmin sijainnut joen haarautumiskohdassa ja on nyttemmin (13.5.) siirretty joen länsihaaran puolelle, hieman haarautumiskohdan yläpuolelle.

Saimme myös uutta mandariinikoetietoa, jonka mukaan nyt kaikkien kolmen kokeen aikana “vapautetusta” 188 mandariineista 139 on päätynyt joen länsihaaraan. Olemme käyttäneet tätä estimaattina smolttien vaeltamisesta, joten voisimme myös olettaa rysän pyytävän nyt tehokkaammin sen ollessa voimakkaimmin virtaavassa paikassa.

Hahmottelin helpohkon pikaratkaisun ongelmalle, jossa uutta rysää lähdetään yksinkertaisesti arvoimaan kokonaan uudella priorijakaumalla. Tämä ratkaisu ei edellyttäisi suuria muutoksia malliin:

Fyke_q[d]<-q_F*Fyke_op[d]*step(32-d)+q_F2*Screw_op[d]*step(d-32)

q_F2~dbeta(1,3)

Step-funktiot palauttavat yksinkertaisesti nollan erotuksen ollessa <0, jolloin summattava saa arvon nolla. Siis päivillä 1-32 käytetään rysän aiempaa priorijakaumaa q_F ja 32-60 uutta q_F2:ta. q_F2:lle annettu arvio hieman suuremmasta pyyntitehosta.

Tämä ratkaisu ei välttämättä ole ongelmaton. Rysän pyydystävyys päivittyy mielestäni datalla samaan tapaan kuin aikasemminkin. Se tarkoittaa, että kaikki rysän aikasemmassa paikassa sijaitessaan keräämä data pyydystettävyydestä siirtyy nyt “uudelle rysälle”, eli uudelle sijainnille. Tämä on mielestäni ristiriitaista sen kanssa, että rysän uuteen sijaintiin perustuva priori antaa nimenomaan ymmärtää, ettei sen pyydystävyys ole vain sen ominaisuus vaan riippuvainen myös sen sijannista. Tähän on syytä paneutua lisää ja katsoa miten tarkalleen riippuvuudet kulkevat pyydystävyys-mallin sisällä.

 

Missä kalat on?

Pyydettyjä smoltteja on tällä hetkellä vain 60 kappaletta vaikka oletettu vaellus mereen piti asiantuntija tiedon mukaan käynnistyä vedenlämpötilan saavuttaessa 8 astetta. Ympäristö.fi sivuilta katsottaessa vesi on tällä hetkellä Pirttinrannan mittauspisteessä jo 11 asteessa. Lämpötilan nousu olisi siis pitänyt jo näkyä pyydyksissä, suurimpina saalismäärinä. Tällä hetkellä mitään piikkiä ei ole havaittavissa, vaan pyydettyjen smolttien määrä vaihtelee satunnaisesti 1 – 6 smoltin välillä, vaikka pyydysten määrä on tuplattu. Alkujaanhan pyydyksenä toimi vain joensivuhaarassa oleva ruuvi. Nykyään käytössä on myös rysä. Toisen pyydyksen lisääminen luulisi jotenkin näkyvän pyydettyjen smolttien määrässä.

Vanhassa mallissamme päivitimme pyydysten ”tehoa” sitä mukaan kun kaloja saatiin pyydyksiin. Pyydetty kala oli ensin failure ja sitten succes mikäli merkattu kala saatiin pyydettyä uudestaan. Priorit saatiin malliin Vesi- ja Kalatutkimus Oy:n mandariinikokeesta. Mandariini kokeessa mandariineista pyydykseen päätyi 20 %. Jos mandariineja ajateltaisiin merkattuina smoltteina, olisi uudelleenpyydettävyys riittävällä tasolla, jotta voitaisiin arvioida smolttien kokonaismäärää luotettavasti. Tällä hetkellä uudelleen pyydettyjä kaloja on vasta 1, joten kahdella pyydyksellä päästään vain 1,7 % uudelleenpyydettävyyteen. Kurssilla oli tosin puhetta, että smoltit saattavat kuitenkin tulla pyydykseen uudestaan vasta 1-2 viikon päästä siitä, kun ne on edellisen kerran saatu pyydettyä. Pyydykset ovat nyt kuitenkin pyytäneet jo 40 päivän ajan, joten viiveen ei enää pitäisi vaikuttaa siihen, että merkattuja kaloja ei onnistuta pyytämään takaisin. Tällä hetkellä vanhan mallin pyydysteho olisi niin alhaalla, että en tiedä olisiko sillä voinut antaa luotettavaa arvioita vaelluskannan koosta.

Itseäni on myös ihmetyttänyt pyydysten sijoittaminen. Jo kokeen alkaessa puhuttiin, että ruuvi ei toimi kunnolla, koska virtaus on niin pieni, että ruuvi ei pyöri kunnolla. Sitten rysä asetettiin aluksi joen haaraumaan. Ymmärtääkseni pyydykset toimivat sitä paremmin mitä kovempi virtaus on. Tällöin smolttien on vaikeampi välttää ”omituista kapistusta”. Tästä syystä pyydys tulisi sijoittaa joen ”päävirran” kohdalle. Toki pyydysten sijoittamiseen on vaikuttanut moni asia, ja juurikin kovasta virrasta johtuen sitä, ei ehkä ole voitu sijoittaa juuri sinne minne se olisi haluttu.

Uudessa mallissamme otimme mallia kurssinvetäjämme pyydysmallista ja siinäkin pyydysten teho päivittyy ymmärtääkseni samaan tapaan, kuin vanhassakin mallissa, näin ainakin teoriassa. Koodia katsoessani, ei jotkut kohdat tästä kuitenkaan aukea minulle kuten ei myöskään ehkä muillekaan ja toivoisinkin, että seuraavalla kerralla palattaisiin vielä tähän, vaikka olemmekin siirtyneet jo päätöksentekoanalyysin maailmaan. Tässä kohta, mikä on vielä epäselvä tagged[d]~dbin(1,1000)}. Mistä nämä numerot tulevat?

Pohdintaa länsi- ja itähaaran mallintamisesta

Pohdin aikaisemmin mallin kehittämisen näkökulmasta mahdollisuutta mallintaa erikseen joen länsi- ja itähaaraan päätyvien smolttien määrää. Tämä olisi hyödyllistä mikäli halutaan jatkossa selvittää esimerkiksi kuinka suuri osa smolteista joutuu länsihaaraan ja kuinka paljon voimalan läpi kulkeminen vaikuttaa niiden kuolleisuuteen. Olen nyt yrittänyt hieman hahmotella mitä tämänkaltainen mallinnus edellyttäisi. Ongelma ei sinänsä varmastikkaan olet teknisesti mitenkään hankala, mutta omalle hahmottamiselleni löytyy siitäkin runsaasti haastetta ja on siksi hyvää pohdintaa pelkästään oppimista ajatellen.

Tällä hetkellä vedessä on taas kaksi pyydystä, rysä ja smolttiruuvi. Ruuvi pyyntää joen itähaaraa, jossa siis kulkevat kalaportaat. Ruuvin sijainti on haarautumiskohdasta alavirtaan. Rysä on nyt siirretty pyytämään länsihaaraa, eli voimalan puolta, mutta se sijaitsee haarautumiskohdasta hieman ylävirtaan. Sijainnista johtuen ei voida olettaa varmasti, etteivät kalat voisi vielä rysän ohitettuaan siirtyä itähaaraan ja otaksuisin että voi olla jopa mahdollista smolttien ruuvin ohitettuaan palata vielä ylävirtaan ja mahdollisesti toiseen haaraan. Tämä varmasti lisää tuntematonta vaihtelua, mutta pohdintani oletuksena onkin nyt tilanne, jossa molemmat pyydykset sijaitsisivat selkeästi haarautumiskohdasta alavirtaan.

Millä tavalla tätä ongelmaa voitaisiin sitten mielestäni mallintaa?

Päivittäin vaeltavan smolttimäärän muutujan n[i]:n suhteen ei muutoksia tarvittaisi. Smoltteja saapuisi siis haarautumiskohtaan n[i]:n suuruinen määrä, jonka jälkeen ne valitsivat joko itäisen, tai läntisen haaran. Näille voisimme valita priorijakaumat tutkimuksen alussa tehdyn mandariinkokeen perusteella. Jakaumana käyttäsin tuttua beta-jakaumaa:

prob_w~dbeta(7,3)       #prioriodennäköisyys länsihaaran päätymiselle
prob_e~dbeta(3,7)       #prioritodennäköisyys itähaaraan päätymiselle

Nämä valitisin parametreiksi eri haaroihin päätyvien smolttien määrää kuvaavan binomijakaumaan:

nw[i]~dbin(prob_w, n[i])     #jakauma länsihaaraan matkaaville smolteille
ne <- n[i]-nw[i]                  #itähaaraan matkaavat smoltit

Saalis mallinnettaisiin molemmille haaroille erikseen binomijakaumana:

FykeX[i]~dbin(Fyke_q[i], nw[i])         #jakauma länsihaaraan saaliismäärälle
ScrewX[i]~dbin(Screw_q[i], nw[i])    #jakauma itähaaran saalismäärälle

Pyydystävyyden prioriarvoja pitäisi hiukan muuttaa. Rysälle prioritietoa mandariinikokeesta ei ole, ruuvin suhteen on huomiotava että nyt pyydystävyys mallintaisi vain itähaaran osuutta, ei smolttien kokonaismäärän pyydystävyyttä. Mandariinkokeen mukaan itähaaraan päätyi kaksi mandariinia, joista kaksi jäi pyydykseen:

q_S~dbeta (2,1)       #prioritodennäköisyys ruuvin pyydystävyydelle
q_F~dbeta (5,3)       #prioritodennäköisyys rysän pyydystävyydelle, mielivaltainen arvio

Näiden päivittäminen voisi tapahtua mielestäni samaan tapaan kuin ennenkin.

Priorien miettiminen on tässä tapauksessa suhteellisen helppoa. Itselleni alkoi tässä vaiheessa muodostua ongelmaksi juurikin ongelman laskennallinen ja looginen puoli. Itselleni on hankalaa hahmottaa jakaumien välillä tapahtuvia matemaattisia operaatiota ja yhdistää mallin osia loogisesti toisiinsa. Nyt minusta tuntuu, ettei malli näin päivitä ollenkaan eri haaroihin päätymismahdollisuuksien todennäköisyysjakaumia. Joudun vielä pohtimaan tarkemmin miten tämä tapahtuu. Myös kyseisten jakaumien suhteellisuus tulisi ottaa huomioon, kävisikö tämä vain jakamalla kukin molempien summalla? Näinkö saataisiin myös itähaaraan pyydystettävyys siirtymään posteriorijakaumiin?

Neuvot ovat tervetulleita!

Milloin malli on oikeasti valmis?

Olemme blogissa pohtineet paljon mallin kehittämiseen liittyviä kohtia, kuten lisäpyydyksen huomioimista ja vaelluspoikasten muuttointensiteetin mallintamista. Varovainen arvioni on, että kaikesta malliin liittyvästä epävarmuudesta huolimatta, olemme olleet tyytyväisiä sen kehittymiseen. Edelleen mielessämme on ollut useita parannusehdotuksia, kuten veden lämpötilan ja korkeuden sekä vaellusmatkan pituuden huomioiminen. Blogipohdinnat ovat siirtyneet enemmän päätöksentekoon liittyviin kysymyksiin, mutta palaan vielä hetkeksi takaisin mallintamisen maailmaan ja aiheeseen, joka on jäänyt itselleni hyvin epäselväksi, ja jota ei vielä ole nostettu blogissa tarkemmin esille: Milloin malli on oikeasti valmis?

Tutkijana painii jatkuvasti omaan työhön kohdistuvan epävarmuuden kanssa. Työstä pitäisi sanoa jotain konkreettista, mutta samalla joutuu tiedostamaan, että työhön liittyy enemmän tai vähemmän epävarmuutta. Kurssilla olen ensimmäistä kertaa harjoittelemassa todennäköisyysmallintamista, ja oppiminen on kohdistunut perusasioiden haltuun ottamiseen ja BUGS-ohjelman ymmärtämiseen. Bayes-maailma on minulle vielä hyvin uusi, mutta kurssin edetessä olen pohtinut, milloin mallin kehittäjä voi olla tyytyväinen aikaansaannokseensa ja valmis esittelemään sen yleisölle.

Biologina jotenkin kuvittelisi, että malli on valmis silloin, kun se kuvaa luonnossa tapahtuvia prosesseja parhaiten. Miten tämä voidaan varmistaa, onkin sitten toinen tarina. Tuleeko kaikki mahdolliset (ympäristö)tekijät olla mukana mallissa? Tilastotiedettä opiskelevat kurssikamut ovat kuitenkin saaneet minut pohtimaan asiaa toisesta näkökulmasta. Ehkä malli onkin valmis silloin, kun se on rakennettu ”oikein ja ammattitaidolla”. Aiemmissa blogipostauksissa on nostettu esiin myös asiantuntijatieto. Olettaen, että asiantuntijatieto on lähellä ”oikeaa totuutta”, onko valmis malli sellainen, joka vastaa asiantuntijan tietoa tai näkemystä?

Myönnettäköön, että kysymys on tällä erää ehkä lähinnä filosofinen, mutta käsitys kehitysprosessista kokonaisuutena on minulle vielä melko tuntematon. Varsinkin kun olemme jättämässä mallin kehittelyn, jotta voimme käsitellä päätösanalyysiä loppukurssin ajan. Pääsimmekö kunnolla edes vauhtiin vai raapaisimmeko vasta pintaa?

Mallipäivitys 13.5.

Viimeisimmät muutokset käytössä olevaan malliin

  • Vaihtoehtoisen smolttien lähtemistodennäköisyyden luonnetta kuvaavan Beta-jakaumamallin lisääminen
  • Mallitekniset muutokset pyydystettävyyden laskemisessa

Käytössä oleva mallimme perustuu pääpiirteittäin edelleen alkuperäiseen rakenteeseen ja eri malliversioiden yhdistämiseen BMA:ta hyödyntäen. Seuraavassa esitellään mallin eri osat ja tehdyt muutokset (kiitos Leolle selkeistä kommenteista BUGS-skriptissä!).

Vuosittainen kokonaisvaellusmäärä

Muuttavien smolttien kokonaismäärän (N) odotusarvon priorina käytössä on edelleen kolmen asiantuntijaarvion keskiarvo (2600), jonka on odotettu tulevan ainoastaan positiivisia arvoja tuottavasta katkaistusta, kokonaisluvuiksi pyöristetystä normaalijakaumasta.

N<-round(cN)

cN~dnorm(2600, prec_N)I(1,)

prec_N<-pow(sd_N, -2)

sd_N<-2000

Kokonaisvaellusmäärän priorin määrittelemiseksi voisi myös asiantuntijaarvioiden sijaan tai lisäksi hyödyntää tietoa edellisvuosina jokeen nousseiden meritaimenten määristä, joko laskemalla nousukkaiden smolttituotantopotentiaali mortaliteettitekijät huomioiden, tai takautuvasti merikuolleisuuden kautta arvioiden aikaisempien vuosien mereen päätyneiden smolttien määriä.

Lähtemistodennäköisyys

Muuttointensiteetin tai päivittäisen lähtemistodennäköisyyden (p) kuvaamiseksi on tähän mennessä käytetty kolmea eri todennäköisyysjakaumaa; tasajakauma, normaali ja log-normaali. Vaihtoehtoisia malleja on ajettu erikseen rinnakkain ja myöhemmin yhdistettynä mallikeskiarvoistamista (BMA) käyttäen. Nykyisessä mallissa näiden kolmen jakauman lisäksi neljäntenä vaihtoehtona on käytetty beta-jakaumaa. Beta-jakauma (Beta distribution – Wikipedia) on intervallille [0,1] määritelty, melko mukautuva todennäköisyysjakauma, jonka muodon määrittää tiheysfunktion alfa ja beta parametrit. Beta-jakauma sopii usein osuuksien sattumanvaraisen käytöksen mallintamiseen.

d1c8bb0654c111cd0a16d1aafd8b970a

Mallissa on tarkastelujakson jokaisen päivän (1,2,3,…60) huomioivan silmukan (“for-loop”) sisällä määritelty lähtemistodennäköisyys neljällä vaihtoehtoista muodolla( p[i,1], p[i,2], p[i,3] ja p[i,4]). Eri p-funktioiden indeksöinti (1–4 hakasulkeiden sisällä) tulee mallissa myöhemmin käyttöön, kun vaihtoehtoiset, ainoastaan muuttointensiteetin muodon määrittelyssä toisistaan eroavat neljä osamallia sisällytetään päämalliin. Kaikissa muissa p:n funktioissa, paitsi tasajakauma-muodossa, on käytetty yhteistä odotusarvon parametriä (myy_p), joka on määritelty skriptin lopussa yhdessä eri funktioden hajontaparametrien kanssa.

for(i in 1:60) {

# p tasajakaumalla

p[i,1]<-1/60

# p normaalijakaumalla

pl[i] <- exp(- pow((i-myy_p)/sd_p,2)*0.5)

p[i,2] <- pl[i] / sum(pl[1:60])

# p log-normaalijakaumalla

pn[i] <- (1/i)*exp(- pow(log(i)-location, 2) / scale)

p[i,3] <- pn[i] / sum(pn[1:60])

# p beta-jakaumalla

pbi[i]<-pow(i/60,myy_p*b_eta/60)*pow(1-i/60,(1-myy_p/60)*b_eta)

Koska yllä olevasta beta-jakauman funktiosta puuttuu normalisointivakio B (beta-funktio) nimittäjästä, varmistetaan että beta summautuu yhteen yli päivien, näin:

p[i,4]<-pbi[i]/sum(pbi[])

Lähtevien smolttien määrät

Seuraavaksi mallissa määritellään lähtevien smolttien päivittäiset (i) määrät (n) kokonaismäärästä (N) binomijakaumalla eri lähtemistodennäköisuusmalleille 1,2,3,4, ja varmistetaan, ettei päivittäiset lukumäärät ole nolla, koska se aiheuttaisi ongelmia kokonaispyydystettävyyn määrittelyssä käytettävässä binomijakaumassa.

n2[i]~dbin(p[i,model],N)

n[i]<-n2[i]+1

}

Saalis ja pyydystettävyys

Dataa on tähän mennessä kerätty kahdella eri pyyntivälineellä (smolttiruuvi ja rysä), ja niiden vaikutukset on huomioitu mallissa jo aikaisemmin. Ruuvi on ollut käytössä koko tarkasteluajan tähän asti kun taas rysä otettiin käyttöön vasta myöhemmin, jonka jälkeen se otettiin pois mutta on nyt taas pyynnissä. Periaate kahden eri välineen kokonaispyyntihehon laskemisessa on edelleen sama kuin aiemmin:

P(kala jää ruuviin TAI rysään) = P(kala jää rysään) + P(kala jää ruuviin) – P(kala jää ruuviin JA rysään)

Muutokset päivittäisen kokonaissaaliin ja pyydystettävyyden arvionnissa ovat malliteknisiä, tehden koodista elegantimman ja mallista mahdollisimman kevyen. Uuden rakenteen myötä myös datan taulukkomuoto on muuttunut, sisältäen seuraavat sarakkeet: ScrewX[] (ruuvin saalis), FykeX[] (rysän saalis), tagged[] (merkityt kalat), Screw_op[] (ruuvin käyttöstatus), Fyke_op[] (rysän käyttöstatus), ScrewR[] (ruuvin takaisinpyyntisaalis), FykeR[] (rysän takaisinpyyntisaalis) ja TotalX[] (kokonaissaalis). Mallissa on tarkasteluajan jokaisen tähänastisen ja seuraavan päivän (1,2,3,…days+1) huomioivan silmukan sisällä määritelty päivittäinen kokonaissaalis (TotalX[d]), päivittyvä kokonaispyyntiteho (Total_q[d]), ruuvin päivittäinen saalis (ScrewX[d]), ruuvin päivittyvä pyyntiteho (Screw_q[d]) ja rysän päivittyvä pyyntiteho (Fyke_q[d]) seuravanlaisesti:

for(d in 1:days+1) {

# Kaikkien havaittujen smolttien yhteenlaskettu määrä päivänä d noudattaa binomijakaumaa parametreilla kokonaispyydystettävyys (Total_q[d]), päivittäiset muuttavat smoltit (n[d])

TotalX[d]~dbin(Total_q[d],n[d])

Total_q[d]<-Screw_q[d]+Fyke_q[d]-Screw_q[d]*Fyke_q[d]

# Ruuvin havainnot noudattavat poisson -jakaumaa parametrilla odotusarvoiset lähtevät smoltit (binomijakaumalla tulee ongelmia, sillä päivittäiset lähtevät määrät saattavat saada arvoja nolla)

ScrewX[d]~dpois(screw_muX[d])

# Odotusarvoiset lähtevät smoltit päivänä d (screw_muX[d]) määrittyvät ruuvin suhteellisella teholla (Screwprop[d])*kuinka moni jää kaiken kaikkiaan kiinni (TotalX[d])

screw_muX[d] <- Screwprop[d]*TotalX[d]

#Ruuvin suhteellinen teho on ruuvin teho jaettuna kokonaisteholla (ruuvi JA rysä)

Screwprop[d]<-Screw_q[d]/Total_q[d]

# Ruuvin suhteellista tehoa päivitetään vain kun ruuvin on käytössä (indikaattorifunktio screw_op saa arvoja 0, kun ei käytössä, arvoja 1 kun käytössä)

Screw_q[d]<-q_S*Screw_op[d]

# Rysän pyydystettävyys päivittyy samalla indikaattorifunktion logiikalla

Fyke_q[d]<-q_F*Fyke_op[d]

# Priori määrälle merkittyjä kaloja (tämä on joku tekninen eli laskennallinen yksityiskohta)

tagged[d]~dbin(1,1000)

}

Seuravaksi mallissa määritellään, kuinka pyydystettävyys päivittyy uudelleenpyydettyjen havainnoilla. Päivät (d) kulkevat toisesta päivästä, koska vasta siitä lähtien on mahdollista pyydystää päivänä 1 merkitty kala.

for(d in 2:days+1) {

# Rysän uudelleenpyytämien kalojen havaintojakauma noudattaa binomijakaumaa parametreilla rysän pyyntiteho(Fyke_q[d]) , edellisenä päivänä merkityt kalat (tagged[d-1])

FykeR[d]~dbin(Fyke_q[d],tagged[d-1])

# Ruuviin voi periaatteessa jäädä kaikki ne kalat, jotka on edellisenä päivänä merkitty, mutta jotka eivät jääneet ruuviin

Screw_nR[d]<-tagged[d-1]-FykeR[d]

# Ruuvin pyydystettävyyden havaintojakauma noudattaa binomijakaumaa parametreilla ruuvin pyydystettävyys (Screw_q[d]), ja edellisessa kaavassa määritellyt mahdolliset määrät (Screw_nR[d])

ScrewR[d]~dbin(Screw_q[d],Screw_nR[d])

}

Rysän pyydystettävyyden prioria (q_F) muutettiin säilyttäen pseudohavaintojen suhteet. Arvoilla 1 ja 4 voidaan tehdä prioriarvio epävarmemmaksi siksi, ettei mandariinikoetta ole toistettu rysälle. Samat suhteet mallintavat kuitenkin ennakkokäsitystä, jonka mukaan rysä ja ruuvi pyydystävät yhtä hyvin. Tämän oletuksen uskottavuudesta voidaan kuitenkin olla eri mieltä, vaikka pyydysten ominaisuuksien eroja ei tiedetäkään, koska rysä pyydystää eri kohdassa jokea ruuviin verrattuna ja koska on epätodennäköistä että smoltit ovat tasaisesti jakautuneita koko virran leveydeltä jo mandariinikokeen tulostenkin perusteella.

q_F~dbeta(1,4)

q_S~dbeta(2,8)

Eri osamallejen sisällyttäminen ja mallikeskiarvoistaminen

Viimeisessä tätä edellisessä versiossa yhdistettiin jo eri lähtemistodennäköisyyksien määrittelemät osamallit yhdeksi malliksi Bayesilaisella mallikeskiarvoistamisella (BMA). Ainoa muutos tämän suhteen tähän malliin, on neljännen mallin, eli lähtemistodennäköisyyden beta-jakaumamallin lisääminen, joka tehtiin seuraavanlaisesti:

# Priori mallin BMA:lle

model~dcat(z[1:4])

# Tässä määritellään prioritodennäköisyys eri mallien totuudelle

z[1]<-1/4 # Tasajakaumamalli

z[2]<-1/4 # Normaalijakaumamalli

z[3]<-1/4 # Log-normaalijakaumamalli

z[4] <-1/4 # Beta-jakaumamalli

# Tästä saadan eri mallien posterioritodennäköisyydet

Z[1]<-equals(model, 1)

Z[2]<-equals(model, 2)

Z[3]<-equals(model, 3)

Z[4] <- equals(model,4)

Lähtemisintensiteettien priorit

myy_p~dnorm(25,tau_myy)I(0.01,)

tau_myy<-pow(7,-2)

sd_p~dnorm(10, tau_sd)I(0.01,)

tau_sd<-pow(5, -2)

scale <- log(1 + pow(sd_p/myy_p,2) )

location <- log(myy_p) -0.5*scale

b_eta~dunif(5,100)

}

Data

list(days=33)

ScrewX[] FykeX[] tagged[] Screw_op[] Fyke_op[] ScrewR[] FykeR[] TotalX[]

0 0 0 1 0 0 0 0

0 0 0 1 0 0 0 0

0 0 0 1 0 0 0 0

1 0 0 1 0 0 0 1

2 0 3 1 0 0 0 2

2 0 2 1 0 0 0 2

0 0 0 1 0 0 0 0

0 0 0 1 0 0 0 0

0 0 0 1 0 0 0 0

1 0 0 1 0 0 0 1

1 0 0 1 0 0 0 1

1 0 3 1 0 0 0 1

0 0 0 1 0 0 0 0

2 0 2 1 0 0 0 2

1 0 1 1 0 0 0 1

0 1 1 1 1 0 0 1

0 1 0 1 1 0 0 1

0 1 0 1 1 0 0 1

1 1 3 1 1 0 0 2

3 2 5 1 1 0 0 5

6 2 8 1 1 0 0 8

4 0 4 1 0 0 0 4

2 0 2 1 0 0 0 2

2 0 2 1 0 0 0 2

1 0 1 1 0 0 0 1

3 0 3 1 0 0 0 3

2 0 2 1 0 0 0 2

1 0 2 1 0 1 0 1

3 0 3 1 0 0 0 3

1 0 1 1 0 0 0 1

1 0 1 1 0 0 0 1

1 0 1 1 0 0 0 1

2 0 2 1 0 0 0 2

NA NA NA 1 1 NA NA NA

NA NA NA 1 1 NA NA NA

NA NA NA 1 1 NA NA NA

NA NA NA 1 1 NA NA NA

NA NA NA 1 1 NA NA NA

NA NA NA 1 1 NA NA NA

NA NA NA 1 1 NA NA NA

NA NA NA 1 1 NA NA NA

NA NA NA 1 1 NA NA NA

NA NA NA 1 1 NA NA NA

NA NA NA 1 1 NA NA NA

NA NA NA 1 1 NA NA NA

NA NA NA 1 1 NA NA NA

NA NA NA 1 1 NA NA NA

NA NA NA 1 1 NA NA NA

NA NA NA 1 1 NA NA NA

NA NA NA 1 1 NA NA NA

NA NA NA 1 1 NA NA NA

NA NA NA 1 1 NA NA NA

NA NA NA 1 1 NA NA NA

NA NA NA 1 1 NA NA NA

NA NA NA 1 1 NA NA NA

NA NA NA 1 1 NA NA NA

NA NA NA 1 1 NA NA NA

NA NA NA 1 1 NA NA NA

NA NA NA 1 1 NA NA NA

NA NA NA 1 1 NA NA NA

END

#BUGS:iin ladattavat eri mallien alkuarvot, hyvä käyttää eri alkuarvoja

list(model=1)

list(model=2)

list(model=3)

list(model=4)

Huomioita lopuksi

Vaikka mallin aktiivinen kehittäminen jäänee lähiaikoina hieman vähäisemmäksi, voisi tulevaisuudessa edelleen yrittää sisällyttää tietoa ympäristömuuttujista (lämpötila, vedenkorkeus, ym) ja niiden vaikutuksista, sekä vaellusmatkan pituudesta ja eri smolttituotantoalueiden (koskien) kapasiteetistä ja sijoittumisesta. Lähiaikoina jatkamme mallin sisällyttämisellä päätösanalyysiin, joka koskee kysymystä Vanhankaupunginkosken padon mahdollista purkamista.

 

Rysä jälleen käytössä

Ajaessani tänään Vanhankaupunginkosken yli, huomasin sivusilmällä smolttirysän olevan jälleen käytössä tauon jälkeen. Rysä oli asennettu nyt pyytämään eri kohtaan jonkin matkaa ylävirtaan edellisestä paikasta ja tällä kertaa enemmän uoman länsipuolelle. Liekö virtaus jälleen käynyt epäsuotuisaksi ruuvipyydyksen käytölle.

 

Kuten porukalla keskustelimme edellisellä kokoontumiskerralla, olisi pyydysten pyyntitehon määrittämisen kannalta paras vaihtoehto, mikäli pyydykset olisivat mahdollisimman ”tasapaksussa” kohdassa jokea, mistä kalat laskeutuisivat mahdollisimman sattumanvaraisesti ohi. Tällöin voitaisiin arvioida pyydyksen pyyntitehoa suoraan osuutena uoman poikkileikkauksen pinta-alasta, jonka pyydys kattaa. Ruuvin pyytäessä tällä hetkellä hyvin epätasaisessa kohdassa jokea itähaaran puolella, selkeän päävirran kohdalla, ei pystytä näin selkeätä laskelmaa tekemään. Epätasaisessa, leveydellään virtauksien puolesta vaihtelevassa uomassa saattaa laskeutumisreiteissä etenkin eri virtaamilla esiintyä suuriakin vaihteluita. Smolttiruuvin asentamispaikkaan vaikuttaa pyydyksen tekniset edellytykset, sen vaatiessa tietyn virtauksen ja hiljaa virtaavan, tasaisen suvannon virtaus ei riitä pyörittämään ruuvin rumpua. Rysällä puolestaan ei ole vastaavia vaatimuksia virtauksen suhteen. Rysän edellinen pyyntipaikka oli kuitenkin heti saarekkeen yläpuolella, missä ainakin silmämääräisesti näyttää, että virta alkaa vaihdella enemmän, kuin ylempänä suvannossa ja esimerkiksi toista haaraa suosivat kalat ovat saattaneet jo ryhmittyä tietylle puolelle jokea epäsattumanvaraisesti.

 

Rysän uusi pyyntipaikka hieman ylempänä vastaa paremmin kalojen koko uoman leveydelle satunnaisesti levittäytymisen edellytyksiä. Muuttamalla pyydysten paikkoja tutkimusjakson aikana, tulee kuitenkin pyydysten tehon ja hierarkkisesti edelleen myös vaeltavien smolttien kokonaismäärän arvioimiseen mukaan lisää epävarmuustekijöitä.

 

Tietysti huolellisellakaan tutkimussuunnittelulla ei pystytä aina vaikuttamaan muuttuviin olosuhteisiin ja suunnitelmia joudutaan muuttamaan. Meidän osalta hommahan etenee lähtökohtaisestikin melko nurinkurisesti. Parempaan lopputulokseen varmastikin päästäisiin, mikäli koko projekti olisi aloitettu mallien alustavalla suunnittelulla ja tutkimusasetelmaa olisi lähdetty kehittelemään mallien ehdoilla.

Tulokset 3.5.2015

Päivä: 25

Pyydettyjä smoltteja: 38

Merkattu: 37

Takaisinpyydettyjä merkittyjä smoltteja: 0

Seuraavassa esitellään tuoreella havaintoaineistolla päivitetyt päivän 25 (3.5.) tulokset käytössä olevista kolmesta eri mallista missä muuttointensiteettiä on kuvattua 1) log-normaali-, 2) normaali- ja 3) tasajakaumilla. Taustat N:n prioriin löytyvät aikaisemmasta tulosbloggauksesta ja lähtokohdat malleihin tästä.

Merkittävin muutos seuranta-asetelmissa, ja tarkemmin kokonaispyyntitehon määrittelemisessä, on Smolttirysän poistaminen käytöstä päivästä 21 eteenpäin. Eli tällä hetkellä pyynnissä on taas ainoastaan ruuvi. Tämän osalta malleja on päivitetty seuraavasti:

lambda[i] <- q_s*n[i]*step(15-i) + q*n[i]*step(i-16) + q_s*n[i]*step(i-22) – q*n[i]*step(i-22)

 

Malli 1 – “log-normaali

Log-normaalimalli lähtemisintensiteetille tuottaa taimenten kokonaismäärän odotusarvon piste-estimaatiksi 1411 kappaletta, jolle 95% luottamusväli on 402–3722 (Taulukko 1). Todennäköisin yksittäinen arvio kokonaismäärästä on (posteriorijakauman moodi) on jossain 500 ja 1000 välissä (Kuva 1).

Maanantaina 4.5. vaeltavien taimensmolttien lukumäärän (n[26]) odotusarvon piste-estimaatti on 33 ja 95 % luottamusväli 7–90 (Taulukko 1). Todennäköisin yksittäinen arvio (posteriorijakauman moodi) vaeltavien smolttien määrästä on 16 (Kuva 2).

Maanantaina 4.5. ruuviin jäävien taimensmolttien lukumäärän (x[26]) odotusarvon piste-estimaatti on 1 ja 95 % luottamusväli 0–4 (Taulukko 1). Todennäköisin yksittäinen arvio (posteriorijakauman moodi) on, että ruuviin ei jää yhtään taimensmolttia (Kuva 3).

Kokonaispyydystettävyyden (q) estimaatti on mallissa 0,073, eli 7,3 % pyydystettävissä olevista kaloista joutuu pyydykseen (Taulukko 1). Toistaiseksi pyydykset eivät ole onnistuneet uudelleenpyydystämään ainuttakaan 37 merkatusta kalasta.

 

 

Kuva 1. Malli 1:n posteriorijakauma vaeltavien taimensmolttien kokonaismäärästä 2015.

Kuva 2. Malli 1:n posteriorijakauma vaeltavien taimensmolttien määrästä maanantaina 4.5.2015

 

Kuva 3. Malli 1:n posteriorijakauma ruuviin jäävien taimensmolttien määrästä maanantaina 4.5.2015

Taulukko 1. Parametrien Nn[26]x[26] ja q posteriorijakaumien tunnusluvut malli 1:ssa.

  mean sd MC_error val2.5pc median val97.5pc start sample
N 1411.0 873.2 19.46 402.0 1177.0 3722.0 51 161900
n[26] 32.53 21.87 0.4414 7.0 27.0 90.0 51 161900
x[26] 0.9503 1.053 0.00358 0.0 1.0 4.0 51 161900
q 0.07326 0.03892 6.637E-4 0.02079 0.06546 0.1682 51 161900

 

Malli 2 – “normaali”

Normaalijakauma lähtemisintensiteetille tuottaa taimenten kokonaismäärän odotusarvon piste-estimaatiksi 2359 kappaletta, jolle 95% luottamusväli on 707–5075 (Taulukko 2). Tulos on selvästi korkeampi kuin log-normaalin mallin saman päivän tulos (1411) ja kuin saman mallin edellinen tulos (1199). Todennäköisin yksittäinen arvio kokonaismäärästä on (posteriorijakauman moodi) on jossain 1500 ja 2000 välissä (Kuva 4).

Maanantaina 4.5. vaeltavien taimensmolttien lukumäärän (n[26]) odotusarvon piste-estimaatti on 68  (95 % luottamusväli 20–150, Taulukko 2), joka on yli kaksinkertainen log-normaalin mallin vastaavaan estimaattiin (33) verrattuna. Todennäköisin yksittäinen arvio (posteriorijakauman moodi) vaeltavien smolttien määrästä on 31–32 (Kuva 5).

Maanantaina 4.5. ruuviin jäävien taimensmolttien lukumäärän (x[26]) odotusarvon piste-estimaatti on 2 ja 95 % luottamusväli 0–6 (Taulukko 2). Todennäköisin yksittäinen arvio (posteriorijakauman moodi) ruuviin jäävien smolttien määrästä on 1 (Kuva 6).

Kokonaispyydystettävyyden (q) estimaatti on mallissa 0,074, eli 7,4 % pyydystettävissä olevista kaloista joutuu pyydykseen (Taulukko 2).

tasaN

Kuva 4. Malli 2:n posteriorijakauma vaeltavien taimensmolttien kokonaismäärästä 2015.

tasapikkun

Kuva 5. Malli 2:n posteriorijakauma vaeltavien taimensmolttien määrästä maanantaina 4.5.2015

tasax

Kuva 6. Malli 2:n posteriorijakauma ruuviin jäävien taimensmolttien määrästä maanantaina 4.5.2015

Taulukko 2. Parametrien N, n[26], x[26] ja q posteriorijakaumien tunnusluvut malli 2:ssa.

  mean sd MC_error val2.5pc median val97.5pc start sample
N 2359.0 1154.0 19.21 707.0 2163.0 5075.0 51 125850
n[26] 67.57 33.88 0.5517 20.0 61.0 150.0 51 125850
x[26] 2.292 1.716 0.007054 0.0 2.0 6.0 51 125850
q 0.07382 0.03459 4.894E-4 0.02592 0.06734 0.1582 51 125850

 

Malli 3 – “tasa”

Tasajakauma lähtemisintensiteetille tuottaa taimenten kokonaismäärän odotusarvon piste-estimaatiksi 2506 kappaletta, jolle 95% luottamusväli on 707–5075 (Taulukko 3). Tulos on korkeampi kuin normaali-mallin saman päivän tulos (2359) ja kuin saman mallin edellinen tulos (1578). Todennäköisin yksittäinen arvio kokonaismäärästä on (posteriorijakauman moodi) on jossain 1500 ja 2000 välissä (Kuva 7).

Maanantaina 4.5. vaeltavien taimensmolttien lukumäärän (n[26]) odotusarvon piste-estimaatti on 42 (95 % luottamusväli 13–90, Taulukko 3), joka on pienempi kuin normaali-mallin tulos (68) mutta suurempi kuin log-normaalin mallin vastaava estimaatti (33). Todennäköisin yksittäinen arvio (posteriorijakauman moodi) vaeltavien smolttien määrästä on 31–32 (Kuva 8).

Maanantaina 4.5. ruuviin jäävien taimensmolttien lukumäärän (x[26]) odotusarvon piste-estimaatti on 1 ja 95 % luottamusväli 0–4 (Taulukko 2). Todennäköisin yksittäinen arvio (posteriorijakauman moodi) ruuviin jäävien smolttien määrästä on 1 (Kuva 9).

Kokonaispyydystettävyyden (q) estimaatti on mallissa 0,082, eli 8,2 % pyydystettävissä olevista kaloista joutuu pyydykseen (Taulukko 2). Tämän estimaatti on korkeampi kuin mallin 1 ja 2 vastaavat tulokset.
tasaN

Kuva 7. Malli 3:n posteriorijakauma vaeltavien taimensmolttien kokonaismäärästä 2015.

tasapikkun

Kuva 8. Malli 3:n posteriorijakauma vaeltavien taimensmolttien määrästä maanantaina 4.5.2015

tasax

Kuva 9. Malli 3:n posteriorijakauma ruuviin jäävien taimensmolttien määrästä maanantaina 4.5.2015.

Taulukko 3. Parametrien Nn[26]x[26] ja q posteriorijakaumien tunnusluvut malli 3:ssa.

  mean sd MC_error val2.5pc median val97.5pc start sample
N 2506.0 1134.0 11.63 902.0 2302.0 5232.0 10000 3420903
n[26] 41.78 19.97 0.1914 13.0 38.0 90.0 10000 3420903
x[26] 1.109 1.096 6.281E-4 0.0 1.0 4.0 10001 3150900
q 0.08204 0.03619 2.966E-4 0.03185 0.07518 0.1702 10000 3420903

 

Seuraavissa malliajoissa tulisi tarkemmin kiinnittää huomiota simulaatioketjujen konvergoitumiseen, autokorrelaatioon ja MC-error:iin, ja näiden seikkojen tarkastelemiseen. Sen pohjalta tulisi tehdä tarvittavat toimenpiteet (burn-in, thin, iteraatioiden määrän lisääminen) tulosten laadun parantamiseksi.