Asiantuntijatiedon keräämisestä

Jatkan nyt edellisestä postauksestani, jossa mietin Bayes-mallintamista päätöksenteon työkaluna. Bayes-mallinnus on omiaan epävarmuuden ollessa tutkimuskohteen osalta suuri, ja jolloin asiantuntijatiedon rooli on tärkeä. Asiantuntijatietoa voidaan käyttää priorien määrittämiseen, mutta asiantuntijatiedon avulla voidaan myös paremmin hahmoittaa tutkimuksen aihetta sekä suurempia kokonaisuuksia ja kokonaiskuvaa (Uusitalo, 2007).

Kuvailenkin nyt lyhyesti ja pääpiirteittäin, miten asiantuntijatietoa voidaan kerätä. Alla oleva malli kuvaa hyvin yksinkertaisella tasolla asiantuntijatiedon keräämistä. Ensimmäinen askel on tietenkin taustatyö ja ongelmanasettelu, sekä itse asiantuntijoiden valitseminen. Onkin mielenkiintoista pohtia, kenet määritellään asiantuntijaksi? Omasta mielestäni asiantuntija voi olla kuka vaan, joka on jollain tasolla kyseessä olevaan asiaan linkittynyt: Vanhankaupunginkosken meritaimenen kohdalla asiantuntija voi olla niin kalastamisesta vastaava viranomainen, kuin vapaa-ajan kalastajakin. Asiantuntijan voisikin uudelleenmääritellä, ja mielestäni “asiantuntijan”  (expert) sijaan voisi olla hyödyllistä käyttää neutraalimpaa sanavalintaa, ”sidosryhmän jäsentä”(stakeholder), tai pelkästään ”tekijää” (actor).

elicit

Malli 1. Asiantuntijatiedon kerääminen. (O’Hagan et al., 2005).

Seuraava vaihe on itse haastattelu. Haastattelu painottaa asiantuntijan sen hetkistä tietoa aiheesta. Tutkijan roolina haastattelussa on lisätä sujuvuutta ja fasilitoida prosessia: tutkijan tulee valmistella haastateltavaa Bayes-mallintamisesta ja varmistaa, että haastateltava ymmärtää mallintamisen pääpiirteittäin. Jos näin ei tehdä, asiantuntija saattaa suhtautua epäluuloisesti mallintamiseen, eikä haastateltavan ja tutkijan välille synny jo tutkimuksenkin kannalta tärkeää luottamuksen tunnetta (Uusitalo, 2007). Eräänlaista koehaastattelua on hyvä harkita, jota voidaan sitten haastateltavien palautteen kautta muokata sujuvampaan ja ymmärrettävämpään muotoon. Haastattelu on myös hyvä videoida tai dokumentoida, jotta siihen voi palata tutkimuksen myöhemmissä vaiheissa. Haastateltavien mahdolliset henkilökohtaiset intressit tulee myös tiedostaa ja ottaa huomioon. (O’Hagan et al., 2005).

Kolmannessa vaihessa asiantuntijoiden antamat priorit ja arvot voidaan mukauttaa muiden asiantuntijoiden lausuntoihin sekä kerättyyn dataan. Tässä voidaan käyttää myös muissa blogipostauksissa viitattua Bayesilaista keskiarvoistamista, missä eri malleille voidaan antaa eri painoituksia. Viimeisessä vaiheessa mietitään tiedonkeruun kattavuutta ja riittävyyttä, jonka jälkeen voidaan päätyä keräämään vielä täydennystä ja lisää asiantuntijatietoa. (O’Hagan et al., 2005).

Asiantuntijatiedon keräämisessä ja käyttämisessä esintyy erinäisiä ongelmia. Ihmisillä on usein rajallinen kyky ymmärtää todennäköisyyksiä ja asettaa niille tietty numerinen arvo, jolloin erilaisten vääristymien syntyminen on tavanomaista. Haastattelun, eri tehtävien, ja kysymysten asettelu vaikuttavat kaikki haastatteluprosessin tuloksiin. Onnistumista on vaikea määrittää, koska annetut arvot kuvaavat haastateltavan subjektiivistä ”totuutta”, joka vaihtelee haastateltavien kesken. Koehaastattelun järjestäminen ja kysymysten uudellenasettelu voivat auttaa todennäköisyyksien hahmoittamisessa.

Lisäksin, niin kuin jo aikaisemmin mainittu, asiantuntijoilla voi mahdollisesti olla erilaisia henkilökohtaisia intressejä, jotka mallintamisessa pitää tiedostaa ja huomioida. Asiantuntijat voivat niin sanotusti pelata omaa peliään, eli antamalla väärää tietoa määrittelemällä prioreja tai tekijöitä omaksi edukseen. Mallien keskiarvoistamisella vääristymää voidaan korjata: keskiarvoistaessa mallit, jotka eivät tue kerättyä dataa, saavat vähemmän painoarvoa. Sen sijaan, asiantuntijoiden antamia tavoitteita ja arvoja päätösmallintamisessa ei voida, eikä tulekaan, tässä vaiheessa keskiarvoistaa (Mäntyniemi et al., 2013).

Vaikka mallintamisen onnistuminen on tärkeää, ehkä tärkeintä on kuitenkin haastateltavan ja tutkijan välisen dialogin ja yhteistyön mahdollistaminen, sekä mahdollisimman avoin ja läpinäkyvä ongelmanasettelu. Näin voidaan varmistaa, että tutkija ei tutki vaan tutkiakseen, vaan hänen työllään on myös yhteiskunnallinen merkitys ja ulottuvuus.

Mäntyniemi, S., et al., 2013. Incorporating stakeholders’ knowledge to stock assessment: Central Baltic Herring. Can. J. Fish. Aquat. Sci, 70.

O’Hagan, A., et al., 2005. Statistical Methods for Eliciting Probability Distributions. Journal of the American Statistical Association, 100: 470.

Uusitalo, L., 2007. Advantages and challenges of Bayesian networks in environmental modelling. Ecological Modelling, 203.

 

Mietteitä Bayes-mallintamisesta ja päätöksenteosta

Tässä blogipostauksessa on luvassa alustavia mietteitäni Bayes-mallintamisen roolista ja hyödyllisyydestä ympäristöä koskevassa päätöksenteossa, tässä tapauksessa erityisesti Vantaanjoen meritaimenen kohdalla. Toisin sanoen, mihin Bayes-mallintamista tarvitaan, ja mikä mallintamisen hyöty on/voi olla?

Oma taustani on ympäristötieteissä ja kehitysmaatutkimuksessa. Kehitysmaatutkimuksessa painotetaan mahdollisimman yksinkertaisen ja helppokäyttöisen teknologian arvoa, jonka nähdään olevan omiaan lisäämään itse teknologian käyttöä, ja sitä kautta myös hyvinvointia globaalin etelän maiden eri yhteisöissä. Esimerkkinä voisi pitää vaikka aurinkopaneeleiden käyttöä: jos yhteisö ei pysty omaksumaan paneeleiden käyttöä, eikä osaa niitä itse käyttää tai huoltaa, aurinkopaneeleiden edut jäävät pieniksi. Samalla tavalla myös osallistavaa päätöksentekoa lisäävien eri työkalujen ja välineiden nähdään edesauttavan yhteisöiden hyvinvointia ja päätöksenteon oikeudenmukaisuutta. Oletuksena siis on, että nykyisen muotoisen ylhäältä alaspäin toimivan säännöstelyn lisäksi, horisontaalisen päätöksenteon sekä yhteisöstä käsin lähtevä päätöksenteon lisääminen edesauttaisi säännöstelyn legimiteettiä ja toimivuutta.

Myös täällä Itämeren rannikkolla on tarvetta alhaalta ylöspäin suuntautuvalle päätöksenteolle, ja olenkin kiinnostunut osallistavasta päätöksenteosta, jossa tarkoituksena on eri sidosryhmien ja tekijöiden osallistaminen mahdollisimman yksinkertaisin työkaluin. Tälle kurssille tulin miettimään, miten Bayes-mallintaminen voisi toimia yhtenä osallistavan päätöksenteon välineenä. Itselläni ei ole matemaattista taustaa, ja suhtauduinkin mallintamiseen aluksi epäilevästi. Bayes-laskennan hienous piilee kuitenkin siinä, että koko universumia mallintamista ei nähdä välttämättömänä ennen itse tekoihin ryhtymistä, vaan päätöksenteko voi perustua todennäköisyyksille ja niiden mallintamiselle.

Vanhankaupunginkosken meritaimenia ja muita vaelluskaloja koskeva päätöksenteko eri sidosryhmien välillä on hankalaa: kaikki eivät luonnollisestikaan ole samaa mieltä vaelluskaloja koskevista toimenpiteistä. Aiemmissa blogipostauksissa (Juhani ja Mikko) on jo kiinnitetty huomiota Vanhankaupunginkosken padon haittoihin meritaimenien ja muiden vaelluskalojen kohdalla. Vaikka asiaa vaelluskalojen kohdalla on tutkittu vähän, haitoista merkkinä ovat suvannosta kesäaikana löytyneet turbiinien katkomat ankeriaat1. Vanhankaupunginkosken padon purkamisesta on puhuttu viime syksystä, ja tällä hetkellä purkupäätös on saanut jatkoaikaa2. Vastakkain ovat kaksi osapuolta, joista toinen haluaa säilyttää padon sen kulttuurihistoriallisen arvon takia, ja toinen suojella vaelluskaloja.

Vaelluskaloja suojellaan ja säädellään Vanhankaupuginkoskella lähinnä paikallisella tasolla. Vanhankaupunginkosken kalavesien hoidosta vastaa kalastuslain määrämänä Helsingin kalastusalue, jonka tehtävänä on myös kalastuksen säätely ja valvonta, sekä toimiminen yhteistyössä kalavesien omistajien, ammattikalastajien ja vapaa-ajankalastajien kanssa. Helsingin kaupungin liikuntavirasto sen sijaan vastaa kosken kalastusjärjestelyistä. Taimen ja lohi ovat rauhoitettuja ajalla 11.9- 15.11, jolloin niitä ei saa nostaa edes kuvattavaksi. 3

Myös koko Vantaanjoen valuma-alue ja siihen liittyvä päätöksenteko vaikuttavat meritaimeniin. Joka vuotiset kuntien jätevesipuhdistamoilta ja pumppaamoilta tapahtuvat puhdistamattomien jätevesien päästöt, ja maataloudesta huuhtoutuvat ravinteet ja kiintoainekset aiheuttavat pahimillaan kala-ja eliöstökuolemia ja kuormittavat Vantaanjokea, sekä viime kädessä myös Itämerta. Vantaanjoen vedenlaatu olikin 1980-luvulla vielä huono, mutta on siitä lähtien kehittynyt parempaan kuormituksen vähenemisen myötä, ja Vantaanjoen vedenlaadun ekologinen tila on nykyään EU-kriiterein kuvattu ”tyydyttäväksi”. 4

Vantaanjoen varrella ja Vanhankaupunginkoskella on siis monenlaista toimintaa ja monenlaisia toimijoita. Bayes-mallinnus voi toimia yhtenä työkaluna meritaimeniin liittyvässä eri sidosryhmien välisessä keskustelussa ja päätöksenteossa. Eri sidosryhmät ja asiantuntijat voidaan ottaa mukaan jo Bayes-mallin kehittelyvaiheessa, ja heidän avullaan voidaan pohtia eri prioreja (tässä projektissa meritaimenten vuosittaisen määrän priorit on asiantuntijoiden antamia), eri tekijöiden vaikuttavuutta, sekä eri päätösmalleja ja niiden hyödyllisyyttä. Olisikin mielenkiintoista pohtia vielä lisää, miten tarkalleen ottaen asiantuntijat voivat olla mukana kehittelyvaiheessa ja mikä heidän panoksensa mallintamisessa voikaan olla.

Osallistavassa päätöksenteossa työkalujen pitää olla helppokäyttöisiä ja kustannustehokkaita, ja vaikuttaa, että parhaimmillaan Bayes-mallinnus on molempia. Tutkijoiden ja haastateltavien välinen yhteisymmärrys on mallintamisessa tärkeää, ja haasteena on kehittää mallintamisen selkokielisyyttä. Tästä kuitenkin lisää vasta seuraavissa blogipostauksissa….

  1. Virtavesien hoitoyhdistys Ry, 2015. Vantaanjoen vesistö. Available online: http://www.virtavesi.com/index.php?upperCatId=4&catid=4
  2. Vihreä Lanka, 05.05. 2015. Kohuttu patopäätös sai jatkoaikaa. Available online: http://www.vihrealanka.fi/uutiset-kotimaa/kohuttu-patop%C3%A4%C3%A4t%C3%B6s-sai-jatkoaikaa
  3. Vanhankaupunginkoski, 2013. Vanhankaupunginkoski. Available online: http://www.vanhankaupunginkoski.ota.fi/
  4. Vantaanjoen ja Helsingin seudun vesiensuojeluyhdistys ry, 2015. Vedenlaatu. Available online: http://www.vhvsy.fi/content/fi/1007/1048/Jokiluonto.html

 

 

Tulokset 30.04-01.05

Image

Ennustukset päiville

22 ja 23

(eli ajalle 30.04-01.05)

 

Eilen (päivä 21) oli saatu yhteensä kuusi taimenta! Vappuluvut ennustetaan tässä nyt uusimmalla mallilla, jossa siis on otettu huomioon edellisessä postauksessa selitetyt tekijät: toinen pyydys (taimenrysä), muutosintensiteetin jakauman uudellenarviointi (käytössä nyt normaali-ja tasamalli), sekä uudet asiantuntijoiden antamat priorit kokonaismäärälle (kokonaislukumäärän odotusarvo 2600, keskihajonta 2000).

Tulokset:

Kuvio 1. Kokonaismäärän posteriori-jakauma normaalimallissa 1

 

 


1

 

Taulukko 1: mallin 1 antamat estimaatit taimenten kokonaismäärän jakauman tunnusluvuille (N Sample size = 147600):

mean
sd MC_error 95% interval
1199.0 834.3   26.68 283-3261

Kokonaismäärän odotusarvon piste-estimaatiksi normaalimallilla on siis laskettu 1199 kappaletta (95% luottamusväli 283-3261), joka, niin kuin saatettiin olettaa, on hieman korkeampi kuin edellisen päivän 1086.

 

Tasajakaumalla (malli 2) kokonaismäärän tulokset näyttävät hieman korkeammilta:

 

Kuvio 2. Kokonaismäärän posteriori-jakauma tasajaukamalla, eli mallissa 2
2

Taulukko 2: mallin 2 antamat estimaatit taimenten kokonaismäärän jakauman tunnusluvuille

mean
sd MC_error 95% interval
1578 1021 36.82 459-4274

 

Ennustukset päiville 22 ja 23 sen sijaan ovat seuraavanlaiset:

Normaalimallilla (malli 1)

Taulukko 3. Posteriorijakauma vaeltavien taimensmolttien määrä torstaina 30.4.2015 (n(22)) ja perjantaina 01.05 (n(23)).

n(i),sample size 147600                       mean sd MC_error 95% interval
n(22) 28.83 18.24 0.5629 7.0-76.0
n(23) 29.83 19.03 0.5872 7.0-79.0

JA

Tasamallilla (malli 2)

Taulukko 3. Posteriorijakauma vaeltavien taimensmolttien määrä torstaina 30.4.2015 (n(22)) ja perjantaina 01.05 (n(23)).

n(i),sample size 156200

  

mean           

 

sd MC_error 95% interval
n(22) 26.30 17.75 0.6137 6.0-73.0
n(23) 26.31 17.76 0.6137 6.0-73.0

 

Viimeiseksi vielä luvut pyydyksiin jäävien taimensmolttien määrästä torstaina 30.4.2015 (x(22)) ja perjantaina 01.05 (x(23)).

 

Normaalimallilla (malli 1):

Kuvio 3 ja 4. Posteriorijakauma ruuviin jäävien taimensmolttien määrästä torstaina 30.4.2015 (x(22)) ja perjantaina 01.05 (x(23)).

4, 5

Mallin mukaan keskiarvo (mean) oli siis:

x(22)= 3,463 ja x(23)= 3,595

Tasamalli (malli 2):

Kuvio 5 ja 6. Posteriorijakauma ruuviin jäävien taimensmolttien määrästä torstaina 30.4.2015 (x(22)) ja perjantaina 01.05 (x(23)).

5,6

Eli tasamallin mukaan keskiarvo (mean) oli:

x(22)= 2,664 ja x(23)= 2,670

Tässä siis esimakua uusimman mallin tuloksista! Mallissa on vielä paljon kehitettävää, ja esim. vieläkin mietimme, miten ruuvin ja rysän vaikutusta voisi parhaiten mallintaa. Nyt kun viime päivinä on satanut paljon ja vedenkorkeus on noussut, rysä otetaan mahdollisesti pois käytöstä, mutta ruuvin pitäisi toimia sitäkin paremmin…

Nyt toivotamme kaikille kuitenkin hauskaa (ja toivottavasti aurinkoista) vappua!!