Categories
Uncategorised

Geoinformatiikan menetelmät 2 – Raportti 7

Johdanto

Kurssin viimeisellä eli seitsemännellä viikolla aiheena olivat geostatistiset interpoloinnit. Aiemmin tutuksi tulleisiin deterministisiin interpolointimenetelmiin verrattuna geostatistisissa interpoloinneissa erona on se, että ne käyttävät apunaan tilastotiedettä. Tilastotiedettä hyödyntäen menetelmissä siis ennustetaan mitattujen pisteiden arvojen perusteella se, mitä muualla tutkimusalueella todennäköisesti on.

Deterministiset ja geostatistiset interpolointimenetelmät eroavat siis toisistaan ja ne soveltuvat erilaisten datojen interpolointiin. Kurssikerran kirjallisuudessa oli esimerkki, jossa interpolointimenetelmiä oli tutkittu osana pohjaveden suolaisuuden tutkimusta. Lopputuloksena geostatistiset interpolointimenetelmät ja tarkimmin vielä EBK (eli Empirical Bayesian Kriging) oli kyseisessä tutkimuksessa paras menetelmä, koska kyseinen menetelmä oli luotettavin (Gunarathna ym., 2016). Luotettavuutta ja mahdollisten virheiden vähyyttä oli tarkasteltu menetelmän virhemarginaalin avulla.

Geostatistiset menetelmät perustuvat spatiaaliseen autokorrelaatioon eli maantieteen ensimmäiseen lakiin. ”Lain” mukaan kaikki riippuu toisistaan, mutta toisiaan lähellä olevat kohteet ovat enemmän toisistaan riippuvaisia kuin kauempana olevat. Spatiaalisessa tilastotieteessä siis hyödynnetään tätä olettamusta.

Interpolointimenetelmänä kurssikerran harjoituksissa käytettiin kriging-interpolointeja. Kyseisten interpolointimenetelmien lopputuloksista voidaan esimerkiksi laskea todennäköisyyksiä, virheitä ja interpoloinnin luotettavuutta. Aineistot, joiden avulla interpolointeja suoritettiin olivat mielestäni mielenkiintoisia, joka lisäsi omalta osaltaan harjoitusten kiinnostavuutta.

Ensimmäinen harjoitus

Seitsemännen kurssikerran ensimmäisen harjoituksen tarkoituksena oli vertailla näitä kahta eri interpolointimenetelmää. Harjoituksen aineistona oli Afrikan lämpötiloja esittäviä pisteitä, jotka interpoloitiin sekä IDW-interpoloinnin että kriging -interpoloinnin avulla.

Interpoloinnit toteutettiin jo aiemmalla kurssikerralla tutuksi tulleen Geostatistical Wizard -työkalun avulla. Työkalussa molempia interpolointimenetelmiä tarkasteltiin vaihtamalla niiden arvoja. IDW-interpoloinnista tehtiin kaksi versiota, jossa oli käytössä hieman eri asetukset, jotka vaikuttivat siihen, mitä olemassa olevia pisteitä interpolointi painottaa ja kuinka paljon. Interpolointien suorittamisen jälkeen lopputuloksia vertailtiin cross validation -ikkunan avulla.

Myös kriging -interpoloinnista tehtiin kaksi eri versiota, joita vertailtiin. Toinen tehtiin optimoinnin avulla ja toisessa muokattiin naapuruston vaikutusta, jotta yhden suunnan naapuripisteet eivät vaikuttaisi niin paljon lopputulokseen.

Kuva 1. Ensimmäisen harjoituksen kartta.

Geostatistical Wizardin käyttö on helppo suorittaa ja optimoinnin avulla interpoloineihin saa arvot, jotka ainakin sopivat kyseiseen menetelmään. Työkalussa on kuitenkin paljon erilaisia arvoja, joita voi myös manuaalisesti säätää. Osa näistä arvoista ja niiden vaikutuksista jäivät hieman epäselviksi. Toisaalta ymmärsin mitä tehtävissä säädettävillä arvoilla, kuten naapurustoa säätämällä, oli tarkoitus saavuttaa, joten ainakin työkalun perusominaisuudet tulivat tutuksi.

 

Toinen harjoitus

Toisessa harjoituksessa etsittiin lämpösaarekkeita Madisonin kaupungin alueelta. Tehtävän alussa tutustuttiin aineistoon erilaisten kaavioiden, kuten histogrammin, avulla sekä kerrottiin taustatietoja lämpösaarekkeiden vaikutuksista esimerkiksi vanhempiin ihmisiin.

Interpolointimenetelminä tehtävässä käytettiin kriging -interpolointia. Ensin tehtiin yksinkertainen kriging -interpolointi, jonka jälkeen suoritettiin Empirical Bayesian kriging -interpolointi. Interpoloinnit toteutettiin taas Geostatistical Wizardin avulla. Interpolointien jälkeen lopputuloksia vertailtiin.

Bayesian kriging -interpolointi eroaa normaalista kriging -interpoloinnista siten, että siinä ei käytetäkään yhtä ja samaa semiovariogrammia koko tutkimusalueelle. Kyseinen interpolointimenetelmä siis jakaa datan pienempiin osiin ja luo jokaiselle osalle oman semiovariogrammin.

Menetelmien vertailussa cross validation -ikkunan avulla huomattiin, että EBK:n avulla saatiin hieman oikeampia lämpötila-arvoja esittävä kartta. Erot arvoissa eivät olleet toki kovin suuria ja visuaalisesti tarkasteltuna interpoloiduissa kartoissakaan ei ollut havaittavissa suuria eroja.

Interpolointien jälkeen käytettiin vielä EBK regression -työkalua, jonka avulla lämpötilojen interpolointeihin yhdistettiin dataa selittävästä tekijästä. Työkalun avulla siis poistettiin kartalta vettä läpäisemättömiä pintoja, kuten asfalttipintoja. Se, miten työkalun matemaattinen toiminta tapahtuu, jäi itselleni hieman epäselväksi, mutta sen ymmärtäminen ei tainnut ollakaan ihan keskeisin osa tehtävää.

Kuva 2. Toisen harjoituksen lämpötilakartta.

Kuva 3. Toisen harjoituksen lämpötilakartta alueittain.

Lyhyt kurssin yhteenveto

Kurssin alussa etänä suoritettava GIS-kurssi kuulosti haastavalta, mutta näin kurssin jälkeen se sujui paremmin kuin aluksi ajattelin. Opin uusia asioita ja ymmärsin ainakin perusasiat eri kurssikerroilta. Suoritetut harjoitukset olivat myös pääosin mielenkiintoisia, vaikkakin osa melko pitkiä. Paras puoli kurssissa oli taas, kuten muissakin GIS-kursseissa, karttojen visualisointi. Visualisoinnissa voi kokeilujen avulla havainnoida tehtyjä työvaiheita ja muutenkin kokeilla erilaisia visualisointimenetelmiä ja väriyhdistelmiä. Visualisointiin voisi myös käyttää hyvinkin paljon aikaa ja usein lopputulosta voisi vielä parantaa, kuten tämän raportin kuvassa 1 legendan lämpötilatiedoista voisi vähentää näkyviä numeroita.

Kuva 4. GIS-blogi part 2 matkalla joululomalle.

Lähteet

Gunarathna et al. (2016). Are Geostatistical Interpolation Methods Better than Deterministic Interpolation Methods in Mapping Salinity of Groundwater? International Journal of Research and Innovations in Earth Science 3(3), 59-64

Moodlen luentodiat

<https://moodle.helsinki.fi/course/view.php?id=41841#section-10>

Leave a Reply

Your email address will not be published. Required fields are marked *