Viikko 7: Geostatistinen interpolointi

Tällä viikolla jatkoimme interpoloinnin parissa. Luennolla opimme determinististä ja geostatistisista menetelmistä ja näiden eroista. Deterministisillä menetelmillä tarkoitetaan hieman yksinkertaisempia menetelmiä, jotka eivät hyödynnä tilastotiedettä ja geostatistiset menetelmät puolestaan hyödyntävät tilastotiedettä. Geostatistisia menetelmiä käytettäessä on mahdollista tarkastella virhemarginaalia. Tällä viikolla vertailimme näitä menetelmiä ja ensimmäisessä tehtävässä determinististä menetelmistä käytettiin IDW interpolointia ja geostatistisista menetelmistä Kriging menetelmiä.

IDW- ja Kriging-interpolointien vertailua

Ensimmäisessä tehtävässä tarkasteltiin Afrikan ja Lähi-Idän lämpötilatietoja, jotka oli tallennettu pistemuotoon. Interpolointi onnistuu parhaiten tehtävänannon mukaan tiedoilla, jotka noudattelevat normaalijakaumaa (kuva 1). Näin ollen interpoloitavaksi kuukaudeksi valittiin elokuu.

Kuva 1. Tehtävässä yksi tarkasteltiin histogrammeja ja valittiin interpoloitavaksi kuukausi, jonka lämpötilat noudattelivat normaalijakaumaa.

Tehtävänannon mukaan usein tulee optimaalista interpolointitulosta varten kokeilla useampaa interpolointimenetelmää ja vertailla näiden luotettavuutta. Tässä tehtävässä toteutimmekin interpoloinnin usealla eri metodilla ja vertailimme näiden luotettavuutta. Tällä viikolla ymmärsin cross validation -diagrammeja viime viikkoja paremmin, kun tehtävässä tuli vertailla eri interpolointimenetelmillä tuotettujen karttojen cross validation -tietoja. Tehtävässä opastettiin vertailemaan esimerkiksi numeerista tietoa ja sitä, kuinka hyvin sininen ja harmaa viiva osuvat päällekkäin. Esimerkiksi root-mean-square on tarkoitus olla lähellä 0 ja tällöin interpolointi on luotettava. Diagrammeja kuvassa 2 vertailemalla voi tulla johtopäätökseen, että IDW Smooth optimized tuotti tällä aineistolla IDW Smoothia luotettavamman interpoloinnin. IDW Smooth optimized huomioi pisteiden etäisyyden tavallista IDW smoothia voimakkaammin.

Kuva 2. IDW Smooth optimized ja IDW Smooth cross validation -vertailut

Tämän jälkeen toteutettiin Kriging menetelmällä kaksi interpolointia, joita vertailtiin jälleen keskenään ja tämän jälkeen IDW interpolointiin. Vertailun tuloksena päädyimme käyttämään modifioitua Kriging interpolointia, johon oli muokattu muun muassa sektorien lukumäärää suuremmaksi ja näin ollen naapuriarvot tulivat tasapuolisemmin huomioitua. Kuten aiemmin mainittu, on geostatistisilla menetelmillä mahdollista tarkastella virhemarginaalia. Kuvassa 3 on kuvattu tummimman punaisella alueet, joilla interpoloinnin tarkkuus on heikoin. Kuvasta näkee selvästi, että interpoloinnin luotettavuus on heikompi alueilla, joilla ei ole mittauspisteitä.

Kuva 3. Virhemarginaali Kriging interpoloinnilla tehtävässä 1.

Kuvassa 4 on ensimmäisen tehtävän kartta interpoloituna modifioidulla Kriging menetelmällä.

Kuva 4. Ensimmäisen tehtävän interpolointi, jossa on kuvattuna Afrikan ja Lähi-Idän lämpötila elokuussa

Kriging vs. Bayesian Kriging

Toisessa tehtävässä interpoloitiin lämpötilakartta ja tämän perusteella tutustuttiin kaupungin alueisiin, joilla on korkein lämpötila ja paljon riskiryhmään kuuluvia ihmisiä, yli 65-vuotiaita, asukkaina. Tässä tehtävässä pitäydyttiin Kriging-menetelmissä. Ensin käytettiin yksinkertaista Kriging-menetelmää ja vertailtiin tuloksia Bayesian Kriging interpolointiin.

Luennolla oppimamme mukaan kriging interpolointi huomioi autokorrelaation, eli havaintopisteiden etäisyyden, interpolointia tuotettaessa. Kun etäisyys kasvaa, autokorrelaatio heikkenee. Kriging ja bayesian kriging eroavat toisistaan siten, että bayesian kriging ei tuota yhtä semivariogrammia vaan jakaa alueen osiin ja tulokset pohjautuvat useampaan semivariogrammiin.

Jälleen vertailimme cross-validation-tietoja ja totesimme tässä tehtävässä Bayesian Kriging interpoloinnin luotettavammaksi. Seuraavaksi toimme aineistosta tietoja, jotka osoittivat rakennettujen alueiden sijainnin. Tätä vaihetta en ymmärtänyt kovin syvällisesti, mutta käytännössä rakennetuilla pinnoilla ja lämpötilalla todettiin olevan positiivinen yhteys ja näin ollen rakennetut pinnat otettiin lopulta huomioon interpoloinnissa. Interpolointi, joka otti huomioon rakennettujen pintojen vaikutuksen lämpötilaan, oli luotettavin ja päädyimme jatkamaan työskentelyä tämän kartan parissa.

Tämän jälkeen halusimme esittää lämpötilatietoa kaupungissa asuinalueittain ja teimme hakuja, joilla identifioitiin alueita, joilla on korkea lämpötila ja paljon yli 65-vuotiaita asukkaita. Toisen tehtävän kartta on esitetty kuvassa 5. Kartassa on siis tietoa pelkästään lämpötilasta. Haku-toiminnolla saimme valittua alueita, joilla on paljon iäkkäitä asukkaita ja korkea lämpötila.

Kuva 5. Kartta Madisonista kuvaa asuinalueiden keskimääräistä lämpötilaa Fahrenheiteina 8.8.2016.

Tehtävä 2 oli jälleen monivaiheinen ja välillä ehdin pudota kärryiltä tehtävävaiheiden kanssa. Vaikka kurssin aikana monimutkaisia tehtäviä tehdessä on saattanut tuntunut siltä, etten ole ymmärtänyt mitään, on kuitenkin lopulta ymmärtänyt kaikista tehtävistä edes jonkin verran. Esimerkiksi tätä tehtävää tehdessä huomasin, että interpoloidun jatkuvan pinnan voi muuttaa aluemuotoiseksi tiedoksi, kuten kuvassa 5 on esitetty. Myös selittävä tekijä, kuten tässä tapauksessa rakennetut alueet, lisäävät interpoloinnin luotettavuutta.

Huomasin jossain vaiheessa kurssin aikana, että jos en ensimmäisellä viikolla ymmärtänyt jotain tehtävää tai menetelmää, siihen usein palattiin seuraavan viikon luennolla ja tehtävissä. Tämä toimi itselleni erittäin hyvin ja alun tuskailun jälkeen asiat usein selkenivät seuraavilla viikoilla. Tällöin eivät opetettavat asiat olleet enää uusia, vaan näihin oli saanut jo pienen maistiaisen edellisellä viikolla. Ehkäpä yhtenä tärkeimmistä kurssin opeista on ollut ArcGIS Pro -ohjelmistoon tutustuminen ja tähän olenkin saanut hyviä eväitä kurssin aikana. Tästä on hyvä jatkaa paikkatieto-opintoja tulevilla kursseilla.

Viikko 6: Interpolointi

Tällä viikolla siirryimme uuden teeman pariin, joka oli interpolointi. Tämän viikon luennolla opimme, että interpolointi perustuu matemaattisiin kaavoihin ja sillä tarkoitetaan paikkatietotyöskentelyssä havaintopisteiden perusteella muodostettavaa arviota tutkittavan ilmiön voimakkuudesta havaintopisteiden sisäpuolella. Interpoloitu kartta voidaan esittää jatkuvana pintana tietystä mitattavasta ilmiöstä yksittäisten pisteiden sijaan (Holopainen ym. 2015, 67-68). Esimerkiksi tämän viikon ensimmäisessä harjoituksessa muodostettiin interpoloimalla kartta, joka kuvaa liuenneen hapen pitoisuuksia meressä.

Interpolointi voidaan jakaa globaaleihin ja lokaaleihin menetelmiin, joista lokaaleissa huomioidaan viereisten pisteiden arvot ja globaalissa kaikkien alueen pisteiden arvot. Useimmissa menetelmissä käytetään autokorrelaatiota, joka olettaa lähellä olevien pisteiden olevan merkitsevämpiä kaukana oleviin havaintopisteisiin verrattuna (Holopainen ym. 2015, 67-68).

Ensimmäinen tehtävä: liuenneen hapen pitoisuus interpoloimalla

Ensimmäisessä tehtävässä luotiin aluksi diagrammeja, joita tarkastelemalla oli helppo päästä selvyyteen alueen happipitoisuuden tilanteesta ja vuodenaikaisista vaihteluista. Interpolointi toteutettiin kahdesti, ensin vuodelle 2014 ja seuraavaksi vuodelle 2015. Toteutimme interpoloinnit hieman erilaisia työvaiheita noudattaen ArcGIS Pro:ssa harjoituksen vuoksi.

Ensin käytettiin Geostatical Wizardia ja Kernel Interpolointia, joka otti huomioon esteen eli tässä tapauksessa lahden (bay). Tällä työkalulla oli helppoa muuttaa sädettä, jonka sisällä naapuriarvot huomioitiin interpoloinnissa. Mitä pienempi säde oli, sitä vähemmän naapuriarvoja otettiin laskutoimituksissa mukaan. Jos säteen asetti liian pieneksi, ei interpoloinnista tullut jatkuvaa aluetta, vaan väleihin jäi tuntemattomia alueita, jotka eivät saaneet arvoa. Jos säde puolestaan oli liian suuri, tuli tulokseksi liian ”epätarkka” kartta, jossa oli liian paljon yleistyksiä. Vuoden 2015 kartan toteutimme niin ikään Kernel Interpoltaion with barriers -toiminnolla, joka haettiin tällä kertaa geoprocessing työkaluista. Tätä polkua käytettäessä työkalu ilmeisesti valitsee automaattisesti aineiston perusteella, mitä naapureita tulisi käyttää laskennassa, sillä siihen ei ollut mahdollista vaikuttaa itse tätä polkua seuraamalla.

Tämän jälkeen muutimme kartan vielä rasterimuotoiseksi ja toimme (import) tehtäväpaketin mukana ladatun tiedoston symbology-valikossa projektiin mukaan. Tämä sai kartan visualisoinnin muuttumaan liukuvaksi. Muokkasin vielä hieman kartan väritystä valiten sen siniseksi. Pohdin jonkin verran tulisiko happipitoiset alueet esittää tumman sinisellä vai vaalealla värillä, mutta päädyin esittämään happipitoiset eli hyvinvoivat alueet sinisellä ja happikatoiset alueet vaalealla maanläheisellä värillä. Kuvassa 1 on lopputulos tehtävästä yksi.

Kuva 1. Ensimmäisen tehtävän kartat, jotka kuvaavat liuenneen hapen määrää Chesapeakenlahdessa vuosina 2014 ja 2015.

Ensimmäisessä tehtävässä karttojen lisäksi tutkittiin myös cross-validation- ja error-taulukoita, joista luultavasti syvällisempään ymmärrykseen voisi auttaa tilastotieteen kurssit. Geoinformatiikka 2 kurssilla onkin jo aiemminkin selvinnyt, että tilastotiede tukee vahvasti geoinformatiikan tieteenalaa.

Tehtävä kaksi: Liuennut happi 3D-mallina interpoloituna

Tehtävässä kaksi selvitettiin niin ikään liuenneen hapen pitoisuuksia ja valmiiden mittausten perusteella interpoloitiin happipitoisuuden tasoja 3D-malliin. Käytimme Empirical Bayesian Kriging 3D -työkalua, johon valittiin mitatut happipitoisuuspisteet ja 3D-mallin vuoksi z-tietoa, eli tietoa syvyydestä tässä tapauksessa. Samalla työkalulla valitsimme kuinka monta naapuripistettä työkalu ottaa huomioon laskettaessa interpolaatioestimaatiota. Useiden työvaiheiden jälkeen loimme animaation happipitoisuuksista 3D-mallina, joka ladattiin erilliseen moodle-kansioon.

Lisäksi loimme isopleettitasoja, jotka kuvaavat samanarvon happipitoisuuksia eri syvyyksissä. Isopleettien luomiseen tutustuttiin jo tiedon esittäminen maantieteessä -kurssilla, joskin silloin piirsimme isopleetteja 2D-karttana itse CorelDraw-ohjelmalla asukastiheydestä.

Isopleetit on esitetty kuvissa 2-4. Punaisella värillä on kuvattu happipitoisimmat, keltaisella värillä keskiarvoiset ja vihreällä värillä vähähappiset alueet. Tämä väritys ei vaikuta jälkeen päin ajateltuna loogisimmalta mahdolliselta ja sen luultavasti muuttaisin, jos tekisin tehtävää uudelleen. Esimerkiksi ensimmäisessä tehtävässä väritys sinisestä vaaleaan voisi toimia myös tässä tehtävässä paremmin. 3D-malleista kuvissa 2-5 huomaa, että happipitoisimmat alueet sijaitsevat aivan vesistön pinnassa ja pohjalla ja vähähappipitoisimmat alueet keskisyvyyksissä.

Kuva 2. Happipitoisuus lähellä vesistön pintaa

 

Kuva 3. Keskiarvoinen happipitoisuus

Kuva 4. Vähähappisia alueita

Lähtöaineistona isopleettien muodostamiseen käytimme aiemmin luomaamme Voxel-karttatasoa. Voxel-taso luotiin Add voxel layer -työkalulla ja lähtöaineistona käytettiin pistetietoa happipitoisuudesta (kuva 5).

Kuva 5. Voxel-taso, joka kuvaa happipitoisuutta syvyyden mukaan.

Interpolointia ja tällä viikolla käyttämiämme työkaluja voisi käyttää useisiin paikkatietotöihin, joissa halutaan esittää kartta jatkuvana esityksenä tiedossa olevien mittauspisteiden perusteella. Tällaisia karttoja voisi maantieteessä olla esimerkiksi lämpötilan, ilmanpaineen tai korkeuden esitykset. Interpoloinnissa vaikuttaa olevan useita seikkoja, joita tulee huomioida ennen työhön ryhtymistä. Erityisesti maantieteelliset esteet ja suhtautuminen ympäröiviin mittauspisteisiin tulee huomioida tarkasti riippuen työtehtävästä. Kun interpoloinnin saloihin pääsee syvällisemmin sukeltamaan, on sillä mahdollisuus toteuttaa tarkkojakin esityksiä mitattavasta ilmiöstä. Kuten Holopainen ym. (2015, 67) toteavat, usein mittaaminen on työlästä ja kallista ja interpolointi on vastaus näihin haasteisiin. Kun tietyt edustavat pisteet on valittu mitattavaksi, voi muusta alueesta tuottaa vaikuttavan ja vakuuttavan interpoloidun esityksen.

 

KIRJALLISUUS

Holopainen, M., Tokola, T., Vastaranta, M., Heikkilä, J., Huitu, H., Laamanen, R. & Alho, P. (2015). Geoinformatiikka luonnonvarojen hallinnassa. Helsingin yliopiston metsätieteiden laitoksen julkaisuja 7. Luettavissa: http://hdl.handle.net/10138/166765. Luettu: 3.1.2020.