GIM2, Harjoituskerta 6 – 5.12.2023

Interpolointi

Interpoloinnissa paikkaan sidottua havaintopistetietoa käyttämällä tuotetaan jatkuva pinta. Spatiaalisessa interpoloinnissa ennustetaan uusia arvoja mitattujen pisteiden välisille alueille. Perustuu havaintoon, että lähellä toisiaan sijaitsevien pisteiden arvot ovat suuremmalla todennäköisyydellä lähellä toisiaan kuin kauempana olevien pisteiden arvot (Holopainen et al. (2015)), aivan kuten maantieteen ensimmäinen laki saneleekin.

Interpoloinnissa tuotetaan uusi aineisto pisteistä alueiksi (vektorimuotoinen) tai pisteistä gridiksi (rasterimuotoinen). Pisteillä tulee olla spatiaalinen autokorrelaatio, jotta jatkuvan aineiston tuottaminen niistä olisi järkevää. 

Voisi ajatella, että bufferointi hyödyntäisi samaa tekniikkaa, vaikka ajatus onkin hieman samantyylinen. Kuitenkaan interpolointi ei ole sama asia bufferoinnin kanssa. Ne eroavat siinä, että bufferoinnissa pisteen, viivan tai alueen ympärille muodostetaan saman laajuinen alue joka puolelta. Tämä alue ei saa uusia arvoja, eikä arvoja tarvitse ennustaa, kuten interpoloinnissa.

Deterministiset interpolointimenetelmät

Iterpolointimenetelmiä on useita, mutta miten ne eroaa? Eroa on siinä, miten menetelmä estimoi uusia arvoja uusille rastereille. Uudet arvot käyttäytyvät eri tavoin siinä, ovatko ne uskollisia mitattujen rasterien arvoille vai ei.

Interpoloinnissa tuotetaan rastereita pistepilvestä, jolloin uuden pikseliruudukon arvot määräytyy kahden pisteen välisien arvojen perusteella. Nämä ehdot määräytymiselle vaihtelevat käytetyn menetelmän mukaan. Esimerkiksi jos viereisessä rasterissa arvo on 20, onko viereen tuleva uusi rasteri arvoltaan 21 vai 18? Tämä riippuu esimerkiksi siitä, onko käytössä ollut globaali vai lokaali analyysi. Joissain menetelmissä arvot voivat olla myös minimi ja maximi arvojen ulkopuolella. Jos maximi arvo olisi 20, interpoloitujen pikselien arvot voisi olla sitä enemmänkin esimerkiksi juuri 21.

Thiessenin polygonit

Thiessenin polygonit perustuvat siihen, että mitatun pisteen ympärille rajataan polygini, jonka rajat ovat lähimpänä alueen sisällä olevaan pisteeseen sekä viereisissä alueissa oleviin pisteisiin. Alue saa tällöin sisällä olevan mitatun pisteen ominaisuustiedot. Alue käyttää lokaalia tietoa ottaen vierekkäisiä pisteitä huomioon. Thiessenin polygonit ovat vektorimuotoista tietoa eroten muista kohta esitellyistä menetelmistä.

Kuva 1. Thiessenin polygonit luovat erilaisia polygineja, joiden arvot vaihtelevat lokaalisti ja spatiaalisesti koko alueella.

Trendipintainterpolointi

Tässä menetelmässä luodaan pisteille matemaattinen funktio ja pinta, josta menetelmä tekee trendin eli yleistyksen. Esimerkiksi on selkeä trendi lämpötilojen laskussa spatiaalisesti, mitä tämä menetelmä hyödyntää laskussaan.

Periaatteena on löytää pienimmän neliösumman menetelmällä polynomifunktio, jonka kuvaama pinta olisi mahdollisimman lähellä havaintopisteiden arvoja. Menetelmä on keskiarvoistava ja pyrkii minimoimaan poikkeamat. Se ei ole uskollinen jo tiedetyille arvoille. Menetelmä on globaali eli ottaa huomioon koko interpoloitavan alueen, ja jos yhtä arvoa muuttaa, muuttaa tällöin kaikkia.

Esimerkiksi lämpötiloissa on selkeä lasku, joten trendipinnan ensimmäinen aste kuvaa jo hyvin lämpötilojen muuttumista Suomen mittakaavassa (Kuva 2.) Jos pisteiden Z arvot vaihtelee, voi käyttää 2 asteen funktion kuvaamaa pintaa, jolloin pinta kaareutuu ja näin ollen pisteet on lähempänä pintaa. Asteen lisääminen aina auttaa löytämään parhaiten pisteiden todelliset arvot, mutta liian pitkälle mentäessä lopputulosta on vaikeampi ymmärtää, laskeminen menee ylisuorittamiseksi eikä enää yleistä tarpeeksi.

Trendipintainterpolointi tehtiin Suomi-maskille, joka ei ollut täysin Suomen muotoinen, mutta se oli rastereilla kuvattu. Sen jälkeen käytettiin Clip-toimintoa muuttaen aineisto vektorimuotoisen Suomen mukaan oikean muotoiseksi.

Kuva 2. Trendipintainterpolointi 1. asteen polynomifunktiolla muodostaa selkeän ja suoran trendin lämpötilojen muutokselle noustessa Etelästä Pohjoiseen.
Kuva 3. Asteen muuttaminen vaikuttaa lopputulokseen. Polynomifunktion järjestysluku (esim. 2) tarkoittaa toisen asteen polynomifunktiota ja näin ollen pinta on kallistunut, mikä vaikuttaa arvoihin.
Kuva 4. Kolmannen asteen trendipinnassa lämpötilatrendit ovat kaareutuneet entisestään ja kuvaavat parhaiten sitä, miten lämpötilat oikeasti jakautuvat Suomen sisällä. Tämä johtuu siitä, että pinta minimoi entisestään poikkeamia mitattujen pisteiden välillä.

IDW – Inverse Distance Weighting

Käänteinen etäisyyttä painottava, mitä lähempänä pisteet on, sitä enemmä vaikuttaa lähialueiden pisteisiin, lokaali, lasketaan: pisteen p naapuripisteen arvo jaetaan sen etäisyydellä pisteeseen, ottaa ns huomioon lähimmät pisteet ja keskiarvoistaa niistä uuden pisteen (määritetään kuinka isolt alueelt extent esim 2 ekana), pehmentää, idw pysyy min ja max arvojen välissä koko ajan, eikä osu ikinä pisteisiin?

idw kokeilin että power optimoi muokkasi tuloksen parhaaksi, naapuruustyyppi ollessaan standardi ja sektorien tyypin ollessa 1, regressioviiva sininen oli lähimpänä harmaa viiva referenssiä. root mean square oli 0,60 lähimpänä 0, mikä pitää olla lähes 0. mean on 0,04 eli tosi lähellä nollaa mutta vääristää arvoja ylöspäin koska 0 yläpuolella.

Kuva 5. IDW-menetelmä tuottaa tarkempaa tietoa ja huomioi lokaalisti pisteiden arvot muodostaen uuden rasteripinnan.

Visualisoinnissa käytin kaikkiin karttoihin Natural breaks Jenks, 10 eri luokkaa, sinisestä valkoisen kautta punaiseen ja siirsin värejä niin, että valkoisin on 0 kohdalla. Muutin arvoja niin, että niissä on vain yksi desimaali.

Eri lämpötilakartat eroavat visuaalisesti selkeästi käytetyn menetelmän mukaan. IDW tuottaa esimerkiksi lämpötilasaarekkeita, mikä tarkoittaa sitä, että arvoja ei ole pehmennetty ja yleistetty niin paljon ja menetelmä on ollut vaativampi toteuttaa. Siinä kunnioitetaan eniten mitattujen pisteiden arvoja. Kuitenkin aineiston uuden arvot voi heitellä, jos mitatut pisteet eivät ole jakautuneet kovin tasaisesti.

Thiessenin polygonit kuvaavat taas tarkemmin spatiaalista jakautumista lokaalisti, ja tämä menetelmä kunnioittaa mitattuja arvoja. Trendipinta taas kuvaa globaalisti ja yleistetysti aineistoa. Se on myös nopein kaikista menetelmistä varsinkin ensimmäisen asteen funktiolla. Riippuen millaista karttaa haluaa, voi jokainen näistä menetelmistä olla toimiva. Jos haluaa tarkempaa tietoa lokaalimmin jakautuneesta aineistosta, voi käyttää IDW tai Thiessenin polygoneja. Jos taas yleistetymmin, voisi käyttää trendipintainterpolointia.

Omasta mielestä kuvaavin selkein ja havainnollistavin näistä tähän tarkoitukseen olisi trendipinnan 3 asteen menetelmä, koska siinä kuvataan selkeästi lämpötilojen lasku noustessa pohjoiseen eikä se tuota yksittäisiä lämpötilasaarekkeita.

Spline

Spline-menetelmä on kuin joustava viivotin, se piirtää samanarvonkäyriä pisteiden välille pyrkien mutkattomuuteen. Se sopii vähittäin muuttuvien arvojen aineistoihin kuten juuri lämpötiloihin. Se on uskollinen mitatuille arvoille, koska kulkee niiden kautta.

On hyvä, jos pisteitä on tasasesti interpoloitavalla alueella, koska jos jossain on vähemmän, niin analyysistä tulee epäluotettavampi. Reuna-alueet on haastavia, kun ei ole enää mitattuja pisteitä mihin verrata.

Esimerkissä interpoloidaan keskilämpötilat vuoden 2020 jokaisen kuukauden ajalta. Voisi suorittaa erikseen jokaisen kuukauden, mutta nopeampaa kopioida vaiheet Model Builderissa ja tehdä ne samaan aikaan. Ensiksi siis jo muokatusta sääasema-aineistosta

Tekemäni Model Builder (Kuva 7.) ei ole kaikkein selkein, ja jouduin tekemään esimerkiksi tammikuun tason uudestaan. En myöskään saanut valmiiksi tuotettua tmluokat.lyr tasoa näkyviin millään kuukaudella. Aikakin tuli vastaan, niin en lähtenyt enää muokkaamaan aineistojen värejä uusiksi, niin valitettavasti jotkin kartat ovat epäselkeitä ja arvojen väritykset liian vaaleita eivätkä erotu hyvin valkoisesta taustasta. toisaalta kesäkuukausien kartat ovat todella punaisia ja niissäkään ei ole selkeästi näkyvissä lämpötilavaihtelut. Kuitenkin aikasarjasta näkee hyvin ajallisen muutoksen ja sen eron, mikä talvi- ja kesäkuukausien lämpötiloissa on.

Kuva 6. Splinellä tehdyt kartat Suomesta kuvaavat hyvin ja tarkasti vuoden lämpötilamuutosta.
Kuva 7. Model Builderin tekemät analyysit jokaiselle kuukaudelle.

 

Lähteet:

  • Holopainen et al. (2015). Geoinformatiikka luonnonvarojen hallinnassa. Helsingin yliopiston metsätieteiden laitoksen julkaisuja 7.

Sofia Salonen, Geoinformatiikan menetelmät 2 – MAA-221, syksy 2023

Leave a Reply

Your email address will not be published. Required fields are marked *