GIM2 – Interpolointi

GIM2 – Interpolointi

Seuraavassa harjoituksessa interpoloidaan lämpötila-aineistoa Ilmatieteenlaitoksen säähavaintoasemilta, sekä Helsingin seudun ympäristöpalveluiden ilmanlaatuaineistoa pääkaupunkiseudulla. Suomen laajuisia lämpötila-aineistoja vuoden 2020 tammikuulta interpoloidaan kolmella deterministisellä interpolointimenetelmällä:

Thiessenin polygoneilla havaintopisteiden lähimmille alueille luodaan polygonit, jotka saavat lämpötila-arvon lähimmän havaintopisteen mukaan. Eri asteen trendipintainterpoloinnilla arvioidaan ja yksinkertaistetaan havaintoaineistoa ennen monimutkaisempia interpolointimenetelmiä. Inverse Distance Weighted, eli IDW-interpolointimenetelmällä otetaan huomioon havaintopisteiden etäisyys toisiinsa, mahdollistaen tarkasteltavan ilmiön paikallisen vaikutuksen määrittämisen. Spline-interpoloinnilla minimoidaan pinnan kaarevuus, luoden paikallisia pistejoukkoja myötäileviä joustavia arvoja, samanarvonkäyriä.

Pääkaupunkiseudun ilmanlaatuaineistot interpoloidaan kahdella geostatistisella interpolointimenetelmällä, jotka ottavat spatiaalisen autokorrelaation huomioon, eli havaintopisteiden etäisyyden vaikutuksen tarkasteltavaan ilmiöön. Simple Kriging-interpolointimenetelmä tuottaa verrattain matemaattisesti yksinkertaisempia tuloksia tarkastelualueelta interpoloinnista syntyvän standardivirheen taasen pysyessä pienempänä, kun taas Empirical Bayesian Kriging-interpolointimenetelmä tuottaa matemaattisesti monimutkaisempia arvopintoja suuremmalla standardivirheellä.

Kuva 1. Lämpötilainterpolointia Thiessenin polygoneilla. Lähde: Ilmatieteenlaitos

 

Trendipintainterpoloinnin parametreissä laskettavan polynomifunktion aste, Polynomial order, hyväksyy näemmä vain kokonaislukuja 1-12. Arvo yksi asettaa täysin tasaisen tason interpoloitaville arvoille, arvon ollessa kolme ja siitä ylöspäin pinnat lähtivät kaartumaan kovemmin mitä korkeampi arvo oli. Yrityksenä ymmärtää trendipintaintepolointia paremmin, nappasin sääasema-aineistosta kourallisen lähekkäisiä sääasemia joissa keskilämpötila-arvovaihteluja voisi helposti vertailla attribuuttitaulukosta ja sen jälkeen lähteä katsomaan mitä trendipintainterpolointi lähtee tekemään pienemmällä alueella, ja miten eri asteiden interpoloinnit vaikuttavat.

Sattumanvaraisesti Etelä-Suomesta kaapatut sääasemapisteillä tammikuun keskilämpötila ei vaihdellut juuri yhtä astetta enempää, matalimman arvon ollessa -0,5 astetta Joutsan Savenahon havaintopisteellä ja korkeimman, +1,7 astetta, Tampereen Tampella. Korkeimman keskilämpötilan havaintopisteet on visualisoitu tummanpunaisella pisteellä, liukuen aina valkoiseen matalimpien arvojen pisteillä. Negatiivisia arvoja ei Polynomial order suostu ymmärrettävästi vastaanottamaan, mutta nollannen asteen interpoloinnilla saatiin nätti koko Suomen kattava interpolointi arvolla 0,777779-0,777778. Neljännen asteen interpoloinnilla saatiin jo verrattain villiä trendipintaa, ja melkoisia ääriarvoja: Tammikuun keskilämpötilat vaihtelevat yksistään Inarin alueella -19324 asteesta +7433 asteeseen. Environmentseista Maskin poistamalla sai korkeamman asteen interpoloinnit taasen vähän erilaisia kurveja, vaikka oman järjen mukaanhan Mask määrittää vain raja-arvot sille, kuinka kauas rasteri piirretään, eikä sen tulisi vaikuttaa mitenkään itse interpoloituihin arvoihin?

Kuva 2. GIF-animaatio eri asteen trendipintainterpoloinnista. Lähde: Ilmatieteenlaitos

 

Kuva 3. GIF-animaatio 0-5 asteen trendipintainterpoloinnista kourallisella sääasemista. Lähde: Ilmatieteenlaitos

 

IDW-interpoloinnin parametrejä määrittäessä Power-funktion optimointi antaa arvon muiden parametrien mukaan optimoidun arvon, joka on hieman kolmea korkeampi Neighbor-typen ollessa Standard, Smoothille antaen arvoksi 4. Arvo vaihtelee myös riippuen Sector typestä ja naapureiden määrästä, mutta pyörii kolmen ja neljän välillä. 20:stä ylöspäin lopputuloksena on melko kulmikkaita ja suoria raja-arvoja,  yhdellä jo varsin pehmeästi liukuvia. Cross Validationin regressiosuoran saa myötäilemään aika hyvin referenssisuoraa, kunhan power-arvon optimoi jokaiselle parametrille. Negatiivisimpien arvojen kohdalla väistämättä näyttää tulevan hitusen, taulukon taasen kertoessa että kaikista 179 pisteestä interpoloidessa vain 11 arvolle tulee positiivista heittoa yli 1, kun taas negatiivisista vain viidelle. Kaikista pisteistä keskimääräiseksi heitoksi tulee positiiviset 0,03635, joka miltei triplaantuu kun interpolointi-poweriksi vaihtaa optimaalisen neljän sijaan kolme, joten saanen olla tyytyväinen.

Lämpötilainterpoloinnin myötä tahdoin päästä testailemaan Raster Functionsien Analysis-valikon Heat Indexiä. Varsin yksinkertainen työkalu joka vaati vain rasterit lämpötilasta ja suhteellisesta kosteudesta, joka löytyi avoimena aineistona ilmatieteenlaitokselta. 10 km x 10 km kokoista suhteellisen kosteuden rasteria oli saatavilla vain vuosittaisena keskiarvona, mutta työkalu lähti silti testiin vaikka keskimääräiset lämpötilat olivatkin vain tammikuulta. Työkalun ajettuani ulos tuli nättiä, vaikkakin raskasta rasteria joka pitkälti myötäili IDW-interpolointia, erona kuitenkin se, että suhteellinen kosteus vaikutti ääriarvoihin: IDW:ssä skaala oli +4,0 – -13,3, kun taas lämpöindeksillä arvoiksi tuli +2,55 – -16,21. Ääriarvot löytyivät Hangonniemen nokasta ja Utsjoen Kevolta. Tarkemmin aineistoon en kuitenkaan päässyt enää tutustumaan, näet lähetti lämpötilaindeksi ArcGIS:ini loputtomaan kuolonkierteeseen, josta pelastuttiin vasta lataamalla vanha backup, jossa en tuota kohtalokasta työkalua vielä ollut ajanut.  Tähän ehkä kuitenkin vielä palaan, kovasti tahtoisin päästä tarkastelemaan vuotuista muutosta lämpöindekseissä, aineistoa ollessa saatavilla aina vuodesta 1961.

Hetkeä myöhemmin olinkin jo tarkastelemassa vuotuista muutosta lämpötilaindekseissä. Käytössä siis Ilmatieteenlaitoksen 10 km x 10 km suhteellisen kosteuden että lämpötilan rasterit vuodesta 1961 vuoteen 2020. Pienen pähkäilyn päätteeksi selvisi myös, että datan arvot oli piilotettu ovelasti bandseihin, joita löytyi 356, yksi vuoden jokaiselle päivälle. Ensimmäisellä bandsilla lämpöindeksin laskeminen tuottikin siis joka vuoden tammikuun lämpötilaindeksin. Oman järjen mukaan bandsit tulisi juntata yhteen kullekin rasterilla vuotuisen keskiarvon laskemiseksi, ArcGIS:n tapauksessa tämä tapahtui Composite Bands-työkalulla. Kaksi aineistoa joista tulisi laskea keskiarvot 365(+1) bandsista 10 km x 10 km pikseleille koko Suomen alueelle, ja toistaa tämä seitsemälle vuodelle: 2020, 2010, 2000, 1990, 1980, 1970 ja 1961, ja vielä juntata Heat Indexin läpi, ilman täyttä varmuutta siitä että koko työkalulla tai käsitellyllä aineistolla minkäänlaista korrektia dataa. Suuremmitta kikkailuitta aineistosta sai kuitenkin seuraavanlaisen kivan visuaalisaation vuoden 2020 tammikuun päivittäisistä keskilämpötiloista Suomen laajuudelta:

 

Kuva 4. GIF-animaatio tammikuun 2020 jokaisen päivän keskilämpötilasta. Lähde: Ilmatieteenlaitos

 

Kuva 5. Karttasarja Suomen kuukausittaisista keskilämpötiloista Spline-interpoloinnilla. Lähteet: Ilmatieteenlaitos, ESRI

 

Taulukko 1. Interpolointimenetelmien vertailua

 

Ettei spatiaalinen autokorrelaatio unohtuisi interpoloinnista, interpoloidaan seuraavaksi kahdella geostatistisella Kriging-interpolointimenetelmällä; Simple Krigingillä ja Empirical Bayesian Krigingillä. Interpoloitavana aineistona toimii HSY:n ilmanlaatua indikoivat mitta-aineistot typpidioksidipitoisuuksista vuodelta 2019 pääkaupunkiseudun 58 mittausasemalta. Mittausasemista on kirjattu typpidioksidipitoisuuksien lisäksi mittauspisteen mittausympäristö, tuulettuvuus sekä liikennemäärät. Ymmärrykseni mukaan ilmanlaatu voi vaihdella ajallisesti ja alueellisesti hyvinkin paljon, joten oletan että arvot ovat keskiarvoistettuja pidemmältä havaintojaksolta eri vuorokaudenaikoihin ja mittauspisteet ovat sijoitettu edustamaan alueen keskimääräistä ympäristöä. 58 mittausasemaa ei myöskään millään pysty kattamaan koko pääkaupunkiseutua siten, että jokaiselta alueelta saataisiin luotettavia arvoja interpoloinnilla, mutta työkaluna ilmanlaadun suuntaa antavan vaihtelun tarkastelulle aineisto varmasti toimii melko luotettavasti.

Aineiston paras ilmanlaatu on mitattu Espoon Luukin mittausasemalla, jossa typpidioksidia havaittiin 5 µg/m3. Muita erityisen hyviä arvoja mitattiin Helsingin Vartiokylän, Pirkkolan, Helsinki-Vantaan lentokentän, Espoon Särkikujan ja Niittymaan mittauspisteiltä, joissa arvot olivat 11-13 µg/m3. Huonoimmat arvot, 38 µg/m3 ja 34 µg/m3 mitattiin Helsingin Pohjois-Esplanadilta ja Sörnäisten Rantatieltä. Seuraava karttasarja Simple Kriging ja Empirical Bayesian Kriging-interpolointien tuloksista ja niiden standardivirhekartat havainnollistavat hyvin miten eri menetelmin voidaan päästä erilaisiin tuloksiin. Simple Kriging-interpoloinnin tulos oli nimensä mukaisestikin hieman EBK:ta yksinkertaisempi, eikä huomioinut niin hyvin jatkuvia arvoja >30 µg/m3 mittauspisteiden välillä EKB:hon verrattuna, mutta tällä menetelmällä standardivirhe pysyi hyvin pienenä erityisesti aivan mitta-asemoiden tuntumassa, joissa ennustepinta oli luotettavimmillaan kummallakin interpolointimenetelmällä. Monimutkaisemmalla kaavalla toimiva EBK-interpolointi taasen tuotti hieman villimmän mallin, jota indikoi myös suurempi standardivirhekartta. Interpolointimenetelmien tuloksien todentaminen muualla kuin mitta-asemien välittömässä läheisyydessä olisi ollut kiinnostavaa ja konkretisoinut paremmin eri metodien tuottamaa tuloseroa, mutta mittapisteaineistosta olisi esimerkiksi pitänyt erotella esimerkiksi kehä 1:n tuntuman mittapisteet, interpoloida uudelleen pelkillä kaukaisimmilla ja keskustan mittapisteillä, jonka jälkeen tulokset olisivat verrattavissa suoraan poisjätettyjen mittapisteiden datan kanssa.

Kriging-interpoloinnin parametrejä määritellessä päästiin melko lähelle referenssisuoraa, missään kohtaa kuitenkaan sitä koskematta toisin kuin IDW:ssä, tulokset ovat hieman positiiviseen päin vääristyneet.

Simple Kriging tuotti havaintopisteiden ollessa 58 keskimääräiseksi standardivirheeksi 5,96 ja keskiarvon 0,258, EBK-interpolointi neljällä sektorilla samaisella havaintopistemäärällä keskimääräiseksi standardivirheeksi 6,18 ja keskiarvoksi 0,135, ja yhdellä sektorilla keskimääräiseksi standardivirheeksi 6,54 ja keskiarvoksi 0,456. Huolimatta siitä, että kaikkien määriteltävien interpolointiparametrien kanssa on auttamatta hieman hukassa, oli lopputuloksena kuitenkin ymmärrettävät ja loogiset lopputulokset pääkaupunkiseudun ilmanlaadusta:

Kuva 6. Ilmanlaatu pääkaupunkiseudulla Kriging-interpolointimenetelmin. Lähde: Helsingin seudun ympäristöpalvelut

 

Lähteet

ESRI. Light Gray Canvas.

Helsingin seudun ympäristöpalvelut. Havaintoasemat.

Helsingin seudun ympäristöpalvelut. Ilmanlaatu 2019.

Ilmatieteenlaitos. Keskilämpötilat 2020.

Ilmatieteenlaitos. Sääasemat.

 

Leave a Reply

Your email address will not be published. Required fields are marked *