Interpoloimalla pisteistä aluemaista tietoa

Tällä kurssikerralla tutustuimme spatiaaliseen interpolointiin, jonka avulla estimoidaan ja tuotetaan pistetiedon pohjalta uutta aluemaista tietoa. Interpolointi on erittäin hyödyllinen keino tuottaa uutta tietoa lähes mistä vain spatiaalisesti jatkuvasta ilmiöstä tai ominaisuudesta mitatun paikkaan sidotun pistetiedon pohjalta. Harvoin tutkimuksissa ja maastomittauksissa on mahdollista kerätä tutkitun ominaisuuden arvoja koko tutkimusalueelta. Ominaisuusarvoja päädytään ajan ja rahan puutteen takia mittaamaan vain joistakin edustavimmista pisteistä, joten mittaustieto ei useinkaan ole alueellisesti täysin kattavaa. Interpolointi mahdollistaa kuitenkin näiden kerättyjen mittaustietojen pohjalta ominaisuusarvojen ennustamisen kaikille tutkimusalueen lopuille pisteille. (Holopainen ym., 2015, s. 67.)

Interpolointi käyttää ennustepinnan muodostamiseen mitattuja arvoja tunnetuista pisteistä, ja laskee niiden avulla estimoidut arvot pisteiden välisille alueille ja muodostaa niistä lopputuloksena rasteripinnan. Interpolointi on mahdollista tehdä deterministisellä tai geostatistisella interpolointitekniikalla, joista molempiin tekniikoihin kuuluu useita erilaisia interpolointimenetelmiä. Deterministiset interpolointimenetelmät perustuvat suoraan ennustettavan pisteen ympäristön mitattuihin arvoihin ja käyttävät interpolointiin matemaattisia funktioita (Holopainen ym., 2015, s. 68; 73).  Näissä menetelmissä arvo estimoidaan lähimpien tunnettujen mittauspisteiden perusteella painottaen niitä etäisyyden mukaan, ja etäisyyspainotus valitaan yleensä ilman sen kummempia perusteluja (Antikainen, n.d.).

Geostatistisessa interpoloinnissa pyritään sen sijaan ymmärtämään havaintopisteissä mitattuihin arvoihin liittyvä säännönmukaisuus, ja käyttämään tätä tietoa tuntemattomien arvojen ennustamisessa (Antikainen, Määttä-Juntunen & Ujanen, 2015, s. 75). Geostatistinen interpolointi perustuu spatiaaliseen autokorrelaation ideaan, että lähellä toisiaan sijaitsevien pisteiden arvot ovat suuremmalla todennäköisyydellä lähellä toisiaan kuin kauempana toisistaan olevien pisteiden arvot (Holopainen ym., 2015, s. 67). Geostatistiset menetelmät käyttävät interpolointiin sekä matemaattisia että tilastollisia menetelmiä (Holopainen ym., 2015, s. 68; 73).

Kurssikerran ensimmäisessä harjoituksessa mallinnettiin liuenneen hapen määrää Chesapeake-lahden vedessä vuosina 2014 ja 2015. Veden happipitoisuus on vesistöjen tutkimuksessa tärkeä veden tilaa ilmaiseva suure ja yksi tärkeimmistä ympäristötekijöistä vesistön ekosysteemille. Hapen puute vedessä heikentää muun muassa eliöiden hajotustoimintaa, kalojen elämää ja aiheuttaa pahimmassa tapauksessa happikatoa vesistön pohjaan (Wikipedia, n.d.-a). Vesistön happipitoisuus määritellään heikoksi, jos liuenneen hapen määrä on alle 5,0 O2mg/L ja erittäin kriittiseksi eli hapettomaksi, jos määrä on alle 0,2 O2mg/L.

Harjoituksessa haluttiin tutkia Chesapeake-lahden veden tilaa kahden vuoden aikana ja vertailla liuenneen hapen määrässä tapahtunutta muutosta. Lähtöaineistona toimi lahdella sijaitsevien 131 mittauspisteen kattama pisteaineisto. Näiden pohjalta haluttiin interpoloimalla mallintaa liuenneen hapen määrän alueellista jakautumista koko lahden alueella. Tarkasteluun valittiin kesäkuukausien mittaustulokset, ja lisäksi huomioitiin ainoastaan mittauspisteet, jotka sijaitsivat yli 5 metrin syvyydessä.

Kesä ja loppukesä ovat otollisia aikoja happitilanteen tutkimiseen, koska kesän aikana muodostunut vesistön lämpötilakerrostuneisuus johtaa erityisesti rehevöityneessä vesistössä veden happipitoisuuden voimakkaaseen heikkenemiseen. Lämpötilakerrostuneessa vesistössä pinnan ja pohjan lämpötilaero on niin suuri, että eri vesikerrokset eivät sekoitu, eikä happea ei pääse kulkeutumaan syvempiin vesikerroksiin asti (Suomen ympäristökeskus, Ilmatieteen laitos &Tulvakeskus, 2019). Pohjan läheisen veden happitilanteen seuraaminen on tärkeää, koska pohjan hapettomuus voi osaltaan laukaista pohjasedimenttiin sitoutuneiden ravinteiden vapautumisen ja  aiheuttaa vesistön sisäistä ravinnekuormitusta (Suomen ympäristökeskus SYKE, 2016).

Koska harjoituksen tutkimusalue on estuaari eli maa-alueen osittain suojaama jokisuualue, interpoloitavalla alueella esiintyvät niemenkärkien muodostamat epäjatkuvuuskohdat asettevat omat eritysvaatimuksensa interpolointimenetelmälle. Interpoloinnissa tulee huomioida mallinnettavalla alueella esiintyvät esteet, joiden yli tutkittava ominaisuus ei voi edetä vaan interpolointi tulee suorittaa rajan reunaa pitkin. Epäjatkuvuuskohtien huomioimiseksi ne täytyy olla digitoitu erilliseksi karttatasoksi, kuten tässä harjoituksessa lahden rantaviivan määrittäväksi polygoniksi.

Esteiden huomiomiseksi interpolointimenetelmäksi valikoitui Kernel interpolation with barriers, joka huomioi lahdenpoukaman niemenkärkien muodostamat epäjatkuvuuskohdat. Suurin osa interpolointitavoista määrittää pisteiden välisen etäisyyden euklidisena etäisyytenä eli suorana viivana kahden pisteen välillä. Kernel-interpolointimenetelmä määrittelee sen sijaan kahden pisteen välisen etäisyyden lyhyimmäksi suorien viivojen sekvenssiksi, jotka yhdistävät kaksi sijaintia ilman, että viivat ylittävät estettä.

Interpoloinnissa tärkeä tekijä on lisäksi se, kuinka laajalla alueella sijaitsevat havaintopisteet otetaan huomioon uuden pisteen arvoa laskettaessa. Liian kaukaa huomioitujen havaintopisteiden arvot voivat olla uuden pisteen arvon ennustamisessa haitallisia, koska ne voivat poiketa liikaa määritettävästä pisteestä (Holopainen ym., 2015, s. 68). Tämä vaatii naapuruusalueen laajuuden (bandwith) tilannekohtaista määrittämistä. Oletuksena ohjelmisto laskee etäisyyden pienimmän neliösumman menetelmällä, mutta harjoituksessa testailtiin, miten alueen koon muuttaminen vaikutti interpoloinnin lopputulokseen.

Kuva 1. Kuvassa interpoloinnissa huomioitujen naapuripisteiden väliseksi etäisyydeksi on määritelty 10 km. Tämän seurauksena interpoloidulle alueelle jää paljon tyhjiä kohtia, joihin ei voitu tehdä ennusteita, koska mittauspisteitä ei ollut tarpeeksi tiheästi

Valitsemalla naapuripisteiden etäisyydeksi 10 km interpoloidulle pinnalle jäi monia reikiä, joihin ei voitu tehdä ennusteita, koska mittauspisteitä ei ollut tarpeeksi tiheästi (kuva 1). Ennustettu arvo muuttuu myös epätasaisesti, kun se liikkuu pisteestä toiseen. Tämä naapuripisteiden välinen etäisyys on tähän lähtöaineistoon liian pieni.

Kuva 2. Kuvassa interpoloinnissa huomioitujen naapuripisteiden väliseksi etäisyydeksi on määritelty 100 km. Tämä kadottaa alueellista vaihtelua ja tekee pinnasta liian sileän.

Naapuripisteiden etäisyyttä kasvatettiin 100 km, jolloin laskenta otti huomioon laajalla alueella sijaitsevia naapuripisteitä (kuva 2). Tämä kuitenkin kadottaa alueellista vaihtelua ja tekee pinnasta liian sileän. Lopulliseksi naapuripisteiden etäisyydeksi määriteltiin 37,5 km, joka oli myös ohjelmiston esittämä oletusarvo. Ohjelmisto ehdottaa etäisyyttä, joka johtaa mallinnuksessa pienimpään mahdolliseen keskivirheen neliöjuuren ristiinvalidointivirheeseen. Jotta liuenneen hapen tilassa tapahtunutta muutosta voitiin vertailla, interpolointi suoritettiin lopuksi sekä vuodelle 2014 että 2015 (kuva 3).

Kuva 3. Chesapeake-lahden happipitoisuus on heikko erityisesti lahden luoteisosissa. Kapeassa lahdessa ihmisten vaikutus happikatoon on suuri, koska mereen valuvat ravinteet ruokkivat leviä, joiden mätänevät kukinnot hävittävät happea. Happikato vaivaakin erityisesti Chesapeake-lahden kaltaisia rehevöityneitä vesistöjä. (Yle, 2018.)

Chesapeake-lahden interpolointitulosten perusteella keskimääräiset liuenneen hapen tasot eivät vuosina 2014 ja 2015 alittaneet kuitenkaan hapetonta 0,2 O2mg/L-tasoa, mutta monet yksittäiset mittaukset olivat kriittisen 5,0 O2mg/L-tason alapuolella. Interpoloidun pinnan avulla voidaan visuaalisella tarkastelulla havaita, että kriittiset kohdat sijaitsevat erityisesti lahden luoteisosissa, ja tarkasteltujen vuosienosalta lahden happipitoisuus on ollut heikompi vuoden 2015 kesän aikana.

Ennustepisteiden luotettavuuden määrittäminen

Interpoloinnin tulosten luottevuus voidaan testata vertaamalla mitattuja arvoja interpoloituihin arvoihin ristiinvalidioinnin (Cross validation) avulla. Analyysi toistaa interpoloinnin lähtöaineiston jättäen laskutoimituksesta aina vuorotellen pois yhden mittauspisteen, ja laskee piilotetulle arvolle uuden estimoituidun arvon. Spatiaalisen interpoloinnin luotettavuutta voidaan sitten analysoida vertaamalla todellisten havaintoarvojen ja estimoidun arvon välistä poikkeamaa. Jos interpoloinnin tuottama mallinnus on luotettava, tulisi näiden kahden pisteen arvon olla mahdollisimman lähellä toisiaan. Jos mitatun arvon ja ennustetun arvon välinen erotuksen virhearvo on suurempi kuin nolla, se tarkoittaa, että ristiinvalidointi on tuottanut korkeamman arvon kuin todellinen arvo. Jos erotus on pienempi kuin nolla, ennuste oli pienempi kuin todellinen arvo.

ArcGIS ohjelmassa ristiinvalidiointi tuottaa valmista numeerista ja graafista diagnostikkaan tulosten analysoimiseksi. Harjoituksessa keskityttiin tarkastelemaan kahta tärkeää interpolointimenetelmän mallinnuksen tarkkuudesta kertovaa suuretta, keskivirheen neliöjuurta (Root mean square, RMS) ja estimointivirheiden keskiarvoa (Mean).

Keskivirheen neliöjuuri (Root mean square, RMS) on aina suurempi kuin nolla, mutta mitä lähempänä se on nollaa, sitä lähempänä ennustetut arvot ovat keskimäärin mitattuja arvoja. Virheen keskiarvon tulisi myös olla mahdollisimman lähellä nollaa, jolloin malli on puolueeton. Jos estimointivirheiden keskiarvo on päälle nollan interpolointi tuottaa yleisesti liian suuria arvoja, ja jos taas keskiarvo on alle nollan estimoidut luvut ovat pienempiä kuin todelliset luvut.

Spatiaalisen interpoloinnin laadunvarmistus tehtiin sekä vuoden 2014 että 2015 tuloksille. Keskivirheen neliöjuuri osoittaa, että vuonna 2014 estimoidut arvot heittivät todellisista arvoista keskimäärin 1,117 O2mg/L ja kesällä 2015 1,002 O2mg/L. Keskivirheen neliöjuuri on siis laskenut hieman vuosien välillä, ja ristiinvalidoinnin ennusteet olivat kesällä 2015 noin 10 prosenttia tarkempia kuin kesällä 2014. Myös estimointivirheen keskiarvo laski kesän 2014 0,045:stä kesän 2015 0,021:een. Koska arvon tulisi olla mahdollisimman lähellä nollaa, voidaan todeta, että kesän 2015 estimoidut arvot ovat hieman tarkempia.

Deterministiset intrepolointimenetelmät käyttävät estimointiin vain pisteistä mitattuja arvoja, ja muuttujan arvojen estimointi tunnettujen havaintopisteiden ulkopuolelle tapahtuu käyttäen matemaattista tasoitusfunktiota (Antikainen, Määttä-Juntunen & Ujanen, 2015, s. 75). Tästä johtuen deterministisille interpolointituloksille voidaan määritellä ainoastaan keskimääräinen virhe estimoidun ja mitatun arvon välillä, mutta tarkkaa mittausvirhettä ja virhemarginaalia joka pikselille ei voida määrittää.

Geostatistinen interpolointi 3D-aineistolle

Kurssikerran toisessa harjoituksessa tutustuimme geostatistiseen interpolointiin 3D-aineistolle. Geostatistinen interpolointi perustuu tilastolliseen mallintamiseen, mikä erottaa ne deterministisistä interpolointimenetelmistä (Antikainen, Määttä-Juntunen & Ujanen, 2015, s. 75). Geostatistisessa interpoloinnissa pyritään ymmärtämään havaintopisteissä mitattuihin arvoihin liittyvä säännönmukaisuus, ja käyttämään tätä tietoa tuntemattomien arvojen ennustamisessa. Geostatistiset interpolointimenetelmät mahdollistavatkin tulosten tarkkuuden analysoinnin ja virhemarginaalin määrittämisen. (Antikainen, Määttä-Juntunen & Ujanen, 2015, s. 75.)

Harjoituksessa tarkasteltiin vesistön happipitoisuuttaa Montereyn lahdella eri mittaussyvyyksissä. Koska vesistön happipitoisuus vaihtelee paitsi vesistön eri osissa niin myös syvyyssuunnassa, vesistön tilaa ja happipitoisuutta arvioitaessa on oleellista ottaa syvyystieto huomioon ja tarkastella liuenneen hapen määrää eri syvyyksissä. Harjoituksen lähtöaineistona toimikin lahdelta kerätty näytteenottoaineisto, jonka mittaussyvyydet vaihtelivat merenpinnasta aina −2080 metrin syvyyteen.

Koska tarkasteltava ominaisuus oli riippuvainen syvyydestä, tuli tämä huomioida myös interpolointitapaa valitessa. Interpolointimenetelmäksi valikoituikin Empirical Bayesian Kriging 3D -interpolointimenetelmä, joka mahdollistaa kolmiuloitteisen, eri syvyyksissä sijaitsevan, aineiston interopoloinnin sekä tarkastelun.

Kriging-menetelmän estimointiosuus on kaksivaiheinen, jossa ensimmäiseksi pyritään analysoimaan aineiston spatiaalista rakennetta ja toiseksi suoritetaan itse mallinnus (Holopainen ym., 2015, s. 74). Ensimmäisessa vaiheessa varsinaista mallinnusta varten aineistosta tulee tarkistaa, onko aineistossa spatiaalista autokorrelaatiota, onko aineisto normaalijakautunut ja millainen trendi aineistossa esiintyy? (Antikainen, Määttä-Juntunen & Ujanen, 2015, s. 79.)

Geostatistinen interpolointimenetelmän perusoletuksia ovat, että spatiaalisesti jatkuva aineiston on spatiaalisesti autokorreloitunut ja lisäksi etteivät muuttujan arvot riipu varsinaisesta xy-sijainnista, eli aineistossa ei esiinny yleistä trendiä. Joissakin tapauksissa muuttujan oletetaan lisäksi olevan normaalijakautunut. Tarvittaessa muuttujan arvoja onkin jakauman osalta mahdollista manipuloida muuttujamuunnoksien avulla, jotta aineisto saataisiin normaalijakautuneeksi. (Antikainen, Määttä-Juntunen & Ujanen, 2015, s. 76.)

Harjoituksessa aineistoa esitarkasteltiinkin histogrammin ja hajontakuvion avulla. Histogrammin perusteella arvioitiin, oliko aineisto normaalijakautunut ja voitiinko sille suorittaa mallinnus. Kokeilemalla eri muuttujamuunnoksia voitiin todeta, että logaritmimuunnos sai aineiston normaalijakautuneeksi. Hajontakuviosta arvioitiin aineistonhappipitoisuuden ja syvyyden välistä trendiä. Aineistosta tunnistettiin trendi, jossa happitasot voitiin arvioida kahdella paikallisella trendiviivalla syvyyden perusteella. Aineiston esitarkastelussa selvitetyt arvot voitiin siten ottaa huomioon itse interpoloinnissa, ja suorittaa tarvittava muuttujamuunnos ja trendin poisto. (Antikainen, Määttä-Juntunen & Ujanen, 2015, s. 79–80.)

Tulosten visualisointi ja luotettavuuden tarkastelu

Interpoloinnin lopputuloksena syntyviä tasoja on mahdollista tarkastella sekä 2D- että 3D-maisemassa, mutta 3D-maiseman etuna on ehdottomasti se, että se mahdollistaa yhtäaikaisesti eri korkeuksissa sijaitsevia mittauspisteiden ja interpoloitujen tasojen visualisoinnin (kuva 4).

Kuva 4. Kuvassa mittauspisteistä interpoloitu geostatistinen pinta 400 metrin syvyydessä. 3D-interpolointimenetelmä mahdollistaa interpoloitujen tasojen tarkastelun liukusäätimen avulla, jolla voidaan liikkua eri syvyys- tai korkeustasojen välillä.

Geostatistisen interpolointimenetelmän erityisyys on myös siinä, että se tuottaa tietoa ennusteen luotettavuudesta jokaisen pikselin osalta. Geostatistiikka eroaa perinteisistä interpolointimenetelmistä tilastollisen luonteensa vuoksi, mikä mahdollistaa monipuolisemman mallin luotettavuuden arvioinnin. Tilastolliset tunnusluvut ja erilaiset hajontakuviot mahdollistavat myös useamman vaihtoehtoisen mallin vertailun. (Antikainen, Määttä-Juntunen & Ujanen, 2015, s. 83–84.)

Lisäksi mallinnetun ennusteen luotettavuutta voidaan arvioida geostatistisen interpoloinnin automaattisesti muodostaman Standard Error -pinnan avulla. Interpoloinnin ns. sivutuotteena muodostunut pinta kuvastaa ennusteen alueellista epävarmuutta, ja sen avulla voi arvioida mallinnuksen alueellista tarkkuutta. Käytännössä epävarmuus on suoraan kytköksissä havaintopisteiden tiheyteen eli mitä kauempana havaintopisteestä ollaan, sitä epävarmempi on laskettu ennuste. (Antikainen, Määttä-Juntunen & Ujanen, 2015, s. 83–84.)

Jotta interpoloitua geostatistisen tasoa voidaan hyödyntää myös muissa jatkoanalyyseissä täytyy kukin interpoloitu taso muuttaa ja tallentaa käyttötarpeen mukaan joko rasteritasoiksi, pisteaineistoksi tai polygoneiksi. 3D-maisema mahdollistaa lopputuloksen visualisoimisen myös animaationa, joka on tehokas tapa visualisoida mallinnuksen lopputulos. Videossa on animoitu Montereyn lahden liuenneen hapen määrään vaihettumista merenpinnasta aina yli 2000 metriin syvyyteen.

 

Visualisoiminen kolmiulotteisena vokseligrafiikkana

3D-interpolointi mahdollistaa kaikkien mallinnettujen pintojen visualisoimisen myös vokselina (Voxel layer), joka on pikselin kolmiulotteinen vastine. Vokseli muodostaa kaikista aineiston pikseleistä kolmiulotteisen kuvamatriisin, joka voidaan tarkastella halutusta kuvakulmasta ja kohdasta. Näin samasta materiaalista voidaan luoda halutun suuntaisia leikesarjoja ja kohdetta voidaan katsella eri suunnista. (Wikipedia, n.d.-b.)

Harjoituksessa liuenneen hapen määrän syvyysvaihtelua että mallinnuksen keskivirhettä kuvaavat karttatasot visualisoitiin vokseliksi (kuva 5). Vokselin avulla voi saada käsityksen tarkastellun muuttujan kaikkien tasojen yhtäaikaisesta pysty- ja vaakasuuntaisesta vaihettumisesta (kuva 6). Vokselin avulla aineistoa voidaan myös tarkastella erillisinä samanarvonpintoina (isosurfaces), joilloin aineistoa on mahdollista tarkastella tasoina, joilla on sama arvo.

Kuva 5. Kuvassa a. on liuenneen hapen määrän syvyysvaihtelu kuvattuna Voxel layerin avulla. Kuvissa b.–d. Voxel layeristä on mahdollista irrottaa samanarvonpintoja (isosurfaces), jotka visualisoivat ne pinnat, joissa esiintyy sama liuenneen hapen määrä.
Kuva 6. Kriging-interpoloinnin sivutuotteena syntyvä virhekartta voidaan myös visualisoida Voxel layerinä. Tästä voidaan hyvin havainnoida virheen suuruuden vaihtelu karttatason eri kohdissa.

Yhteenveto

Erilaisia interpolointimenetelmiä on useita, ja ne tuottavat erilaisia pintoja. Kuhunkin mallinnukseen sopivin tekniikka riippuu aina muun muassa mallinnettavasta ominaisuudesta, havaintopisteiden määrästä ja laajuudesta sekä tietysti mallinnuksen tavoitteesta (Holopainen ym., 2015, s. 67). Kaikki interpoloinnit ovat kuitenkin aina vain approksimaatioita ja sisältävät virheitä. Yksinkertaisemmilla deterministisillä interpolointimenetelmillä voidaan laskea keskimääräinen ero estimoitujen ja mitattujen arvojen välillä, mutta tilastollisia menetelmiä hyödyntävien geostatististen interpolointimenetelmien etuna on se, että virheistä saadaan tarkempaa tietoa. Geostatistinen interpolointimenetelmä mahdollistaa virhemarginaalin määrittämisen kartan jokaiselle pikselille, jonka avulla voidaan tarkasti arvioida mallinnuksen tarkkuutta. Interpoloitaessa usein onkin tarpeen testata erilaisia vaihtoehtoisia malleja ja tarkastella, mikä menetelmä lopulta tuottaa tarkimman lopputuloksen ja pienimmän mahdollisen virheen.

 

Lähteet

Antikainen, H. (n.d.) GIS-jatkokurssi. Viikko 4: Spatiaalinen statistiikka. Haettu 8.12.2020 osoitteesta https://docplayer.fi/66521305-Gis-jatkokurssi-viikko-4-spatiaalinen-statistiikka-harri-antikainen.html

Antikainen, H., Määttä-Juntunen, H. & Ujanen, J. (2015).  GIS-analyysimenetelmät ArcGIS 10.2.1 -ohjelmistolla. Oulun yliopiston maantieteen laitoksen opetusmoniste no. 43. Haettu 5.12.2020 osoitteesta http://jultika.oulu.fi/files/isbn9789526207889.pdf

Holopainen,  M., Tokola, T., Vastaranta, M., Heikkilä, J., Huitu, H.,  Laamanen, R. & Alho, P. (2015). Geoinformatiikka luonnonvarojen hallinnassa. Helsingin yliopiston metsätieteiden laitoksen julkaisuja 7. Haettu 5.12.2020 osoitteesta http://hdl.handle.net/10138/166765

Suomen ympäristökeskus, Ilmatieteen laitos &Tulvakeskus. (2019, 2. joulukuuta). Vaivaako happikato? Haettu 8.12.2020 osoitteesta https://www.vesi.fi/vesitieto/vaivaako-happikato/

Suomen ympäristökeskus SYKE. (2016, 22. syyskuuta) Pintavesien tilan seuranta. Haettu 8.12.2020 osoitteesta https://www.ymparisto.fi/fi-FI/Vesi/Pintavesien_tila/Pintavesien_tilan_seuranta?f=PohjoisKarjalan_ELYkeskus 

Wikipedia. (n.d.-a) Happipitoisuus (limnologia). Haettu 8.12.2020 osoitteesta https://fi.wikipedia.org/wiki/Happipitoisuus_(limnologia)

Wikipedia. (n.d.-b). Vokseli. Haettu 8.12.2020 osoitteesta https://fi.wikipedia.org/wiki/Vokseli

Yle. (2018, 8. tammikuuta) Meristä hiipuu happi – kuolleiden vyöhykkeiden määrä rannikoilla on kymmenkertaistunut. Haettu 8.12.2020 osoitteesta https://yle.fi/uutiset/3-10010357

Näkyvyyden tarkastelu ja mallintaminen näkysyysanalyysien avulla

Tällä kurssikerralla keskityimme kahteen näkyvyysanalyysiin, Viewshed- ja Line of Sight -analyysiin, sekä lopuksi vielä 3D-maisemaan kohteiden visualisoinnissa.

Kurssikerran aluksi tutustuimme tarkemmin näkyvyysanalyyseihin, jotka soveltuvat korkeusmallista muodostuvan maiseman tarkasteluun ja näkyvyyden analysointiin. Analyyseillä voidaan vastata kysymykseen, mitkä alueet tai kohteet voidaan nähdä katselupaikasta? Näkyvyysanalyysiä voidaan kuitenkin varsinaisen näkyvyyden lisäksi hyödyntää myös erilaisten kuuluvuus- ja melualueiden mallinnukseen (Antikainen, Määttä-Juntunen & Ujanen, 2015, s.58–59). Analyysin suorittaminen vaatii kuitenkin aina lähtöaineistoksi vähintään sekä tarkasteltavan alueen korkeusmallin että karttatason, jossa on määritelty tarkastelupaikka.

Viewshed- ja Line of Sight -analyysi tarkastelevat kumpikin korkeusmallin avulla, mitkä alueet näkyvät johonkin tarkastelukohteeseen, ja mitkä jäävät katveeseen. Näkyvyysanalyysi voidaan laskea suoraan maanpinnalta tai laskelmissa voidaan huomioida myös esimerkiksi kasvillisuuden ja rakennusten korkeustiedot ja siten aiheuttamat näköesteet. Vaikka kummankin näkyvyysanalyysin pääperiaate on sama, ne kumpikin mallintavat näkyvyyttä kuitenkin eri tavalla.

Viewshed-työkalu soveltuu parhaiten, kun tarkastelukohde on laajempi alue, ja siitä halutaan tunnistaa ne kohdat, jotka ovat näkyvissä määritellystä tarkastelupaikasta. Tarkastelupaikka voi olla yksi tai useampi piste, viivamainen kohde tai polygoni. Viewshed-työkalun lopputuloksena syntyy rasteritaso, jossa näkyvyysarvo on määritetty sen mukaan, onko pikseli näkyvissä tarkastelupaikasta vai ei. Jos tarkastelupisteitä on vain yksi, lopputuloksen saamat arvot ovat 0 = pikseli ei näy tai 1 = pikseli näkyy. Jos tarkastelupaikaksi on määritelty joukko pisteitä, analyysi laskee näkyvyyden jokaiselle tarkastelupaikalle, ja rasteritason arvot määrittyvät sen mukaan, kuinka monesta katselupaikasta kyseinen ruutu on nähtävissä. (Antikainen, Määttä-Juntunen & Ujanen, 2015, s.58–59.)

Tätä tarkastelutapaa hyödynnettiin kurssikerran ensimmäisessä harjoituksessa, jossa tehtävänä oli suunnitella uusi, neljän valotolpan muodostama, valaistusjärjestelmä leirintäalueelle New Yorkin osavaltiossa. Valaistusta suunniteltaessa haluttiin varmistaa, että mahdollisimman laaja osa leirintäalueesta olisi valaistu vähintään kolmesta valotolpasta. Valaisinvaihtoehtoja oli kaksi, 3 metriä korkeat ja 10 metriä korkeat valaisimet. Tehokkaimman valaistusjärjestelmän valitsemiseksi, harjoituksessa hyödynnettiin Viewshed-työkalua mallintamaan näiden kahden erikorkuisen valaistusjärjestelmän kattamaa aluetta ja helpottamaan näin lopullisen päätöksen tekemistä.

Harjoituksessa tarkastelupaikkoina toimi neljä pistemäistä valotolppaa. Viewshed-työkalussa on oletuksena, että tarkastelupiste tai -viiva sijaitsee yhden korkeusyksikön korkeudella maanpinnasta, mutta tätä tietoa voidaan muuttaa vastaamaan aina kunkin tarkastelukohteen todellisia tietoja. Tosielämän esimerkkien mallintaminen saattaakin usein edellyttää näkyvyyden heijastavan esimerkiksi tietystä kulmasta tai tietyn etäisyyden päähän. Viewshed-analyysissä on mahdollista huomioida näitä tekijöitä, ja lisätä  ne tarkkailupisteen/viivan ominaisuustietoihin. (Antikainen, Määttä-Juntunen & Ujanen, 2015, s. 58–59.)

Harjoituksessa täydennettiin attribuuttitauluun vertailtavien valaisimien tekniset tiedot, kuten valaisimen korkeus maanpinnasta (OFFSETA=korkeus maanpinnasta), valon tulokulma (AZIMUTH1=tarkastelun laajuuden alkukulma) sekä valotehon maksimietäisyys (RADIUS2=etäisyys). Nämä tarkastelupaikan ominaisuustiedot toimivat reunaehtoina analyysille ja vaikuttavat lopputulokseen.

Tehokkaimman valaistusjärjestelmän valinnassa kriteerinä oli se, että suurimman osan leirintäalueesta tulisi olla valaistu vähintään kolmesta valotolpasta. Koska harjoituksessa tarkastelupisteitä oli neljä, lopputuloksessa rasterin arvo kertoo, moneenko näistä tarkastelupisteistä kyseinen solu näkyy. Aineistolle suoritettiin siis vielä loogisuusvertailu, jossa loogisen operaattorin avulla aineistosta valittiin vain solut, joiden arvo oli > 2.

Harjoituksessa analyysit suoritettiin sekä 3 metriä (kuva 1) että 10 metriä (kuva 2) korkeille valotolpille, ja vertaamalla näiden kummankin valaisinjärjestelmän valaisemia alueita, voitiin tulla lopputulokseen, että 10 metriä korkeat valaisintolpat täyttivät asetetut kriteerit paremmin ja sopivat siten leirintäalueen uudeksi valaisinjärjestelmäksi.

Analyysissä ei kuitenkaan huomioitu muita maastonesteitä, kuten puustoa, jonka korkeuden tuoman peittävyyden huomioiminen olisi varmasti vaikuttanut siihen, miten laajoja alueita valotolpat pystyivät valaisemaan.

Kuva 1. Kartassa leirintäalueen kohdat, jotka on valaistu vähintään kolmesta valotolpasta, jos valotolppien korkeus on 3 metriä.
Kuva 2. Kartassa leirintäalueen kohdat, jotka on valaistu vähintään kolmesta valotolpasta, jos valotolppien korkeus on 10 metriä.

Line of Sight -analyysi kuvaa näkyvyyttä linjaa pitkin

Line of Sight -näkyvyysanalyysi tarkastelee näkyvyyttä linjaa pitkin kahden kohteen välillä. Tässä analyysissä tarkastelupaikkana voi olla ainoastaan pistemuotinen vektori,  ja tarkastelun kohteena voi olla yksi tai useampi piste, viiva tai polygoni. Analyysi perustuu siihen, että katselupisteestä piirretään suora jana, ja jos sen tiellä on esteitä, tulkitaan, että sen takana olevat kohteet jäävät peittoon. Jos katselupaikan ja katsottavan kohteen välinen suora ei leikkaa korkeusmallia niin kohde on nähtävissä.

Line of Sight -analyysiä hyödynnettiin kurssikerran toisessa harjoituksessa, jonka tehtävänä oli määrittää, mitkä Philadelphian keskustan läpi kulkevan paraatireitin kohdat oli nähtävissä kahdesta määritellystä tarkastelupisteestä. Harjoituksessa otettiin huomioon korkeusmallin lisäksi rakennusten peittävyys sekä määriteltiin näkyvyyslinjoille maksimietäisyys.

Näkyvyyden määrittäminen linjaa pitkin koostuu useammasta työvaiheesta, jossa aluksi tulee määrittää näköyhteys tarkasteltavien kohteiden välille. Näiden näkölinjojen pohjalta voidaan suorittaa näkyvyysanalyysi, jossa näkölinjoja verrataan maanpinnan ja rakennusten korkeustietojen aiheuttamiin esteisiin. Jos kohteiden välinen näkölinja leikkaa korkeusmallia tai muuta näköestettä, niin katsotaan ettei esteen taakse jäävä alue ole nähtävissä lähtöpisteestä.

Analyysin lopputuloksena näkölinjojen attribuuttauluun tallentuu uusi sarake, johon tulee tieto siitä, onko linjaa pitkin näköyhteys lähtö- ja päätepisteen välillä (0 = ei nähtävissä, 1 = on nähtävissä). Tieto visualisoidaan lisäksi kartassa, jossa vihreän värin saavat linjat, joista on näköyhteys päätepisteeseen ja punaisen värin ne näkölinjat, joiden tiellä on este, kuten esimerkiksi rakennus. Tällä tavoin harjoituksessa saatiin määriteltyä, mitkä kohdat paraatireitin osista olivat tarkkailijoiden nähtävissä ja mitkä taas eivät.

Tosielämän tilanteen tavoin harjoituksessa otettiin huomioon lisäksi näkyvyyden heikkeneminen, esimerkiksi sateen tai sumun takia. Näkyvyyslinjoja haluttiin siis lisäksi rajata maksimissaan 600 jalkaa (noin 180 metriä) pitkiksi. Näkyvyyslinjojen pituuden rajaaminen vaatii niiden mittaamista, ja sitten hakulausekkeella niiden kohteiden etsimistä ja poistamista, jotkä eivät täyttäneet kriteereitä (eli ei näkyvyyttä lähtö- ja päätepisteen välillä tai päälle 600 jalkaa pitkiä). Lopputuloksena saatiin karttaesitys, jonka näkölinjat osoittavat niihin paraatireitin kohtiin, jotka turvallisuushenkilöt voivat nähdä katoilla sijaitsevista tarkkailupisteistä (kuva 3).

Kuva 3. Näkölinjat osoittavat niihin paraatireitin kohtiin, jotka turvallisuushenkilöt voivat nähdä katoilla sijaitsevista tarkkailupisteistä.

Kaupunkien 3D-visualisointi

Kurssikerran viimeisessä harjoituksessa tutustuttiin ArcGIS paikkatieto-ohjelman tarjoamiin 3D-maisemien visualisointi keinoihin. 3D-maisema voidaan luoda käyttämällä vektori-, rasteri- ja korkeusmallitietoja, mutta tässä harjoituksessa keskityttiin pääasiassa vektorimuotoisten karttakohteiden 3D-visualisointiin. ArcGIS ohjelman 3D-työkalut mahdollistavat esimerkiksi 2D-karttaesityksen elävöittämisen visualisoimalla pistemuotoisia vektorikohteita  kolmiulotteisilla symboleilla, jotka voivat kuvata realistisia tosielämän kohteita, kuten liikennevaloja tai puita. Jos pisteaineistoon on tallennettu lisäksi kohteiden korkeustietoja, voidaan tämä huomioida visualisoinnissa, esimerkiksi rakennusten ja puuston korkeudessa.

Kuva 4. Kuva on luotu ArcGIS ohjelmassa pistemuotoisen datan pohjalta visualisoimalla se muun muassa puiksi sekä liikennevaloiksi. Symbolien avulla on saatu luotua hyvin realistinen 3D-kaupunkimaisema.

Pistemäisinä vektorikohteina voidaan siis visualisoitu paikkatieto-ohjelmistossa enemmän tosielämän kohteita kuvaavilla elementeillä, joiden avulla saadaan rakennettua hyvin realistinen kaupunki- ja katunäkymä alueesta (kuva 4). ArcGIS mahdollistaa lisäksi 3D-maisemassa liikkumisen, ja maisemaa voidaan tarkastella kaikista ilmansuunnista niin ilmasta lintuperspektiivistä kuin katutasosta. 

Muita visualisointi keinoja on 3D-muotojen varjostus, jolla voidaan luoda syvyyttä kuviin ja siten parantaa tiedon laatua ja auttaa katsojaa hahmottamaan pintojen muotoja, korkeuseroja ja tekstuuria. Valaistusominaisuudella (Illuminating) voidaankin lisätä 3D-näkymään keinotekoinen valonlähde, ja tarkastella sen avulla korkeusvaihteluista, maaston esteistä sekä auringon asemasta muodostuvia varjostusalueita kolmiulotteisella pinnalla (kuva 5) (Holopainen ym., 2015, s. 88). Tätä ominaisuutta voitaisiin hyödyntää esimerkiksi asuntorakentamisessa, jos haluttaisiin määritellä korkean kerrostalon varjostavuutta muihin lähiympäristön taloihin eri vuorokauden- ja vuodenaikoina.

Kuva 5. ArcGIS ohjelmistolla 3D-näkymään voidaan lisätä keinotekoinen valonlähde, joka luo 3D-muodoille varjostuksen. Rakennuksia esittäville 3D-muodoille luodut varjot auttavat hahmottamaan muun muassa rakennusten korkeusvaihtelua.

Kurssikerran viimeiseksi harjoitukseksi yhdistettiin aiemmissa 3D-harjoituksissa opitut asiat, ja harjoiteltiin rakennuksen ja ympäristön mallinnusta 3D-näkymäksi. Tehtävänä oli visualisoida Berliiniin suunnitellun uuden rakennuksen sijoittumista muuhun kaupunkikuvaan ja jo rakennettuun ympäröivään kaupunkiympäristöön kuten rakennuksiin ja puustoon. Harjoituksessa siis lisättiin jo olemassa olevaan kaupunkikuvaan suunniteltu uusi rakennus ja lisäksi lisättiin varjostus kaikille 3D-muodoille (kuva 6).

ArcGIS mahdollistaa eri mittakaavassa olevien 3D-näkymien luomisen aina koko maapalloa visualisoivista näkymistä paikallisempiin ja pienempiin alueisiin. Koska tässä harjoituksessa tavoitteena oli visualisoida vain yhden rakennuksen sijoittumista kaupunkikuvaan, soveltui paikallinen tarkastelu paremmin. Tälläisellä visualisoinnilla on myös mahdollista saadaan tarkempi ja yksityiskohtaisempi kuva tarkasteltavasta alueesta.

Kuva 6. Kaupunkirakenteen visualisoinnin lisäksi kuvaan on lisättiin varjostus, joka luo varjon kaikille 3D-muodoille.

Kuhunkin visualisointiin kulloinkin parhaiten sopivat ratkaisut riippuvat siitä, mitä halutaan esittää ja millaista tietoa välittää. Tämä vaikuttaa siihen, mitkä elementit kuvassa tulee esiintyä sekä mitä tehostekeinoja on syytä käyttää. Datan analysoinnin ja uuden tiedon tuottamisen lisäksi ArcGIS taipuu siis myös tiedon visualisointiin monille eri tavoilla ja aina käyttötarpeesta riippuen.

Lähteet

Antikainen, H., Määttä-Juntunen, H. & Ujanen, J. (2015).  GIS-analyysimenetelmät ArcGIS 10.2.1 -ohjelmistolla. Oulun yliopiston maantieteen laitoksen opetusmoniste no. 43. Haettu 2.12.2020 osoitteesta http://jultika.oulu.fi/files/isbn9789526207889.pdf

Holopainen,  M., Tokola, T., Vastaranta, M., Heikkilä, J., Huitu, H.,  Laamanen, R. & Alho, P. (2015). Geoinformatiikka luonnonvarojen hallinnassa. Helsingin yliopiston metsätieteiden laitoksen julkaisuja 7. Haettu 2.12.2020 osoitteesta http://hdl.handle.net/10138/166765

Korkeusmallista johdettua tietoa

Tämän viikon harjoitustehtävissä tutustuttiin rasterimuotoiseen korkeustietoon pohjautuviin analyyseihin. Paikkatieto-ohjelmistolla korkeusmallista on mahdollista johtaa useita erilaisia johdannaisia, kuten korkeusprofiileja, näkyvyys- ja kaltevuusanalyysejä sekä hydrologisia veden valuntaan liittyviä analyysejä. Tämän kurssikerran harjoituksissa päästiinkin näkemään, miten monenlaista tietoa korkeusmallin pohjalta on mahdollista tuottaa ja mallintaa.

Kurssikerran ensimmäisessä harjoituksessa tehtävänä oli johtaa korkeusmallin avulla tietoa, joka auttaa paikantamaan mahdolliselle viinitarhalle sopivat paikat San Diegossa Kaliforniassa. Optimaalisen sijainnin tulee täyttää seuraavat ehdot: korkeus yli 200 metriä, kaltevuus 1,5–15 % välillä ja rinteen suunta kaakkoon, etelään tai lounaaseen päin.

Harjoituksessa lähtöaineistona toimi jo valmis DEM-korkeusmalli (Digital Elevation Model), joka tarkoittaa x-, y- ja z koordinaatit sisältävää, tunnettuun koordinaatistoon sidottua, maanpinnan korkeusvaihteluita kuvaavaa pintaa. Tässä harjoituksessa käytettävä DEM on rasterimuotoinen korkeusmalli, jossa z-koordinaatti on tallennettu pikselin ominaisuustietoon.

Ensimmäisessä harjoituksessa optimaalisen sijainnin määrittämisessä tarvittiin siis tietoa tarkasteltavan alueen rinteen kaltevuudesta (Slope). Tämän laskeminen onnistuu korkeusmallista peräkkäisten pikseleiden arvojen avulla. Kaltevuus lasketaan solun ja sen naapurisolujen korkeuseron avulla. Alueilla, joilla korkeustieto muuttuu paljon vierekkäisten solujen välillä, saadaan tulokseksi jyrkempi kaltevuus kuin alueilla, joissa korkeus muuttuu tasaisemmin.

Kaltevuustieto kertoo siis korkeuden ja etäisyyden muutoksesta tietyllä tarkastelualueella. ArcGIS paikkatieto-ohjelmistossa tämän kaltevuuden laskenta onnistuu valmiin funktion avulla, ja lopputuloksena saatu kaltevuustieto voidaan ilmoittaa joko kulma-asteina tai prosentteina (prosentti=korkeudenmuutos / etäisyyden muutos x 100). Kaltevuuslaskelmilla on useita eri käyttömahdollisuuksia, ja sen lopputuloksena saadun karttatason avulla on mahdollista jo havainnoida kartoitetun alueen maastonmuotoja.

Lisäksi sijainnin määrittämiseen tarvittiin tietoa rinteiden suunnasta, ja myös tämän johtaminen onnistuu korkeusmallin pohjalta. Rinteen suunta lasketaan vertaamalla solun korkeutta sen naapurisoluihin. Yleisesti ottaen, jos itään oleva naapurisolu on korkeammalla ja lännessä oleva naapurisolu on matalammalla, solulla on länteen päin oleva näkökohta. Harjoituksessa käytetyt rinteen kaltevuuden (Slope) ja suunnan (Aspect) laskennan työkalut käyttävät siis kumpikin naapurustoanalyysiä. Lopputuloksena syntyvässä karttatasossa rinteen suunta ilmoitetaan myötäpäivään kulkevina asteina välillä 0–360. Nämä numeeriset arvot voidaan liittää kompassin suuntiin niin, että esimerkiksi suoraan itään päin olevien solujen numeerinen arvo on 90 astetta. Tasaisille alueille (joiden kaltevuusarvo on 0) määritetään rinteen suunnaksi -1. (Esri, n.d.)

Kun korkeusmallista oli johdettu sekä rinteen kaltevuuteen että suuntaan liittyvä tieto, tuli kaikki kolme karttatasoa vielä yhdistää, jotta voitiin tunnistaa ne pikselit, jotka täyttivät kaikki hakukriteerit. Tämä onnistuu Raster Calculator -työkalulla, jossa on laskuoperaatioiden lisäksi käytettävissä erilaisia loogisia operaattoreita, joiden avulla rasteriaineistosta voidaan tunnistaa operaation ehdot täyttävät solut. Tässä harjoituksessa optimaalisten sijaintien määrittämiseksi operaationa toimi (“sd_elevation” > 200) AND (“sd_slope” >= 1.5) AND (“sd_slope” <= 15) AND (“sd_aspect” >= 112.5) AND (“sd_aspect” <= 247.5) -lauseke, jossa kaikkien ehtojen tulee täyttyä yhtä aikaa. 

Koska rasteriaineiston pikselit voivat kuvata vain yhtä muuttujaa ja saada kerrallaan yhden arvon, syntyy operaation lopputuloksena binäärikarttataso, jossa arvon 1 saavat ne kohteet, jotka täyttävät annetun lausekkeen ehdot ja arvon 0 ne kohdat, jotka eivät ole soveltuvia (kuva 1).

Kuva 1. Kuvassa on tunnistettu ne kohdat, jotka täyttävät kaikki optimaalisele sijainnille asetetut ehdot. Optimaalisimmat sijainnit viinitarhalle sijaitsevat Cowles Mountainin kaakkoisrinteillä.

Visualisointi helpottaa tiedon tulkitsemista

Optimaalisen viinitarhan visuaalisen tarkastelun helpottamiseksi maastoa haluttiin vielä edelleen tarkastella kolmiulotteisemmin, ja tämän mahdollistaa korkeusmallista johdettu vinovalovarjostus (Hillshade) sekä korkeuskäyrät (Contour).

Vinovalovarjostus (Hillshade) on hyvä keino korostaa maaston korkeuseroja ja tarkastella maaston muotoja hyvin realistisesti (Antikainen, Määttä-Juntunen & Ujanen, 2015, s. 48). Hillshade-työkalulla korkeusmallin kuvaamaa korkeuspintaa valaistaan kuvitteellisella valonlähteellä/auringolla, joka luo valon ja varjon avulla illuusio rinteen suunnasta ja topografiasta. Itse työkalussa voidaan valita sekä valonlähteen suunta (Azimuth) että korkeus (Altitude). Valon tulosuunta ja -korkeus valitaan asteina: suunta määritetään pohjoisesta myötäpäivään (0–360 astetta) ja korkeus horisontista zeniittiin (0–90 astetta) (Antikainen, Määttä-Juntunen & Ujanen, 2015, s. 48). Nämä valinnat vaikuttavat suuresti lopputuloksena syntyvään visualisointiin. Kun valonlähteen sijainti on määritetty, algoritmi käyttää kaltevuutta ja rinteen suuntaa avuksi ja määrittää, kuinka kirkkaasti kukin lähtöaineiston solu valaistaan. Vinovalovarjoste täydentääkin kartan sisältämää korkeusinformaatiota.

Korkeussuhteiden havainnoinnin helpottamiseksi karttaesitykseen lisättiin myös korkeuskäyrät. Ne luodaan korkeustiedon pohjalta Contour-työkalun avulla, jonka loppuloksena syntyy vektorimuotoinen viiva-aineisto, jossa yksi viiva kuvaa absoluuttista korkeustietoa eli korkeuden samanarvonkäyrää (Antikainen, Määttä-Juntunen & Ujanen, 2015, s. 49). Pakollisia valintoja työkalussa on vain korkeuskäyrien tasoero eli käyräväli, mutta työkalun avulla voi lisäksi määrittää jonkun tietyn lähtökorkeuden (Base contour), josta korkeuskäyriä aletaan piirtämään (Antikainen, Määttä-Juntunen & Ujanen, 2015, s. 49).

Lopputuloksena syntyy korkeutta kuvaavat samanarvonkäyrät, jotka visualisoivat, miten korkea maasto on kyseisessä kohdassa. Korkeuskäyrät helpottavat siis korkeustiedon visualisointia sekä kartan tulkitsemista. Näitä samanarvonkäyriä voidaan korkeuden kartoittamisen lisäksi käyttää myös, minkä tahansa jatkuvista arvoista koostuvan pinnan kartoittamiseen, kuten sadannan tai ilmanpaineen.

Näkyvyysanalyysi tuo lisätietoa maisemasta

Harjoituksessa lisäkriteeriksi lisättiin, että mahdolliselta viinitarholta tulisi olla myös näkymä läheiseen Murrayn tekojärveen. Tämän hahmottamiseksi harjoituksessa suoritettiin näkyvyysanalyysi (Viewshed), jonka algoritmi tunnistaa lähtöaineistona toimivasta korkeusmallirasterista ne solut, jotka voidaan nähdä määritetystä havainnointipisteestä.

Näkyvyys lasketaan arvioimalla solujen korkeudet paikallisten horisonttien löytämiseksi. Paikallisen horisontin ulkopuolella olevat alueet voidaan sitten arvioida sen määrittämiseksi, ovatko ne näkyvissä vai eivät, ja jos on, edustavatko ne kauempana olevaa paikallista horisonttia. Viewshed-työkalu voi ottaa huomioon myös muita tekijöitä, kuten tarkkailijan korkeuden, käyttämällä erityisiä määritteitä, jotka voidaan lisätä tarkkailupisteen ominaisuustietoihin. (Esri, n.d.)

Harjoituksessa havainnointipisteenä käytettiin tekojärven keskelle lisättyä pistettä, josta käsin maisemaa tarkasteltiin. Lopputuloksena syntyi uusi rasteri karttataso, jossa kartan solut saivat arvot 0 = ei näy tai 1 = näkyy tarkastelupisteeltä. Tätä analyysiä olisi voinut vielä edelleen jatkaa suorittamalla karttatasoille lokaalin päällekkäisoperaation. Kertomalla yhteen sekä optimaalista viinitarhan sijaintia että tekojärven näkyvyysaluetta kuvavat binääriset karttatasot, olisi lopputuloksena saatu ne pikselit, joissa lopulta nämä kaikki ehdot olisivat täyttyneet. Mutta tämänkin lisäksi optimaalisen viinitarhan sijainnin määritämisessä, olisi lisäksi tarvittu tietoa muistakin muuttujista kuten auringon säteilystä tai etäisyydestä läheisiin teihin.

Kuva 2. Kartassa Hillshade-kuvan päällä läpinäkyvänä maaston korkeustiedot, jotka on visualisoitu maaston korkeutta kuvaavalla väritysskaalalla. Lisäksi päällä on punaisella kuvattu viinitarhalle optimaaliset sijainnit ja keltaisella alueet, joista on hyvät näkymät Murrayn tekojärvelle. Kartasta voi tunnistaa muutamia alueita, joissa keltainen ja punainen alue asettuvat päällekkäin ja jotka täyttävät tällöin kummatkin kriteerit.

Tässä harjoituksessa tyydyttiin nyt tarkastelemaan näitä eri karttatasoja päällekkäin (kuva 2) ja arvioimaan optimaalisia sijainteja visuaalisen analyysin avulla. Lisäksi lopuksi analyysin tulokset viimeisteltiin vielä muutamalla 2D kartta 3D esitykseksi (kuva 3).

Kuva 3. ArcGIS ohjelmisto mahdollistaa 2D aineiston muuttamisen 3D malliksi ja maaston korkeussuhteiden ja muotojen tarkastelun sen avulla.

Tässä harjoituksessa tärkeäksi muodostui käytettävän lähtöaineiston laatu ja tarkkuus. Rasteriaineistoa käsitellessä aineiston tarkkuudella, spatiaalisella resoluutiolla, on muun muassa merkitystä sille, miten tarkkoja mallinnuksia ja analyysejä aineistosta on mahdollista tehdä. Toinen tekijä, joka vaikuttaa johdettujen rasterien laatuun, on naapuriruutujen määrä. Rasterin sisäpuolella olevilla soluilla on kahdeksan välitöntä naapuriruutua, mutta reunalla olevilla soluilla on vain viisi ja kulmasoluilla vain kolme vierekkäistä ruutua. Koska rinteen suuntaan ja jyrkkyyteen liittyvät analyysit käyttävät hyväkseen naapuriruutujen tietoja eli laskevat reuna- ja kulmasolujen arvot, analyysien luotettavuus on heikompi rasteriaineiston reuna- ja kulmasoluille, koska naapurisoluja on vähemmän. Tämä rajoitus tulee erityisesti tärkeäksi tarkasteltaessa johdetun rasteriaineiston reunalla olevia kohteita tai kun johdettuja rasteripintoja halutaan yhdistää.

Hydrologinen mallintaminen ja hydrografi-diagrammin luominen

Kurssikerran toisessa harjoituksessa tutustuttiin korkeusmallin pohjalta tehtäviin hydrologisiin mallinnuksiin. Tavoitteena oli arvioida veden virtausnopeutta ja tulvahuipun ajallista jakaumaa hypoteettisen tulvatapahtuman aikana Stowessa, Vermontissa mahdollisten tulvavahinkojen ehkäisemiseksi.

Harjoituksessa veden virtauksen mallintaminen aloitettiin korjaamalla korkeusmallissa olevia kuoppia, jotka voivat olla todellisia tai sitten korkeusmallissa olevia virheitä. “Kuopat” ovat pikseleitä, joiden kaikki naapuriruudut ovat sitä korkeamalla, ja tästä johtuen virtauksen mallintamisessa vesi ei pääse virtaamaan niistä eteenpäin. Tämä voi aiheuttaa virheitä mallinnuksessa, ja näiden kuoppien tunnistaminen sekä täyttäminen ovat tärkeä osa aineiston alkuvalmistelua. Kuoppia muodostavien pikselien täyttäminen tapahtuu paikkatieto-ohjelmistossa nostamalla näiden solujen korkeusarvot vähintään samalle tasolle yhden naapurisolun kanssa (Holopainen ym., 2015, s. 84).

Kun korkeusmallin kuopat on täytetty, onnistuu virtaussuunnan määrittäminen D8-virtaussuunta-algoritmin avulla (Holopainen ym., 2015, s. 134). Virtaussuunta määrittyy maksimaalisen korkeusarvon muutoksen mukaan jokaiselle ruudulle, ja veden virtauksen mallien avulla voidaan päätellä, mihin naapuriruutuun vesi siitä virtaa (Holoainen ym., 2015, s. 84). Lopputuloksena syntyy virtaussuuntagridi, jonka avulla pystytään edelleen määrittämään jokiverkon uomat sekä vapaasti valitun pisteen yläpuolinen valuma-alue (Holopainen ym., 2015, s. 134). Harjoituksessa virtaussuuntagridiä käytettiinkin  tarkastelun kohteena olevan Little River -joen purkupisteen yläpuolisen valuma-alueen määrittämiseksi.

Alueen virtaaman aikakäyrän määrittämiseksi tarvittiin lisäksi tietoa valuma-alueen veden virtausnopeudesta sekä kerääntymisajasta alajuoksulla sijaitsevaan purkupisteeseen (kuva 4). Näiden avulla voidaan ennustaa, missä ajassa vesi virtaa valuma-alueella ja saavuttaa purkupisteen mahdollisen rankkasateen jälkeen.

Kuva 4. Valuma-alueen veden kerääntymisaika purkupisteeseen vaihtelee 0–47 000 sekunnin välillä.

Valuma-alueen topografia- ja korkeustietojen pohjalta pystyttiin siis johtamaan useita pintavaluntaan liittyviä muuttujia ja mallintamaan veden virtausta hypoteettisen tulvatilanteen sattuessa. Näiden tietojen pohjalta pystyttiin luomaan virtaaman aikakäyrä (kuva 5), joka kuvaa veden virtausnopeutta (m2/s) ja tulvahuipun ajallista jakautumista tarkastellulla Little River purkupisteellä. Tämän perusteella tarkastellussa uomassa on yksi korkea tulvahuippu ja se saavutetaan 4 tuntia sateen jälkeen.

Kuva 5. Veden virtausnopeutta ja tulvahuipun ajallista jakaumaa kuvaava hydrografi-diagrammi. Sen avulla voi tulkita, että Little River uomassa tulvahuippu saavutetaan noin neljä tuntia sateen jälkeen.

 

Lähteet

Antikainen, H., Määttä-Juntunen, H. & Ujanen, J. (2015).  GIS-analyysimenetelmät ArcGIS 10.2.1 -ohjelmistolla. Oulun yliopiston maantieteen laitoksen opetusmoniste no. 43. Haettu 27.11.2020 osoitteesta http://jultika.oulu.fi/files/isbn9789526207889.pdf

Esri. (n.d.). Terrain Analysis Using ArcGIS Pro.

Holopainen,  M., Tokola, T., Vastaranta, M., Heikkilä, J., Huitu, H.,  Laamanen, R. & Alho, P. (2015). Geoinformatiikka luonnonvarojen hallinnassa. Helsingin yliopiston metsätieteiden laitoksen julkaisuja 7. Haettu 27.11.2020 osoitteesta http://hdl.handle.net/10138/166765

Soveltuvuusanalyysit apuna optimaalisen sijainnin tunnistamisessa

Kolmannella kurssikerralla jatkoimme työskentelyä valkopäämerikotkien pesimäpaikkojen tunnistamiseksi San Bernardinon kansallismetsän alueelta. Edellisellä kurssikerralla oli jo määritelty optimaaliselle sijainnille asetetut kriteerit, tutustuttu lähtöaineistoihin sekä laskettu niistä tarvittavia tietoja sekä rasteroitu koko aineisto. Tällä kurssikerralla jatkoimme kartografisen mallin rakentamista yhdistämällä ja analysoimalla karttatasoja näiden sopivimpien kohteiden tunnistamiseksi. (Holopainen, Tokola, Vastaranta, Heikkilä, Huitu, Laamanen & Alho, 2015, s. 94–95.)

Perinteinen kartografisen mallinnuksen esimerkki on sopivan paikan etsintä eri kriteerein, joka etenee analyysin määrittämisestä, tarpeellisten karttatasojen ja operaatioiden määrittämisen kautta lopputuloksen luotettavuuden, rajoitusten ja sopivuuden tarkistamiseen. Kartografinen mallinnus perustuu Tomlinin (1990) kehittämään kartta-algebraan, jossa karttakohteisiin liittyviä matemaattisia paikkatieto-operaatioita asetetaan ketjuksi siten, että edellisen toiminnon tulos on aina seuraavan syöte. Kartografista mallinnusta käytetään usein etsittäessä joitakin tiettyjä kriteereitä täyttäviä maa-alueita, kuten tässä tapaukessa valkopäämerikotkien optimaalisen pesimäpaikan määrittelyssä. (Holopainen ym., 2015, s. 95.)

Optimaalisen sijainnin määrittämisessä voidaan valita kolmesta eri soveltuvuusanalyysistä, joita ovat yksinkertainen/binäärinen (simple), painotettu (weighted) sekä sumea (fuzzy) analyysi. Kukin näistä eri soveltuvuusanalyyseistä muokkaa ja yhdistelee analyysissä käytettyä aineistoja eri tavalla sekä tuottaa erilaisen näkemyksen optimaalisista sijainneista. Kuhunkin analyysiin soveltuvan analyysin valinta riippuu siis siitä, miten halutaan, että eri karttatasoilla kuvatut kriteerit otetaan huomioon analyysissä sekä esitetään mallin lopputuloksessa.

Kolmannen kurssikerran ensimmäisessä harjoituksessa tutustuttiin yksinkertaiseen (simple) soveltuvuusanalyysiin, joka voidaan suorittaa binäärimuodossa olevalle rasteriaineistolle. Tämä analyysi soveltuu mallinnuksiin, joissa halutaan tunnistaa kohteet, jotka täyttävät yhtäläisesti kaikki asetetut kriteerit. Analyysissä sopivien alueiden paikallistaminen tapahtuu yhdistämällä kartta-algebran laskutoimitusten avulla numeerisessa muodossa olevia karttatasoja, joissa kukin karttataso esittää yh­tä muuttujaa (Holopainen ym., 2015, s. 99). Koska yksinkertaisessa soveltuvuusanalyysissä halutaan tunnistaa kohteet, jotka täyttävät kaikki kriteerit, käytetään karttatasojen yhdistämisessä kertolaskua.

Raster Calculator -työkalulla suoritetaan siis lokaali päällekkäisoperaatio, jossa jokaisen karttatason päällekkäiset solut kerrotaan, ja laskenta tapahtuu pikseli kerrallaan. Kertomalla yhteen binääriset rasterikarttatasot, joissa soveltuvat alueet on koodattu numerolla 1 ja ei soveltuvat kohteet arvolla 0, saadaan laskutoimituksen lopputuloksena kartta, jossa arvon 1 saavat vain ne alueet, jotka täyttävät yhtäaikaisesti kaikki annetut ehdot. (Holopainen ym., 2015, s. 98–99). Laskutoimituksen lopputuloksen saatu karttataso kuvaa kriteerit täyttäviä soluja, jotka sijaitsevat kolmen järven ympärillä pohjoisen ja koillisen suuntaisilla rinteillä metsäalojen sisällä (kuva 1).

Kuva 1. Kuvassa esitetty valkopäämerikotkille sopivien pesimäpaikkojen sijainti San Bernardinon kansallismetsässä. Analyysin lopputuloksena saatavaa tietoa voidaan hyödyntää alueiden visuaaliseen tarkasteluun ja esimerkiki pesimäpaikkoja kenttätutkimusta suunniteltaessa.

Koska kaikkeen mittaamiseen tiedon keruuseen ja käsittelyyn liittyy kuitenkin monia virhelähteitä, joita ei pystytä koskaan täysin poistamaan, paikkatietoa tuotettaessa halutaan usein myös testata käytetyn lähtöaineiston sekä mallin tulosten luotettavuutta käyttäen herkkyys- ja virheanalyysejä.

Herkkyysanalyysi on mallin tuloksen epävarmuuden arvioimista. Sen avulla pyritään selvittämään, kuinka herkkä mallin tulos on käytettyjen lähtöoletusten muuttamiselle.  Osittaisherkkyysanalyysissä yhden muuttujan kriteereitä muutetaan kerrallaan ja lasketaan uusi optimaalinen sijainti näillä muutetuilla arvoilla. (Wikipedia, n.d.) Herkkyysanalyysin lopputuloksena saatua muutettua karttatasoa verrataan alkuperäiseen karttatasoon visuaalisesti sekä laskemalla näiden kahden karttatason välinen erotus. Jos kyseisen muuttujan lähtöoletusten muuttaminen muuttaa lopputulosta suuresti, voidaan sanoa, että tulos on herkkä kyseisen parametrin muutoksille.

Harjoituksessa muutettiin optimaalisen pesimäalueen puuston latvuspeittävyyden määrää huomioimaan soveltuvuusanalyysissä alueet, jossa peittävyys oli 30–60 % (alunperin 20–60 %). Tällä muutetulla parametreilla laskettiin uusi karttataso, ja sitä verrattiin alkuperäiseen kuvassa 1 esitettyyn karttatasoon päällekkäisanalyysin avulla.

Näitä kahta binääristä karttatasoa vertaamalla (“Sensitivity_Surface” – “SuitabilitySurface”) != 0 operaatiolla saatiin lopputuloksena karttataso, jossa arvon 0 saa ne pikselit, jotka ovat kummassakin karttatasossa yhtäläiset ja arvon 1 ne pikselit, jotka osuvat vain toisen karttatason kohdalle. Lopputulos on esitetty kuvassa 2, jossa on punaisella kuvattu karttatasojen välinen erotus sekä mustalla alkuperäinen soveltuvuuskarttataso.

Kuva 2. Herkkyysanalyysin avulla voidaan selvittää, kuinka herkkä mallin tulos on käytettyjen lähtöoletusten muuttamiselle. Kuvassa punaisella on esitetty herkkyysanalyysin sekä alkuperäisen soveltuvuusanalyysin välinen erotus.

Virheanalyysillä voidaan puolestaan testata lähtöaineiston luotettavuutta ja sitä, kuinka suuri mittausvirhe käytetyssä lähtöaineistossa voi olla ennen kuin se vaikuttaa saatuun tulokseen (kuva 3).

Kuva 3. Virheanalyysissä on muutettu rinteen korkeusmallia ja suuntaa määrittävän datan arvoja, ja laskettu näillä arvoilla uusi karttataso. Vertaamalla tätä karttatasoa alkuperäisellä aineistolla saatuun tulokseen voidaan arvioida, kuinka suuren virhemarginaalin aineisto kestää ennen kuin se vaikuttaa mallilla tuotettuun lopputulokseen.

Painotettu soveltuvuusanalyysi

Yksinkertaisen (simple) soveltuvuusanalyysin lisäksi optimaalisen sijainnin määrittämisessä voidaan käyttää kahta muuta soveltuvuusanalyysin muotoa, joista kumpikin muokkaa ja yhdistelee aineistoja eri tavalla. Kurssikerran toisessa harjoituksessa tutustuttiin tarkemmin painotettuun (weighted) soveltuvuusanalyysin, joka sopii analyyseihin, joissa halutaan valita alueita perustuen siihen, miten hyvin ne täyttävät asetetut kriteerit.

Tässä harjoituksessa lähtöaineistona toimi sama aineisto kuin aiemmassa harjoituksessa, mutta binäärisen aineiston sijaan painotetussa soveltuvuusanalyysissä aineisto uudelleenmuokataan arvoihin 1–10, jossa arvo 10 kuvaa soveltuvinta aluetta. Aineiston muokkaaminen voidaan tehdä uudelleenluokittelemalla Reclassify-työkalulla, joka soveltuu luokitellulle rasteriaineistolle tai uudelleen skaalaamalla Rescale By Function -työkalulla.  Rescale By Function -työkalu sopii jatkuvalle rasteriaineistolle, ja aineistolle,  jota ei haluta ryhmitellä uudestaan vaan ainoastaan skaalata rasterin arvot uudelleen. Soveltuvan työkalun valitseminen ja aineiston uudelleenluokittelu vaatiikin alkuperäisten lähtöaineiston arvojen, mitta-asteikon ja yksikön tuntemista, koska kaikki lähtöaineiston muuttujan ominaisuudet vaikuttavat käytettäviin analyyseihin, työkaluihin sekä lopputulokseen.

Harjoituksessa jokaisen neljän eri karttatason pikselien arvot uudelleen luokiteltiin tai skaalattiin vaihettumaan 1–10 välillä (kuva 4). Kartografinen malli voikin koostua useista karttatasoista, jotka kuvaavat mallissa käytettyjen muuttujien spatiaalista vaihtelua tutkittavalla alueella (Holopainen ym., 2015, s. 95). Koska kukin muuttuja on kuvattu omalla karttatasollaan, vaatii optimaalisten sijaintien tunnistaminen vielä kunkin karttatason yhdistämistä.

Kuva 4. Kuvassa on kutakin neljää eri kriteeriä kuvaavat karttatasot uudelleenluokiteltuna tai -skaalattuna vaihettumaan arvojen 1–10 välillä, jossa 10 kuvaa sopivinta aluetta. Mallissa hyödynnettiin myös järvialueiden rasteriaineistoa maskina, jolla peitettiin aineistosta pesimäalueiksi sopimattomat järvialueet. Vasen yläkulma: kulttuurivaikutuksen määrä alueella. Vasen alakulma: järven läheisyys. Oikea yläkulma: puuston latvuspeittävyys. Oikea alakulma: rinteen suunta.

Karttatasoja yhdistettäessä painotetussa soveltuvuusanalyysissä kaikki analyysille asetetut kriteerit eivät ole yhtä tärkeitä vaan kullekin kriteerille asetetaan painokertoimet, joilla painotetaan eri kriteerien ja ominaisuuksien merkitystä. Kullekin karttatasolle lisätään siis oma painotuksensa, ja painotus voidaan asettaa joko Weighted Overlay tai Weighted Sum -työkaluilla, joista molemmat menetelmät käyttävät painotettuja lineaarikombinaatioita laskemaan uuden arvon kullekin solulle.

Weighted Overlay -työkalu soveltuu kokonaisluvuille, ja painotus perustuu suhteellisiin prosenttiosuuksiin. Karttatasoja yhdistettäessä kullekin karttatasolle asetetaan prosenttiosuus, jotka eivät  voi yhdessä ylittää 100 prosenttia. Weighted Sum -työkalun avulla voidaan taas asettaa päällekkäin useita rastereita kertomalla kukin karttataso sille annetulla painoarvolla ja sen jälkeen laskemalla kaikki karttatasot yhteen. Weighted Sum painotuksessa painoarvot voivat olla, mikä tahansa positiivinen tai negatiivinen desimaali- tai kokonaislukuarvo, eikä se rajoitu suhteelliseen prosenttiosuuteen. Tässä harjoituksessa sopivan sijainnin tunnistamisessa käytettiin Weighted Sum -työkalua painottaen eniten järven läheisyyttä sekä sijaintia kaukana alueista, joissa on ihmistoimintaa kuten rakennuksia ja teitä. Painotetun analyysin lopputuloksena syntynyt kartta esittääkin näiden kriteerien takia, valkopäämerikotkille sopivien pesimäpaikkojen sijaitsevan pääasiassa kartoitetulla alueella olevien järvien ympäristössä (kuva 5).

Kuva 5. Tummimmat vihreät alueet osoittavat optimaalisimpia sijainteja valkopäämerikotkien pesimäalueiksi. Nämä alueet sijaitsevia etupäässä kartoitetulla alueella sijaitsevien järvien ympärillä. Kartan kaakkoisosassa sijaitsee myös vuoristoinen alue, joka on sopiva pesimäalueeksi sen ihmistoiminnasta kaukaisen sijainnin takia.

Paikkatiedon laadun ja tuloksien testaaminen virheanalyysin avulla

Myös painotetut soveltuvuusanalyysin tuloksien luotettavuutta voidaan testata käyttäen herkkyys- ja virheanalyysejä. Painotetun soveltuvuusanalyysin kohdalla herkkyysanalyysi voidaan kohdistaa joko aineistoa muokkaavaan uudelleenluokitteluun tai -skaalaukseen tai painotusarvoon. Herkkyysanalyysi tulee kuitenkin aina kohdistaa vain yhteen muuttujaan ja operaatioon kerrallaan, jotta voidaan tarkastella sen vaikutusta optimiratkaisuun.

Virheanalyysi kohdistuu sen sijaan lähtöaineiston luotettavuuden arvioimiseen aineistolle määritellyn luottamusvälin sisällä. Virheanalyysillä voidaan testata, miten aineistosta saatu tulos poikkeaa, jos lähtöaineistossa onkin jokin mittausvirhe (esim. ±1 metriä). Jatkuvasta lähdeaineistosta virheen vaikutus voidaan analysoida esimerkiksi satunnaisesti lisäämällä tai vähentämällä virhearvo (esim. ±1) lähtöaineiston soluista, ja tarkastelemalla muutoksen vaikutusta lopputuloksena saatuun karttatasoon (kuva 6).

Kuva 6. Virheanalyysissä muutetaan lähtöaineiston mittaustuloksia ja tarkastellaan sen avulla, miten paljon muutokset vaikuttavat saatuun lopputulokseen. Virheanalyysin avulla voidaan arvioida lähtöaineiston luotettavuutta ja testata, kuinka herkkä malli on lähtöaineiston poikkeamilla.

Tässä harjoituksessa tyydyttiin tarkastelemaan herkkyys- ja virheanalyysin tuloksia visuaalisesti, mutta niiden erotuksen laskeminen olisi varmasti paljastanut tarkemmin, missä kohdissa kahden karttatason välisiä eroavaisuuksia esiintyi. Kummankin analyysin tulokset olivat visuaalisen tarkastelun perusteella hyvin lähellä alkuperäisen analyysin alueita, joten näiden harjoituksessa testattujen muuttujien, puuston latvuspeittävyyden sekä rinteen korkeusmallin, osalta mallin ja lähtöaineiston voidaan katsoa olevan luotettavia.

Tällä kurssikerralla vertaillut yksinkertainen  ja painotettu soveltuvuusanalyysi tarjoavat siis kumpikin mallin sopivimpien tai tärkeimpien kohteiden tunnistamiseksi maastosta, mutta kuhunkin tilanteeseen parhaiten soveltuva analyysitapa riippuu sekä asetetuista tavoitteista että lopputuloksena saadun tiedon tarpeesta. Yksinkertainen soveltuvuusanalyysi yksilöi ne alueet, jotka täyttävät yhtäaikaisesti kaikki annetut ehdot, mutta se ei anna informaatiota  alueiden keskinäisestä paremmuudesta (Holopainen ym., 2015, s. 99). Painotettu soveltuvuusanalyysi kuvaa sen sijaan paremmin alueiden välistä vaihettumisesta ja alueiden välisiä suhteita, ja visualisoi kartalle siten myös alueiden välistä paremmuusjärjestystä.

Lähteet

Holopainen,  M., Tokola, T., Vastaranta, M., Heikkilä, J., Huitu, H.,  Laamanen, R. & Alho, P. (2015). Geoinformatiikka luonnonvarojen hallinnassa. Helsingin yliopiston metsätieteiden laitoksen julkaisuja 7. Haettu 10.11.2020 osoitteesta http://hdl.handle.net/10138/166765

Wikipedia. (n.d.). Herkkyysanalyysi. Haettu 16.11.2020 osoitteesta https://fi.wikipedia.org/wiki/Herkkyysanalyysi

Rasterianalyysejä ja työvaiheketjutuksia

Toisen kurssikerran harjoituksissa tutustuimme rasteriaineiston datan hallintaan, analyyseihin ja visualisointiin. Rasterimuotoinen paikkatietoaineisto on pikselistä/soluista rakentuvaa kuvamuotoista paikkatietoaineistoa, joista yleisimpänä esimerkkinä ovat ilma- ja satelliittikuvat. Kurssikerran ensimmäisessä harjoituksessa tutustuimmekin satelliittikuvista tehtäviin rasterianalyyseihin.

Ensimmäisessä harjoituksessa lähtöaineistona toimi kaksi monikanavaista Landsat 8 satelliittikuvaa vuosilta 2013 ja 2015. Vertaamalla näitä kahta samalta alueelta eri vuosina otettua satelliittikuvaa haluttiin tunnistaa, oliko kuvatulla alueella tapahtunut maankäytön ja kasvillisuuden muutosta.

Kasvillisuudessa tapahtuneen muutoksen tunnistamiseksi kummallekin satelliittikuvalle laskettiin ensin vihreän kasvillisuuden määrään sekä kuntoon reagoiva NDVI (Normalized Difference Vegetation Index) eli normalisoitu kasvillisuusindeksi, jonka laskeminen perustuu kasvillisuuden heijastamaan valoon. Vihreät kasvit absorboivat valoa punaisella aallonpituusalueella (RED) ja toisaalta heijastavat voimakkaasti lähi-infrapuna-alueen säteilyä (NIR). NDVI-indeksin laskenta perustuu näiden kuvattujen aallonpituusalueiden väliseen suhteeseen, ja se kuvaa tehokkaasti elinvoimaisen kasvillisuuden määrää kartoitetulla alueella. (Keto, 2017, s. 15–16; Suomen ympäristökeskus (SYKE), n.d.)

Kasvillisuusindeksi-analyysin lopputuloksena syntyi kaksi uutta NDVI-indeksiä  kuvaavaa rasterimuotoista karttatasoa. Näiden karttatasojen välisen muutoksen tunnistamiseksi karttatasoja verattiin keskenään rasteriaineiston päällekkäisanalyysin avulla.

Rasteriaineiston päällekkäisoperaatiot jaetaan analyysin alueellisen laajuuden mukaan lokaaliin, fokaaliin, zonaaliin sekä globaaliin operaatioon/analyysiin. Valittu funktio vaikuttaa analyysin kohdistettavuuden lisäksi siihen, millaisia laskuoperaatioita  analyysillä on mahdollista suorittaa ja mitä arvoja operaation lopputuloksena syntynyt karttataso voi saada. Rasteriaineiston mitta-asteikko asettaa myös rajoitteita mahdollisille laskuoperaatioille, joten tärkeä osa rasteriaineiston datan hallintaan on myös tuntea käytettävän datan mitta-asteikko ja käyttömahdollisuudet. (Holopainen, Tokola, Vastaranta, Heikkilä, Huitu, Laamanen & Alho, 2015, s. 51–52, 62).

Harjoituksessa hyödynnettiin rasterianalyysin lokaalia paikallisfunktiota, joka suorittaa määrätyn operaation rasterin jokaiselle solulle yksi kerrallaan. Tyypillisiä rasterianalyysin paikallisfunktion operaatioita ovat summa, erotus, tulo, jakolasku, eksponentti/logaritmiarvot ja trigonometriset funktiot (Holopainen ym., 2015, s. 62).

Kuva 1. Vuosien 2013 ja 2015 kasvillisuusindeksien välinen erotus kuvattuna punaisesta vihreään vaihettuvan väriskaalan avulla.

Harjoituksessa lokaalin päällekkäisoperaation avulla laskettiin vuosien 2013 ja 2015 NDVI-indeksien välinen erotus (kuva 1). Lopputuloksena saadun karttatason pikselien arvot kuvaavat kasvillisuuden määrässä tapahtuneen muutoksen suuruutta.  Koska harjoituksessa oltiin kuitenkin kiinnostuneita vain siitä, oliko kuvatulla alueella tapahtunut muutosta, mutta ei sen suuruudesta, tuli päällekkäisanalyysin pohjalta saatu aineisto vielä luokitella uudestaan binääriseksi rasteriaineistoksi.

Uudelleenluokittelua voidaan käyttää, kun aineisto halutaan luokitella alkuperäisestä luokittelusta poikkeavalla tavalla (Holopainen ym., 2015, s. 55). Uudelleenluokittelussa rasteriaineiston pikseleiden arvot muutetaan uusiksi antamalla jokaiselle lähtökartassa olevalle arvolle, joku uusi arvo. Harjoituksessa muutoksen suuruutta kuvaava aineisto ryhmitteltiin/luokiteltiin niin, että kukin pikseli sai joko arvon 1 = muutosta tai 0 = ei muutosta. Lopputuloksena syntynyt karttataso yksinkertaisti karttaesitystä, ja kuvassa 2 näkyvällä kartalla on näkyvissä kaikki alueet, jossa on havaittavissa kasvillisuuden muutosta vuosien 2013 ja 2015 välillä.

Kuva 2. Kartassa on kuvattu punaisella ne alueet, joissa on havaittavissa kasvillisuuden muutosta vuosien 2013 ja 2015 välillä.

Rasteriaineiston käsittelyä ja muokkaamista

Kurssikerran toisessa ja kolmannessa harjoituksessa käsiteltiin tarkemmin paikkatietoaineiston käsittelyä ja muokkaamista analyyseihin sopivaksi. Kummassakin harjoituksessa valmisteltiin aineistoa valkopäämerikotkille sopivien pesimäpaikkojen tunnistamiseksi San Bernardinon kansallismetsässä.

Kuten aiemmin kirjoitin, kaikkien paikkatietoaineistojen hallinta ja analyysointi lähtee aina liikkeelle jostain käyttäjän asettamasta kysymyksestä, johon halutaan löytää vastaus. Kysymykseen vastaaminen vaatii kuitenkin usein monien eri alueellisten kriteerien huomioimista, ja siten myös useiden paikkatietoaineistojen hyödyntämistä. Tämä korostuu varsinkin rasteriaineiston kohdalla, koska yksi rasterikarttataso voi käsittää vain yhden muuttujan.

Tässä harjoituksessa lähtöaineistona toimi kolme eri rasterikarttatasoa sekä yksi vektorikarttataso, joista jokainen kuvasi yhtä optimaalisen sijainnin löytämiseen tarvittavista muuttujista. Harjoituksessa monet optimaalisen pesimäsijainnin määrittämiseen tarvittavat kriteerit vaativat näiden kohteiden välisten etäisyyksien mallintamista, joka laskettiin suorittamalla muuttujille kustannuspinta-analyysi. Kustannuspinta-analyysin avulla valituista muuttujista saatiin mallinnettua erilaisia leviämismalleja.

Kustannuspinta-analyysin perusideana on laskea kumulatiivinen kustannus jostain tietystä pisteestä (tai pisteistä) käsin koko kustannuspinnan kattamalle alueelle (Antikainen, Määttä-Juntunen & Ujanen, 2015, s. 38–39). Kustannuspinnan muodostuksessa valitulla lähtöpinnalla kuvatut kohteet muodostavat nollatason, josta poikkeaminen aiheuttaa kustannuksia. (Holopainen ym., 2015, s. 101–102). Analyysin lopputuloksena syntyy kumulatiivinen rasteripinta, jonka jokaisen solun arvo edustaa solun läpi kulkemisesta aiheutuvaa yksikkökustannusta, eli siis kustannusta yhtä etäisyysyksikköä kohti (Antikainen, Määttä-Juntunen & Ujanen, 2015, s. 38–39). Tällä analyysillä myös yksi vektorimuotoinen karttataso saatiin muutettua rasterimuotoiseksi karttatasoksi eli rasteroitua, jolloin eri karttatasot olivat yhdistettävissä keskenään.

Jotta näitä eri karttatasoja voitiin edelleen yhdistää päällekkäisanalyysiä  ja optimaalisen sijainnin tunnistamista varten, aineistoa tuli yksinkertaistaa uudelleenluokittelun avulla. Uudelleenluokittelussa optimaalisen sijainnin täyttäville pikseleille annettiin arvo 1 ja ei soveltuville alueille 0. Eri päällekkäiset binääriset karttatasot on kuvattu kuvassa 3. Tämän harjoituksen aineiston spatiaalista mallintamista käsitellään lisää seuraavassa kirjoituksessa.

Työvaiheiden ketjuttaminen osa rasterityöskentelyä

Tämän kurssikerran harjoituksissa korostui erityisesti paikkatietoaineistojen käsittely ja muokkaaminen analyyseihin sopivaksi sekä eri työvaiheiden yhdistäminen monivaiheiseksi työvaiheketjuksi. Paikkatietoaineiston muokkaaminen ja analysointi vaatiikin useiden peräkkäisten työvaiheiden ketjuttamista. Kurssilla käytettävä ArcGIS paikkatieto-ohjelmisto tarjoaa oivallisen ModelBuilder-työkalun näiden yksittäisten työvaiheiden ketjuttamiselle sekä niistä muodostetun työvaiheketjun tallentamiselle järjestelmään myös myöhempää käyttöä varten.

Harjoituskerran tehtävissä huomasinkin ModelBuilder-työkalun etuina olevan muun muassa sen, että se auttaa hahmottamaan monivaiheisten työvaiheiden kokonaisuuden sekä varmistamaan, että kaikki tarvittavat työvaiheet tulee suoritetuksi. ModelBuilder-työkalu esimerkiksi vähentää paikkatietoaineiston käsittelyssä manuaalisen työn määrää, tekee työskentelystä systemaattisempaa sekä antaa mahdollisuuden korjata analyyseissä esiintyneitä virheitä ilman, että kaikkea tarvitsee aloittaa alusta.

Itsestään tietysti paikkatietojärjestelmä ja sen työkalut eivät analyysejä kuitenkaan pysty tekemään, vaan olennaiset osat kokonaisuutta ovat hyödynnettävät paikkatietoaineistot ja itse käyttäjät. Vaikka esimerkiksi työvaiheista muodostetun pohjamallin käyttäminen automatisoi ja nopeuttaa eri työvaiheita, vaatii se paikkatietojärjestelmän käyttäjältä kuitenkin ymmärrystä käsiteltävistä aineistoista, työvaiheiden järjestyksen merkityksestä että spatiaalisista analyyseistä.

Kuva 3. Kartalla on kuvattu neljä eri binääristä rasterikarttatasoa päällekkäin, joista jokainen esittää yhtä optimaalisen sijainnin määrittämiseen tarvittavaa kriteeriä. Kriteerit ovat yli 0 metriä kehitetystä alueesta, 20–60 % puuston latvuspeittävyys, pohjois-koillis-suuntaisella rinteellä sekä alle 2 mailia järvestä.

Lähteet:

Antikainen, H., Määttä-Juntunen, H. & Ujanen, J. (2015).  GIS-analyysimenetelmät ArcGIS 10.2.1 -ohjelmistolla. Oulun yliopiston maantieteen laitoksen opetusmoniste no. 43. Haettu 12.11.2020 osoitteesta http://jultika.oulu.fi/files/isbn9789526207889.pdf

Holopainen,  M., Tokola, T., Vastaranta, M., Heikkilä, J., Huitu, H.,  Laamanen, R. & Alho, P. (2015). Geoinformatiikka luonnonvarojen hallinnassa. Helsingin yliopiston metsätieteiden laitoksen julkaisuja 7. Haettu 10.11.2020 osoitteesta http://hdl.handle.net/10138/166765

Keto, K. (2017). Kasvillisuuden kaukokartoitus. (Kandidaatintyö, Oulun yliopisto). Haettu 9.11.2020 osoitteesta http://jultika.oulu.fi/files/nbnfioulu-201703311417.pdf

Suomen ympäristökeskus (SYKE). (n.d.). NDVI (Normalized difference vegetation index)-indeksi korkearesoluution satelliittikuvamosaiikeista (2000 ja 2006).  Haettu 9.11.2020 osoitteesta http://wwwi4.ymparisto.fi/i4/fin/tietosivut/vacciaRsData_ndvi.html

Uutta tietoa ja ymmärrystä paikkatietokyselyillä ja -analyyseillä

Geoinformatiikan menetelmät 2 -kurssin ensimmäisen viikon luennolla sekä harjoituksissa tutustuttiin vektorimuotoisen paikkatietoaineiston kyselytyökaluihin sekä paikkatietoanalyyseihin. Nämä ovat keskeisiä toimintoja paikkatietoaineiston käsittelyssä, ja niiden avulla suurista paikkatietoaineistoista ja ominaisuustietotauluista on mahdollista tuottaa uutta tietoa ja ymmärrystä ilmiöiden alueellisesta jakautumisesta ja vaihtelusta. Paikkatietojärjestelmien vahvuus onkin siinä, että kyselyjen ja analyysien tuloksia on mahdollista tarkastella järjestelmässä sekä visuaalisesti kartalla että attribuuttitauluna. (Muukkonen, 2019.)

Paikkatietokyselyillä uutta tietoa

Paikkatietokysely on yksi paikkatietojärjestelmien yleisimmistä toiminnoista, ja se voi kohdistua joko paikkatietoaineiston sijainti- tai ominaisuustietoihin tai molempiin. Paikkatietokysely on aineiston rajaamiseen soveltuva työkalu, joka ei muuta itse tiedon rakennetta vaan sen avulla voidaan luoda laajemmista aineistoista uusia suppeampia osa-aineistoja. (Blomqvist & Johansson, 2004, s. 42–46; Muukkonen, 2019.)

Paikkatietokyselyn valintalausekkeen muodostamisessa voidaan käyttää erilaisia paikkatietojärjestelmään koodattuja hakupredikaatteja, jotka määrittelevät, mitä arvoja toiminto palauttaa. Hakupredikaatit voivat kohdistua joko tarkasteltavan kohteen sisäisiin arvoihin tai kohteidenvälisen topologian vertailuarvoihin. Kyselytyökalulle annetut hakuehdot suodattavat tietokannasta kaikki kohteet, jotka täyttävät annetut ehdot ja tuo kohteet tarkasteltavaksi. Kyselyn avulla suodatetut kohteet on myös mahdollista tallentaa edelleen uudeksi tietokannaksi, jonka kanssa jatkaa työskentelyä. (Holopainen ym., 2015, s. 59.)

Ensimmäisessä harjoituksessa tehtiin kohteen sisäiseen ominaisuustietoon perustuva kysely, jossa haettiin rautateitä koskevasta tietokannasta yhdestä sarakekentästä vain tietyn arvon omaavat tietueet. Kyselyn RAILWAY is equal to station -hakulausekkeen avulla kartalle haettiin näkyviin vain todelliset rautatieasemat, ja piilotettiin kohteet, jotka eivät tätä kriteeriä täyttäneet kuten rautatien tasoylikäytävät ja seisakkeet (kuva 1).

Kuva 1. Harjoituksessa haluttiin rajata paljon ominaisuustietoa sisältävästä tietotaulusta kartalle näkyviin vain tietyt hakuehdot täyttävät kohteet. Kartalla näkyvissä ominaisuustietotaulusta haetut rautatieasemet.

Ominaisuustietojen lisäksi paikkatietokysely voi kohdistua myös aineiston sijaintitietoihin. Sijaintietoihin perustuvissa hakulausekkeissa on käytettävissä karttakohteiden keskinäiseen suhteeseen perustuvia operaatioita, kuten sijaitseeko kohde toisen sisällä, sivuavatko kohteet tai leikkaavatko ne toisiaan tai ovatko kohteet täysin erillään toisistaan. (Blomqvist & Johansson, 2004, s. 42–46.) Kyseisessä harjoituksessa haluttiin rajata Utahin osavaltion erämaa-alueista vain ne alueet, jotka sijaitsivat San Rafaelin aavikon alueella. Tätä varten aineistoon oli lisätty ns. keinotekoinen polygoni, joka kuvasi tarkasteluun haluttua aluetta. Näille kahdelle karttatasolle tehtiin spatiaalinen operaatio, joka ilmaisee kohteiden topologisia suhteita (Geoinformatiikan sanasto, 2018, s.71). Karttatasojen välistä topologiaa eli kohteiden keskinäistä sijainnillista suhdetta hyödyntämällä aineistosta saadaan haettua vain rajatulla alueella sijaitsevat kohteet (kuva 2). (Holopainen ym., 2015, s. 54.)

Kuva 2. Kahden polygonimuotoisen karttakohteen keskinäistä suhdetta vertaamalla kartalle saatiin näkyviin Utahin osavaltion erämaa-alueista vain ne alueet, jotka sijaitsivat San Rafaelin aavikon alueella.

Paikkatietojärjestelmissä on myös useita valmiit rutiineja, joiden avulla voidaan laskea kartan alueiden ja luokkien pinta-aloja sekä pisteiden välisiä etäisyyksiä. Lisäksi vektoripohjaisissa järjestelmissä voidaan laskea viivojen pituuksia. (Holopainen ym., 2015, s. 53.) Kyselyjen tuloksia on myös mahdollista järjestellä ominaisuustietotaulun sisällä esimerkiksi aakkosjärjestykseen tai suuruusjärjestykseen sekä laskea sarakekohtaisia summia ja keskiarvoja (Blomqvist & Johansson, 2004, s. 42).

Koska paikkatietojärjestelmien päätehtävä on helpottaa alueellisten ilmiöiden tarkastelua, nämä kysely- ja analyysityökalut ovat keskeisiä. Itsestään tietysti paikkatietojärjestelmä ja sen työkalut eivät analyysejä pysty tekemään, vaan olennaiset osat kokonaisuutta ovat itse käyttäjät ja hyödynnettävät paikkatietoaineistot. Kaikkien paikkatietoaineistojen hallinta, kerääminen, käsittely, kyselyt ja analyysit lähtevät liikkeelle jostain käyttäjän asettamasta spatiaalisesta kysymyksestä, johon halutaan löytää vastaus. Vasta spatiaalisen ongelman ja kysymyksen asettamisen jälkeen, voidaan päättää, mitä paikkatietokyselyitä ja -analyysejä tarvitaan.

Läheisyysanalyysi ja vyöhykkeen laskenta

Harjoituskerran kolmannessa tehtävässä siirryttiin läheisyysanalyyseihin. Näitä analyysejä voidaan hyödyntää, kun halutaan vastata esimerkiksi kysymykseen, mikä on lähellä tai mikä on läheisin. Läheisyysanalyysissä käytettäviä paikkatietoanalyysimenetelmiä ovat esimerkiksi etäisyysvyöhykkeen laskenta sekä lähimmän naapurin haku (Geoinformatiikan sanasto, 2018, s. 96).

Kolmannessa harjoituksessa käytettiin pisteiden välisiä etäisyyksiä laskevaa paikkatietoanalyysimenetelmää. Lähimmän naapurin haussa käytetään spatiaalista operaatiota etäisyys (distance), jonka tuloksena on kohdejoukon pisteistä se, joka on lähimpänä annettua pistettä. (Geoinformatiikan sanasto, 2018, s. 100.) Harjoituksessa tällä operaatiolla saatiin määriteltyä, mikä oli kunkin kuntosalijäsenen lähin kuntosali ja minkä etäisyyden päässä lähin kuntosali sijaitsee. Operaation tuloksena syntyneet etäisyystiedot periytyivät kuntosaliasiakkaita koskevaan ominaisuustietotauluun.

Kuva 3. Kuvassa pisteet edustavat yksittäistä kuntosalijäsentä ja tähdet kuntosalien sijaintia. Kunkin kuntosalin ympärille on tehty säteeltään 5 mailin buffer-vyöhyke, jonka avulla pystyttiin arvioimaan kuntosalien vaikutusalueen jättämää katvealuetta.

Harjoituksessa laskettiin myös kunkin kuntosalin ympärille 5 mailin etäisyys- eli puskurivyöhyke. Vyöhykkeen laskennassa käytetään spatiaalista operaatiota (buffer), jonka tuloksena syntyy vyöhyke, jonka reuna ulottuu määrätylle etäisyydelle tarkasteltavasta kohteesta tai kohdejoukosta (Geoinformatiikan sanasto, 2018, s. 100–101).  Etäisyysvyöhyke voidaan määritellä kiinteäksi tai se voi vaihdella kohteen ominaisuustiedon, kuten koon, mukaan. (Holopainen ym., 2015, s. 64).

Tämän paikkatietoanalyysimenetelmän seurauksena syntyy uusi vyöhykepolygoni, jota voidaan hyödyntää jatkoanalyyseissä tarkasteltaessa esimerkiksi halutun levyisellä vaikutusaluevyöhykkeellä sijaitsevia kohteita toisilta karttatasoilta. Harjoituksessa puskurivyöhykettä hyödynnettiin spatiaalisessa operaatiossa, jossa vyöhykkeen avulla määriteltiin ne kuntosalikävijät, jotka sijaitsivat määritellyn vyöhykkeen ulkopuolella (kuva 3). Tätä tieto olisi voitu hyödyntää muun muassa liiketoiminnan laajentamissuunnitelmassa ja tunnistaa katvealueen avulla potentiaalinen sijainti uudelle kuntosalille.

Paikkatiedon hyödyntäminen päätöksenteossa

Paikkatietojen hyödyntäminen päätöksenteossa ja toiminnanohjauksessa on lisääntynyt. Tämä vaatii paikkatietojärjestelmän käyttäjältä ymmärrystä käsiteltävistä aineistoista sekä spatiaalisista analyyseistä. Päätöksenteon tueksi haluttua aineistoa on harvoin valmiina saatavilla vaan uuden tiedon tuottaminen vaatii kykyä muokata, yhdistää ja analysoida eri tietoa sisältäviä paikkatietoaineistoja.

Harjoituskerran neljäs tehtävä käsittelikin useasta eri päällekkäisestä karttatasosta koostuvan aineiston analyysi- ja muunnosmenetelmiä sekä eri työvaiheiden ketjuttamista. Tässä harjoituksessa hyödynnettiin päällekkäisanalyysin (overlay) union-operaatiota, joka yhdistää eri karttatasot ja niiden ominaisuustiedon yhteen uuteen ominaisuustietotauluun.

Harjoituksessa haasteena oli määritellä optimaalinen sijainti uudelle tuulivoimapuistolle Coloradon osavaltiossa. Sopivan sijoituspaikan löytäminen vaati useiden tekijöiden ja kriteerien huomioimista, joka edellytti useiden eri paikkatietoaineistojen ja karttatasojen hyödyntämistä ja yhdistämistä. Ketjuttamalla eri työvaiheita voitiin lopulta luoda kaikki kriteerit yhdistävä karttataso, josta suorittamalla monikriteerinen analyysi saatiin määriteltyä kohteet, jotka täyttivät kaikki projektille asetetut ehdot.

Harjoituksessa hyödynnettiin myös vektorianalyysin yhdistävyysanalyysiä, jonka laskufunktiot mahdollistavat esimerkiksi kahden pisteen välisen etäisyyden tai lyhimmän/nopeimman reitin laskemisen aineistosta (Holopainen ym., 2015, s. 51). Harjoituksessa analyysiä käytettiin reitinoptimointiin ja matka-ajan määrittämiseen optimaalisten tuulivoimapuistojen välillä. Harjoituksen lopputulos on esitetty alla olevassa kartassa.

Tässä tehtävässä mielestäni korostui se, miten aineiston käsittely ja analysointi saattaa vaatia useita eri välivaiheita ennen kuin se on käyttötarkoitukseen sopivassa muodossa sekä se, että operaatioiden järjestyksellä on merkitystä lopputulokseen. Toisaalta myös tietokantojen sisältämän tiedon monipuolisuus tuli esille ja sen useat eri muokkaus- ja analysointimahdollisuudet. Erilaiset paikkatietokyselyt ja -analyysit tarjoavat siis monenlaisia käyttömahdollisuuksia paikkatietoperusteiseen optimointiin ja päätöksentekoon.

Lähteet

Blomqvist, T. & Johansson, I. (2004). Paikkatiedon tukimateriaali lukion maantieteen opettajille. Haettu 30.10.2020 osoitteesta https://www.yumpu.com/fi/document/read/38242443/paikkatiedon-tukimateriaali-lukion-maantieteen-opettajille-edufi

Geoinformatiikan sanasto. (2018).  4. painos. Helsinki: Maanmittauslaitos. Haettu 30.10.2020 osoitteesta http://www.tsk.fi/tiedostot/pdf/GeoinformatiikanSanasto.pdf

Holopainen,  M., Tokola, T., Vastaranta, M., Heikkilä, J., Huitu, H.,  Laamanen, R. & Alho, P. (2015). Geoinformatiikka luonnonvarojen hallinnassa. Helsingin yliopiston metsätieteiden laitoksen julkaisuja 7. Haettu 30.10.2020 osoitteesta http://hdl.handle.net/10138/166765

Muukkonen, P.  (2019). Luento 4: Paikkatietomallien perusominaisuudet (attribuuttitiedot ja sijaintitiedot).  MAA-104 Johdatus geoinformatiikkaan maantieteessä [Luentodia]. Helsingin yliopisto.

Inhimillisen hyvinvoinnin kuvaaminen teemakartoilla

Viimeisenä kurssikertana vuorossa oli oman karttaesityksen tuottaminen. Valitsin tarkasteltavaksi alueeksi Afrikan valtiot, joita olimmekin tutkineet jo aiemmalla kurssikerralla. Halusin tuottaa kartan, jossa vertailen valtioiden välistä kehitystä inhimillistä ja sosiaalista hyvinvointia kuvaavien muuttujien avulla. Aineistokseni otin Maailman pankin tietokannasta löytyvän YK:n Agenda 2030 kestävän kehityksen tavoiteista kootun tietokannan ja YK:n inhimillisen kehityksen indeksin tietokannan. Keräsin näistä isommista tietokannoista haluamani Afrikan valtioita koskevat muuttujat ja liitin ne csv. tiedostona ja Join-toimintoa hyödyntäen QGISissä olevaan taustakarttaan. (Sustainable Development Goals 2019, Human Development Data 1990–2018.)

Ensimmäisessä karttaesityksessäni halusin tarkastella valtioiden välisiä eroja inhimillisen kehityksen indeksin avulla (Human Development Index, HDI) (kuva 1). Inhimillisen kehityksen indeksi kuvaa valtioiden kehitystasoa eliniän, koulutuksen sekä elintason (BKT/henkilö) avulla asteikkolla 0–1, jossa 0 on alin taso ja 1 on korkein. Inhimillisen kehityksen indeksi kuvaa jo osaltaan väestön tietotasoa lukutaidon ja koulutuksen osalta, mutta halusin lisäksi tarkastella samalla kartalla, kuinka suuri osuus valtioiden västön yli 15-vuotiaista on lukutaitoisia. Lukutaitoisten osuus on kuvattu teemakartan päällä ympyrädiagrammeina, jotka on suhteutettu muuttujan suuruuteen (Tilastokeskus.)

Kuva 1. Inhimillisen kehityksen indeksi kuvaa valtioiden sijoittumista ja kehitystasoa kolmella mittarilla, jotka ovat elinikä, koulutus sekä elintaso. (Human Development Data 1990–2018, Sustainable Development Goals 2019.)

Inhimillisen kehityksen indeksi on mielekäs tapa tarkastella valtioiden eroja, koska se huomioi talouden mittareiden lisäksi hyvinvoinnin ja inhimillisen kehityksen. Ensimmäisestä karttaesityksestä voi nähdä, että suurimman osan Afrikan valtioista HDI-indeksi on alle 0,55, jota pidetään muihin maailman valtioihin verratessa matalan kehityksen tasona. Kehittyneimmät valtiot löytyvät taas Pohjois- ja Etelä-Afrikasta, ja näissä myös lukutaitoisen väestön osuus on noin 80–95 %. Lukutaito onkin kehittyvissä maissa tärkeässä roolissa niin köyhyyden poistamisessa, naisten aseman parantamisessa kuin demokratian lisäämisessä.

Aineiston kokoamisen osalta kohtasin haasteita siinä, ettei kaikista tarkastelemistani muuttujista löytynyt tieto samalta vuodelta, vaan kartoissa esitetyt tilastot on kerätty vuosilta 2014–2018. Tilastotietoja ei myöskään löytynyt kaikista maista ja erityisesti Somalian ja Länsi-Saharan osalta tilastotiedoissa oli puutteita. Saatavilla olevien tilastojen ollessa puutteellisia, heikentää se tietysti osaltaan myös maiden välistä vertailtavuutta.

Tein myös toisen karttaesityksen Afrikan valtioiden lapsikuolleisuudesta (alle 5-vuotiaat lapset) ja sairaanhoitajien sekä kätilöiden määrästä 1000 asukasta kohden (kuva 2). Kätilöillä on tärkeä rooli äitiys- ja lapsikuolleisuuden vähentämisessä, ja lisäksi heidän määränsä kertoo valtion kehitystasosta sekä terveydenhuoltopalveluiden laadusta ja saatavuudesta. Lapsikuolleisuuden määrään valtioissa vaikuttaa tietysti kuitenkin myös monet muutkin tekijät kuten puhtaan veden, ravitsemuksen ja lääkkeiden saanti. (Laakso 2019.)

Kuva 2. Lapsikuolleisuuden määrä kertoo osaltaan valtion kehitystasosta. Sairaanhoitajien ja kätilöiden määrä on yksi muuttuja joka vaikuttaa valtioiden lapsikuolleisuuteen ja samalla kuvastaa valtion terveydenhuoltopalveluiden saatavuutta. (Human Development Data 1990–2018, Sustainable Development Goals 2019.)

Toinen karttaesitykseni näyttää, että lapsikuolemat keskittyvät etenkin Saharan eteläpuoliseen Afrikkaan, joista kartalta hälyttävästi nousevat ainakin Chad, Nigeria ja Keski-Afrikan tasavalta. Matalimmat lapsikuolleisuus luvut ovat puolestaan Pohjois-Afrikan valtioista Egyptissä, Libyassa, Tunisiassa ja Algeriassa.

Näissä kummassakin karttaesityksessä visualisoitavaa tilastotietoa etsiessäni korostui selvästi se, ettei aina haluttua tilastoaineistoa ole välttämättä saatavilla ja eri maiden välisissä tilastointitarkkuuksissa ja säännöllisyyksissä on paljon eroja. Varsinkin sairaanhoitajien ja kätilöiden määrien tilastotiedoissa oli puutteita, joten karttaesityksessä osasta valtioista tämän muuttujan tieto puuttuu.

Aineistopuutteista huolimatta olen erittäin tyytyväinen näihin karttaesityksiin. Ne kuvaavat selkeästi Afrikan valtioiden välisiä eroja ja tuovat esille sekä niitä valtioita, joissa kehityssuunta on jo positiivinen että osaltaan valtioita, joissa kestävän kehityksen tavoitteiden saavuttaminen kaipaa edelleen parannusta. Vastaavien karttaesitysten toistaminen olisi myös mielenkiintoista vaikka 10 vuoden välein, jolloin muuttujien kehitystä pystyisi tarkastelemaan myös pidemmällä aikavälillä.

Tiia Laisi (2020) olikin omassa blogissaan tuottanut erittäin mielenkiintoisen aikasarjan maailman väestönkasvusta vuosilta 1990 ja 2020, sekä vuoden 2045 väestöennusteesta. Laisin (2020) tuottamista väestökarttoista pystyy hyvin havaitsemaan, miten väestönkehitys on hyvin erilaista ympäri maailmaa ja miten väestökeskittymät ovat jatkuvassa muutoksessa. Mielestäni kartat soveltuvat hyvin myös opetuskäyttöön, jossa niitä voisi käyttää tausta-aineistona muun muassa pohdittaessa, millaisia seurauksia ja vaikutuksia väestönkasvulla tai toisaalta vähenemisellä on eri maihin.

Yhteenveto kurssilla opitusta

Näin viimeisen kurssikerran päätteeksi palasin vielä lukemaan ensimmäistä blogikirjoitustani ja kurssin alussa miettimiäni oppimistavoitteita. Mielestäni olen kokonaisuutena saanut hyvän käsityksen QGIS paikkatietojärjestelmän käyttömahdollisuuksista ja ominaisuuksista. Olen käytännön kautta huomannut, miten järjestelmä mahdollistaa alueellisten tietojen käsittelyn, analysoinnin sekä visualisoinnin selkeäksi karttaesitykseksi. Monet paikkatietoaineistoa koskevat käsitteet ja analyysitavat ovat konkretisoituneet kurssin harjoitusten kautta. Voinkin sanoa kurssin päätteeksi saaneeni erittäin hyvän peruskäsityksen ja opin geoinformatiikan menetelmistä.

 

Lähteet:

Human Development Data 1990-2018. (2019). Human Development Report 2019. United Nations Development Programme (UNDP). Viittauspäivä 26.2.2020. <http://hdr.undp.org/en/2019-report>

Laakso, T. (2019). Äitiys- ja lapsikuolleisuuden väheneminen on ollut ”huikaiseva menestys”, sanoo WHO – Silti joka 11:s sekunti joko äiti tai lapsi kuolee. Maailma.net. Viittauspäivä 26.2.2020.<https://www.maailma.net/uutiset/aitiys-ja-lapsikuolleisuuden-vaheneminen-on-ollut-huikaiseva-menestys-sanoo-who-silti-joka>

Laisi, T. (2020). Kurssikerta 7. Omia karttaesityksiä. Viittauspäivä 9.3.2020. <https://blogs.helsinki.fi/tlaisi/2020/02/26/viimeinen-kurssikerta/>

Sustainable Development Goals. (2019). The World Bank. Viittauspäivä 26.2.2020. <https://datacatalog.worldbank.org/dataset/sustainable-development-goals>

Tilastokeskus. Inhimillisen kehityksen mittaus. Viittauspäivä 26.2.2020 <https://www.stat.fi/tup/tietoaika/tilaajat/ta_04_02_melkas.html>

Riskien kuvaamista kartalla

Kuudennen kurssikerran aluksi jalkauduimme GIS-luokasta ulos tekemään havaintoja ja aineistonkeruuta maastosta. Kiertelimme parin kanssa Kumpulan kampuksen lähimaastossa noin tunnin ajan ja tarkastelimme julkisten tilojen, kuten puistojen ja katujen, turvallisuutta ja viihtyisyyttä. Tekemämme havainnot keräsimme Epicollect5-sovellukseen, joka puhelimen GPS paikannuksen avulla sai tuotettua niistä suoraan pisteaineistoa. 

Epicollect5-sovellus olikin yksinkertainen ja näppärä tapa tuottaa havainnointeihimme perustuvaa paikkatietoaineistoa, jota luokkaan palattuamme tarkastelimme ja hyödynsimme lisää. Kaikkien ryhmäläisten keräämien havaintojen avulla pystyimme tekemään pienimuotoista aluetutkimusta ja interpoloimalla havaintopisteiden välit saimme tuotettua karttaesityksen, joka kuvasi muun muassa miten turvalliseksi Kumpulan kampuksen lähiympäristö koetaan (kuva 1). Esimerkiksi jo tästä pienestä otannastamme nousi esiin, että Kustaa Vaasan tien ahkerasti liikennöity risteys koetaan vaaralliseksi.

Kuva 1. Kumpulan kampuksen läheisyydestä kerätyt pistehavainnot interpoloituna. Pistehavainnot kuvastavat sitä, kuinka turvallisena alue koetaan.

Kumpulan kampuksen lähiympäristön turvallisuuden tarkastelun jälkeen siirryimmekin tarkastelemaan luonnonkatastrofeja ja riskejä globaalimmalla mittakaavalla ja erityisesti tarkoitus oli tuottaa opetuskäyttöön soveltuvia karttaesityksiä endogeenisten ilmiöiden esiintymisestä.

Kuva 2. Vuosina 2000–2020 tapahtuneet vähintään magnitudi 6 maanjäristykset. (United States Geological Survey)

Ensimmäinen karttani (kuva 2) esittää päälle magnitudi 6 maanjäristyksiä viimeisen 20 vuoden aikana. Kartta visualisoi selvästi, miten suurin osa maanjäristyksistä tapahtuu litosfäärilaattojen saumakohdissa, joissa laatat työntyvät toistensa alle, erkanevat tai sivuavat toisiaan. Maanjäristyksiä tapahtuu myös laattojen sisäosissa, mutta huomattavasti harvemmin. Kartta visualisoi myös, miten pienempiä maanjäristyksiä tapahtuu usein ja isompia taas harvemmin. Voimakkaita magnitudi 6,0–6,9 maanjäristyksiä tapahtuu vuodessa noin 120 kun erittäin voimmakkaita ja tuhoisia  magnitudi 8,0 tai suurempia tapahtuu muutama.

Toisessa karttaesityksessäni (kuva 3) halusin tarkastella seismisyyttä ja vulkanismia Euroopassa. Opetuskäyttöä ajatellen monet ilmiöt saattavat usein konkretisoitua, kun niitä tarkastelee lähempänä omaa elin- ja kokemusympäristöä. Tämän kartan avulla pystyy hahmottamaan Atlantilla sijaitsevan Euraasian ja Pohjois-Amerikan laatan erkanemissauman sekä Välimerellä sijaitsevan Afrikan ja Euraasian laatan törmäyssauman. Karttaesityksestäni tosin uupuu näitä litosfäärilaattojen liikesuuntia ja rajatyyppejä ilmaisevat merkit, jotka on huomattavasti selkeämmin esitetty Johomaps-sivustolla sijaitsevassa kartassa (Johomaps).

Kuva 3. Välimeren alue on erityisesti maanjäristyksille herkkää aluetta, koska se sijaitsee Euraasian ja Afrikan laatat törmäyskohdassa. Kartalla on esitetty 2000–2020 välillä tapahtuneet vähintään magnitudi 6 maanjäristykset ja vuoden 1964 jälkeen tapahtuneet tulivuorenpurkaukset. (United States Geological Survey, NOAA Volcano Location Database Search)

Vuosina 2000–2020 tapahtuneiden maanjäristysten lisäksi kartalle on lisätty  lähihistoriassa tapahtuneet tulivuorenpurkaukset.  Karttaesityksestä olisi jo helppo pohtia vulkanismin ja seismisyyden yhteyttä laattatektoniikkaan ja lisäksi, millaisia uhkia nämä luonnonilmiöt aiheuttavat niiden esiintymisalueilla. Karttaesityksestä voisi tarkastella esimerkiksi erityisesti maanjäristyksille herkkää Välimeren aluetta, joka on myös suosittu lomakohde. Myös SHARE-projekti on selvittänyt Euroopan maiden seismisen hasardin tasoa ja projektin lopputuloksena syntynyt karttaesitys visualisoi hyvin riskialttiit alueet. SHARE-projektista voi lukea lisää täältä. (Giardini, Woessner & Danciu 2013.)

Suosittuja lomakohteita löytyy myös Aasiasta Tyynenmeren tulirenkaaksi nimitetyltä alueelta (kuva 4). Tyynenmeren tulirengas on nimitys alueelle joka kiertää Tyyntämerta. Alueella sijaitsee suurin osa maapallon aktiivisista tulivuorista ja siellä tapahtuu lähes 90 % kaikista maanjäristyksistä. (Yle 2017.)

Kuva 4. Tyynenmeren tulirengas on nimitys alueelle joka kiertää Tyyntämerta. Kuva: Yle Uutisgrafiikka 2017
Kuva 5. Tyynenmeren tulirenkaan alueella sijaitsee suurin osa maapallon aktiivisista tulivuorista ja siellä tapahtuu lähes 90 % kaikista maanjäristyksistä. (United States Geological Survey, NOAA Volcano Location Database Search, Yle 2017)

Kolmas karttaesitykseni (kuva 5) kuvaakin Kaakkois-Aasian puoleista osaa Tyynenmeren tulirenkaan alueesta, ja vertaamalla sitä Eurooppaa esittävään karttaan, on helppo hahmottaa, millainen ero alueiden välillä on arvioitaessa todennäköisyyttä maanjäristyksen tai tulivuorenpurkauksen toteutumiselle.

Kunkin alueen riskitasoon vaikuttaa kuitenkin riskin toteutumisen todennäköisyyden lisäksi alueen selviytymiskyky ja haavoittuvuus riskin tapahtuessa. Carita  Aapro-Koski (2020) toteaakin osuvasti blogissaan, että opetustilanteessa olisi hyvä myös pohtia, millaisia henkilö- ja aineellisia vahinkoja maanjäristykset aiheuttavat osuessaan tiheästi asutulle alueelle. Muun muassa Our World in Data -sivustolta löytyy Hannah Ritchien ja Max Roserin (2019) tuottamia informatiivisia diagrammeja eri luonnonkatastrofien vaatimista henkilövahingoista ja taloudellisista menetyksistä.

Yleistäen voidaan sanoa, että suurin osa taloudellisista vahingoista koskettaa kehittyneitä teollisuusmaita, kun taas suurin osa kuolonuhreista on kehittyvissä maissa. Tämä johtuu juuri infrastruktuurista ja siitä ettei kehittyvien maiden rakennuksia ole useinkaan suunniteltu kestämään maanjäristysten aiheuttamaa heiluntaa ja tärinää. Oikealla rakennussuunnittelulla on siis keskeinen merkitys sekä kuolonuhrien että taloudellisten menetysten vähentämisessä.

Lähteet:

Aapro-Koski, C. (2020). Kurssikerta 6: Karttoja opetustarkoitukseen. Viittauspäivä 22.2.2020. <https://blogs.helsinki.fi/aacarita/>

Giardini, D., Woessner J. & Danciu L. (2013). Seismic Hazard Harmonization in Europe (SHARE). Viittauspäivä 22.2.2020. <https://ec.europa.eu/programmes/horizon2020/en/news/safer-buildings-lower-risks-reducing-damage-caused-earthquakes-europe>

Johomaps. Tectonic Plates of the Earth. Viittauspäivä 22.2.2020. <http://www.johomaps.com/world/worldtecton.html>

NOAA Volcano Location Database Search. NOAA National Centers for Environmental Information (NCEI). Viittauspäivä 22.02.2020. <https://www.ngdc.noaa.gov/nndc/struts/form?t=102557&s=5&d=5>

Ritchie, H. & Roser, M. (2020).  Natural Disasters. Our World In Data. Viittauspäivä 22.02.2020. <https://ourworldindata.org/natural-disasters>

United States Geological Survey. Earthquake Catalog. Viittauspäivä 22.02.2020. <https://earthquake.usgs.gov/earthquakes/search/>

Yle. (2017). Miksi maa järisi taas Meksikossa? – Tunnetko Tulirenkaan ja Kookoslaatan? Viittauspäivä 22.2.2020. <https://yle.fi/uutiset/3-9841716>

Analyysityökaluilla uutta tietoa

Kurssin edetessä olemme yhä enemmän siirtyneet kohti paikkatietoaineistojen analyysi- ja muunnosmenetelmiä. Siinä, missä kurssin alussa lähdimme liikkeelle siitä, että visualisoimme valmista paikkatietoaineistoa, on nyt painopiste siirtynyt siihen, että oppisimme ja osaisimme valjastaa käytettävissä olevan paikkatietoaineistoja omiin tarpeisiimme ja tuottaa siitä uutta tietoa.

Keskeisiä ominaisuuksia paikkatietoaineiston käsittelyssä onkin siitä tehtävät analyysit ja kyselyt, joista tällä kurssikerralla tutustuimme tarkemmin vektoriaineiston perusanalyyseistä buffer- eli puskurivyöhykkeeseen ja päällekkäisanalyysin (overlay). Näitä analyysityökaluja voidaan hyödyntää sekä yhdessä että erikseen tuottamaan uutta paikkatietoa.

Puskuroinnissa valittujen vektorikohteiden ympärille määritetään halutun levyinen vyöhyke, josta syntyy uusi alue/karttataso. Yhdistämällä tähän päällekkäisanalyysi voidaan laskea, kuinka monta pistemuotoista kohdetta vyöhykkeen sisä- tai ulkopuolelle rajautuu. Näiden avulla voi siis tutkia erilaisten alueellisten kohteiden päällekkäisyyksiä ja yhteyksiä.

Tätä toimintoa hyödyntäen laskimmekin muun muassa Malmin lentokentän ja Helsinki-Vantaan lentoaseman melualueilla asuvien ihmisten määriä (taulukko 1), joukkoliikennepysäkkien vaikutusalueiden väestötietoja (taulukko 2) sekä taajamien väestötietoja (taulukko 3). Harjoitusten tulokset ovat nähtävissä taulukoissa.

Puskurivyöhyke ja päällekkäisanalyysityökalun avulla saatu paikkatietoaineisto tarjoaa siis monenlaisia käyttömahdollisuuksia paikkatietoperusteiseen optimointiin ja päätöksentekoon. Tällaisia paikkatietoaineistoanalyysejä voikin hyödyntää niin julkinen sektori kuin kaupalliset toimijat vaikutustenarvioinnissa, aluesuunnittelussa, saavutettavuutta arvioitaessa tai vaikkapa uuden kaupan sijaintia ja sen asiakaskuntaa selvitettäessä. Koska paikkatietojärjestelmien päätehtävä on helpottaa alueellisten ilmiöiden tarkastelua, ovat nämä analyysityökalut keskeisiä.

Itsestään tietysti paikkatietojärjestelmä ja sen työkalut eivät analyysejä pysty tekemään, vaan olennaiset osat kokonaisuutta ovat hyödynnettävät paikkatietoaineistot ja itse käyttäjät. Paikkatietoaineiston osalta huomioitavaa on muun muassa aineiston saatavuus, mahdollinen hinta, laatu ja luotettavuus. Myös aineiston kerääjän ja käsittelijän tarkkuudella ja ammattitaidolla on kriittinen merkitys siinä, millaisia paikkatietoaineistoja ja karttaesityksiä lopputuloksena syntyy. Paikkatietojärjestelmän käyttäjältä vaaditaankin ymmärrystä käsiteltävistä aineistoista sekä spatiaalisista analyyseistä.

Kurssikerran itsenäistehtävän kanssa tulikin tilanne, jossa tällaiselta aloittelevalta paikkatieto-osaajalta otettiin apupyörät pois ja edessä oli omien ongelmanratkaisutaitojen testaaminen QGISillä. Tehtävässä kartoitin vuosina 1965–1970 rakennettujen kerrostalojen määrää ja sijaintia sekä Helsingissä että koko pääkaupunkiseudulla (taulukko 4) ja visualisoin tulokset teemakartoiksi (kuva 1 ja kuva 2). Tällaisesta tiedosta voisi olla kiinnostunut esimerkiksi remonttiyritys, joka kartoittaisi itselleen asiakkaita linjasaneerausta  tarvitsevista taloyhtiöistä.

 

Kuva 1. Vuosina 1965–1970 rakennettujen kerrostalojen osuus pääkaupunkiseudun kerrostalokannasta on suurin Lehtisaaressa, Hämevaarassa ja Kauniaisissa.
Kuva 2. Helsingissä eniten 1965–1970 rakennettuja kerrostaloja on Lehtisaaressa, Kontulassa ja Vuosaaressa.

Karttaesityksen tuottamisessa oli avainasemassa aineiston suodattaminen ja valikoiminen isommasta pääkaupunkiseudun rakennuksia edustavasta pisteaineistosta. Suodatin aineistosta pienempiä osajoukkoja niiden sijainnin, käyttötarkoituksen ja rakennusvuosien perusteella, joita sitten tarkastelin ja muokkasin lisää erillisinä karttatasoina.

Myös Alex Nylander (2020) oli tarttunut tähän putkiremonttikohteita koskevaan tehtävään ja olen hänen kanssaan samaa mieltä siitä, että erityisesti haastetta lopulta aiheuttikin aineiston yhdistäminen samaan karttatasoon, jotta siitä sai suoritettua laskutoimituksia field calculator-työkalulla ja lopulta visualisoitua karttaesitykseksi. Itsellenikään ei meinannut aluksi muistua aiemmilta kurssikerroilta mieleen, miten sain yksittäisiä rakennuksia edustavan pisteaineiston määrän laskettua kaupunginosia kuvaavien polygonialueiden sisältä.

Kokeilin sekä Join attributes by location että Count points in polygon –toimintoa tähän ratkaisuksi, joilla kummallakin sai saman lopputuloksen, mutta joista jälkimmäinen oli tähän tehtävään lopulta ehdottomasti loogisempi vaihtoehto. Kun pistaineistojen määrät oli saatu polygonitason kanssa samaan tietokantaan onnistuikin niistä laskutoimitusten tekeminen jo paljon helpommin. Vielä ennen teemakartan visualisointia poistin tuloksista kaikki kohteet, joissa ei ollut lainkaan haluttuja kohteita eli 1965–1970 rakennettuja kerrostaloja. 

Tässä tehtävässä mielestäni korostui erityisesti se, miten aineiston käsittely saattaa vaatia useita eri välivaiheita ennen kuin se on käyttötarkoitukseen sopivassa muodossa. Toisaalta myös tietokantojen sisältämän tiedon monipuolisuus tuli esille ja sen useat eri muokkaus- ja analysointimahdollisuudet. 

Mielestäni QGIS vaatii kuitenkin käyttäjältään paljon asiantuntemusta ja perehtyneisyyttä sen ominaisuuksiin sekä tietämystä paikkatietoaineistosta. Siinä missä järjestelmä suorittaa monia toimintoja, tietokantaliitoksia ja analyysejä muutamissa sekunneissa, tulisi käyttäjän kuitenkin olla ohjaksissa arvioidakseen sekä hyödynnetyn lähdeaineiston luotettavuutta että järjestelmässä suoritettujen toimenpiteiden virheettömyyttä. Tähän mennessä koen kuitenkin vasta raapaisseeni QGISin toimintojen pintaa, ja tilanne on kohdallani varmasti enemmin niin, että QGIS vie minua 10–0 kuin toisin päin.  🙂

Lähteet:

Nylander, A. (2020). Kurssikerta 5: Buffereita ja väestöanalyysejä. Viittauspäivä 16.2.2020. <https://blogs.helsinki.fi/alny/2020/02/18/kurssikerta-5-buffereita-ja-vaestoanalyyseja/>

Pisteaineistosta ruututeemakartaksi

Tällä kerralla vuorossa oli pisteaineiston visualisointi ruututeemakartalla. Lähtöaineistonamme toimi pääkaupunkiseudun kuntien asuinrakennuksista ja asukkaista kerätty tietokanta, joka olikin massiivinen lähes 95 000 kohdetta sisältävä pisteaineisto (kuva 1). Näistä pisteistä jokainen kohde esitti todellista rakennusta ja piti sisällään tiedon muun muassa asuntorakennuksen rakennusvuodesta, rakennuksessa asuvien ihmisten määrästä sekä sukupuoli- ja ikäjakaumasta. Käytettävissämme oli siis erittäin paljon dataa.

Kuva 1. Tässä vektorimuotoisessa pisteaineistossa jokainen piste esittää todellista rakennusta pääkaupunkiseudulla.

Pisteaineiston etuna on tietysti tiedon tarkka paikannettavuus ja pistekartalla voikin esittää ilmiön sijoittumista, levinneisyyttä ja voimakkuutta. Jos aineistosta haluaa kuitenkin tunnistaa alueiden välisiä eroja tai keskittymiä, onnistuu se paremmin aluejakoon perustuvalla kartalla. Aluejakoon perustuvia karttoja ovat muun muassa aiemmilta kurssikerroilta tuttu koropleettikartta ja tällä kertaa vuorossa oleva ruutukartta.

Ruutukartassa tarkasteltu alue jaetaan tasakokoisin ruutuihin ja kartan aluejakona toimii nämä tilastoruudukot. Ruudut voivat olla kooltaan vaikkapa 250 m x 250 m, 1 km x 1 km tai 5 km x 5 km, eivätkä siis noudata mitään hallinnollista aluejakoa. Tästä syystä ruutukartta tarjoaakin hyvän keinon tarkastella alueellisten ilmiöiden leviämistä hallinnollisista aluerajoista riippumatta. Aiemmista blogijulkaisuista tutut koropleettikartat perustuvat aina sen sijaan johonkin valmiiseen aluejakoon.

Ruutukartta eroaa koropleettikartasta myös siinä, että sillä voi esittää sekä absoluuttisia että suhteellisia lukuja. Ruututeemakartta soveltuukin absoluuttisten arvojen, kuten väestömäärän, esittämiseen, koska ruudut ovat yhtä suuria, eikä niiden kokoero väärennä tulosta.

Tämän kurssikerran karttaesityksessäni päädyin esittämään miesten suhteellista osuutta väestöstä 1 km x 1 km kokoisilla tilastoruuduilla (kuva 2). Ennen teemakartan tekemistä karsin aineistosta pois kaikki kohteet, joissa väestömäärä oli ≤ 1, etteivät ne vääristäisi liikaa lopputulosta.

Kuva 2. Kurssikerralla tuotimme pääkaupunkiseudusta ruutukartan, johon liitimme pisteaineistosta paikkasidonnaista tietoa. Kartalla visualisoitu miesten osuus väestöstä 1 km x 1 km kokoisilla tilastoruuduilla.

Lopputuloksena syntynyt kartta kuvaa mielestäni onnistuneesti pääkaupunkiseudun sukupuolijakaumaa. Ruutukartan värityksessä päätin korostaa sinisellä värillä ruutuja, joissa miehiä on enemmän ja punaisella taas niitä, joissa naisia on enemmän. Lisäksi valitsin korostusvärin ruuduille, joissa naisia ja miehiä on suunnilleen saman verran. 1 km x 1 km kokoinen ruutu soveltui hyvin valitsemalleni aineistolle, koska se toi esille alueiden välistä vaihtelua säilyttäen samalla ilmiön paikannettavuuden niin, että kartalta on tunnistettavissa eri asuinalueet ja kaupunginosat.

Karttaesityksen heikkoutuna toisaalta on sen puutteellinen taustakartta ja siksi alueiden huono paikannettavuus ilman hyvää aluetuntemusta tai muuta apukarttaa. Kartan tulkintaa helpottaisi ehdottomasti tarkempi taustakartta, johon olisi merkittynä ainakin suurimmat liikenneväylät sekä isoimpien asutuskeskittymien nimistö.

Tuija Hyvättinen (2020) oli omassa blogissaan tarkastellut myös pääkaupunkiseudun sukupuolijakaumaa, ja voin yhtyä hänen tekemiinsä huomioihin, että pääkaupunkiseudun kunnista Helsinki näyttää olevan naisvaltaisin, kun taas Espoossa ja Vantaalla sukupuolijakauma on huomattavasti tasaisempi. Lieneekö tästä syy vai seuraus, että esimerkiksi Helsingin yliopiston tutkinto-opiskelijoistakin vuonna 2018 64 % oli naisia. (Helsingin yliopisto numeroina 2019.) Vastaavasti kartalta on myös tunnistettavissa miesvaltaisena alueena Aalto-yliopiston kampusalue Espoossa.

Myös Itä-Vantaa ja sieltä esimerkiksi Hakunila nousee kartalta alueena, jossa miesten osuus väestöstä on naisia suurempi. Tällä alueella on tunnistettavissa myös muita kehitystrendejä, kuten alhainen väestönkasvu ja väestön ikääntyminen (Parviainen 2019). Varmasti ainakin osittain alueen kehno maine vaikuttaa siihen, ettei alueella asu eikä sinne muuta enemmän pariskuntia ja lapsiperheitä, jotka osaltaan tasaisivat alueen sukupuoli- ja ikäjakaumaa.

Kaikissa karttaesityksissä siis se, mitä ja miten esitetään ja millä mittakaavalla vaikuttaa esitystavan valintaan. Harvoin mikään alueellinen ilmiö noudattaa ennalta säädettyä rajaa, ja siksi tällä kurssikerralla tarkasteltu ruutukartta on hyvä esitystapa, kun halutaan tarkastella ilmiön esiintymistä, leviämistä ja vaihtelua hallinnollisista rajoista riippumatta. Koropleettikartta on taas parhaimmillaan silloin, kun aluerajat liittyvät kuvattavaan ilmiöön tai tarkastellaan laajoja alueita. (Tilastokeskus a., Tilastokeskus b.)

Lähteet:

Helsingin yliopisto numeroina. (2019). Helsingin yliopisto. Viittauspäivä 6.2.2020. <https://www.helsinki.fi/fi/yliopisto/tutustu-helsingin-yliopistoon/helsingin-yliopisto-numeroina#section-11420>

Hyvättinen, T. (2020). Rasterit kehiin! Viittauspäivä 6.2.2020. <https://blogs.helsinki.fi/hytuija/2020/02/06/rasterit-kehiin/>

Parviainen, E. (2019). Vantaan väestö 2018/2019. Vantaan kaupunki. Tietopalvelu B4. Viittauspäivä 6.2.2020. <https://www.vantaa.fi/hallinto_ja_talous/tietoa_vantaasta/tilastot_ja_tutkimukset/vaesto_ja_ennuste>

Tilastokeskus a. Tilastoteemakartat: ruutukartta. Viittauspäivä 6.2.2020. <https://tilastokoulu.stat.fi/verkkokoulu_v2.xql?course_id=tkoulu_teemak&lesson_id=4&subject_id=3&page_type=sisalto>

Tilastokeskus b.  Tilastoteemakartat: Koropleettikartta. Viittauspäivä 6.2.2020. <https://tilastokoulu.stat.fi/verkkokoulu_v2.xql?course_id=tkoulu_teemak&lesson_id=4&subject_id=2&page_type=sisalto>