Viikko 7 – Geostatistinen interpolointi

Kurssin viimeinen viikko jatkui interpolointien parissa. Vedimme tällä viikolla viivan determinististen sekä geostatististen interpolointien välille, ja käsittelimme niiden eroavaisuuksia. Viime viikko keskittyi pääasiassa deterministisiin interpolointimenetelmiin, kuten IDW- ja Kernel-interpolointiin. Deterministinen interpolointi ei hyödynnä tilastotiedettä samalla tavalla kuin geostatistinen interpolointi, vaan rakentuu lähinnä vierekkäisten mittauspisteiden arvojen perusteella. Geostatistinen interpolointi ottaa puolestaan kattavammin huomioon muuttujien spatiaalisen vaihtelun. Interpolointi painottuu tällöin spatiaaliseen autokorrelaatioon ja tilastotieteeseen. Spatiaalisen autokorrelaation ideana on, että kohteet jotka ovat lähekkäin toisiaan, ovat enemmän riippuvaisia toisistaan kuin kaukana sijaitsevat kohteet. Spatiaalinen tilastotiede (johon geostatistinen interpolointi pohjautuu) olettaakin, että tällaista riippuvuutta esiintyy luonnossa. Menetelmä mahdollistaa siksi myös virhemarginaalien tarkastelun, ja tulosten validiteetin kattavamman arvioinnin.

Viikon harjoitustehtävät painottuivat pääasiassa geostatistiseen kriging-interpolointiin. Vertasimme ensimmäisessä tehtävässä (Interpolate temperatures using the Geostatistical Wizard) IDW- ja kriging-interpolointia. Toisin sanoen tutkimme miten deterministinen interpolointi ja geostatistinen interpolointi käytännössä eroavat keskenään ja mitä samankaltaisuuksia niillä mahdollisesti on. Kriging-interpolointi huomioi spatiaalisen autokorrelaation voimakkuutta ja ulottumista, jolloin sen avulla voidaan myös laskea todennäköisyyksiä, virheitä sekä luotettavuutta. Sanoisin siis hypoteesina jo nyt, että kriging-interpolointi osoittautuu tehtävässä “paremmaksi” menetelmäksi tulosten tarkasteluun. Vertailimme tehtävässä näitä kahta menetelmää interpoloimalla dataa Afrikassa tehdyistä lämpötila mittauksista.

Ensin loimme datan perusteella histogrammin lämpötilamittauksista, sillä lämpötilojen jakautumista on helpompi tutkia sen avulla. Tämä työvaihe tuli tutuksi jo viime viikon harjoitustehtävissä. Histogrammia tutkiessa voidaankin huomata, että elokuun lämpötilat seuraavat aika hyvin normaalijakaumaa, jolloin myös geostatistinen interpolointi on kaikista tehokkainta. (Pakko myöntää etten vieläkään pienen pohtimisen jälkeen ole täysin varma miksi interpolointi on tällöin tehokkainta, näin kuitenkin todettiin tehtävässä.) Tämän havainnon jälkeen suoritimme ensin IDW-interpoloinnin elokuussa mitatuilla arvoilla. Suoritimme kaksi IDW-interpolointia, joista toista on optimoitu dataan sopivammaksi muuttamalla tiettyjä parametreja (kuva 1).

Kuva 1. Vasemmalla on IDW smooth -taso ja oikealla  IDW Smooth Optimized -taso. (Lähde: Esri Academy – Interpolate temperatures using the Geostatistical Wizard)

Kuten kuvasta 1 voidaan todeta, punaiset alueet (eli korkeimmat lämpötila estimaatit) kattavat nyt kartalla laajemman alueen. Tasot ovat muuten hyvin samanlaisia ja on hyvin vaikea spontaanisti sanoa, kumpi näistä on luotettavampi. Tutkimme siksi tuloksia seuraavaksi ristiinvalidoinnin avulla. Keskityimme tarkkailemaan tasojen neliöllistä keskiarvoa (root mean square). Mitä lähempänä keskiarvo on nollaa, sen täsmällisempi taso on. Nopean ristiinvalidoinnin perusteella voidaankin sanoa, että IDW Smooth Optimized -tasolla on pienempi virhemarginaali ja sitä voidaan siksi pitää luotettavampana.

IDW-tasojen tutkailun jälkeen siirryimme kriging-interpolointiin. Geostatistisen luonteen takia kriging-interpolointi tarjoaa paljon enemmän tunnuslukuja ja muuttujia, joiden avulla datan luotettavuutta voidaan tutkia. Tehtävässä lueteltiinkin pitkä lista eri parametreja ja niiden vaikutuksia interpoloinnin tulokseen. Tämä oli omasta mielestäni erittäin hyödyllistä ja auttoi ymmärtämään interpolointi-prosessia edes jonkin verran syvemmin. Suoritimme siis kaksi kriging interpolointia: kriging default ja kriging modified. Alkuperäistä interpolointia modifioitiin mm. optimoimalla ja määrittämällä sen “sector type” niin, ettei yksittäisen suunnan naapureilla olisi yhtä isoa vaikutusta tuloksessa.

Kuva 2. Interpoloinnin tuloksena saatu Kriging modified -taso, josta on laadittu lämpötiloja mallintava kartta. (Lähde: Esri Academy – Interpolate temperatures using the Geostatistical Wizard)

Tämän jälkeen vertailimme tasoja ristiinvalidoinnin avulla. Tasojen tunnusluvut olivat niin lähellä toisiaan, ettei tässä tapauksessa ollut kirkkaan selvää kumpi on luotettavampi. Kriging modified -tasolla oli kuitenkin hieman parempi neliöllinen keskiarvo, ja tämän perusteella valitsimme sen kriging default -tason sijaan. Kun näitä molempia tasoja verrattiin puolestaan aikaisempaan IDW Smooth Optimized -tasoon, huomattiin että kriging-interpoloinnilla saadut tulokset olivat kaiken kaikkiaan tarkempia. Ihan viimeisenä laadimme vielä kriging modified -tasolle näppärän virhekartan (kuva 3), joka kuvaa interpoloinnin luotettavuutta eri puolilla karttaa.

Kuva 3. Virhekartta. (Lähde: Esri Academy – Interpolate temperatures using the Geostatistical Wizard)

Toisessa harjoitustehtävässä (Analyze Urban Heat Using Kriging) tutkimme lämpösaarekeilmiötä Madisonin kaupungissa, Wisconsinissa, ja sen vaikutusta kaupungissa asuviin – varsinkin riskiryhmään kuuluviin vanhempiin asukkaisiin. Tehtävässä hankalinta oli ehkäpä termien ja konseptien järkevä kääntäminen suomen kielelle. Käytimme tässäkin tehtävässä apuna kriging-interpolointia ja aloitimme ensin luomalla datan pohjalta histogrammin (kuva 4), jotta voitaisiin määrittää onko lämpösaarekeilmiö alueella edes todellinen. Nopean tarkastelun jälkeen voidaan todeta, että lämpösaarekeilmiö on havaittavissa, sillä alimmat lämpötilat sijoittuvat kaupunkia ympäröiville alueille ja korkeimmat lämpötilat kaupungin keskusalueille.

Kuva 4. Histogrammi datasta. (Lähde: Esri Academy – Analyze Urban Heat Using Kriging)

Tämän jälkeen suoritimme ensin (simple) kriging-interpoloinnin. Säädimme interpoloinnin parametrejä niin, että virhemarginaali olisi mahdollisimman pieni. Myös interpoloinnin tulosta tarkastellessa voidaan todeta, että lämpösaarekeilmiö on todellinen (kuva 5). Tehtävässä olennaista oli simple kriging -interpoloinnin vertaaminen bayesian kriging -interpolointiin. Näin lyhyesti selitettynä geostatinen interpolointi pohjautuu semivariogrammeihin (ilmaisevat riippuvuuden määrää datassa). Bayesian kriging -menetelmässä data jaetaan pieniin osiin, ja jokaiselle osalle luodaan oma semivariogrammi yhden koko datan kattavan semivariogrammin sijaan. Näin saadaan vielä tarkempi mallinnus datasta, jossa on yleensä pienemmät virhemarginaalit (kuva 5).

Kuva 5. Vasemmalla simple kriging -interpolointi ja oikealla empirical bayesian kriging -interpolointi. (Lähde: Esri Academy – Analyze Urban Heat Using Kriging)

Seuraavassa työvaiheessa käytimme EBK (empirical bayesian kriging) regression –työkalua. Tämän avulla sisällytimme interpolointiin dataa vettä läpäisemättömistä pinnoista, kuten asfaltoiduista teistä ja parkkipaikoista. Leikkasimme samalla myös tarpeetonta dataa extract by mask -työkalulla. Teimme datasta pistekaavion (kuva 6), joka osoittaa kytköksen mitattujen lämpötilojen ja vettä läpäisemättömien pintojen osuuksista. Pintojen huono absorptio ja suuri albedo vaikuttavat paikallisesti lämpötilaan sitä nostaen. Siksi mitä enemmän vettä läpäisemättömiä pintoja on, sitä korkeammat ovat mitatut lämpötilat.

Kuva 6. Pistekaavio vettä läpäisemättömien pintojen ja lämpötilojen suhteesta. (Lähde: Esri Academy – Analyze Urban Heat Using Kriging)

Pääsimme tekemään tehtävässä myös paljon ristiinvalidointia, kun päätimme mitä kriging-interpoloinnilla saaduista tuloksista on paras käyttää datan syvempään tarkasteluun. Kun olimme valinneet luotettavimman tuloksen, yhdistimme siihen dataa kaupungin alueista  ja tutkimme millä alueilla lämpösaarekeilmiö on voimakkainta. Näihin alueisiin tai niin sanottuihin “blokkeihin” oli sidottuna dataa myös alueen asukkaista. Tämän perusteella pystyimme identifioimaan alueet, joilla riskiryhmään kuuluvien asukkaiden osuus on huomattava. Valitsimme alueet valintatyökalun avulla ja annoimme ehdoiksi “mean is greater than 81” ja “densityover65 is greater than 100000”. Nän ArcGIS määritti alueet, joilla lämpötilan keskiarvo on yli 81 fahrenheitia ja 65-vuotiaiden asukkaiden asukastiheys on enemmän kuin 100000 (kuva 7).

Kuva 7. Yhdistetty data. Oikealla sinisellä alueet, jotka määritetiin valintatyökalulla. (Lähde: Esri Academy – Analyze Urban Heat Using Kriging)

Lähteet

Holopainen et al. (2015). Geoinformatiikka luonnonvarojen hallinnassa. Helsingin yliopiston metsätieteiden laitoksen julkaisuja 7. 

Tehtävälähteet

Interpolate temperatures using the Geostatistical Wizard https://www.arcgis.com/sharing/rest/content/items/0eb5f9204170449da8230fe6a887e053/data


Analyze Urban Heat Using Kriging https://www.esri.com/training/catalog/5b4e36a842cbd2069a939171/analyze-urban-heat-using-kriging/

Viikko 6 – Interpolointi

Kuva: NASA Earth Observatory, Chesapeake Bay

Tällä viikolla tutustuimme interpolointiin ja värikkääseen kirjoon erilaisia interpolointimenetelmiä. Luennolla käsiteltiin muun muassa trendipintainterpolointia, IDW-interpolointia (Inverse Distance Weighted) ja Spline-interpolointia. Käsittelimme myös miten spatiaalisen interpoloinnin laadunvarmennus voidaan suorittaa ristiinvalidoimalla (cross validation). Tällöin jätetään tahalleen osa havaintopisteistä interpoloinnin ulkopuolelle ja verrataan myöhemmin näiden havaintopisteiden arvoja niiden interpoloinnilla estimoituihin arvoihin. Interpoloinnin ideana (näin nopeana kertauksena) on siis määrittää mitattujen kohteiden pohjalta kohteiden välille tiettyjä oletusarvoja. Menetelmiä on useita ja ne vaihtelevat muun muassa interpoloitavan aineiston tai halutun lopputuloksen perusteella. Tällä viikolla olennaisimpia interpolointimenetelmiä oli Kernel-interpolointi ja 3D-interpolointi. 

Ensimmäinen tehtävä (Model Water Quality Using Interpolation) koostui monesta eri osasta ja tuntui, että tehtävää tehdessä kului pienehkö ikuisuus. Harjoittelimme tehtävässä pääasiassa Kernel-interpolointia, jota käytetään yleensä jos interpolointiin suunniteltu aineisto/pinta ei ole jatkuva, vaan siinä on tietynlaisia “esteitä”. Esteitä voi esimerkiksi olla korkeusmallissa esiintyvät korkeuserot eli erilaiset kohoumat tai vajoamat, joita voidaan käyttää rajamaan interpolointia. Ensimmäisessä harjoitustehtävässä tutkimme Chesapeakenlahden happitasoja (dissolved oxygen levels) vuoden 2014 ja 2015 kesinä. Chesapeakenlahti sijaitsee Pohjois-Amerikan itärannikolla ja tämän viikon raportin kansikuva onkin satelliittikuva kyseisestä lahdesta.

Ennen kuin pääsimme itse interpoloinnin pariin, tutkimme dataa erilaisia diagrammeja käyttäen. Loimme muun muassa viivadiagrammit ja histogrammit datasta, jotta voisimme tutkia sen ominaisuuksia. Diagrammin perusteella on helppo tutkia ensinnäkin voiko dataa interpoloida ja miten sitä kannattaa interpoloida. Tarkasteltu data koostui 1984 vuodesta asti mitatuista happipitoisuuksista sekä muista komponenteista. Kartalla kyseinen CSV-muotoinen data ilmenee siis vertikaalisesti, sillä eri vuosien mittaukset ovat “kasaantuneet” päällekkäin ja näyttäytyvät yhtenä pisteenä. En nyt syvennä miten loimme datasta diagrammit, sillä työvaiheiden syvempi selittäminen voi käydä hieman yksitoikkoiseksi. Sen sijaan näytän muutaman kuvan lopputuloksista 🙂

Kuva 1. Viivadiagrammi vuoden 2015 kesän mittauksista. (Lähde: Esri Academy – Model Water Quality Using Interpolation)

 

Kuva 2. Histogrammi vuoden 2015 kesän mittauksista. (Lähde: Esri Academy – Model Water Quality Using Interpolation)

Kun tämä oli tehty, aloitimme Kernel-interpoloinnin. Rajasimme interpolointia lahden rantaviivan avulla eli rantaviiva toimi aiemmin mainittuna “esteenä” (barrier). Erehdyin ensin poistamaan kaikki aikaisemmin tehtävässä määritetyt rajaukset, jonka takia tuli interpoloitua kaikki pisteet kesän 2014 ja 2015 mittauspisteiden sijaan (kuva 3). Huomasin tämän kuitenkin sen jälkeen, kun tehtävän luvut eivät enää sopineet omiin lukuihin datan ristiinvalidoinnissa. Pakitin muutaman työvaiheen taaksepäin ja sain onneksi interpoloitua datan oikein. Tutkimme ja vertailimme dataa tehtävässä siis ristiinvalidoinnin avulla. Työvaihe oli ehkä enemmän itsenäistä oppimista ja syvempää ymmärtämistä varten, joten en siitäkään rupea tässä nyt jaarittelemaan tai raportti venyy liian pitkäksi. Haluan sen sijaan esitellä hienoa layouttia (kuva 4), jonka pääsimme tekemään interpoloinnin tuloksista! Yritin viikolla 4 tehdä jotain vastaavaa, mutta en oikein onnistunut… Oli kiva saada nyt selkeät ohjeet layoutin tekoon niin voi tulevaisuudessakin luoda sellaisia enemmän 🙂

Kuva 3. Kernel-interpolointi koko datasta. Happipitoisuus on kokeimmillaan punaisilla alueilla. (Lähde: Esri Academy – Model Water Quality Using Interpolation)

Kuva 4. Tehtävän perusteella tehty layout tulosten vertailuun. (Lähde: Esri Academy – Model Water Quality Using Interpolation)

Toisessa tehtävässä (Interpolate 3D Oxygen Measurements in Monterey Bay) harjoittelimme 3D-interpolointia ja teimme näppärän video visualisoinnin interpoloinnin lopputuloksesta. Tämäkin tehtävä pyöri tietyn vesistön happipitoisuuksien selvittämisen ympärillä. Tutkimme Kaliforniassa sijaitsevaa Monterey lahtea ja päämääränä oli interpoloinnin avulla luoda happipitoisuuksia ennakoiva yhtenäinen taso. 3D-mallinnus mahdollisti tehtävässä datan vertikaalisuuden tarkemman tutkimisen. Aloitimme luomalla ensin mitatuista happipitoisuuksista histogrammin, joka tässäkin tapauksessa auttoi käsittelemään dataa sekä tutkimaan sen jakaumaa. Vielä kiinnostavampi ja visuaalisesti miellyttävämpi tarkkailumenetelmä oli datan pohjalta laadittu pistekaavio (kuva 5). 

Kuva 5.  Syvyyden (z) ja happipitoisuuden suhde pistekaavion avulla visualisoituna. Yleistettynä syvyyden laskiessa myös happipitoisuus laskee. (Lähde: Esri Academy – Interpolate 3D Oxygen Measurements in Monterey Bay)

Histogrammin ja pistekaavion tutkimisen jälkeen aloitimme varsinaisen 3D-interpoloinnin. Teimme tämän käyttämällä ArcGIS:n Empirical Bayesian Kriging 3D -työkalua. Tämä tehtävä (niin kuin edellinen) koostui myös monista eri työvaiheista ja erinäisistä aspekteista. Tässä raportissa on käyty näitä läpi erittäin pinnallisesti ja työvaiheista saisi kirjoitettua paljon enemmän. Niitä voisi käyttää huomattavasti laajemmin hyväksi omassa pohdinnassa ja harmittaa, etten itse tälle tasolle nyt tekstini kanssa yltänyt. Interpoloinnin jälkeen tapahtui tuttu ristiinvalidointi, jonka jälkeen puolestaan loimme animaation tuloksista (video 1). Animaatio oli erittäin helppo tehdä ArcGIS:n työkalujen avulla, vaikka ensin lisäsin ajatuksissani aivan liian monta freimiä ja animaation lataaminen kesti sen takia ihmeellisen kauan. Tämän jälkeen teimme interpoloinnin perusteella vielä vokseli-tason, jota trimmasimme niin, että alueet jotka eivät sisältäneet dataa leikattiin pois.  Lopputulos oli ihan kivan näköinen ja visualisoi selkeästi haluttua ilmiötä (kuva 6). 

Video 1. Animaatio interpoloinnista. (Lähde: Esri Academy – Interpolate 3D Oxygen Measurements in Monterey Bay)

 

Kuva 6. Vokseli-taso, joka kuvaa vesistön happipitoisuuksia vertikaalisuunnassa. (Lähde: Esri Academy – Interpolate 3D Oxygen Measurements in Monterey Bay)

Lähteet

Holopainen et al. (2015). Geoinformatiikka luonnonvarojen hallinnassa. Helsingin yliopiston metsätieteiden laitoksen julkaisuja 7. 

Tehtävälähteet

Model Water Quality Using Interpolation https://www.esri.com/training/catalog/5a55259913a04b46905e98e2/model-water-quality-using-interpolation/


Interpolate 3D Oxygen Measurements in Monterey Bay
https://www.esri.com/training/catalog/5c6ca9cb440a5667be0f45f3/interpolate-3d-oxygen-measurements-in-monterey-bay/

 

Viikko 5 – Näkyvyysanalyysi ja 3D-analyysi

Viidennen viikon aiheena olivat näkyvyysanalyysit sekä 3D-visualisointi. (Jee!) Näkyvyysanalyyseillä tutkitaan, mitkä alueet tai kohteet on nähtävissä tietyistä katselupisteistä. Tätä voidaan soveltaa moneen oikean elämän eri tilanteeseen ja dilemmaan. Näkyvyysanalyyseistä on hyötyä esimerkiksi, kun halutaan perustaa erilaisia tähystyspaikkoja (niin rajavalvontaan kun lintujen tarkkailuun) tai puhelinverkon tukiasemia. Lisäksi niitä voidaan käyttää apuna tie- ja yhteiskuntasuunnittelussa. Yhteiskuntasuunnittelussa voidaan joko piilottaa tai tuoda esiin haluttuja kohteita. Näkyvyysanalyysit tehdään pääasiassa korkeusmallien avulla. Näkyvyys määritetään sen perusteella leikkaako katselupisteen ja tarkkailtavan kohteen välinen suora korkeusmalin. Näkyvyysanalyyseistä keskityimme sekä luennolla että viikon tehtävissä viewshed ja line of sight -analyyseihin. Pakko sanoa, että pidin tämän viikon tehtävistä todella paljon – lähinnä sen takia, että pääsi leikkimään 3D-visualisointien kanssa.

Ensimmäisessä tehtävässä (Performing Viewshed Analysis in ArcGIS Pro) selvitimme itäiseen New Yorkiin perustettavan leirintäalueen valaistusta, jotta alueen asiakkaat voisivat nauttia ulkoilusta myös auringon laskettua. Pääsimme harjoittelemaan tehtävässä viewshed -analyysia, joka siis pohjautuu laajemman tarkastelukohteen tutkimiseen useammasta katselupisteestä. Analyysi määrittää rasteritasolle (binääriset) näkyvyysarvot, jolloin arvo 0 symboloi alueita, jotka “eivät näy” ja arvo 1 alueita, jotka “näkyy”. Tämän perusteella voidaan erottaa alueet, jotka ovat valaistu ja määrittää samalla kuinka monta lamppua valaisee kyseisiä alueita. Ennen analyysiä muokkasimme hieman lamppuihin liittyvän datan atribuuttitaulukkoa haluttujen parametrien perusteella, ja analyysin jälkeen mallinsimme tuloksia matemaattisten rasterifunktioiden avulla.

Kuva 1. Viewshed-analyysin lopputulos. (Lähde: Esri AcademyPerforming Viewshed Analysis in ArcGIS Pro)

Tehtävänannossa todettiin, että mahdollisimman suuri osa leirintäalueesta tulisi olla vähintään kahden lampun valaisema. Kuten kuvasta 1 näkyy, tuloksena saatu valaistu alue ei ole kovin suuri verrattuna leirintäalueen kokoon. Alueen valaistusta tulee siis lisätä huomattavasti, jotta se täyttäisi annetut kriteerit. Teimme tämän muuttamalla datan “OFFSETA” -muuttujaa kolmesta metristä kymmeneen metriin. Muuttuja määrittää tarkkailijan korkeuspisteen korkeusmallin perusteella. Mitä korkeammalla katselupiste on, sen laajempi näkyvyys alueesta teoriassa on. Tämän jälkeen suoritimme analyysin loput vaiheet uudelleen ja lopputuloksena saimme valaistumman leirintäalueen (kuva 2).

Kuva 2. Viewshed-analyysin lopputulos, kun “OFFSETA” on 10. (Lähde: Esri Academy – Performing Viewshed Analysis in ArcGIS Pro)

Viikon toisessa tehtävässä (Performing Line of Sight Analysis) suoritimme nimenmukaisesti line of sight -analyysin. Analyysissa tarkastellaan ilmiötä yhdestä katselupisteestä usean katselupisteen sijaan. Teimme analyysin 3D-visualisoinnin avulla ja täytyy sanoa, että oli tosi siistiä päästä käsittelemään tämän muotoista dataa. Tehtävänantona oli tutkia Philadelphiassa järjestettävän paraatin turvallisuutta kaupungin 3D-mallin ja muun ohessa olleen datan avulla. Näiden perusteella tuli määrittää paraatireitiltä kohteet, jotka turvamiehet tai -kamerat voivat nähdä valmiiksi määritellyistä katselupisteistä. 

3D-mallin kanssa työskenteleminen oli helppoa ja se mahdollisti datan sekä tuloksien monipuolisen tarkastelun. Aloitimme viewshed-analyysin ArcGIS:n Line of Sight -työkalulla, joka loi katselupisteiden ja tarkasteltavan kohteen (paraati) välille useita suoria (kuva 3). Määritimme analyysia tehdessä suorien keskeiseksi välimatkaksi 9 metriä. Tämän jälkeen lisäsimme suorien ominaisuustaulukkoon dataa niiden pituuksista myöhempiä työvaiheita varten.

Kuva 3. Line of sight -analyysi. (Lähde: Esri Academy – Performing Line of Sight Analysis)

Koska tehtävässä on määritettävä mitkä paraatireitin kohdat voidaan nähdä katselupisteistä käsin, on seuraavaksi tehtävä hieman karsimista. Poistimme kaikki suorat, jotka leikkaavat matkalla jonkin rakennuksen sekä kaikki suorat, joiden pituus on yli 335 metriä. Suorille oli määritettävä jonkinlainen maksimipituus, sillä selkeälläkin säällä voi nähdä vain rajallisesti. Suorien poistaminen tapahtui Select By Attributes -työkalulla. Kun line of sight -analyysi suoritettiin, loi se automaattisesti attribuuttitaulukkoon TarIsVis-sarakkeen, joka ilmaisee arvoilla 0 ja 1 kohteen näkyvyyttä katselupisteestä. Tämän pohjalta oli valintatyökalulla helppo määrittää ne suorat, joiden TarIsVis arvo on 0 ja joiden pituus on enemmän kuin 335 metriä. Klikkasimme Delete Features -työkalua ja sanoimme hyvästit kyseisille suorille (kuva 4).

Kuva 4.  Line of sight -analyysi. Soveltumattomat suorat poistettu. (Lähde: Esri Academy – Performing Line of Sight Analysis)

Kuten kuvista huomaa, suorien määrä väheni huomattavasti alkuperäisestä. Karsimme aivan lopuksi vielä suoria hieman lisää sään muutosten varalta. Sade ja sumuisuus heikentävät näkyvyyttä huomattavasti eikä tällöin ole välttämättä mahdollista nähdä yli 300 metrin päähän. Siispä toistimme analyysin, mutta tällä kertaa asetimme suorien maksimipituudeksi 183 metriä (kuva 5).

Kuva 5.  Line of sight -analyysi. Suoria karsittu lisää. (Lähde: Esri Academy – Performing Line of Sight Analysis)

Viimeisessä tehtävässä (Authoring 3D Scenes) käytiin läpi vähän kaikenlaista liittyen ArcGIS:n 3D-malleihin. Objektina oli luoda oma “3D scene” ja tutustua tähän liittyen erilaisiin konsepteihin sekä yksinkertaisiin toimintoihin. Tehtävän johdannossa lueteltiin mihin kaikkeen ArcGIS:n 3D ominaisuutta voidaan käyttää, ja miten se voi mahdollisesti helpottaa sekä parantaa (elevate) datan visualisointia. 3D-visualisoinnin avulla voidaan nähdä muun muassa vertikaalisuunnassa päällekkäin oleva data sekä lisätä realistisuutta ympäristön visualisointiin. Oma 3D-visualisointi kiteytyi siihen, että loimme Berliinissä toimivalle kaupunkisuunnittelijalle 3D-mallin tietyn rakennuksen lähialueesta. Mallin tarkoituksena on tarkastella miten rakennuksen korkeus suhteutuu sitä ympäröiviin elementteihin (kuten muihin rakennuksiin tai kasvillisuuteen). Lisäilimme periaattessa vain valmista dataa omaan “new local scene” -karttaan ja symboloimme sitä 3D-visualisoinnin mukaisesti, sekä skaalasimme sen oikeaan mittakaavaan. Lopputulos oli ihan kivan näköinen (kuva 6). Tehtävä oli siis enimmäkseen vain 3D-visualisoinnin perusteisiin tutustumista 🙂

Kuva 6.  3D-visualisointia. (Lähde: Esri Academy – Authoring 3D Scenes)

 

Lähteet

Holopainen et al. (2015). Geoinformatiikka luonnonvarojen hallinnassa. Helsingin yliopiston metsätieteiden laitoksen julkaisuja 7. 

Tehtävälähteet

Performing Viewshed Analysis in ArcGIS Pro https://www.esri.com/training/catalog/57d8718d8b3e1ff2376bf91c/performing-viewshed-analysis-in-arcgis-pro/

Performing Line of Sight Analysis https://www.esri.com/training/catalog/57fd7a465413c49402a2dd9b/performing-line-of-sight-analysis/

Authoring 3D Scenes https://www.esri.com/training/catalog/5e70eb2417148e49006ea3c6/authoring-3d-scenes/

Viikko 4 – Korkeusmallille tehtävät analyysit ja hydrologinen mallintaminen

Tällä viikolla tutustuimme erilaisiin korkeusmalleille tehtäviin analyyseihin ja muunnoksiin. Luennolla kertasimme muun muassa mitä korkeusmallit ovat (DEM, DTM ja DSM) ja miten niitä tuotetaan. Lisäksi tutustuimme korkeusmallien tietorakenteisiin ja puhuimme hieman interpoloinnista, jota voi luontaisesti soveltaa myös korkeusmalleihin. Täysin uusia käsitteitä tällä viikolla oli korkeusprofiilin konveksisuus ja konkaavisuus, joita käytetään kuvaamaan pinnan viettoa. Konveksi profiili on kupera ja konkaavi profiili on kovera. Tähän kaikkeen liittyen työpajoissa tehtiin kaksi eri tehtävää. Tehtävät tuntuivat suhteellisen helpoille ja niitä oli ihan mukava tehdä.

Ensimmäisessä tehtävässä (Terrain Analysis Using ArcGIS Pro) harjoiteltiin pääasiassa slope, hillshade ja aspect -tasojen tekoa. Slope kuvaa rinteen jyrkkyyttä eli korkeuspinnan vieton suuntaa. Se lasketaan joko asteina tai prosentteina ja saa informaatiota ympäröivien solujen korkeustiedoista. Aspect kuvaa puolestaan rinteen suuntaa/sijoittumista. Aspect on hyödyllinen, kun tutkitaan ilmakehän ilmiöiden vaikutusta alueeseen (esimerkiksi miten aurinko tai tuulet vaikuttavat). Aspect on myös kytköksissä ympäröiviin soluihin. Tämän takia rajatun alueen reunojen solut voivat antaa vääristynyttä tietoa, sillä niillä on ympärillä vähemmän soluja, joista ottaa informaatiota. Rinteiden viettoa ja suuntaa voidaan myös määrittää hillshade -työkalun avulla, jolla tehdään alueesta varjostuskuva. Tästä lisää myöhemmin 🙂

Eli tehtävänantona oli etsiä potentiaalisia alueita viinitarhalle San Diegossa. Kriteereitä oli kolme: “elevation above 200 meters”, “slope between 1.5 percent and 15 percent” ja “some southern exposure”. Tällä kertaa aloitin tehtävän kiinnittämällä huomiota metadataan, koska tuntuu että en ole aikaisemmilla viikoilla tätä oikein tutkinut. Esri Academyn tehtävät sisältävät suoraan kaikki tarvittavat datasetit, ja välistä jää siis tarkempi aineistoon tutustuminen. Tehtävien suorittaminen voi tämän takia äkkiä muuttua vain aivottomaksi klikkailemiseksi (niinkuin tämän viikon toisessa tehtävässä tuntui käyvän). Käytimme tehtävässä datana NED:n (National Elevation Dataset) korkeusmallia, jotka jakaa ja tuottaa USGS (United States Geological Survey). Ennen tehtävän tekemistä tutustuttiin myös datassa käytettyihin yksiköihin ja koordinaatistoon, jotta näiden kanssa ei syntyisi kiusallisia virheitä. 

Tehtävä suoritettiin binäärisenä analyysinä raster calculator -työkalulla. Yhdistimme kaikki aikaisemmin luetellut ehdot ja saimme jotakuinkin tällaisen funktion: (“sd_elevation” > 200) & (“sd_slope” >= 1.5) & (“sd_slope” <= 15) & (“sd_aspect” >= 112.5) & (“sd_aspect” <= 247.5). Tässä kohtaa ArcGIS kaatui ensimmäistä kertaa koko kurssin aikana. Onneksi tiedostosta löytyi tuore backup ja pääsin jatkamaan siitä mihin jäinkin. Funktio teki tehtävänsä, jonka jälkeen meillä oli kartalla kaikki potentiaaliset alueet, jotka täyttävät viinitarhan rakentamisen ehdot. Lopputuloksen visualisoin tehtävänannon mukaan. Tuntuu että tehtävät rakastavat väriä mars red, joka nyt myös tälläkin kartalla (kuva 1) loistaa läsnäolollaan. Käytin tällä kertaa enemmän aikaa ArcGIS:n toimintojen tutkimiseen ja sain jopa luotua tuloksista jonkun näköisen kartan pohjoisnuolineen ja mittakaavoineen. Legendan tekeminen tuotti vielä paljon vaikeuksia, mutta olen nyt hieman viisaampi tämän suhteen ja pienellä harjoittelulla saan varmasti kasaan varteenotettavan kartan. 

Kuva 1. Potentiaaliset alueet viinitarhalle. (Lähde: Esri Academy – Terrain Analysis Using ArcGIS Pro)

Seuraavaksi teimme hieman lisävisualisointia, jota varten käytimme resoluutiolta pienempää dataa. Loimme sen avulla hillshade-tason, korkeuskäyrät ja teimme tietynlaisen näkyvyysanalyysin (viewshed). Näille kaikille löytyi oikeastaan suorat komennot tai työkalut ArcGIS:stä. Hillshade -työkalulla voidaan luoda realistisen näköinen mallinnus alueen pinnanmuodoista (kuva 3). Saatu tulos ilmentää miltä pinta näyttäisi, jos se valastaisiin jollain valonlähteellä. Valonlähteen suunta eli atsimuutti ja valon lähteen korkeus eli altitudi vaikuttaa tulokseen suuresti. Yleensä atsimuuttia kuvataan 351 asteesta, eli valonlähde on luoteessa. Tämän on todettu olevan kaikille helpoin tapa lukea hillshade dataa, vaikka oikeasti valonlähde (auringonvalo) paistaa vain harvoihin paikkoihin tästä suunnasta. Luennolla kannustettiin kokeilemaan hillshaden -tason luomista toisella atsimuutilla ja näinpä siis tein. 🙂 Loin tason, jonka atsimuutti on 135 eli valonlähde tulee kaakosta (kuva 2). 

Kuva 2. Vasemmalla atsimuutti on 315 astetta, oikealla se on 135 astetta. Tulkitsisin itse kuvia aivan erilailla. Kun atsimuutti on 135 astetta, maanpinnan painaumat näyttävät ainakin omiin silmiin kohoumilta. Tässä tilanteessa alakulman vesistöalue näyttää tasangolta tai jopa sandurilta. 

Kuva 3. Hillshade -taso, jonka päällä alkuperäinen korkeusmalli, jonka läpinäkyvyyttä ja visualisointia (värejä) on muokattu. 

Lisäsimme seuraavaksi tuotokseen korkeuskäyrät (kuva 4) niille suunnitellulla työkalulla ja teimme eräänlaisen näkyvyysanalyysin. Näkyvyysanalyysin (viewshed) avulla saadaan määritettyä solut, jotka voidaan nähdä tietystä tarkastelupisteestä. Tässä tilanteessa haluttiin määritellä solut, joista on hyvä näkyvyys Murray-tekojärvelle. Analyysin tuloksena saatiin hieman epämääräisen näköinen visualisointi tästä kaikesta (kuva 5). Tajusin tässä vaiheessa, että olisin voinut visualisoida lopputuloksen haluamallani tavalla, eikä tehtäviä olisi tarvinnut noudattaa niin tarkasti. Yritin tehdä myös lopputuloksesta jonkinnäköistä karttaa, mutta legendan luominen osoittautui taas sen verran hankalaksi että jouduin luovuttamaan. Analysoimme lopuksi tuloksia myös 3D-kartan avulla, joka sattuukin olemaan tämän blogipostauksen epävirallinen kansikuva. 

Kuva 4. Korkeuskäyrät

Kuva 5. Kuvassa punaisella potentiaaliset viinitarha-alueet, sinisellä Murray-tekojärvi ja keltaisella näkyvyysanalyysin tuloksena saadut alueet. Kartalla oranssit alueet täyttävät kaikki viinitarhan rakentamiseen annetut ehdot sekä tarjoavat hyvän näköalan tekojärvelle. 

Tämän jälkeen oli aika viikon toiselle tehtävälle (Predict Floods with Unit Hydrographs), jossa pääsimme tekemään hydrologista mallinnusta. Tehtävässä tehtiin eräänlaista tulvakartoitusta Vermontissa sijaitsevalle Stowen kaupungille. Tehtävän toteutus oli kummallinen ja erosi muiden tehtävien formaatista. ArcGIS toimi suoraan tietynlaisena portaalina tehtävän tekemiselle ja eri työvaiheet sekä työkalut ponnahtivat valmiina esiin ArcGIS:ssä omalle näytölle. Tämän takia tehtävän tekeminen tuntui hieman epäluonnolliselle. Tuntui ettei oikein mitään jäänyt mieleen, kun vain seurasi työvaiheita sokeana eikä päässyt ajattelemaan omilla aivoilla. 

Tehtävä alkoi “sink” -alueiden eli kuoppien paikantamisella ja poistamisella. Kuoppia esiintyy joissain DEM-malleissa ja ne ovat nimensä mukaisesti alueita, joiden elevaatio on alhainen niitä ympäröiviin soluihin verrattuna. Tällaiset kuopat ovat problemaattisia hydrologisessa mallinnuksessa, sillä vesi ei pääse valumaan kuopasta pois, ja tämä voi aiheuttaa tuloksissa erilaisia virheitä. Kun saimme kuopat poistettua, saimme uuden (kuopattoman) DEM-mallin, jota käytimme työskentelyn pohjana. Tästä lähti käyntiin monivaiheinen työsarja, jota ei enää edes meinaa muistaa. Määrittelimme seuraavaksi veden virtauksen suuntaa alueella (jotta saisimme selville valuma-alueen) ja tuloksena oli kiva värikäs kartta (kuva 6). 

Kuva 6. Veden virtausta kuvaava rasteritaso. (Flow direction) (Lähde: Esri Academy – Predict Floods with Unit Hydrographs)

Valuma-aluetta varten on myös tiedettävä laskujoen sijainti. Tämän määritettiin kumulatiivisten virtaamien ja useiden eri työkalujen avulla. Kun tämä oli tiedossa, saatiin muodostettua valuma-alue (kuva 7), joka kuvaa kaikkea sitä vesimäärää mikä kulkee alueelta laskujokeen. Valuma-alue on melkein koko Stowen kaupungin rajojen kokoinen ja jo nyt voidaan spekuloida suurten sademäärien tuottavan tulvia alueella. Seuraavana tehtävänä on laskea kuinka nopeasti vesi virtaa laskujokeen vertikaalisen nousun avulla. Tätä varten loimme alueelle tutun ja turvallisen slope-tason (kuva 8). Veden virtauksen nopeus saatiin nyt määritettyä slope-tasolla ja kumulatiivisella virtaamalla (kuva 9). 

Kuva 7. Stowen valuma-alue tumman lilalla, kaupungin rajat oranssilla ja laskujoki näkyy kuvassa valkoisena. 

Kuva 8. Slope-taso. Tummat alueet kartalla ovat jyrkempiä. 

Kuva 9. Veden virtauksen nopeus. (Tummemmat värit edustavat hitaampaa virtausta ja vaaleammat nopeampaa virtausta). Tästä kuvasta ei tule ilmi, mutta virtaus on nopeinta joissa, jotka kulkevat Stowen kaupungin läpi. 

Näiden työvaiheiden jälkeen rupesimme luomaan isopleettikarttaa, joka kuvaa kuinka kauan vedellä kestää virrata tietyille alueille. Veden virtausaika saadaan selville jakamalla virtauksen pituus sen nopeudella. Käytimme tässä “flow length” -työkalua. Lopputuloksena oli taso, jonka rastereissa on tieto siitä, kuinka kauan vedellä kestää virrata rasterista laskujokeen. Arvot vaihtelivat välillä 0 – 47 000 eli vedellä kestää virrata paikoittain 0 sekunnista noin 13 tuntiin. Lopuksi käytimme “reclassify” -työkalua, jonka avulla saimme lopputuloksesta kasattua isopleettikartan (kuva 10). Ihan viimeisenä kasasimme kokoon taulukon tästä kaikesta (taulukko 1), jonka luomisprosessista en nyt enempää aijo selittää. Olisi joku kerta kiva sukeltaa vielä bonustehtävien pariin, mutta tuntuu että jo näiden tehtävien tekemisessä menee useita tunteja. Ehkä tekeminen nopeutuu kun ArcGIS tulee tutummaksi. 

Kuva 10. Tadaa! Valmis isopleettikartta virtausajoista (joka näyttää vähän hiili-möhkäleeltä) Tummemmat alueet edustavat lyhyempiä virtausaikoja ja vaaleammat alueet pidempiä. 

Taulukko 1. Y-akselin tunniste jäi kuvasta jostain syystä pois. Y-akseli kuvaa siis: “Discharge at outlet per unit of excess rainfall (square meters per second)”.

 

Lähteet

Holopainen et al. (2015). Geoinformatiikka luonnonvarojen hallinnassa. Helsingin yliopiston metsätieteiden laitoksen julkaisuja 7. 

 

Tehtävälähteet

Terrain Analysis Using ArcGIS Pro https://www.esri.com/training/catalog/57630436851d31e02a43f18f/terrain-analysis-using-arcgis-pro/

 Predict Floods with Unit Hydrographs https://www.esri.com/training/catalog/598a43865bed191d3a9bc732/predict-floods-with-unit-hydrographs/

 

Kolmas viikko – Rasterimuotoisten aineistojen analysointia II

Kuva 1.  Maistiainen tämän viikon tehtävistä. Taustalla vihreällä valkopäämerikotkalle suotuisat asuinalueet.

Kolmas viikko jatkui edellisen viikon soveltuvuusanalyyseistä. Tuolloin valmisteltu data voidaan nyt vihdoin koota yhteen ja määrittää San Bernardinon luonnonpuistossa alueet, joilla Yhdysvaltain kansallislintua tullaan todennäköisimmin tapaamaan (kuva 1). Luennolla puolestaan tutustuimme mm. metatietoon, muuttujiin sekä niiden ominaisuustaulukoihin ja koordinaatistoihin paikkatietojärjestelmissä. Lisäksi kävimme läpi rasteriaineistojen käsittelyssä olennaisia työkaluja, joista useampaa käytimme myös tämän viikon tehtävissä. Tällä viikolla ongelmaa tuntui tuottavan erityisesti valtava uuden tiedon määrä, sekä Esri Academyn käsitteiden ja konseptien järkevä kääntäminen suomen kielelle. Tiedon määrän takia tuntuu myös, että raportista tuli vähän turhan pitkä. Valkoisen paperin kammo ei auttanut asiaa, kun oma käsitys oleellisesta ja epäolennaisesta hämärtyi sen vaikutuksesta.

Criteria Dataset
Far from developed areas Land cover raster

Not too densely or sparsely covered by forest

(ranging from 20 percent to 60 percent)

Tree canopy raster
Close to lakes (fewer than 2 miles) Major lake polygons
Located on northeast-facing aspects DEM raster (digitaalinen korkeusmalli)

Taulukko 1. Valkopäämerikotkan esiintymisen kannalta optimaalisten alueiden kriteerit ja niiden käsittelyyn tarvittavat aineistot. Lähde: (Esri Academy – Creating a Simple Suitability Model)

Pääsimme siis ensimmäisessä tehtävässä takaisin binäärisen soveltuvuusanalyysin pariin. Analyysin avulla määritämme valkopäämerikotkalle suotuisia asuinpaikkoja tiettyjen kriteerien perusteella (taulukko 1). Tehtävänannossa kerratiin ja syvennyttiin binäärisiin (binary) ja painotettuihin (weighted) soveltuvuusanalyyseihin. Kuten viime viikolla todettiin, binäärisessä analyysissä uudelleen luokitellaan solujen arvot binäärilukujen 0 ja 1 avulla. Tällöin luku 1 saa arvon “meets the criteria” ja luku 0 saa arvon “doesn’t meet the criteria”. Painotetun (weighted) soveltuvuusanalyysin avulla puolestaan annetaan eri painoarvot prosentteina eri rasterikartoille sen perusteella millainen lopputulos halutaan. Eli mitä korkeampi arvo, sen enemmän painoarvoa tasolla on. Tätä harjoittelimme myös viikon viimeisessä tehtävässä. Alapuolella havainnollistava kuva kyseisestä weighted overlay -prosessista.

Kuva 2. Weighted overlay -prosessia havainnollistava kuva. (Lähde: Luentodiat)

Tehtävänannossa painotettiin binäärisen analyysin kätevyyttä, kun halutaan määrittää soluja, jotka täyttävät kokonaan halutut vaatimukset. Binäärisiä rastereita voidaankin käyttää ns. “maskina” tai “maskirastereina”. Näiden avulla pystytään peittämään analyysin kannalta ei-halutut tai soveltumattomat alueet. Valkopäämerikotka esimerkissä maskina voitaidaan käyttää järviä mallintavaa rasteritasoa, ja peittää järvi-alueet antamalla niille arvo 0. Järvien pinta-alueita ei tarvita tarkastelussa, sillä nämä alueet eivät sovellu valkopäämerikotkan asuinalueiksi ja siksi ne on hyvä peittää. Vaikka binääriset soveltuvuusanalyysit ovat käteviä ja helppoja, niitä ei voi käyttää jos halutaan mallintaa jatkuvaa skaalaa. Tällöin on hyvä käyttää esimerkiksi “weighted” tai “fuzzy” -malleja.

Tehtävässä olennaisinta oli viime viikolla valmistellun datan yhdistäminen. Tasot yhdistettiin “suitability surface” -tasoksi, joka mallintaa kaikkia kriteerejä samanaikaisesti, ja jonka avulla voidaan nyt määritellä valkopäämerikotkalle optimaaliset asuinalueet. Data koottiin yhteen “raster calculator -työkalun avulla. Yhdistämisessä käytetään kertolaskua, sillä mikä vain luku kertaa 0 on 0. Näin saadaan kaikki halutut kriteerit esiintymään samanaikaisesti. Tasojen yhdistäminen tapahtui lähinnä modelbuilderissä eli muokkasimme työvaiheketjua (kuva 3) lisäilen sinne työvaiheita. Kun suoritimme ketjuun lisätyt työvaiheet “run” -komennolla, saimme vihdoin tason, joka mallintaa parhaimpia alueita. En pitänyt siitä, millaiseksi tehtävä käski karttaa tekemään, joten päätin visualisoida sopivat alueeet tummanvihreällä (kuva 4). 

Kuva 3. Ensimmäisen tehtävän työvaiheketju. Lähde: (Esri Academy – Creating a Simple Suitability Model)

Kuva 4. Binäärisellä soveltuvuusanalyysillä määritellyt kohteet. Tummanvihreät alueet ovat valkopäämerikotkan esiintymisen kannalta optimaalisia alueita San Bernardinon luonnonpuistossa.

Tutustuimme samassa tehtävässä käsitteisiin “sensitivity analysis” ja “error analysis”, jotka ovat relevantteja myös viimeisen tehtävän yhteydessä. Herkkyysanalyysillä määritetään kuinka suuri – tai millainen vaikutus – lopulliseen dataan on, jos muutetaan jotain mallin parametreistä. Parametriä muutetaan työvaiheketjussa, jonka jälkeen ketju suoritetaan uudestaan “run” -komennolla. Vaikutuksen arviointi tapahtuu visuaalisesti saaduista tuloksista. Jos tulos eroaa paljon alkuperäisestä, on se korkeasti sensitiivinen kyseiselle parametrille. Suoritimme herkkyysanalyysin tehtävässä modifioimalla CanopyTrans -layeria. Muutimme erästä luokkaa latvustonpeitettä kuvaavassa tasossa kymmenellä yksiköllä.

Virheanalyysissä tutkitaan miten alkuperäisten datasettien (esimerkiksi niiden arvojen) virheet vaikuttavat lopputulokseen. Kun virhe on “istutettu” modelbuilderin avulla, suoritetaan taas komennot ja analysoidaan lopputulosta visuaalisesti. Jos lopputulos on suuresti muuttunut, on hyvä vaihtaa datasettiä tai miettiä uudelleen miten alkuperäistä tulosta on tulkittava. Suoritimme virheanalyysin niin, että poistimme “elevation” -tason ja korvasimme sen “DEM_error” -tasolla, joka on harjoitusta varta vasten laadittu eri arvoja sisältävä taso. DEM:iä eli korkeusmallia voi muuttaa esimerkiksi +/- 1 metrin. Tällä muutoksella ei ollut suuresti vaikutusta verrattuna alkuperäiseen tulokseen.

Toisessa tehtävässä pääsimme käyttämään painotettua (weighted) soveltuvuusanalyysiä.  Tutkimme aivan samaa ilmiötä kuin aikaisemmin eli valkopäämerikotkalle optimaalisia asuinalueita metsästetään vieläkin. Latasimme datan Esri Academysta, joka sisälsi jo puolilleen valmiin työvaiheketjun. Käytimme “reclassify” -työkalua melkeinpä kaikkiin datan rasteritasoihin, jotta saisimme ne muokattua kriteerien mukaisiksi (taulukko 1). Esimerkiksi annoimme työkalun avulla skaalalla 1-10  niille soluille suurimmat arvot, joiden latvustopeite on lähellä 45%. Tämän avulla kriteeri “Not too densely or sparsely covered by forest” täyttyy. Kun tasoja oltiin muokattu kriteerien mukaisiksi, suoritimme työvaiheketjun ja pääsimme tutkimaan saatuja tuloksia (kuva 5).

Kuva 5. Kriteerien perusteella muokattu “aspect” -taso, joka kuvaa rinteen suuntaa.

Tästä jatkoimme sitten seuraavassa tehtävässä kuten binäärisen soveltuvuusanalyysin kanssa eli yhdistimme äskettäin “reclassify” -työkalulla muokatut tasot. Tasot yhdistettiin painotetun soveltuvuusanalyysin mukaisesti antamalla niille eri prosentteihin pohjautuvia arvoja. Analyysiä tehdessä pitää muistaa, että arvojen yhteenlaskettu osuus ei tule ylittää 100%. Kun eri tasot oltiin yhdistetty modelbuilderin avulla, saatiin yhteinen rasteritaso “suitability surface”. Skaalasimme rasteritason arvot käyttäen “percent clip” -skaalausta, joka poimii prosenttuaalisesti suurimmat ja pienimmät arvot, ja tekee niiden välissä oleville arvoille lineaarisen skaalauksen. Lopputulos oli ainakin subjektiivisesti sanottuna miellyttävän näköinen (kuva 6). 

Kuva 6. Painotetulla (weighted) soveltuvuusanalyysillä määritellyt kohteet. Tummanvihreät alueet ovat valkopäämerikotkan esiintymisen kannalta optimaalisia alueita San Bernardinon luonnonpuistossa. Lähde: (Esri Academy – Creating a Weighted Suitability Model)

Tämän jälkeen suoritimme herkkyys- ja virheanalyysin tulokselle. Teimme tämän kutakuinkin samalla taktiikalla kuin binäärisen soveltuvuusanalyysin kanssa. Toki prosessit erosivat toisistaan hieman, sillä painotettu soveltuvuusanalyysi skaalautuu jatkuvasti, kun taas binäärinen analyysi ei. Tässä tilanteessa herkkyysanalyysi voidaan toteuttaa muuttamalla joko yksittäistä parametriä, tai sitten jonkun tason painotuksen arvoa. Kahta tasoa muutetaan niin, että tasojen yhteenlaskettu prosenttiosuus on silti 100%. Muutimme “Developed areas” -tason arvoa luvusta 0.3 lukuun 0.2. Koska käytimme “weighted sum” -työkalua, ei kaikkien yhteenlaskettujen prosenttiosuuksien tarvinnut olla 100%. Virheanalyysin teimme samallalailla kuin binäärisessä soveltuvuusanalyysissä eli muuttamalla DEM-rasteria DEM_error -rasteriksi. Kummassakaan tapauksessa lopputulos ei juuuri muuttunut. Solujen välisten arvojen magnitudi muutui hieman ja tämä ilmeni esimerkiksi alueiden värien tummumisena.  Vaikutuksesta värierot kasvoivat, ja omasta mielestäni kartta näyttää nyt hieman dramaattisemmalta. Tarkkasilmäiset huomaavat tämän eron kuvissa 7 ja 8. Voidaan siis sanoa, että mallin herkkyys muutoksille (ainakin näiden muuttujien suhteen) on matala.

Kuva 7 ja 8. Yläpuolella on alkuperäinen “suitability surface” ja alapuolella on herkkyysanalyysin tuloksena saatu “sensitivity surface”. 

 

Lähteet

Holopainen et al. (2015). Geoinformatiikka luonnonvarojen hallinnassa. Helsingin yliopiston metsätieteiden laitoksen julkaisuja 7. 

MAA-221 Geoinformatiikan menetelmät 2 (syksy 2020) luentodiat, Opettaja Petteri Muukkonen

 

 Tehtävälähteet ja data

1.https://www.esri.com/training/catalog/5cad02009b1f4010cad9abdc/creating-a-simple-suitability-model/

2.https://www.esri.com/training/catalog/5cbf7e046b7be962098492f4/transforming-data-for-a-weighted-suitability-model/

3.https://www.esri.com/training/catalog/5cbf7e336b7be96209849309/creating-a-weighted-suitability-model/

Toinen viikko – Rasterimuotoisten aineistojen analysointia I

Kuva 1. Kolmannen tuntitehtävän mukaan ArcGIS Pro:lla luotu rasterimuotoinen kartta (Lähde: Esri Academy – Preparing Data for a Suitability Model)

Kun ensimmäinen viikko painottui laajalti vektorimuotoisiin aineistoihin ja niiden kanssa työskentelemiseen, niin toinen viikko painottui luontaisesti rasteriaineistojen muokkauksiin sekä analyyseihin. Koen rasterianalyysien olevan hieman hankalampia kuin vektorianalyysien. Rasteriaineistot koostuvat useista ominaisuustietoa sisältävistä pikseleistä, jotka määräävät koollaan aineiston resoluution. Vektoriaineistoissa kohteet kuvataan pikseleiden sijaan pisteinä, viivoina tai polygoneina ja ne pitävät sisällään enemmän ominaisuustietoa, joka tekee niistä omasta mielestäni suoraviivaisempia analysoinnin kohteita.

Rasterimuotoisten aineistojen analyysit koostuvat jopa hyvin kompleksisista työvaiheista, jotka seuraavat tarkasti toisiaan ja muodostavat ns. työvaiheiden ketjuja (function chain). Kävimme luennolla läpi juurikin kuinka työvaiheita (ja työvaiheiden ketuja) voidaan tallettaa ArcGIS Pro:ssa eräänlaisiksi pohjamalleiksi (template). Ne auttavat ensinnäkin työvaiheiden seuraamisessa, mutta myös nopeuttavat työskentelyä paljon. Kävimme luennolla lisäksi läpi rasteriaineistojen visualisointia, värivalintojen tärkeyttä, sekä eri rasteriaineistojen esitysmalleja. Rasteriaineistoja laatiessa on turvallista luottaa ns. “intuitiivisiin väreihin” ja käyttää universaalisesti tunnettuja värejä symboloimaan eri kohteita. Lisäksi voidaan miettiä esitetäänkö tiettyä ilmiötä esimerkiksi luokittelemalla vai gradientilla. Tälle viikolle on siis luultavasti tiedossa kivoja ja esteettisesti miellyttäviä karttoja, jos viikkotehtävien tekeminen ei tuota suurempia ongelmia.

Ensimmäinen Esri Academy:n tehtävä (Processing Raster Data Using ArcGIS Pro) perehdytti rasteridatan käsittelyyn ja rasterityökalujen käyttöön. Kävimme tehtävässä pääasiassa läpi juurikin työvaiheiden ketjun muodostamista (kuva 1), sekä ketjun käyttämistä pohjamallina. ArcGIS:ssä on iso liuta erilaisia algoritmeja, joiden avulla voidaan tuottaa, käsitellä ja visualisoida rasteridataa. Pää meni välillä näistä kaikista toiminnoista pyörälle, ja vaatii kyllä hetken että ne siirtyvät säilömuistiin. Tehtävässä käsiteltiin kahta eri vuosina (2013 & 2015) otettua satelliittikuvaa samalta alueelta. Tarkoituksena oli tutkia vuosien välistä normalisoitua kasvillisuusindeksiä (NDVI, Normalized Difference Vegetation Index) ja sen avulla kasvillisuuden muutosta.

Kuva 1. Ensimmäisen viikkotehtävän työvaiheiden ketju eli “function chain” (Lähde: Esri Academy – Processing Raster Data Using ArcGIS Pro)

Loimme ensin NDVI-tasot satelliittikuvista, jonka jälkeen vähensimme ne toisistaan. Tuloksena saatu tasojen erotus kuvaa muutosta vuosien välillä. Tämän jälkeen annoimme datalle uusia arvoja “remap” -työkalun avulla: arvo 1 kuvaa “muutosta” ja arvo 0 kuvaa “ei muutosta”. Loimme tämän perusteella tasolle atribuuttitaulukon. Ilmiön visualisointi tapahtui punaviher-gradientilla, joka lopuksi sai vain “punaisena” esiintyviä arvoja. Eli punainen väri kartalla (kuva 2) kuvaa vuosien 2013 & 2015 välistä muutosta kasvillisuuden suhteen. Toivon todella, että tein tehtävän oikein. Hämmennystä aiheutti, kun tehtävän annossa puhuttiin “keltaisista alueista”, jotka mallintavat kasvillisuuden muutosta.  Eikö tämä ole juuri toisinpäin? Punaisella/vihreällä merkityt alueet kuvaavat muutosta ja keltaisella värillä kuvataan aluetta, joka ei ole muuttunu. Toisaalta saamassani lopputuloksessa ei ole muuta väriä kuin punainen, joten saattaa hyvinkin olla että taas on jotain mennyt harmillisesti pieleen.

Kuva 2. Ensimmäisen tehtävän lopputulos kartalla. (Lähde: Esri Academy – Processing Raster Data Using ArcGIS Pro)

Toinen tehtävä (Introduction to Suitability Modeling) tuotti aluksi hieman hämmennystä, sillä tehtävässä nostettiin esiin monta uutta käsitettä. Päätin jättää tämän informaatiopläjäyksen muhimaan hetkeksi mieleen ja palasin tehtävän pariin muutaman päivän tauon jälkeen. Luulen, että ymmärrän tehtävää nyt paremmin. Eli pähkinänkuoressa “suitability modeling” (tietynlainen soveltuvuus mallintaminen/soveltuvuusanalyysi) on prosessi, jossa yhdistellään erilaisia kriteeripohjaisia aineistoja, jotta saataisiin määritettyä tarkastellulle ilmiölle optimaalinen sijainti. Tehtävässä lueteltiin ainakin kolmenlaisia mallintamistapoja: “binary”, “weighted” ja “fuzzy”. Keskeisenä konseptina oli opetella ymmärtämään rasteriaineistojen ominaisuuksia, jolloin voidaan myös ymmärtää koko “suitability modeling” -prosessia (kuva 3).

Kuva 3. Miten “suitability modeling” -prosessia tulisi lähestyä. (Lähde: Esri Academy – Introduction to Suitability Modeling)

Kolmannessa tehtävässä (Preparing Data for a Suitability Model) pääsimme laittamaan opitun käytäntöön. Tehtävänantona oli määritellä valkopäämerikotkan esiintymisen kannalta optimaalisia alueita San Bernardinon luonnonpuistossa. Optimaalisille alueille oli paljon kriteereitä, joiden kaikkien oli toteuduttava (taulukko 1). Tehtävä suoritettiin kokonaan työvaiheiden ketjun avulla (kuva 4). Tämä osoittautui nopeaksi keinoksi analysoida dataa, sekä luoda uusia aineistoja sen pohjalta. Koska käsiteltäviä aineistoja oli tehtävässä paljon, oli prosessia helpompi hallita ketjun avulla. Aineistoja pystyi yhdistämään muutamalla klikkauksella haluttuihin toimintoihin, jotka “run” -komennolla suorittivat halutun toiminnon datalle (kuva 5).

Criteria Dataset
Far from developed areas Land cover raster

Not too densely or sparsely covered by forest

(ranging from 20 percent to 60 percent)

Tree canopy raster
Close to lakes (fewer than 2 miles) Major lake polygons
Located on northeast-facing aspects DEM raster (digitaalinen korkeusmalli)

Taulukko 1. Valkopäämerikotkan esiintymisen kannalta optimaalisten alueiden kriteerit ja niiden käsittelyyn tarvittavat aineistot. Lähde: (Esri Academy – Preparing Data for a Suitability Model)

 

Kuva 4. Kolmannen viikkotehtävän työvaiheiden ketju (Lähde: Esri Academy – Preparing Data for a Suitability Model)

 

Kuva. 5 Kriteerien perusteella muokattu digitaalinen korkeusmalli (DEM). Värit havainnollistavat rinteen suuntaa. (Lähde: Esri Academy – Preparing Data for a Suitability Model)

Hämmennyin hetkeksi kun tehtävä loppui kuin seinään, mutta se jatkui seuraavassa viikkotehtävässä (Transforming Data for a Simple Suitability Model). Kolmannen tehtävän jäljiltä olimme saaneet aikaan kriteereitä mallintavat tasot (ns. “derived data”), joiden perusteella aineistoa oli vielä muokattava pidemmälle, että saataisiin selville optimaaliset alueet. Käytimme tässä “binary suitability modeling” -prosessia, jonka keskeinen idea oli siis antaa pikseleille/soluille binäärisiä arvoja: arvo 1 “suitable” ja arvo 0 “unsuitable”. Teimme kyseisen soveltavuusanalyysin kaikille tehtävän aineistoille. Lopputuloksena saatiin 4 erilaista tasoa, jotka täyttävät annetut kriteerit. Seuraavan viikon rasterianalyysi tehtävissä jatkamme aineiston kanssa työskentelemistä ja luultavasti yhdistämme aineistot  yhdeksi suureksi kokonaisuudeksi. 

Kuva 6. Tässä esimerkki “Land cover” -aineistosta, jota on muokattu niin, että annetut kriteerit toteutuvat. Kuvassa tummat alueet (“undeveloped areas”) toteuttavat annetut kriteerit, kun taas punaiset alueet (“developed areas”) kuvaavat kaupunki- ja teollisuusalueita. (Lähde: Esri Academy – Transforming Data for a Simple Suitability Model)

 

Lähteet

Holopainen et al. (2015). Geoinformatiikka luonnonvarojen hallinnassa. Helsingin yliopiston metsätieteiden laitoksen julkaisuja 7. 

 

Tehtävälähteet ja data

    1. https://www.esri.com/training/catalog/57e19a8eed0f3a861c100985/processing-raster-data-using-arcgis-pro/
    2. https://www.esri.com/training/catalog/5c08179b7351db0c2ab3fbf4/introduction-to-suitability-modeling/
    3. https://www.esri.com/training/catalog/5cad01dd9b1f4010cad9abc4/preparing-data-for-a-suitability-model/
    4. https://www.esri.com/training/catalog/5cad01b39b1f4010cad9ab56/transforming-data-for-a-simple-suitability-model/

 

Ensimmäinen viikko – Return of the GIS

Kurssi alkoi omalla kohdallani jännittävissä tunnelmissa, sillä viimeisestä suoritetusta GIS-kurssista on jo jonkin aikaa. Oli kuitenkin mukava huomata ettei kesäloma ollut pyyhkinyt kaikkea viime lukuvuonna opittua pois muistista. GIS:n pariin takaisin palaaminen ja viikkotehtävien tekeminen oli jopa virkistävää ja antoisaa muuten kovin teoriapainotteisten kurssien lomassa. Ensimmäisen viikon luento ja luentokirjallisuus (Holopainen et al, 2015) painottui lähinnä erilaisiin vektoriaineistojen päällekkäis-, leikkaus-  ja läheisyysanalyyseihin, joihin sitten syvennyttiin ensimmäisten viikkotehtävien parissa. 

Teimme viikkotehtävät ArcGIS Pro -ohjelmistolla, joka on itselleni aivan uusi tuttavuus, vaikka olen kuullutkin kyseisestä GIS-ohjelmistosta aikaisemmilla kursseilla paljon. ArcGIS:n käyttäminen onnistui kuitenkin ohjeiden avulla tehokkaasti ja erosi lopulta aikaisemmin käyttämästämme QGIS-ohjelmistosta yllättävän vähän. Ohjelmien käyttöjärjestelmien välillä oli jonkin verran eroja, mutta kaikki tutut komennot löytyivät lopulta tavalla tai toisella. Koska emme tämänhetkisen tilanteen takia voineet kokoontua kampuksen GIS-luokkiin työskentelemään, kokoonnuimme virtuaalisesti Zoomin välityksellä ja kävimme läpi Esri Academy:n valmiita GIS-harjoituksia. Valmiit tehtävät olivat onneksi hyvin suoraviivaisia ja eivät tuottaneet sen kummempia vaikeuksia. Esri Academy:n harjoitusten hyvä puoli on, että kurssin teemaan liittyvät käsitteet tulevat myös englanniksi tutuiksi. 

Kuva 1. Tehtävien visualisointia. Oikealla tunnuslukutaulukko.

Luennon aiheiden lisäksi kävimme tehtävien avulla myös läpi ArcGIS:n perustoimintoja, kuten tasojen yhdistämistä tai miten aineisto rajataan esimerkiksi mittakaavan mukaan. Toisessa viikkotehtävässä painotettiin eri ominaisuuksien spatiaalisten suhteiden ymmärtämistä, jolloin myös oikean elämän ongelmia voidaan ratkaista. Tästä esimerkkinä aineistojen analysoiminen niiden mahdollisten päällekkäisyyksien perusteella. Tehtävässä lueteltiin paljon eri komentoja, jolla tätä ilmiötä voidaan tutkia (touches, contains, intersects, overlaps, within, crosses). Tehtävän kysymys kuului kutakuinkin näin: “How many acres of proposed wilderness areas in Utah are located around San Rafael Swell?” Tätä oli helppo tutkia annetuista aineistoista “within” -komennon avulla, joka rajasi kaikista erämaa-alueista ne kohteet, joita ollaan suunnittelemassa San Rafael Swell:n alueelle (kuva 1). Valinnan jälkeen tutkimme aineiston tunnuslukutaulukkoa, jonka avulla oli mahdollista määrittää alueiden yhteenlaskettu pinta-ala. Utah:n alueelle on siis suunnitteilla noin 3 379 346 eekkeriä erämaa-aluetta, joista 272 811 eekkeriä sijaitsee San Rafaelin Swell:n alueella. 

Kuva 2. Tehtävien visualisointia. 

Kolmannen tehtävän tehtävänantona oli etsiä optimaalista paikkaa kuntosaliketjun uudelle kuntosalille. Tähdet kuvassa 2 merkitsevät jo valmiiksi olemassa olevia samaisen ketjun kuntosaleja. Tutkimme etäisyyksiä “proximity analysis” -metodien avulla eli vaikutusalueanalyysien avulla. Kuten kurssikirjallisuudessa todetaan, vaikutusalueanalyyseillä voidaan luoda tasoja, joissa on määritetty haluttujen kohteiden etäisyys tai hakea kohteet tietyltä etäisyydeltä (Holopainen et al. 2015). Haluttujen kohteiden etäisyys voidaan määrittää “buffer” -työkalun avulla. Se muodostaa kohteen ympärille vyöhykkeen, jonka leveyden voi itse määrittää. “Spatial query” -työkalut puolestaan auttavat hakemaan tiettyjä kohteita tietyltä etäisyydeltä kyselyiden muodossa. “Near” -työkalut laskevat suoraan etäisyyden haluttujen kohteiden välillä. Käytimme kyseisessä tehtävässä bufferi-työkalua, joka mahdollisti vyöhykkeiden luomisen kuntosalien ympärille ja näin niiden vaikutusalueiden analysoinnin suhteessa kuntosalien jäsenten sijaintitietoon. Kuten kuvasta 2 tulee ilmi, neljäs kuntosali kannattaa rakentaa jo olemassa olevien kuntosalien keskiöön, johon sijoittuu myös huomattava osa kuntosalin asiakkaista.

Kuva 3. Tehtävien visualisointia

Viimeinen tehtävä tuntui hieman hankalalta, sillä tehtävässä oli monta eri vaihetta. Tehtävänä oli määrittää uudelle tuulivoimalalle optimaalista paikkaa Coloradon osavaltiossa.  Tehtävä suoritettiin ArcGIS online:n avulla, joka toimi hieman erilailla kuin ArcGIS pro. Tuulivoimalan optimaaliselle paikalle lueteltiin useita ehtoja: 

    • Tuulivoimalan tulee sijaita Coloradon osavaltiossa
    • Tuulivoimalan tulee sijaita piirikunnassa, jossa asukasluku on ainakin 20 000 (2010)
    • Tuulivoimalan tulee sijaita alueella, jossa tuulivoiman voimakkuus on asteikolla 4
    • Tuulivoimalan tulee sijaita 10 mailiin säteellä olemassa olevista suuremmista sähkölinjoista, joiden kapasiteetti on ainakin 400kV
    • Tuulivoimalan tulee sijaita 5 mailin säteellä olemassa olevista tuulivoimaloista, joiden tuulimyllyjen turbiinin roottorien halkaisija on vähintään 100 jalkaa

Tehtävä vaati siis paljon tasojen yhdistelemistä ja kyselyiden laatimista erilaisten toimintojen avulla. Tutuksi tuli myös bookmark-työkalu, joka mahdollisti tiettyjen alueiden ja mittakaavojen tallentamisen. Monivaiheisen prosessin lopputulos (kuva 3) oli omalla kohdallani hieman erikoinen. Kaikkien kyselyiden suorittamisen jälkeen sain vain yhden optimaalisen alueen tuulivoimalan sijainnille, vaikka mallivastauksessa alueita oli kaksi. Kuvaan 3 on merkitty punaisella alueet, jotka kyselyiden suorittamisen jälkeen olisi pitänyt jäädä jäljelle. En ole aivan varma mikä meni vikaan, mutta veikkaan että joku vaihe jäi huolimattomuudesta tekemättä. Tutkimme lopuksi etäisyyksiä Denverin kaupungista näille kahdelle tuulivoimala-alueelle, sekä alueiden pinta-aloja, mikä auttoi optimaalisen sijainnin määrittämisessä. Kävi ilmi, että alempi tuulivoimala-alue on kaupunkia lähempänä ja myös pinta-alaltaan suurempi, mikä tarjoaa enemmän mahdollisuuksia tuulivoimalan sijoittamiseen, sekä sen ylläpitoon. 

 

Lähteet

Holopainen et al. (2015). Geoinformatiikka luonnonvarojen hallinnassa. Helsingin yliopiston metsätieteiden laitoksen julkaisuja 7. 

 

Kuvalähteet

https://cdn.europosters.eu/image/1300/kuvatapetit/star-wars-return-of-the-jedi-i35531.jpg

 

Tehtävälähteet ja data

    1. https://www.esri.com/training/catalog/57630431851d31e02a43ee5e/managing-map-layers-in-arcgis-pro/
    2. https://www.esri.com/training/catalog/5d091b34b415216e8f174c41/understanding-spatial-relationships/
    3. https://www.esri.com/training/catalog/5f170c5c9a0e6512bd2bf913/introduction-to-proximity-analysis/
    4. https://www.esri.com/training/catalog/5b4e41df06b3cc4f1cc15df0/perform-a-site-suitability-analysis-for-a-new-wind-farm/

 

Viimeinen kurssikerta – Omia karttoja

Kurssi on hyvä lopettaa tuntevan olevansa käsiin hajoavan vuoristoradan kyydissä. Aluksi kaikki vaikuttaa menevän hyvin ja QGIS:n käyttäminen tuntuu mutkattomalta. Vuoristoradan ensimmäiseen kaarteeseen saavuttaessa alkavat kuitenkin laitteen lahot rakenteet rikkoutua. Tässä vaiheessa tajuaa, että oma innovatiivisuus ja luovuus on kuivunut olemattomiin ja itsenäinen tehtävä tuntuu ylitsepääsemättömältä esteeltä. Eipä siinä auta muu kuin pysäyttää kyseinen laite ja hypätä pois kyydistä ennen kuin kirjaimellisesti putoaa korkealta ja kovaa. 

Viimeisen kerran tehtävänä oli laatia vapaavalintainen kartta jostain ilmiöstä ja etsiä itsenäisesti aineistoja sen toteuttamiseksi. Voi olla, että saatavilla olevan tiedon määrä lamautti minut ja siksi tehtävä tuntui ajoittain niin vaikealle. Alussa suunnitelmani olivat jopa harvinaisen selvät, sillä halusin pääasiassa tutkia Eurooppaa ja esittää erilaisia karttoja sen väestöön liittyen. Käytin kuitenkin kartan laatimiseen varatun luennon siihen, että etsin lisää tietoa eri aineistontarjoajien sivuilta koska en ollut mihinkään tyytyväinen. 

Kotiin päästyäni päätin palata takaisin lähtöruutuun ja aloittaa aineistojen etsimisen alusta.  Päädyin kaivamaan esiin Globaalit tutkimuskysymykset maantieteessä -kurssin esseet, sillä muistin erään kurssin aiheen käsitelleen metsien kehitystä. Tutkimme tuolloin ilmiötä Global Forest Change -tietokannan avulla (University of Maryland). Tietokanta oli omasta mielestäni hyvin visualisoitu ja suunniteltu. Sen avulla oli helppoa nähdä niin metsäpalojen kuin viljelyn vaikutuksen luonnontilaisiin metsiin globaalisti. Tietokantaa tutkiessa itseäni jäi kuitenkin askarruttamaan muutama asia. Global Forest Change -sivustolla nostettiin esiin Indonesia Riaun provinssissa metsän tuhoutumisen edenneen kiihtyvää vauhtia viime vuosikymmenellä pääasiassa viljelyn seurauksena. Päädyinkin siis lopulta luomaan karttasarjan, joka käsittelee Indonesian sademetsäalueita käyttäen Global Forest Change -tietokannasta ladattuja rasteriaineistoja eräänlaisena pohjana. 

Löysin Global Forest Watch -sivustolta tietokannan Indonesian palmuöljyplantaaseista sekä RSPO (Roundtable on Sustainable Palm Oil) eli kestävän tuotannon periaatteiden mukaisesti palmuöljyä tuottavista plantaaseista. Halusin näiden tietokantojen avulla tutkia miten palmuöljyviljelmät sijoittuvat alueella ja onko niillä selvää korrelaatiota suhteessa Indonesian luonnollisen metsäpinta-alan vähenemiseen. Lisäksi halusin myös selvittää RSPO-plantaasien osuuden alueen kaikista plantaaseista. 

Idea oli jopa suhteellisen mukiinmenevä, mutta itse toteutus koitui ongelmaksi kun tajusin, että kartat tulevat todennäköisesti vain näyttämään siltä, miltä ne alkuperäisessä tietokannassa (Global Forest Change) näyttävät. Karttojen laatiminen tuntui liian helpolle, sillä ilmiön esittäminen ei vaatinut suurempia välietappeja excelissä tai taisteluja QGIS:n eri työkalujen kanssa. En siis ole kovin tyytyväinen tuloksiin, mutta ainakin karttojen visuaalinen puoli on kunnossa. Palmuöljy tietokannan lisäksi latasin Natural Earth -sivustolta vektorimuotoisia tietokantoja maailman valtioista ja meristä. 

Kuva 1. Kuvassa esitettynä Indonesian luonnolliset metsät vuonna 2000 prosentteina. Lähde: Global Forest Change. 

Kuva 2. Kuvassa esitetty metsäpinta-alan väheneminen Indonesiassa vuosina 2000-2018 asteikolla 0 – 18. Lähde: Global Forest Change. 

Kuva 3. Palmuöljyplantaasit (oranssilla)  ja RSPO-plantaasit (punaisella) Riaun provinssissa Indonesiassa 2019. Lähde: Global Forest Watch. 

 

Kuva 4. Päätin esittää taulukossa kestävästi palmuöljyä tuottavien plantaasien määrän (RSPO) Indonesian muihin plantaaseihin verrattuna. Taulukossa on lisäksi myös muuta tietoa alueen viljelmistä. 

Alueen palmuöljy plantaasit

Alueen RSPO-

plantaasit

Alueen kaikkien palmuöljyplantaasien pinta-ala yhteeensä Kuinka monta prosenttia plantaaseista on vastuullisesti palmuöljyä tuottavia plantaaseja?
1845 78 152 001 km² 4,23 %

 

Kuva 5. Indonesian palmuöljyplantaasit (oranssilla)  ja RSPO-plantaasit (punaisella) 2019. Lähde: Global Forest Watch.

Kuten aikaisemmin totesin, kartat esittävät laajalti (kuva 1 ja kuva 2)  jo samalla formaatilla saatavilla olevaa tietoa. Motivoituneena muuttamaan tämän, päätin interpoloida molemmat tietokannat palmuöljyviljelmistä ja tutkia näin metsäpinta-alan vähenemistä. Tarkastelemalla kuvia 2 ja 5 voidaan jo todeta, että muuttujien välillä vallitsee spatiaalinen korrelaatio. Plantaasien sijainti ja luonnontilaisten metsien väheneminen kohdistuu samoille alueille. Interpoloidut kartat (kuva 6 ja kuva 7) vahvistavat tätä havaintoa, mutta tuovat esiin myös RSPO-plantaasien vaikutuksen aluetta ympäröiviin metsiin. Kuvasta 7 voidaan havaita, että alueilla joilla tuotetaan kestävästi palmuöljyä ei ole havaittavissa yhtä voimakasta metsäpinta-alan vähenemistä kuin muilla plantaasialueilla (kuva 6). On toki pidettävä mielessä, että osa plantaaseista tuottaa sekä RSPO:n kriteerien mukaista palmuöljyä ns. “normaalisti” tuotetun palmuöljyn lisäksi.  Tämä voi vaikuttaa interpoloinnin tuloksiin. 

Kuva 6. Riaun provinssi Indonesiassa. Tummansiniset alueet kuvaavat alueita, joihin suurimmat palmuöljyplantaasit sijoittuvat. Punaiset alueet kuvaavat metsien häviämistä vuosina 2000-2018. 

Kuva 7. Riaun provinssi Indonesiassa. Tummansiniset alueet kuvaavat alueita, joihin suurimmat RSPO-palmuöljyplantaasit sijoittuvat. Punaiset alueet kuvaavat metsien häviämistä vuosina 2000-2018. 

Kävin lopuksi tutkimassa muiden kurssilaisten blogeissa esiintyviä karttoja ja erityisesti esiin nousi Roni Lindholmin “Kurssikerta 7” -julkaisussa (29.2.2020) kaupunkipyöräilyä käsittelevä karttasarja.  Halusin mainita juuri kyseisen julkaisun, sillä kirjoittaja onnistui kiitettävästi laatimaan jotain mielenkiintoista ja uutta – tämä jäi itseltäni uupumaan. Karttoja oli antoisaa lukea ja niitä oltiin pohdittu hyvin blogissa. Olen samaa mieltä tulosten yllättävyydestä blogin kirjoittajan kanssa. 

Tähän loppuun haluan vielä nopeasti mainita päätökseen saatetusta kurssista hieman. Kaiken kaikkiaan kurssi oli todella antoisa ja pidin kurssin aikana tehdyistä tehtävistä. Karttojen laatiminen sekä QGIS:n toimintojen opettelu oli oikeastaan mukavaa vaihtelua pelkän pänttäämisen sijasta. Sanoisin hallitsevani QGIS:n käyttämisen tällä hetkellä suhteellisen hyvin, eikä ohjelmisto itsessään synnyttänyt suuria päänsärkyjä kurssin aikana. Tästä on hyvä jatkaa positiivisin mielin kohti seuraavia kursseja ja uusia haasteita. 

 

Lähteet

 

Natural Earth

<https://www.naturalearthdata.com>

 

University of Maryland. Global Forest Change. 

<https://earthenginepartners.appspot.com>

 

Global Forest Watch

<http://data.globalforestwatch.org>

 

Lindholm, R. (29.2.2020). Kurssikerta 7. Blogikirjoitus.

<https://blogs.helsinki.fi/lroni/>

Kuudes kurssikerta – Ulkoilua ja interpolointia

Kuudes kurssikerta alkoi raittiin happihyppelyn merkeissä. Aloitimme keräämällä pienemmissä ryhmissä tietoa Kumpulan alueelta Epicollect5 -paikkatietosovellukseen. Lisäsimme sovellukseen sijaintitieto sidonnaisia kohteita puhelimen GPS:n avulla. Lisätessä sovellukseen kohteita tuli vastata kysymyksiin alueen viihtyvyydestä ja turvallisuudesta, minkä perusteella tutkimme Kumpulan kaupunkikohteiden yleistä viihtyvyyttä. Pinja Laitinen tuo blogissaan “Ylös, ulos ja lenkille” esille Heini Mäkelän hyvän huomion siitä, että kerätty tieto ei ole kovin objektiivista, vaan enemmänkin juuri subjektiivinen kokemus alueesta. Eräs kysymyksistä oli kuinka turvalliseksi tuntee kyseisen alueen tai kohteen ja tämä voi riippua paljon yksilön omista kokemuksista. Määritetyistä kohteista voidaan oikeastaan nähdä, että Kumpulan kampuksen alueella tietty yksittäinen kohde on koettu hyvin turvattomaksi vaikka alueen muu ympäristö ollaan koettu pääasiassa turvalliseksi (kuva 2). 

Koska arvioimme myös kaupunkikohteiden viihtyvyyttä, on otettava huomioon arviointi hetkellä vallitsevat sääolosuhteet – jotka sattuivat olemaan harvinaisen surkeat. Kävelimme ympäri kumpulaa tihkusateessa ja ajoittaisissa jäätävän kylmissä tuulenpuuskissa. Jos olisimme arvioineet kohteet aurinkoisella ja lämpimällä säällä, olisi viihtyvyyden kokemus varmasti ollut erilainen. Väittäisin siis vahvasti, että viihtyvyyteen vaikuttaa epäsuorasti myös sää. Ulkoilun jälkeen asteltiinkin sitten takaisin luokkaan läpimärkänä. 

Kuva 1. Epicollect5-sovelluksesta QGIS:iin tuodut kohteet. 

Kun olimme saaneet datan kerättyä, toimme sen CSV (comma separated values) -muotoisena tiedostona QGIS:iin Epicollect5-sovelluksesta. Lisäksi avasimme muutaman muun tietokannan mm. Helsingin alueen tiestöstä ja rakennuksista. Kun olimme saaneet kerätyt kohteet kartalle, rupesimme tutkimaan visuaalisesti niissä koettuja turvallisuuden tunteita. Kohteiden ja koetun turvallisuuden välillä pystyttiin nähdä yhteys liikenneverkon kanssa. Keskimäärin hieman turvattomaksi koettiin risteykset ja suurien autoteiden varret. Turvalliseksi koetut paikat sijoittuivat puolestaan puistoalueille, Kumpulan kampukselle sekä Vanhankaupungin alueelle (kuva 2). Harjoittelimme lopuksi kohteiden interpolointia. Interpolointi määritti mitattujen kohteiden välille tietyn oletusarvon, minkä seurauksena saimme tulokseksi yhtenäisen kartan alueen turvallisuudesta. Kokeilimme myös miltä interpolointi näyttää eri arvoilla (kuva 3) ja voidaan, todeta että arvojen muuttaminen vaikuttaa selvästi lopputuloksiin sekä kartan luettavuuteen. 

 

Kuva 2. Interpoloitu kartta. Turvallisuuden tunteen kokeminen eri kohteissa Kumpulan alueella. Sininen kuvastaa turvallisimpia kohteita ja punainen turvattomampia kohteita. 

Kuva 3. Interpoloinnin lopputulos, kun pisteiden väliseksi etäisyydeksi määritetään 10. 

Pakko sanoa, että interpolointi oli omasta mielestäni kurssikerran – ellei koko kurssin –  kiehtovin osuus. QGIS on ihmeellinen siinä mielessä miten esteettisiä karttoja sekä esityksiä sen avulla on mahdollista luoda ja miten monipuolisesti karttoja voi laatia, jos vain tietää mitä tekee. Kurssikerran itsenäisenä tehtävänä oli etsiä itse dataa ja laatia sen perusteella kolme luonnonriskejä ilmentävää karttaa. Tehtävä oli omakohtainen suosikki tähän mennessä ja katosin hetkeksi tietokantojen syövereihin ihailemaan saatavilla olevan tiedon määrää. Päädyin käyttämään kaikissa kartoissani NOAA:n (National Oceanic and Atmospheric Administration) tulivuoritietokantaa.

Etsin tietokannasta maailmanlaajuisesti merkittävimmät tulivuorenpurkaukset ja rajasin tapahtuma ajankohdaksi 1500 – 2020. Tietokanta sisälsi laajasti tietoa mm. purkausten uhriluvuista, taloudellisista vahingoista sekä purkausten voimakkuudesta VEI-asteikolla (vulkaaninen räjähdysasteikko). Tietokantaan oli merkattu myös aiheuttiko purkaus tapahtuessaan tsunamin tai maanjäristyksen. Olen itse todella kiinnostunut luonnonmaantieteestä ja varsinkin endogeenisistä prosesseista, siksi tietokanta oli itselleni kuin runsaudensarvi. 

Kuva 4. Merkittävien tulivuorenpurkausten uhrimäärät vuosina 1500-2020.

Muutin NOAA:n sivuilta saadun tietokannan excelissä CSV-muotoon ja siivosin sitä hieman, jonka jälkeen toin sen QGIS:iin. Päätin ensin laatia maailmanlaajuisen kartan 1500-2020 vuosina tapahtuneista merkittävistä tulivuorenpurkauksista ja niiden kuolonuhreista (kuva 4). Kuten lopputuloksesta huomataan, eniten purkauksiin liittyviä kuolemia on Karibianmerellä sekä Indonesiassa. Tietokannasta tarkasteltuna Martiniquessa tapahtunut Pelee-tulivuoren purkaus vaati 28 000 kuolonuhria, joka on maailmanlaajuisesti eniten tarkastellulla aikavälillä. Kyseinen tsunamin synnyttänyt purkaus tapahtui vuonna 1902 ja oli VEI-asteikolla 4. Indonesian alueella puolestaan katastrofaalisin tietokantaan merkitty purkaus on vuonna 1815 purkautunut Tambora-kerrostulivuori.  VEI-asteikoltaan Tamboran purkaus oli 5 ja sen seurauksena menehtyi noin 10 000 henkeä. 

Kun mietitään kartan soveltuvuutta opetustarkoitukseen voidaan kyseenalaistaa kartan selkeys. Sanoisin, että laatimani kartta on laajalti epäselvä ja sen luettavuus kärsii tämän takia. Tulivuoria kuvaavat kohteet peittävät toisensa ja karttaa on mahdoton tulkita pelkästään kuvasta vaan sen tarvitsee myös sanallista selittämistä. Kartan legendasta ei esimerkiksi tule esiin, että kyseessä on tulivuorenpurkauksiin liittyvät kuolonuhri määrät. On myös pidettävä mielessä että teknologian ja seurantalaitteiden kehittyessä tulivuorenpurkauksiin liittyvät kuolemat ovat vähentyneet, koska niihin ollaan voitu varautua paremmin. Tämän takia karttaa ei voida oikeastaan yleistää ja tutkia näin alueita, jotka kärsivät tulivuorenpurkauksista eniten. 

 

Kuva 5. Indonesiassa tapahtuneet merkittävät tulivuorenpurkaukset tapahtumavuoden mukaan (1500-2020). 

Halusin seuraavaksi tutkia tulivuorenpurkausten tapahtuma ajankohtia. Kartalla (kuva 5) tummemmat siniset alueet ovat alueita, joilla on tapahtunut vanhimmat merkittävät tulivuorenpurkaukset ja vaaleat keltaiset alueet kuvaavat puolestaan uudempia tulivuorenpurkauksia. Kartan luokittelu voisi olla erilainen, sillä luokkaeroja on vaikea havaita kartalla niiden määrän takia. Muuten sanoisin, että kartta on suhteellisen informatiivinen. Kyseenalaistan silti sen käytettävyyttä tai tarpeellisuutta opetuksessa. Kartalta voidaan nähdä miten alueet ovat olleet eri aikoina aktiivisia. Interpolointi tason luokittelu saa kartan näyttämään sille, että tulivuorenpurkaukset ovat yleistyneet vuosien kuluessa. Todellisuudessa asia ei ihan ole näin. Kartalla näkyvät purkaukset ovat yhteydessä seurantateknologian kehittymiseen ja siksi purkauksia on vähemmän tarkasteluvälin alkuvuosilta.

 

Kuva 6. Vuosina 1500-2020 tapahtuneet merkittävät tulivuorenpurkaukset Etelä-Amerikassa mitattuna VEI-asteikolla. 

Päätin viimeisessä kartassa käyttää hyödyksi tietokantaan merkittyä VEI-asteikkoa. Lopputulosta voisikin käyttää mahdollisesti opetus tai havainnointi tarkoitukseen. Valmis kartta (kuva 6) havainnoi missä päin manteretta purkauksia on tapahtunut ja mitkä ovat niin sanotusti alttiitta alueita merkittäville tulivuorenpurkauksille. Kartan avulla voidaan tarkastellulta aikaväliltä paikantaa alueet, joissa tulivuorenpurkauksen voimakkuus on ollut suurin. Kartan ongelmana on kuitenkin sen vähäinen informaatio, sillä karttaa ei pystyisi lukemaan ilman kuvatekstiä. Tämä tuntuu olevan toistuva teema omalla kohdallani. Itse kartasta ei tule ilmi mitä ilmiötä kyseinen kartta käsittelee. Näin jälkikäteen mietittynä olisi ollut myös hyvä laatia karttoja eri muuttujien suhteen. Sain idean interpoloida kartan VEI-asteikon mukaan ja verrata sitä purkauksen uhrimääriin. Olisi ollut mielenkiintoista tutkia miten nämä muuttujat korreloivat keskenään. Lisäksi olisi ollut kiinnostavaa tutkia purkausvuosia ja verrata niitä kuolonuhreihin tai talodellisiin vahinkoihin. Näiden tutkiminen taitaa jäädä omaksi vapaa-ajan iloksi.

 

Lähteet

 

Laitinen, P. (2.3.2020). Ylös, ulos ja lenkille. Blogikirjoitus. 

<https://blogs.helsinki.fi/lempempi/> 

Mäkelä, H. (24.2.2020). Epicollect5-sovellus, interpolointi ja cvs-muotoisen aineiston lataaminen internetistä. Blogikirjoitus.

<https://blogs.helsinki.fi/mcheini/>

National Oceanic and Atmospheric Administration

<https://www.ngdc.noaa.gov/>

Viides kurssikerta – Itsenäisten tehtävien kirjoa

Viides kurssikerta jatkui edellisellä kerralla digitoitujen kohteiden analysoimisella. Olimme digitoineet Pornaisten alueelta rakennukset sekä tärkeimmät tiet, joiden avulla harjoittelimme pääasiassa QGIS:n bufferointitoiminnon käyttöä ja sen soveltamista. Tutkimme miten asutus sijoittuu esimerkiksi koulujen ympärille, teiden varsille ja terveysaseman läheisyyteen luomalla niiden ympärille halutun kokoisen puskurivyöhykkeen. Pohdimme tämän avulla kuinka suuri osa alueen asukkaista asuu kyseisten kohteiden välittömässä läheisyydessä. Bufferi-analyysin avulla näiden kysymysten selvittäminen oli helppoa. Puskurin luomisen jälkeen pystyi selvittämään sen sisälle jäävät kohteet “select by location” -toiminnolla ja vastaavasti puskurin ulkopuolelle jääviä kohteita oli mahdollista tutkia “invert selection” -toiminnolla.

 

Tehtävä 1 – Malmin lentokenttä 

 

Kuva 1. Malmin lentokentän ympärille luotu säteeltään kahden kilometrin kokoinen puskurivyöhyke ja sen alueelle jäävät kohteet (merkitty keltaisella). 

Kun bufferointi oli tullut tutuksi, oli aika siirtyä opitun soveltamiseen itsenäisten tehtävien parissa. Käytimme itsenäisiä tehtäviä tehdessä erilaisia tietokantoja Vantaan alueesta, kuten  väestötietokantaa johon oli merkitty tietoa myös alueen rakennuksista ja esimerkiksi niiden käyttöönottovuosista. Pohjakarttana käytimme valmiita rasterimuotoisia tietokantoja. Pohdimme tunnilla yhdessä tehtäviä ja niiden toteutusta Tiina Aallon kanssa. Tiina keksi taulukoida saadut tulokset ja nähtyäni kuinka siistin lopputuloksen tästä sai aikaan, päätin myös laatia vastaavanlaisen taulukon omista tuloksista blogiin. Kunnia tästä kuuluu siis hänelle. 

Aluksi tutkittiin Malmin lentokenttää ja sen lähiympäristöä. Lentokenttä digitoitiin ensin omaksi kohteekseen, mikä mahdollisti puskurivyöhykkeen luomisen sen ympärille. Tämän jälkeen puskurivyöhykkeen ja kyselyjen avulla määriteltiin alueen väestöstä erilaista dataa tehtävänannon mukaisesti. Tehtävänä oli tutkia kuinka suuri osa alueen väestöstä asuu pahimmalla melualueella eli noin 2 km säteellä Malmin lentokentästä. Voidaan todeta, että kahden kilometrin etäisyydellä Malmin lentokentästä asuu huomattava määrä ihmisiä (kuva 2). Alue kattaa laajalti koko Malmin ja ulottuu jopa Kontulan sekä Jakomäen alueelle. Alueella on myös useampi koulu, joita lentoliikenteen melusaaste voi haitata. Kilometrin päähän lentokentästä ei puolestaan ole rakennettu niin paljoa. Alueelle osuu pääasiassa vain Sepänmäen asutusalue ja osa Tapanilasta. Siispä pahimmat meluhaitat jäävät kuitenkin suhteellisen vähäisiksi. 

 

Kuva 2. Taulukko Malmin lentokentän lähiympäristöstä ja lentokentän melualueista. Tiedot saatu Vantaan väestötietokannasta.

Vantaan asukkaat yhteensä Vantaan rakennukset yhteensä Asukkaat 1 km säteellä Malmin lentokentästä Asukkaat 2 km säteellä Malmin lentokentästä
490 173 55 811 8 648 56 727

 

Innostuin tekemään myös aiheeseen liittyvän lisätehtävän. Tehtävä osoittautui vaikeammaksi kuin ajattelin, sillä en ollut vielä sisäistänyt kunnolla QGIS:n laskinohjelman käyttöä. Lisätehtävänä oli tutkia kuinka vanha Malmin lentokenttä on ympäristöönsä verrattuna ja ottaa selvää kuinka moni 1 km etäisyydellä olevista rakennuksista on rakennettu alueelle Malmin lentokentän käyttöönoton jälkeen. Päätin luottaa Wikipediaan, jossa Malmin lentokentän käyttöönottovuodeksi todettiin 1936. Määritin visuaalisella analyysillä atribuuttitaulukosta rakennukset, jotka oltiin otettu käyttöön ennen vuotta 1936 tai kyseisenä vuonna. Tämän jälkeen vähensin määrän 1 km säteellä olevista rakennuksista ja sain vastaukseksi 690. Kopioin tietokannan Exceliin, jossa laskin kyseisten rakennusten asukkaat. Lopputulokseksi sain yhteensä 8 420 asukasta. Tietokannassa ei ollut tietoa 12 rakennuksen käyttöönottovuosista, mutta tulosten perusteella voi todeta Malmin lentokentän olevan selvästi vanhempi kuin ympäristönsä. 

 

Helsinki-Vantaan lentokenttä 

Päätin esittää seuraavan tehtävän visuaalisesti. Käytimme samoja tietokantoja ja metodeja mutta lisäksi sovelsimme tietokantaa Helsinki-Vantaan meluvyöhykkeistä. 

 

Kuva 3. Taulukko Helsinki-Vantaan lentokentän lähiympäristöstä ja alueen meluvyöhykkeistä. 

Vantaan asukkaat yhteensä 490 173
Vantaan rakennukset yhteensä 55 811
Helsinki-Vantaan lentokentästä 2 km säteellä eli sen välittömässä läheisyydessä asuvat

10 299 asukasta

2 215 rakennusta

Pahimmalla melualueella (65 dB) asuvien prosentuaalinen osuus lentokentän välittömässä läheisyydessä asuvista Edellisen kohdan asukkaista pahimmalla melualueella asuu 27. Prosentteina tämä on lähemmäs 3 prosenttia (2.6 %). 
Vähintään 55 dB melualueella asuvat Yhteensä koko melualueella (55dB – 65dB) asuu 11 913 ihmistä 
Jos saapuva liikenne käännettäisiin laskeutumaan Tikkurilan yli, kuinka monen ihmisen elämää vähintään 60 dB lentomelu haittaisi Tikkurilassa* Yhteensä 2 397 ihmistä

* Rajasin Tikkurilan väestön asutusalueiden perusteella ja otin rajaukseen mukaan Tikkurilan alueen, Hiekkaharjun, Jokiniemen, Kuninkaalan, Simonkylän sekä Viertolan. Koin että pelkän Tikkurilan alueen valitseminen tietokannasta ei olisi ollut kovin kuvaavaa.

 

Tehtävä 2 – Asemat

 

Kuva 4. Taulukko Vantaan asemista ja niiden lähiympäristöstä. Käytimme valmista tietokantaa Vantaan juna- ja metroasemista.

Alueen asukkaat yhteensä 490 173
Asukkaat, jotka asuvat 500 metrin päässä lähimmästä juna- tai metroasemasta 106 691
Asemasta alle 500 metrin päässä asuvien prosentuaalinen osuus alueen kaikista asukkaista Noin 22% eli vähän yli neljäsosa
Työikäisten (15-64v) osuus alle 500 metrin päässä lähimmästä juna- tai metroasemasta asuvista Yhteensä 73 086 asukasta eli noin 69%

 

Tehtävä 3 – Taajamien asukit 

Jatkoimme samoilla tietokannoilla mutta lisäksi tutkimme tietokantaa Vantaan taajamista. Ensin tuli määrittää kuinka moni tehtävän alueen asukkaista asuu taajamissa. Määritin tämän “select by location” -toiminnolla ja sain vastaukseksi 478 371, joka on huomattava osa alueen kaikista asukkaista (490 173). Seuraavaksi tuli puolestaan määrittää taajamien ulkopuolella asuvat kouluikäiset ja kuinka suuri osuus tämä on kaikista alueen kouluikäisistä. 

Koska tehtävänannossa ei määritetty kouluikäisten ikähaarukkaa, päädyin rajaamaan kouluikäiset peruskoululaisiin eli 7-16 vuotiaisiin. Tätä laskiessani sisäistin vihdoin QGIS:n laskinohjelman käytön. Kouluikäisiä on koko alueella yhteensä 60 922 ja taajamien ulkopuolella heistä asuu 1 556 eli noin 2.5%.

Viimeinen kohta tuotti eniten aherrusta ja siksi päätinkin käsitellä tehtävää blogissani hieman yksityiskohtaisemmin. Haluan esitellä kovan työn tulokset ja olla esimerkki siitä, mitä ei välttämättä kannata lähteä tekemään sillä olisin saanut saman lopputuloksen paljon yksinkertaisempaa metodia käyttäen. Viimeinen kysymys kuului: “Kuinka monella alueella ulkomaalaisten osuus on yli 10%, entä 20% tai 30%?” Tulkitsin kysymyksen siten, että kuinka monella taajama-alueella ulkomaalaisten osuus on x alueen asukkaista. Väestötietokannassa oli reilusti yli 200 kohdetta, joissa ei ollut tietoa ulkokansalaisista asukkaista mutta päätin kuitenkin käyttää saatavilla olevaa tietokantaa ja jättää kyseiset kohteet pois laskuista. Tämän seurauksena tuloksilla voi olla suuri virhemarginaali. 

Päätin pitkän pohdinnan jälkeen hylätä taajama-alue luokittelun ja laskea asuinalue kohtaiset ulkokansalaisten osuudet. Tämä tuntui järkevämmältä sillä kysymyksessä ei spesifioitu mitä alueluokittelua käyttää. Koko urakkaan meni reilu tunti kun hain kohteita nimen perusteella ja yhdistelin niitä “merge” -toiminnon avulla. Yhdistettyjä asuinalueita oli lopulta 77 ja tietokantaan jäi paljon kohteita, joihin ei oltu merkitty asuinalueita. Päätin jättää kohteet pois laskuista, mikä puolestaan vaikuttaa myös tuloksiin. 

 

Kuva 5. Työlään prosessin tulokset. 

Laskin ulkokansalaisten prosentuaaliset osuudet koko asuinalueen väestöön verrattuna samaan atribuuttitaulukkoon (kuva 5). Lopputulokseksi sain, että alueita joissa ulkokansalaisten osuus on yli 10% on 21, alueita jossa osuus on yli 20% on 2 ja alueita jossa osuus on yli 30% ei ole yhtään. Tuloksia vääristää luultavimmin puutteet tietokannassa. Olisin voinut yhdistää alueet myös toisin ja hälytyskellojen olisi pitänyt soida ennen kuin aloitin yli tunnin kestävän merge-operaation. Lopputuloksessa kaikkia asuinalueita ei olla kuvattu ja tietyistä asuinalueista voi puuttua useita kohteita.

 

Tehtävä 4 – Uima-altaat ja saunat

Päätin esittää tämänkin tehtävän tulokset pääasiassa taulukossa, ettei blogiteksti venyisi liian pitkäksi. Kyseisessä tehtävässä käytin pääkaupunkiseudun väestö- ja rakennustietokantoja, sekä pääkaupunkiseudun aluerajauksia. 

 

Kuva 6. Taulukko pääkaupunkiseudun uima-altaista ja saunoista.

Pääkaupunkiseudun kaikki asutut talot 90 725
Pääkaupunkiseudun uima-altaalla varustetut talot 855
Asukkaiden määrä yhteensä uima-altailla varustetuissa taloissa 12 170
Uima-altaiden määrä erilaisissa talotyypeissä

Omakotitalot – 345

Paritalot – 158

Rivitalot – 113

Kerrostalot – 181

Saunojen määrä pääkaupunkiseudun taloissa ja niiden prosentuaalinen osuus kaikista alueen taloista

Sauna yhteensä 21 922 taloissa. 

Tämä on noin viidesosa kaikista alueen taloista (24%).  

Tehtävänä oli myös laatia kartta, joka kuvaa pääkaupunkiseudun uima-allasrikkaimpia alueita. Päätin ensin luoda “join” -työkalun avulla tietokannoista yhden aineiston, jotta pystyisin esittämään uima-altaiden jakautumista pääkaupunkiseudulla. Tulokset näyttivät kuitenkin hassuille ja olin todella epävarma olinko laatinut kartan oikein. Päätin hakea vertaistukea muiden kurssilaisten blogeista ja törmäsin Heini Mäkelän “Bufferointi ja kohteiden valinta” -blogikirjoituksessa (20.2.2020) esiintyvään karttaan samasta aiheesta ja yllätyin, kuinka traagisen erilaiset kartat olivat. Heinin kartta motivoi yrittämään uudelleen ja tämä palkittiin, sillä lopputulos näytti nyt paljon paremmalta. Tein alunperin väärin yhdistäessä tietokannat, sillä palatessani kurssin aiempiin tehtäviin tajusin että kartan voi laatia yksinkertaisesti “count points in polygon” -toiminnolla. Lopulta sain kartan näyttämään jotenkin oikealle (kuva 7.) Kuten huomataan, eniten uima-altaita on Lauttasaaressa, jossa määrä ylittää huimat 53. 

Kuva 7. Pääkaupunkiseudun uima-altaat alueittain. 

 

Lähteet

Aalto, T. (19.2.2020). Itsenäistä taistelua. Blogikirjoitus. 

<https://blogs.helsinki.fi/tidaalto/> 

Mäkelä, H. (20.2.2020). Bufferointi ja kohteiden valinta. Blogikirjoitus. 

<https://blogs.helsinki.fi/mcheini/>