Categories
Uncategorised

Geoinformatiikan menetelmät 2 – Raportti 7

Johdanto

Kurssin viimeisellä eli seitsemännellä viikolla aiheena olivat geostatistiset interpoloinnit. Aiemmin tutuksi tulleisiin deterministisiin interpolointimenetelmiin verrattuna geostatistisissa interpoloinneissa erona on se, että ne käyttävät apunaan tilastotiedettä. Tilastotiedettä hyödyntäen menetelmissä siis ennustetaan mitattujen pisteiden arvojen perusteella se, mitä muualla tutkimusalueella todennäköisesti on.

Deterministiset ja geostatistiset interpolointimenetelmät eroavat siis toisistaan ja ne soveltuvat erilaisten datojen interpolointiin. Kurssikerran kirjallisuudessa oli esimerkki, jossa interpolointimenetelmiä oli tutkittu osana pohjaveden suolaisuuden tutkimusta. Lopputuloksena geostatistiset interpolointimenetelmät ja tarkimmin vielä EBK (eli Empirical Bayesian Kriging) oli kyseisessä tutkimuksessa paras menetelmä, koska kyseinen menetelmä oli luotettavin (Gunarathna ym., 2016). Luotettavuutta ja mahdollisten virheiden vähyyttä oli tarkasteltu menetelmän virhemarginaalin avulla.

Geostatistiset menetelmät perustuvat spatiaaliseen autokorrelaatioon eli maantieteen ensimmäiseen lakiin. ”Lain” mukaan kaikki riippuu toisistaan, mutta toisiaan lähellä olevat kohteet ovat enemmän toisistaan riippuvaisia kuin kauempana olevat. Spatiaalisessa tilastotieteessä siis hyödynnetään tätä olettamusta.

Interpolointimenetelmänä kurssikerran harjoituksissa käytettiin kriging-interpolointeja. Kyseisten interpolointimenetelmien lopputuloksista voidaan esimerkiksi laskea todennäköisyyksiä, virheitä ja interpoloinnin luotettavuutta. Aineistot, joiden avulla interpolointeja suoritettiin olivat mielestäni mielenkiintoisia, joka lisäsi omalta osaltaan harjoitusten kiinnostavuutta.

Ensimmäinen harjoitus

Seitsemännen kurssikerran ensimmäisen harjoituksen tarkoituksena oli vertailla näitä kahta eri interpolointimenetelmää. Harjoituksen aineistona oli Afrikan lämpötiloja esittäviä pisteitä, jotka interpoloitiin sekä IDW-interpoloinnin että kriging -interpoloinnin avulla.

Interpoloinnit toteutettiin jo aiemmalla kurssikerralla tutuksi tulleen Geostatistical Wizard -työkalun avulla. Työkalussa molempia interpolointimenetelmiä tarkasteltiin vaihtamalla niiden arvoja. IDW-interpoloinnista tehtiin kaksi versiota, jossa oli käytössä hieman eri asetukset, jotka vaikuttivat siihen, mitä olemassa olevia pisteitä interpolointi painottaa ja kuinka paljon. Interpolointien suorittamisen jälkeen lopputuloksia vertailtiin cross validation -ikkunan avulla.

Myös kriging -interpoloinnista tehtiin kaksi eri versiota, joita vertailtiin. Toinen tehtiin optimoinnin avulla ja toisessa muokattiin naapuruston vaikutusta, jotta yhden suunnan naapuripisteet eivät vaikuttaisi niin paljon lopputulokseen.

Kuva 1. Ensimmäisen harjoituksen kartta.

Geostatistical Wizardin käyttö on helppo suorittaa ja optimoinnin avulla interpoloineihin saa arvot, jotka ainakin sopivat kyseiseen menetelmään. Työkalussa on kuitenkin paljon erilaisia arvoja, joita voi myös manuaalisesti säätää. Osa näistä arvoista ja niiden vaikutuksista jäivät hieman epäselviksi. Toisaalta ymmärsin mitä tehtävissä säädettävillä arvoilla, kuten naapurustoa säätämällä, oli tarkoitus saavuttaa, joten ainakin työkalun perusominaisuudet tulivat tutuksi.

 

Toinen harjoitus

Toisessa harjoituksessa etsittiin lämpösaarekkeita Madisonin kaupungin alueelta. Tehtävän alussa tutustuttiin aineistoon erilaisten kaavioiden, kuten histogrammin, avulla sekä kerrottiin taustatietoja lämpösaarekkeiden vaikutuksista esimerkiksi vanhempiin ihmisiin.

Interpolointimenetelminä tehtävässä käytettiin kriging -interpolointia. Ensin tehtiin yksinkertainen kriging -interpolointi, jonka jälkeen suoritettiin Empirical Bayesian kriging -interpolointi. Interpoloinnit toteutettiin taas Geostatistical Wizardin avulla. Interpolointien jälkeen lopputuloksia vertailtiin.

Bayesian kriging -interpolointi eroaa normaalista kriging -interpoloinnista siten, että siinä ei käytetäkään yhtä ja samaa semiovariogrammia koko tutkimusalueelle. Kyseinen interpolointimenetelmä siis jakaa datan pienempiin osiin ja luo jokaiselle osalle oman semiovariogrammin.

Menetelmien vertailussa cross validation -ikkunan avulla huomattiin, että EBK:n avulla saatiin hieman oikeampia lämpötila-arvoja esittävä kartta. Erot arvoissa eivät olleet toki kovin suuria ja visuaalisesti tarkasteltuna interpoloiduissa kartoissakaan ei ollut havaittavissa suuria eroja.

Interpolointien jälkeen käytettiin vielä EBK regression -työkalua, jonka avulla lämpötilojen interpolointeihin yhdistettiin dataa selittävästä tekijästä. Työkalun avulla siis poistettiin kartalta vettä läpäisemättömiä pintoja, kuten asfalttipintoja. Se, miten työkalun matemaattinen toiminta tapahtuu, jäi itselleni hieman epäselväksi, mutta sen ymmärtäminen ei tainnut ollakaan ihan keskeisin osa tehtävää.

Kuva 2. Toisen harjoituksen lämpötilakartta.

Kuva 3. Toisen harjoituksen lämpötilakartta alueittain.

Lyhyt kurssin yhteenveto

Kurssin alussa etänä suoritettava GIS-kurssi kuulosti haastavalta, mutta näin kurssin jälkeen se sujui paremmin kuin aluksi ajattelin. Opin uusia asioita ja ymmärsin ainakin perusasiat eri kurssikerroilta. Suoritetut harjoitukset olivat myös pääosin mielenkiintoisia, vaikkakin osa melko pitkiä. Paras puoli kurssissa oli taas, kuten muissakin GIS-kursseissa, karttojen visualisointi. Visualisoinnissa voi kokeilujen avulla havainnoida tehtyjä työvaiheita ja muutenkin kokeilla erilaisia visualisointimenetelmiä ja väriyhdistelmiä. Visualisointiin voisi myös käyttää hyvinkin paljon aikaa ja usein lopputulosta voisi vielä parantaa, kuten tämän raportin kuvassa 1 legendan lämpötilatiedoista voisi vähentää näkyviä numeroita.

Kuva 4. GIS-blogi part 2 matkalla joululomalle.

Lähteet

Gunarathna et al. (2016). Are Geostatistical Interpolation Methods Better than Deterministic Interpolation Methods in Mapping Salinity of Groundwater? International Journal of Research and Innovations in Earth Science 3(3), 59-64

Moodlen luentodiat

<https://moodle.helsinki.fi/course/view.php?id=41841#section-10>

Categories
Uncategorised

Geoinformatiikan menetelmät 2 – Raportti 6

Lyhyt johdanto kurssikerran teemaan eli interpolointiin

Kuudennella viikolla aiheena oli tutustua erilaisiin interpolointimenetelmiin. Paikkatietojärjestelmät perustuvat sijainniltaan tunnettuihin tietoihin. Tiedot eivät ole kuitenkaan aina alueellisesti kattavia, joten jotta alueita voidaan kuvata tarkemmin, niin käytetään spatiaalisen interpoloinnin menetelmiä. Spatiaalisessa interpoloinnissa tiettyyn paikkaan sidottuja havaintopisteitä käytetään muodostamaan jatkuva pinta interpoloinnin avulla.

Spatiaalinen interpolointi perustuu siis havaintoon, jonka mukaan toisiaan lähellä sijaitsevat pisteet ovat arvoiltaan suurella todennäköisyydellä lähellä toisiaan verrattuna kauempana toisistaan oleviin pisteisiin. Tätä ilmiötä kutsutaan spatiaaliseksi autokorrelaatioksi, jota pyritään mallintamaan itse erilaisissa interpolointimenetelmissä.

Interpolointimenetelmiä on monta ja aina oikean valitseminen ei ole helppoa. Menetelmän tulee soveltua halutun ominaisuuden mallintamiseen ja sen tulee pystyä hyödyntämään tehokkaasti käytettyjä havaintopisteitä ja niiden sijainteja. Menetelmistä osa soveltuu paremmin laajempien trendinomaisten vaihteluiden kuvaamiseen ja toiset pienimuotoisempien paikallisempien vaihteluiden kuvaamiseen (Holopainen ym., 2015).

Ensimmäinen harjoitus

Kurssikerran ensimmäisessä harjoituksessa tuli tutustua dataan eli happipitoisuuksiin Chesapeakenlahen alueella. Valmiissa datassa happipitoisuuksia oli esitetty eri puolilla lahden aluetta pisteiden avulla. Harjoituksen alussa dataa tutkittiin kaavioiden avulla. Kaavioiden avulla tutkittiin happipitoisuuksia eri vuosina, jotta saatiin selville, että itse analyysi tuli toteuttaa vuoden 2014 aineistosta, jossa tutkitut happipitoisuudet olivat huonommillaan. Vuoden selvittämisen jälkeen toisella taulukolla tutkittiin vielä tarkemmin eri osia lahden alueella.

Tämän jälkeen päästiin tekemään interpolointia. Interpolointi tehtiin Geostatistical Wizard -työkalun avulla, jonka avulla siis saatiin interpoloitu taso, josta näkyi happitasoiltaan ”kuolleet alueet” (dead zones).

Interpolointimenetelmänä tehtävässä käytettiin Interpolation with barries -> Kernel Interpolation. Kyseinen menetelmä on trendipintainterpolointia, joka toteutetaan tietyllä alueella sijaitsevien toisistaan lyhyillä välimatkoilla sijaitsevien pisteiden interpolointiin. Menetelmä myös sopi hyvin tähän tehtävään, sillä tehtävän alue, eli lahti, jossa on kapeita vesialueita maan vieressä, sopi hyvin menetelmän käyttöön näiden veden ja maan rajojen takia.

Tehtävässä tutkittiin menetelmää syöttämällä erilaisia arvoja General Properties sektiossa, visuaalisia muutoksia tarkasteltiin kartasta. Tarkastelun avulla selvitettiin muun muassa sitä, painottaako interpolointi jotain alueita vahvemmin kuin toisia. Esimerkiksi yksi parametri, jonka muokkaamista kokeiltiin, oli bandwith, joka mittaa sitä, kuinka kaukaiset havaintopisteet otetaan huomioon. Parametrin arvoja muokkaamalla interpoloinnista voi suurilla arvoilla tulla liian yleistetty ja pienillä taas karttaan voi syntyä katvealueita.

Tehtävän loppupuolella aineistoa tarkasteltiin vielä cross validation ikkunan avulla. Ikkunan avulla pystyttiin selvittämään muun muassa mahdollisia virheitä. Tehtävän lopussa vielä visualisoitiin ja luotiin kartat annettujen ohjeiden perusteella (kuva 1).

 

Kuva 1. Ensimmäisen harjoituksen kartta, vihreät alueet kuvaavat happipitoisuuksiltaan hyviä ja punaiset huonoja alueita.

Toinen harjoitus

Kurssikerran toisessa harjoituksessa tutustuttiin 3D-aineistojen interpolointiin. 3D-aineistojen interpoloinnissa interpolointi voidaan tehdä esimerkiksi eri korkeuksille erikseen, kuten tehtävässä tulikin tehdä. Tehtävässä selvitettiin sitä, miten syvemmät alueet vaikuttavat alueen happipitoisuuksiin.

Tehtävän alussa ensimmäisen harjoituksen tapaan ensin tarkasteltiin erilaisia kaavioita, joiden avulla aineistoon tutustuttiin. Kaavioiden avulla tarkasteltiin esimerkiksi juuri mainittua happipitoisuuden ja syvyyden välistä eroa. Tarkastelussa havaittiin muun muassa se, happipitoisuudet ovat alhaisimmillaan noin 600 ja 1000 metrin syvyydessä ja 1000 metristä syvemmälle mentäessä ne hiljalleen taas nousevat.

Harjoitus toteutettiin Empirical Bayesian Kriging 3D työkalun avulla. Työkalun parametrejä muokattiin annettujen ohjeiden mukaisesti. Työkalun lopputuloksena syntyi geostatistinen taso, jota tarkasteltiin muokkaamalla ja visualisoimalla sitä. Tämän jälkeen tarkasteltiin vielä luodun mallin tarkkuuttaa ja arvioitiin sen virheiden suuruutta.

Tarkastelun jälkeen päästiin käyttämään jälleen GIS-velho työkalua eli Geostatistical Wizardia, jonka avulla Empirical Bayesian Kriging 3D interpolointi toteutettiin. Interpoloinnin jälkeen se validoitiin, eli tarkasteltiin sen mahdollisten virheiden suuruutta.

Tehtävän lopussa lopputulos visualisoitiin vielä annettujen ohjeiden mukaisesti sekä animaationa että ns. Voxel layerina ja samanarvonpintoina (isosurfaces). Mikäli tehtävän aiemmissa vaiheissa ei ollut pitänyt taukoa, niin animaation toteuttamisessa siihen tarjoutui hyvä sauma, sillä animaationtuottamisprosessin lataaminen otti ajallisesti oman reilun akateemisen varttinsa.

Kuva 2. Voxel layer.

Tämän pienen pakotetun tauon ja animaation toteuttamisen jälkeen lopputulos visualisoitiin vielä Voxel layerina (kuva 2), jonka visualisoimisessa päästiin muun muassa leikkaamaan turhia kulmia luodusta tasosta pois. Viimeisessä vaiheessa luotiin myös happipitoisuuksien samanarvonpinnat (kuva 3).

Kuva 3. Samanarvonpinnat (isosurfaces).

Categories
Uncategorised

Geoinformatiikan menetelmät 2 – Raportti 5

Lyhyt johdanto viidennen kerran asioihin

Viidennellä viikolla aiheena olivat näkyvyysanalyysit sekä 3D-visualisointi. Näkyvyysanalyysit tarjoavat monipuolisia mahdollisuuksia, joihin analyysia voi käyttää. Näkyvyysanalyysien avulla voidaan muun muassa selvittää maisema-alueiden suunnitteluun ja metsänhoidon vaikutusten selvittämiseen. Analyysit sopivat myös rakennettujen ja rakentamattomien alueiden näkyvyystarkasteluihin (Holopainen ym., 2015). Myös luennolla esillä ollut kohteiden, kuten tehtaan, piilottaminen näkyvistä on yksi mielenkiintoinen mahdollisuus, johon analyysia voi käyttää.

3D-visualisoinnin avulla voidaan kuvata muun maussa kaupunkeja ja teemakarttoja. 3D-visualisoinnit sopivat myös aiemmin kurssilla esillä olleen korkeusmallin (DEM) visualisointiin.

Ensimmäinen harjoitus
Ensimmäisessä harjoituksessa tehtävänä oli suorittaa näkyvyysanalyysi, jonka avulla tarkasteltiin leirintäalueiden valojen kattavuutta. Koska valoja oli useampi, tehtiin näkyvyysanalyysi, joka sisälsi useita katselupisteitä eli kohteita.

Harjoituksessa käytettiin databasea, jonka kautta aineistot lisättiin harjoitukseen ja jonne luodut aineistot myös tallentuivat. Databasen käyttäminen oli kätevää juuri edellä mainittujen syiden takia. Aineistojen tallentuminen databaseen helpotti ja nopeutti työskentelyä. Toki databasen käyttämisessä tuli olla hieman perillä siitä, mihin aineistot ladatessa tallentaa, jotta ne löytää kun niitä tarvitaan.

Itse harjoituksessa leirintäalueen valojen näkyvyyttä muokattiin niiden attribuuttitaulukon kautta. Taulukon tietoja muokkaamalla vaihdettiin muun muassa valojen korkeutta, joka tietenkin vaikuttaa siihen, kuinka pitkälle valot valaisevat.

Attribuuttitaulukon tietojen muokkaamisen ohella harjoituksessa käytettiin muun muassa viewshed -työkalua. Työkalun avulla saatiin selville valaistu alue sekä alueet, joihin yltää useampi kuin yksi valo. Työkalun parametrejä muokkaamalla ja valitsemalla oikeat input ja output rasterit saatiin aikaiseksi kartta, josta näkyy että 10 metriä korkeat valotolpat valaisevat alueen kriteereiden mukaisesti.

Kuva 1. Ensimmäisen harjoituksen kartta.

Toinen harjoitus
Toisessakin harjoituksessa suoritettiin näkyvyysanalyysi. Tehtävänä oli analysoida paraatin turvallisuutta tarkkailevien henkilöiden näkyvyyttä suhteessa itse paraatin kulkuväylään. Ensin harjoituksessa luotiin näkyvyysanalyysi ja sen jälkeen analyysia vielä tarkennettiin määrittelemällä sille esteitä.

Lähtöaineistona harjoituksessa oli Philadelphian korkeusmalli (DEM), kaupungin rakennusten sijainnit, paraatireitin sijainti sekä paraatin tarkkailijoiden sijainti. Ensimmäinen tehtävä datan lataamisen jälkeen oli luoda näkyvyyttä kuvaavat viivat tarkkailijoiden ja paraatin reitin välille. Tämä toteutettiin Construct Sight Lines -työkalun avulla.

Työkalun avulla saatiin siis selville se, mitkä paraatin alueet ovat tarkkailijoiden näkyvissä. Tämän jälkeen Line Of Sight -työkalun avulla äsken luotuja näkyvyyttä kuvaavia viivoja tarkennettiin vielä esteiden eli rakennusten avulla. Lopputuloksena näkyvyyttä kuvaavat viivat olivat siis punaisia tai vihreitä, punaisten viivojen kohdalla tarkkailijoiden näkyvyyden peitti rakennus.

Viivojen lisämuokkaus jatkui Add Z Information -työkalun avulla. Työkalun avulla mitattiin viivojen pituus 3D:nä. Vielä tämän jälkeen analyysistä poistettiin viivat, joista tarkkailijat eivät nähneet paraatia. Aikaisempien rakennusten estämien viivojen lisäksi tässä vaiheessa otettiin huomioon kaikki liian kaukana tarkkailijoista olevat viivat, joita he eivät voisi enää nähdä.

Kuva 2. Toisen harjoituksen työvaiheet Model Builderissa.

Tehtävän viimeisessä vaiheessa suoritettiin vielä analyysi, jossa otetiin säätilat huomioon. Jos paraatipäivänä olisi esimerkiksi sumuinen tai sateinen keli, niin tarkkailijoiden näkyvyys olisi huonompi kuin kirkkaana päivänä.

Kuva 3. Toisen harjoituksen kartta.

Kolmas harjoitus
Kolmannessa harjoituksessa tuli suunnitella 3D-kartta asuintalon rakennusta varten. 3D:n avulla voidaan visualisoida erilaisia kohteita, kuten esimerkiksi kaupunkien 3D-mallit. Ennen itse kartan suunnittelemista harjoituksessa esiteltiin erilaisia 3D-ympäristöjä. Erilaisten ympäristöjen, kuten lokaali ja globaali, ymmärtäminen on tärkeää, jotta voi toteuttaa analyyseja ja karttoja 3D:n avulla. Toinen esimerkki oli kartografinen ja fotorealistinen 3D-ympäristö.

Kuva 4. Esrin kokoama ohje, jossa näkyy vaiheet, jotka tulee suorittaa 3D-aineistojen kanssa työskennellessä.

Itse harjoituksessa ensin tutustuttiin 3D-ympäristöön Scene Viewerin avulla. Tämän jälkeen kartan suunnittelussa tuli lähinnä muokata valmista dataa selkeämmäksi, esimerkiksi pisteistä puita. 3D-aineistojen kanssa työskentely oli hauskaa ja myös nostalgista, sillä grafiikat toivat hieman mieleen 2000-luvun alussa julkaistut SimCity-pelit.

Erilaisten 3D-visualisointien avulla voidaan kuvata hyvin juuri esimerkiksi erilaisia kohteita kaupungeissa. Kuvassa 5 näkyy ehdotetun rakennuksen sijainti. Vaikka harjoituksen kaupunkina olikin Berliini, niin valitsin karttojen (kuva 5 ja 6) puiksi palmut, koska ne olivat mielestäni visuaalisesti hienot. Realistia ne eivät toki ole ainakaan vähään aikaan, ellei ilmastonmuutos ehdi nopeuttaa lämpötilojen nousua ennakoitua nopeammin.

Kuva 5. Kolmannen harjoituksen kartta.

Huono puoli 3D-aineistojen kanssa työskentelyssä oli se, että grafiikoista huolimatta ainakin itselläni fuksiläppäri otti oman aikansa ja kävi melko kuumana aineistojen kanssa työskennellessä ja niitä muokatessa. Toki tätä ongelmaa voi hieman helpottaa säätämällä näkyvissä olevien tasojen määrää.

Kuva 6. Ehdotetun rakennuksen sijainti vielä eri näkökulmasta eli toiselta puolelta jokea.