VIImeinen

Viimeiset sanat ja kartat

Vihdoin, kahden vuoden taipaleen jälkeen olen saavuttanut pisteen, jossa tämän kurssin loppu häämöttää. En tottapuhuen osaa edes sanoa, miksi tämä on jäänyt niin vaiheeseen, jostain syystä koko homma vain unohtui. Noh tässä esittelen karttoja, jotka sain alulle silloin parisen vuotta sitten ja nyt eilen viimeistelin.

Päätin käyttää kartoissa EU:n tarjoamaa dataa päästödataa, jonka käsittely osoittautui muistaakseni haasteelliseksi. Ongelmana taisi olla CSV:n käyttämä epätavallinen erotinmerkki. Datan kanssa oli muistaakseni myös muitakin ongelmia, koska muistan sen vieneen aikaa. Lisäksi yhdistin samaan dataan väkilukutiedot kustakin EU-maasta jonka avulla sain laskettya myös hiilidioksidipäästöt per kapita. Lopputuloksena syntyi sitten tällaiset varsin yksinkertaiset koropleettikartat, jotka paljastavat EU:n pahimmat päästelijät. Tein kartoista kaksi versiota joista toinen kertoo hiilidioksidin bruttopäästöt maittain ja toinen väestöön suhteutetut päästöt. Harkitsin molempien datojen sisällyttämistä yhteen karttaan, mutta ajattelin  kartan olevan selkeämpi näin kahtena esityksenä.

Bruttopäästökartassa korostuu lähinnä maat, joiden väkiluku on suuri, tosin Saksa erityisen voimakkaana.  Asukaslukuun suhteutettuna päästöt jakautuvat vastaavasti niin, että pohjoiset maat korostuvat. Huomattava poikkeus tässä on tosin Ruotsi, jonka asukaskohtaiset päästöt kuuluvat alimpaan luokkaan.

Tämän kurssin jälkeen on GIS-taitoni ovat toki kehittyneet ja ajattelin sisällyttää tämän blogin loppuun muutaman toisilla kursseilla tekemäni kartan. Ensimmäisenä esittelen Pythonilla koodatun, Leaflet-pohjakarttaa käyttävän interaktiivisen HTML-kartan, jonka tein Automating GIS processes -kurssilla. Karttaesityksessä voi valita kahdesta tasosta, joita tarkastella: viheralueen määrän tai asukasmäärän muutoksen kullakin Helsingin postinumeroalueella. Viheralueen määrä on laskettu GeoPandasin päällekkäisanalyyseillä ja käyttäen Helsingin kaupungin WFS-rajapinnasta löytyvällä datalla. Postinumeroalueet väestödatoineen on osa väestökeskuksen Paavo-tietokantaa ja on ladattu keskuksen WFS-rajapinnasta.

Kartta antaa myös tietoa tarkasteltavasta postinumeroalueesta viemällä hiiren sen päälle. Ilmestyvä pop-up kertoo viheralueen ja väestönmuutoksen määrän numeerisena. Tästä on myös nähtävissä alueen pääasiallinen maankäyttötyyppi, joka on myös laskettu päällekkäisanalyysillä.

Jos päädyt selailemaan karttaa, kannattaa huomioida, että pop-upit temppuilevat hieman. Vaihdettaessa tarkasteltavaa karttatasoa, lakkaavat ne välillä toimimasta, jolloin labels -karttataso on laitettava pois ja päälle, mikäli ne haluaa nähdä taas uudelleen.

Karttaa pääset selailemaan tästä linkistä: https://autogis-2020.github.io/final-assignment-onniporh/pop_growth_and_land_use_map.html

Alla myös näyttökaappaus kartasta.

Samaisella kurssilla käytimme myös Helsingin yliopiston tuottamaa matka-aikamatriisia ja loimme koodin, jolla sen aineistoa on helppo käsitellä. Selvitimme matka-aikoja eri sijainteihin, joista yksi oli Mall of Tripla. Innostuin visualisoimaan matka-ajoista tähän pisteeseen oheisen kartan QGIS:llä Pythonin ulkopuolella. Tämä matka-aikamatriisi on erittäin hyödyllinen työkalu, jonka avulla on helppo selvittää alueellista saavutettavuutta eri sijainteihin ympäri pääkaupunkiseutua. Matriisi on luotu YKR-ruudukkoon, joten sen yhdistäminen myös ruututietokannan aineistoihin on helppoa.

Massadata (eng. Big Data) on ollut viime vuosina kuuma puheenaihe GIS-piireissä. Massadatalla tarkoitetaan yleisesti ottaen sen tyyppistä dataa, jonka ominaispiirteisiin kuuluu datan suuri määrä joka kasvaa jatkuvasti. Tällaista dataa on esimerkiksi sosiaalisen median postaukset tai puhelinoperaattoreiden tuottama data. Sen mahdollisuudet koskettavat lähes kaikkea maantieteellistä tutkimusta, mutta siihen sisältyy runsaasti virhelähteitä ja riskejä. Hyvin merkittävä virhelähde massadatassa on sen käyttäjäkunnan aiheuttamat tilastolliset vinoumat. Esimerkiksi Instagramin tuottamassa datassa on yliedustettuina nuoret ja nuoret aikuiset, kun taas vaikkapa urheilusovellusdatassa yliedustettuina ovat aktiiviurheilijat.

Suuri ongelma massadatassa on se, että sen sisältämä data on usein hyvin henkilökohtaista, joka aiheuttaa riskejä yksityisyydensuojaan. Yksittäisen henkilön tunnistaminen yleisestä massadatasta ei saa olla mahdollista ihan jo eettisistä syistä, mutta myös yksityisyydensuojalain määräämänä. Tämän takia massadata ei usein ole lainkaan avoinna vapaaseen käyttöön ja vapaasti käytettävissä oleva data on helposti niin suojattua, että sen käyttö liikkuuvuuden tutkimisessa voi olla haastavaa. Massadata on kuitenkin arvokas lähde suuremman mittakaavan tutkimuksissa ja tulevaisuudessa sen rooli monissa maantieteellisissä tutkimuksissa tulee varmasti kasvamaan.

Seuraava Advanced geoinformatics -kurssilla tekemäni kartta visualisoi hyvin yksinkertaisella tavalla Instagramin tarjoamaa massadataa. Kartassa on kuvattu kaikki Instagram-postaukset, joissa on käytetty tunnistetta #flowfestival. Huomattavaa on, miten suuri hajonta on näinkin spesifillä tunnisteella.

Tässäpä tulikin kaikenlaista muuta höpistyä myös, mutta vihdoin alkaa tämä vuosien prokrastinaatio olla päätöksessään. Paras tämän savotan lainaus löytyykin jo ensimmäisestä blogipostauksestani: ”Ajankäytön hallinta on myös sellainen asia, jonka suunnitteluun aion nähdä enemmän vaivaa ensi viikolla.” Heh. Kuinkas sitten kävikään.

Kiitos, anteeksi ja toivottavasti joku tästä oppii jotain.

Pahoitellen,
Onni Pörhölä

Vastaa

Sähköpostiosoitettasi ei julkaista. Pakolliset kentät on merkitty *