Valmis

Kaikki on siis valmista.

Viimeisiltä viikoilta uupuu ne vähätkin blogiviittaukset kummallisen itsenäisen ja monivuotisen suoritustavan vuoksi. En enää alkanut kaivelemaan kaikkia arkistoja. Uskon ja toivon että kirjoituksissa ja kartoissa on muuten kaikki tarvittava kurssin loppuunviemiseen.

Tsemppiä jatkoon Artulle ja kiitos!

-Sanni H.

Skenaarioita tulevaisuuden Espanjasta

Viiimeisen kerran itsenäistyöhön päätin koota jotain esitettävää ja asiallisen simppeliä – kahden muuttujan kartta koropleettipohjalla ja toisella teemamuuttujalla. Valitsin tarkasteltavaksi alueeksi Espanjan, sillä totesin että tulkintaa on helpompi tehdä jos pystyy aluksi edes auttavasti arvioimaan tulosten uskottavuutta  omien tietojen pohjalta. Väestörakenne vei mennessään, ja syvennyin siihen tarkemmin.

Tarkastelutasoksi päätyi lopulta NUTS 3 -jaottelu, koska sillä oli loogista etsiä tilastotietoa ja yhtä tasoa suurempien itsehallintoalueiden taso käsittää liian vähän alueita tähän tarkasteluun. Käytännössä NUTS 3 -taso vastaa maakuntia (provincias).  Halusin kovasti käyttää edes kahta eri tietolähdettä työhön. Ongelmia tuli tosin heti, koska Espanjaanhan täytyy kuulua niin Baleaarien kuin Kanariansaartenkin, mutta jostain syystä ne eivät kuuluneet kaikkiin INE:n (Instituto Nacional de Estadística) eli Espanjan tilastokeskuksen aineistoihin. Olisi auttanut melkoisesti jos INE julkaisisi myös NUTS-koodimuodossa tai edes numeroin alueiden ID-tunnuksia – kaksikielisten (espanja/katalaani) nimien välilyönnit ja erikoismerkkien käyttö poikkesivat aineistoissa. Lisäksi erikoismerkit aiheuttivat päänvaivaa Eurostatista tuoduissa csv-taulukoissa, kunnes keksin että UTF-8 -encoding täytyy pakottaa tallennusvaiheessa. Onneksi aineisto oli tarpeeksi pieni että sain ratkaistua ongelmia myös ihan manuaalisesti kirjoittamalla. Konstit on monet. Päädyin lopulta yhtenäisyyden vuoksi käyttämään vain Eurostatin aineistoja, alueiden shapefile on myös lainattu sieltä – NUTS-tasoilla datan tuottaminen on arvattavastikin EU:n heiniä. 

Löysin Eurostatilta mielenkiintoisen väestödatan, joka sisälsi skenaarioennusteita vuoteen 2100 asti Eurostat (2021). Villimpiäkin ennusteita, kuten nollamuuttoliikkeen skenaarioi, olisi ollut olemassa valtiotasolla, mutta NUTS 3 -datassa oli tarjolla vain baseline projection. Tämä oli ehkä ihan hyväkin juttu niin ei lähtenyt analyysit ihan laukalle. Laskin sieltä väestönmuutosta vuosien 2020-2050 välillä. Toisen muuttujan lähteenä toimi oikeastaan samainen, massiivinen väestöaineisto. Tästä laskin tämänhetkisen ns. vanhuuskertoimen jokaiselle alueelle, eli suhteutin yli 65-vuotiaiden osuuden maan keskiarvoon. Yritin sovitella tätä symboleina tai diagrammeina kartalle, mutta oikeastaan numeromuoto tuntuu ainakin itselleni (karttaa tietysti liian pitkään katselleena) loogiselta.

Halusin ilmaista vanhuuskertoimen prosenttien sijaan siksi, ettei se sekoitu väestömuutoksen prosenttien kanssa. Vanhuusprosentin vaihtelut olisi myös pitänyt ilmaista negatiivisina ja positiivisina prosenttiosuuksina tai lähtien 100 prosentista, mikä olisi ollut vaikeatajuisempaa. Mitä ihmettä tarkoittaa 100% vanhuksia? Kertoimesta näkee yhtä nopeasti, alkaako luku nollalla vai ykkösellä eli ollaanko alle vai yli kansallisen keskiarvon. Väestönmuutoksen esittäminen kaksivärisenä on mielestäni onnistunut, koska se näyttää selvästi jälleen miinuksella ja plussalla olevat alueet. Sinisen ja punaisen luokkaraja olisi tietysti kannattanut heittää nollille 2,5 sijaan. Ainakin yksi selvä puute jäi legendasta, mutta en lähde nyt sitä viilailemaan – vanhuuskerroin on tosiaan laskettu vuoden 2020 tiedoilla. Tarkemmin ajatellen lukija voi erehtyä ajattelemaan, että osuus olisi laskettu joltain tulevaisuuden vuodelta tai keskiarvolta.

Kuva 1. Espanjan ennustettu väestönmuutos vuoteen 2050 ja yli 65-vuotiaiden kerroin suhteessa maan keskiarvoon. 

Pohdin sitä, että tavallaan kartan muuttujat esittävät ikään kuin samaa asiaa ja kartan informaatioarvoa voi kyseenalaistaa sen vuoksi. Samalla kuitenkin tarkoituksena oli löytää mahdollinen selittävä yhteys, joka on havaittavissa kartan perusteella. Trendinä on se, että suurimpia vanhuuskertoimia saavat alueet ovat myös voimakkaimmin pienenevän väestöskenaarion alueita ja päinvastoin. Etenkin Kanariansaarilta löytyy muutama kohde, jotka sotivat tätä vastaan, mutta niiden väestön rakenne ja sitäkin tärkeämmin koko poikkeavat mannermaasta. Siksi niistä löytyvät myös suurimman väestönkasvun skenaariot. Suurimmat kaupungit Madrid (keskellä sisämaata) ja Barcelona (koillisrannikko) erottuvat loogisesti kasvavina alueina, useimmiten suuri nettomuutto myös nuorentaa väestöä, sillä yli 65-vuotiaat muuttavat harvoin. Tätä kautta muuttoliike heijastelee myös ikärakenteeseen. Keskimäärin nuorempi rannikko- ja saariväestö  kasvaa (suurten kaupunkien selittämänä) ja etenkin luoteisosat kuihtuvat väestörakenteeltaan.

Tavoitteena oli ikäänkuin testata skenaarion uskottavuutta, ja vanhenevan väestön ainakin jonkiasteinen korrelointi väestön vähenemiseen vaikuttaisi siltä, että monissa provinsseissa ikärakenne selittää muutoksia väestössä. Myös Espanjan tilastokeskuksen väestönkehitysarvio (INE 2020), joka on niin ikään perusskenaarion mukaan kehitetty, antaa samanlaisen kuvan tilanteesta. Madridin ja Katalonian väestöt kasvavat eniten ja luoteisosien itsehallintoalueet menettävät eniten väestöstään samalla, kun iäkkäiden osuus kasvaa koko maassa. Olin jo lähes siteeraamassa tähän löytämääni artikkelia, jossa kovasti väitettiin Espanjan ikääntyvän nopeammin kuin muu Eurooppa vuoteen 2050 mennessä. Artikkelin käyttämistä YK:n lähteistä en itse tehnyt samaa tulkintaa, joten raflaava loppukaneetti nyt käyttämättä. Siellä on moni muu maa, Suomi mukaan lukien, skenaarioissa Espanjaa edellä. INE:n raportin (2020) mukaan koronapandemia hidastaa muuttoliikettä jonkin aikaa, mutta samalla vuonna 2020 kuolleisuus oli toki poikkeava. Poikkeavatkin tilanteet siis saattavat silti olla heiluttamatta isoja trendejä.

Toinenkin kartta olisi ollut ihan kiva, mutta näillä mennään nyt niin että heilahtaa!

Lähteitä:

Eurostat (2021). Population projections (proj): Reference Metadata in Euro SDMX Metadata Structure (ESMS). https://ec.europa.eu/eurostat/cache/metadata/en/proj_esms.htm (luettu 2.3.2021).

INE (2020). Population projection 2020-2070. Press release 22nd September.2020.  https://www.ine.es/en/prensa/pp_2020_2070_en.pdf (luettu 2.3.2021).

Johdatus interpolointiin ja maanjäristyksiä

Kuudes kurssikerta käynnistyi sisällöllisesti tosi mukavasti, kun pääsi kuulemaan vanhasta kunnon Jan Gehlin eli Geelin Janin ideaalista, ihmisten kaupungista ja siihen kuuluvista kaupunkisuunnittelun periaatteista. En nyt ollut mukana luentokerralla, joten jätin pisteeni pomimatta EpiCollectilla. Sen sijaan hyödynsin opastuksen mukaisesti yhtä kurssikertaa vastanneen csv-tiedoston ja näppäilin sen kurssikerran esimerkkikartan mukaisesti harjoituksen. EpiCollect on kuitenkin onneksi melko helppokäyttöinen, ja olen hyödyntänyt sitä jo kahdella kurssilla: Maantieteelliset kohteet lähiympäristössä ja Satelliittipaikannusmenetelmät maantieteessä. Jälkimmäisellä mittasimme myös mm. polygon-muotoista dataa, ja sen paikannuksessa saikin olla jo paljon tarkempi, lisäksi muistissa on uudelleenprojisointiin liittyvät haasteet aineiston kanssa. Todennäköisesti kohtasimme silloin vähän samankaltaisia ongelmia, kuin nyt oli ollut UTM-kaistojen kanssa kurssiblogin mukaan. Interpolointi oli yksi pääteemoista ja ansaitsee paikan otsikossakin – interpolointikarttaa ei tästä blogista kuitenkaan nyt löydy. Kokeilin yhtä interpolointia järistysten magnitudien suhteen, mutta totesin sen olevan melko huono valittuun teemaan, sillä järistykset eivät muodosta mitään jatkuvaa pintaa ja kartta vääristäisi.

Varsinaisissa itsenäisharjoituksissa päätin syventyä maanjäristysten esiintymiseen globaalilla tasolla. Näkökulma keskittyy historialliseen dataan, sen jakautumiseen ja toisaalta esitettätyyteen. NOAA:n aineisto sisältää tietoa merkittävistä maanjäristyksistä. Se ulottuu vuodesta 2050 ennen ajanlaskun alkua nykypäivään saakka, ja valikoituneissa tapahtumissa jokin kolmesta täyttyy: järistyksestä on aiheutunut kuolonuhreja, merkittävää taloudellista vahinkoa, tai se on ollut voimakkuudeltaan yli 7.5 Richterin yksiköissä. (Jälkeenpäin huomasin, että ehkä oli turhaa käyttää tuota Richter-sanaa joka kartassa, magnitudi olisi riittänyt.)

Kuvasta 1 voidaan nopeasti kerrata maanjäristysten, ja etenkin voimakkaiden sellaisten, esiintymistä globaalisti. Järistyksiä tapahtuu eniten sellaisissa mannerlaattojen saumakohdissa, joissa on myös alityöntövyohykettä. Poikkeuksena  tästä on Keski-Aasian ja Himalajan pohjoisseudun järistykset, jotka ovat verrattain kaukana laatan rajasta, mutta näitäkin selittää voimakas ja aktiivinen alityöntövyöhyke Intian ja Euraasian laattojen välillä. Lisäksi kartasta puuttuu tuolta kohtaa alityöntövyöhyke – muilta osin se vastaa pääasiallisia vyöhykkeitä mannerlaatta-aineiston pohjalta jalostettuna. Historiallisen aineiston ennen vuotta 1000 tapahtuneet järistykset taas painottuvat Välimeren, Lähi-Idän ja Itä-Aasian alueille. Vaikuttaisi siis siltä, että tietoa historian tapahtumista on saatavilla eniten tietoa suurten tunnettujen sivilisaatioiden alueelta. Koitin vaihtoehtoista esitystä varten löytää ei-eurosentristä esitystapaa, jossa tuttu tulirengaskin olisi erottunut hyvin, mutta se osoittautuikin vähän hankalammaksi löytää.

Kuva 1. Maanjäristyksiä suhteessa mannerlaattojen rajoihin ja alityöntövyöhykkeisiin. 

Kuvassa 2 puolestaan on vertaileva kartta, joka toimikoon muistutuksena aineiston valinnasta, kartan vallasta ja yksinkertaisesti erikokoisesta aineistosta. Molemmissa kartoissa esitetään näennäisesti täsmälleen samaa asiaa eli magnitudiltaan 7 tai yli Richterin suuruisia maanjäristyksiä. Punaiset pisteet perustuvat NCEDC:n aineistoon vuosilta 1980-2012 (yhteensä 401 kohdetta), kun siniset pisteet edustavat puolestaan aikaisemmin mainittua NOAA:n aineistoa, jonka pisteet edustavat siis viimeistä 4000 vuotta (yhteensä 1133 kohdetta). Näiden kahden välillä on siis eroja aikaskaalassa, aineiston laajuudessa ja tarjoajassa. Kuvan 1 kartan perusteella voidaan kuitenkin päätellä (olettaen, että 4000 vuotta on lyhyt aika geologisessa historiassa), että historiallisen aineiston tuoma vääristymä aiheuttaa kenties poikkeavan voimakkaan sinisten pisteiden esiintyvyyden Kreikan ja Turkin lähettyvillä. Halusin kokeilla jotakin erilaista, ja mielestäni tämä esimerkki on hyvä havainnollistamaan tietojen esittämistä esimerkiksi lukioikäisille ja kehittää kriittistä tarkastelutapaa sisältöaiheen lisäksi.


Kuva 2. Voimakkaita maanjäristyksiä tarkasteltuna kahdella eri aineistolla.

Tarkastellaan lopuksi vielä lähempää yhtä aluetta. Kuvan 1 kartasta nähdään, että Japani on aktiivisten alityöntövyöhykkeiden lähellä ja myös historiallisia järistyksiä on alueelle tallennettu paljon. Kuvassa 3 (pohjoisnuoleton ja skaalaton kartta, maailmankarttoihin verrattuna tässä olisi ollut aiheellista lisätä) on osa Itä-Aasiaa tarkasteltuna mannerlaattojen saumakohtien, voimakkaiden järistysten ja kaupunkialueiden sijoittumisten suhteen. Japanilla on pitkä historia maanjäristyksiin valmistautumisessa ja järistyksiä kestävässä rakentamisessa. Historian aikana maanjäristykset ovat olleet huomattavasti tuhoisempia kuin nykyisin.

Kuva 3. Voimakkaiden maanjäristysten sijoittuminen suhteessa kaupunkialueisiin Itä-Aasiassa. 

Koska tässä on nyt tarkasteltu vain maanjäristyksiä, olisi hyvä tarkastella myös tulivuorten sijoittumista. Siinä missä näissä kartoissa on keskitytty lähinnä alityöntövyöhykkeisiin, tulivuoria esiintyy lähellä muunkinlaisia laattarajoja ja toisaalta myös kauempana niistä. National Geographicin MapMaker-työkalu on siitä kätevä, että siinä käyttäjä pystyy itse lisäämään karttaan tasoja, joita tarjotaan teemakohtaisesti. Näin toisiinsa linkittyvää dataa on helppo tarkastella.

Loppukevennys: Mistä tunnistaa laadukkaan, interwebsistä ladatun vektoriaineiston? Siitä, kun Norjan rantaviiva näytää tältä. Tähän tarkoitukseen tämän skaalatason aineisto oli kuitenkin mukavan kevyt.

Lähteitä:

NCEDC. Historic ANSS Composite Catalog Search. https://ncedc.org/anss/catalog-search.html (luettu 1.3.2021).

NOAA National Centers for Environmental Information. Global Significant Earthquake Database.  doi:10.7289/V5TD9V7K (luettu 1.3.2021).

Viides kerta ja viisikymmentä toistoa

Viides kurssikerta käynnistyi näppärästi puskurianalyysien äärellä. Heti alkuun tuli sekä kannustavia että koomisia hetkiä. Olin ihan itse keksinyt käyttää aineistolle clip-työkalua aineiston rajaamiseksi vain Pornaisten keskustan alueelle ja kokeillut myös intersectionia kun pohdiskelin, että näillä kahdella ei lie tässä yhteydessä eroa. Oli kannustavaa huomata, että jotain on hallussa tässä vaiheessa, kun gis-harjoituksia on tullut tehtyä muillakin kuin fuksikursseilla. Ilokseni oivalsin alkuharjoituksessa, että olin innostunut digitoimaan alueen kaikki pienetkin tiet ja jokaisen rakennuksen näyttävästi polygoneina, joten puskurianalyysi tuotti lähes kaikki rakennukset tuotaavan tuloksen (lisäys kertausvuodelta: nyt tämä yleistyssuositus lukee ohjeissa, jos ei keksi itse käyttää maalaisjärkeä :D). Note to self: kannattaa tarkistaa jatkossa seuraavista vaiheista, mitä varten harjoituksessa pyydetään tekemään jotakin.

Taulukossa 1 on koottuna kurssikerran tehtävien tunnuslukuja – pääkaupunkiseudun väestöä tarkasteltuna monella tavalla. Läppäriraukka oli sen verran kovilla, että taulukon Asemat-kohtaan jätin vuoden 2019 tulokseni. Sisällöstä sanottakoon sen verran, että pk-seudun väestö tosiaaankin asuu taajamissa eli isoilla kirkoilla melko kattavasti (96-prosenttisesti) ainakin tämän taajama-aineiston, josta en sen enempää tiedä metatietoja, perusteella.

Taulukko 1. Pääkaupunkiseudun asukasmääriä ja -osuuksia tarkasteltuna suhteessa lentokenttiin, asemiin ja taajama-alueisiin. *Asemat-kohdan tunnusluvut on laskettu vuonna 2019 käytetyn datan mukaisesti. 

Työkaluista tutuimmiksitämän harjoitusken myötä kävivät etenkin Spatial Query ja puskurianalyysi. Spatial Query on erittäin hyödyllinen lisä, sillä se kertoo tilastollisesti sen mitä kartalla näkee visuaalisesti tasojen välillä, eli käytännössä kuinka moni tason X objekteista on tason Y objektien sisällä (contains) tai  niillä on leikkaavia osia (intersect). Puskurianalyysiä voisi käyttää perinteisesti saavutettavuuden määrittämiseen, josta klassikkoesimerkkinä julkisen liikenteen saavutettavuus. Pysäkeille voidaan asettaa jokin tietty puskuri (esimerkiksi 200 metriä olen nähnyt käytettävän, liekö tuo jokin mukavuusraja vai oikeasti ihannetavoite pääkaupunkiseudulla) ja tarkastella, kuinka paljon ihmisiä asuu sen peittämällä alueella. Jos tätä tarkastellaan yhdessä vaikkapa suuremman puskurivyöhykkeen ja liikenteen kanssa, voidaan määritellä paras mahdollinen sijainti uudelle pysäkille. Laapotti (2019) mainitsi hyvän esimerkin buffereiden käytöstä: yksinkertaisella jokivyöhykemääritelmällä voi kartoittaa vaikkapa aikaisemmalla viikolla tutuksi tulleiden tulvien alueella asuvien ihmisten määrää. 


Kuva 1. 1965-1970 -luvuilla rakennettujen, remonttialttiiden kerrostalojen osuuksia kaikista kerrostaloista pääkaupunkiseudun pienpiireissä.

Sitten vielä lopuksi varsinaisen itsenäistehtävän pariin: tarkastelin remonttialttiissa iässä olevia kerrostaloja Helsingissä. Kikkailin hieman menemään ja käytin join attributes by location summarya kahteen kertaan niin, että sain tuotettua tietokantaan sekä kaikkien kerrostalojen määrän että tuona viiden vuoden massatuotantoaikana rakennettujen kerrostalojen määrän pienalueittain ja niistä sitten osuuden laskettua (tämä lähinnä itselle menetelmämielessä muistiin, ei välttämättä helpoin tapa mutta toimiva). Kuvassa 1 on visualisoituna koko pääkaupunkiseudun tilanne. Kartassa arvon saavat vain sellaiset pienpiirit, joissa on ylipäänsä kerrostaloja tuolta ajanjaksolta (kannatti myös koneen kapasiteetin kannalta). Helsingin itäiset ja koilliset osat, sekä koillinen radanvarsi Vantaan puolella, erottuvat suurilla osuuksillaan, kuten myös Kauniainen. Pisteaineistosta voidaan visuaalisesti kuitenkin tulkita melko nopeasti, että määrällisesti metron itäpää on tässä voittaja, ja alue onklin tarkemmassa tarkastelussa kuvassa 2. Kuvan 2 karttaesitykseen olisi ollut havainnollista tuoda metrolinja, ja kenties kaikkien pienpiirien rajojen sijaan pk-seudun karttaankin olisi voinut tuoda ainakin metro- ja juna radat.

Kaikkiaan Helsingissä 1965-1970 on rakennettu 2 094 asuinrakennusta, joista kerrostaloja on 776. Koko pääkaupunkiseudulla vuosina 1965-1970 rakennetuissa kerrostaloissa on 39 002 asuntoa, joissa asuu yhteensä 65 206 ihmistä. Putkiremonttien massa-aalto siis koskettaa tai on koskettanut noin 6,3% pääkauounkiseudun asukkaista.

Kuva 2. 1965-1970 -luvuilla rakennettujen, remonttialttiiden kerrostalojen osuuksia eräissä Itä-Helsingin pienpiireissä.

Tämän kerran harjoituksissa tuli todella paljon toistoa, ja toivonkin, että edes ne asiat olisivat nyt iskostuneet muistiin ja uskaltaisin olla rohkeammin mielin GIS-tehtävien kanssa enkä luovuttaa kesken kaiken – usein on monta tapaa ratakaista yksi asia, eikä sillä ole lopulta merkitystä, miten ongelman saa ratkaistua jos menetelmä on perusteltu.

Lähteet:

Laapotti, S. (2019). Kammottava itsenäistyminen.  https://blogs.helsinki.fi/saagalaa/. Viitattu 16.3.2019.

Ruudun takaa

Neljännellä kurssikerralla tutustuttiin ruutukarttoihin ja rasteriaineiston kanssa työskentelyyn. Edellisiin harjoituksiin nähden nyt täytyi olla jo tarkkana prosesseissa käytetyistä luvuista, komennoista ja aineiston rajaamisesta, sillä ruutuaineisto sisältää helposti tuhansia tietueita. Ensimmäistä kertaa oli jo hyvät mahdollisuudet saada ohjelma kaadettua.

Harjoituksen tuloksena sain aikaan kartan, joka esittää muunkielisten suhteellisia osuuksia pääkaupunkiseudun väestöstä (kuva 1). Muunkielisillä tarkoitetaan muuta kuin suomea tai ruotsia äidinkielenään puhuvia, tosin kuten ensimmäisen kurssikertani blogissa totesin, on määritelmä usein epäselvä. En tiedä käytetyn aineiston metatietoja, joten en tiedä kuuluvatko saamelaiset muunkielisiin vai eivät. Se ei kuitenkaan ole pääkaupunkiseudulla tilastollisesti merkitsevää.

Ruutuaineistoissa olennaisinta lie ruutukoko ja sen vaikutus ilmiöiden esitettävyyteen. Valitsin karttaani 500 x 500 metrin ruutumatriisin, joka tuntui sopivalta koko pääkaupunkiseutua esittävälle kartalle. Kilometrin ruutukoko olisi yleistänyt jo liikaa ja pelkäsin, että pienemmällä ruutukoolla aineisto olisi ollut liian raskas prosessoitavaksi. Kokeilinkin soveltaa ohjeiden mukaisen 1 km ruudun jälkeen heti 100 metrin ruutuja mielenkiinnosta kahteen kertaan, mutta molemmilla kerroilla ohjelma kaatui. Kolmannella kerralla prosessi olisi saattanutkin onnistua tai olisin voinut rajata aineiston koskemaan vain Helsinkiä tai jotakin suuralueista. Olisikin mielenkiintoista vertailla samaa muuttujaa samalla luokittelulla mutta huomattavasti pienemmällä ruutukoolla jollakin alueella, kuten suuralueella ja verrata sitä ison kartan arvoihin.

Kuva 1. Muunkielisten osuus väestöstä pääkaupunkiseudulla 500 x 500 metrin ruutuaineistolla.

Absoluuttisten arvojen esittäminen on ruutuaineistossa on toisinaan perusteltua, vaikkei sitä muissa tapauksissa suositellakaan. Ruutuaineistossa jokainen ruutu saa vain yhden arvon ja on jo itsessään yleistettyä tietoa. Siksi sillä onkin mielekästä esittää sellaisia muuttujia, jotka eivät ole pistemäisiä mutta eivät tasaisen jatkuviakaan, kuten koropleettikartat. Pistekarttaan verrattuna sijainnin tarkkuus on jonkin verran huonompi ruutukoosta riippuen, eivätkä ruudut noudata nimettyjen alueiden rajoja, kuten Ahonenkin (2019) toteaa blogissaan. Tässä tapauksessa absoluuttisten arvojen esittäminen tai ainakin esittävyyden kokeileminen olisi ollut näin jälkeen päin ajatellen järkevää, sillä nyt suuri osa korkeimman arvon saavista (100%) ruuduista on nyt sellaisia joissa asuu vain yksi asukas, joka sattuu olemaan muunkielinen. Toinen vaihtoehto olisi ollut poistaa kyseiset ruudut esityksestä, mikä toisaalta myös vääristää dataa. Esityksellisesti lisäarvoa olisi tuonut se, että tiedon selventämiseksi jokaisen luokan perään olisi merkitty kyseisten ruutujen lukumäärä sulkeissa. En ole kovin tyytyväinen siis valintaani esittää teemaa suhteellisina osuuksina (etenkin, kun kerrankin olisi voinut käyttää absoluuttisia arvoja) tai valittuihin luokkarajoihin. 

Hieman alempien arvojen ruudut, kuten 10-50 prosentin muunkielisen väestön ruudut tuntuvat antavan paremmin kuvaa trendeistä: kantakaupunki ja muut keskukset erottuvat korkeammilla arvoillaan. Kantakaupunkia tarkastellessa suhteelliset arvot antavat paremmin kuvaa ilmiön jakaantumisesta – Ruoholahden ja Kalasataman seudut erottuvat korkeammilla arvoillaan. Näillä alueilla vieraskielisten edustamat kieliryhmät poikkeavat jonkin verran muista alueista, ja vallitsevina kielinä on venäjän lisäksi englanti ja espanja ja korkeakoulutettujen määrä on suurempi kuin esimerkiksi itäisen suurpiirin vieraskielisimmillä alueilla (Helsinki alueittain 2019). Uusille kasvualueille muutetaan tietotyön perässä.

Karttaa visuaalisesti ja sisällöllisesti tarkastellessa pääväylien muodostama verkosto hahmottelee pääkaupunkiseutua tuntevalle aluetta hieman mutta ei avaa esimerkiksi kuntien rajoja tai nimiä. Tuomalla suuralueiden nimet esitykseen yritin hieman helpottaa esittävyyttä, sillä pienalueiden nimistä olisi tullut liian pieniä. Espoon ja Vantaan kohdilla muutamat keskukset tulevat nimikoiduksi oikein ja oikeille kohdille, mutta Helsingin suuralueet (läntinen, eteläinen jne.) ovat hieman hämmentävät ja valinta ei siksi ollut kaikista toimivin.

Kurssikerran lopuksi tutustuimme myös rasteriaineiston kanssa työskentelyyn. Rinnevarjostusta olin tehnyt ennenkin, mutta piirtäminen QGIS:llä oli minulle jokseenkin uutta. Muistan piirtäneeni vain yksittäisiä viivoja, joten oli mielenkiintoista seurata miten omista piirtelyistä muodostui tietokanta.

Kuva 2. Peruskarttalehden korkeuskäyrärasteri ja korkeusmallista 5 metrin välein  mallinnetut korkeuskäyrät. 

Opimme myös, miten rasteriaineistosta on mahdollista mallintaa ominaisuuksia QGIS:ssä. Kuvassa 2 on visualisoituna peruskarttalehden korkeuskäyriä ruskealla (päällekkäisten rasteritasojen kanssa joutuu aina kikkailemaan, keksin vaihtaa korkeuskäyrärasterin valkoisen värin läpinäkyväksi, jolloin sain peruskarttalehteä taustalle näkyviin helpottamaan tulkintaa) ja laserkeilausaineistosta 5 metrin välein mallinnettua korkeuskäyrää vihreällä.  Kuvan keskiössä on mielivaltaisesti valittu Kumpula, sillä sellainen hauska nimi sattui karttalehdeltä löytymään. ”Loogisilla” korkeusvaihteluilla, kuten korkeammilla mäillä, käyrät noudattelevat samoja linjoja, mutta esimerkiksi kuvassa näkyvä ojantörmä on visualisoituna vain mallinnuksessa. Mallinnuksen datassa on vain jonkin ajankohdan korkeudet, ja oja on saattanut hetkellisesti olla hyvin kuiva tai sitä ympäröivä kasvusto on tallentunut mallinukseen. Karttalehden korkeuskäyrissä puolestaan on otettu huomioon vain pysyvät ja relevantit korkeuserot ja siksi siitä on luotettavampaa tehdä päätelmiä. Toisaalta uuden laserkeilausaineiston perusteella voidaan havaita sellaisia uusia eroja, joita tulisi uusissa kartoissa huomata.

Ensi viikon bufferointeja odotellessa, heissulivei!

Lähteet:

Ahonen, P.  (2019) Kurssikerta 4.  Blogiteksti.  https://blogs.helsinki.fi/piah/

Helsinki alueittain 2019. Helsingin kaupunki, kaupunginkanslia, kaupunkitutkimus ja -tilastot. Helsinki 2020.

Tietokantoja ja tulvia

Kolmannen kurssikerran alussa harjoiteltiin erilaisten tietokantojen tuomista QGis:iin sekä niiden yhdistämistä toisiinsa  relaatiotietokannaksi ja lopulta yhdeksi tietokannaksi. Olennaisinta on, että aineistoista löytyisi aina jokin kohteita yksilöivä tunnus. Tässä harjoituksessa esikäsittelimme tietokantaa niin, että jokaista aineiston maata koski vain yksi rivi päällekkäisyyksien välttämiseksi tulevissa sarakelisäyksissä eli yhdistimme alueita niin, että maan nimestä tuli yksilöivä tunnus.

Afrikan tietokantojen sisällöistä löytyy mielenkiintoisia yhdistelmiä, joiden korrelaatioita voidaan tarkastella. Luonnonvarojen käyttöönotto, kuten timanttikaivoksen tai öljykenttien löytäminen, aiheuttaa jonkinlaisia muutoksia ympäristöön ja yhteiskuntaan. Tähän liittyy vahvasti esimerkiksi kysysmyksiä siitä, kuka luonnonvarat omistaa, kenellä on oikeus käyttää niitä sekä millaisia ympäristövaikutuksia niillä on.  Näin ollen konfliktien syttymiset saattavat johtua käynnistyneestä toiminnasta, mutta eivät luonnollisestikaan ole ainoa selittävä tekijä.  Kuitenkin esimerkiksi sellaisilla alueilla, joilla sijaitsee timanttikaivoksia, konfliktien on huomattu kestävän pidempään kuin muualla (Raleigh et al. 2010).

Volyymiltään riittävän kattavalla aineistolla, joka sisältäisi käytetyn datan lisäksi muun muassa lisää temporaalista ulottuvuutta,  voitaisiin esimerkiksi koittaa arvioida, sijoittuvatko konfliktien tapahtumisajankohdat heti kaivosten löytymisen aikaan vai vasta poraamisen aloittamiseen sekä toisaalta konfliktien mahdollista vaikutusta kaivosten tuottavuuteen. Lisäksi sellaisten alueiden kohdalla, joissa on ollut pitkään konflikteja voitaisiin arvioida tapahtumien vaikutuksia kehitykseen. Eräänä modernin yhteiskunnan ja infrastruktuurin ’kehittyneisyyden’ mittarina voidaan käyttää internetin käyttöä, joka resurssien keskittyessä konflikteihin ja niiden seurauksiin saattaa viivästyä. Toisaalta taas hyvin tuottavat öljykentät ja timanttikaivokset saattavat kiihdyttää tätä kehitystä. Kaikki esitetyt riippuvuudet ovat hyvin kapeakatseisia ja riittämättömiä tarkasteluun sellaisenaan, mutta ovat esimerkkejä mahdolisista analyyseistä. Tästä saisi hienon interaktiivisen kartan, josta voisi tarkastella myös esimerkiksi yksittäisten konfliktien tapahtumavuosia klikkaamalla. Se kuitenkin oikaisisi esitettävyyteen liittyviä haasteita turhankin paljon.

Kurssikerralla tehtiin myös itsenäisesti Afrikka-harjoituksen oppien mukaisesti tietokanta- ja aineistoliitoksia niin, että saatiin aikaan kuvan 1 kaltainen karttaesitys Suomen valuma-alueiden tulvaherkkyyksistä eli tulvaindeksistä, joka laskettiin keskiylivirtaaman suhteella keskialivirtaamasta; suhteessa korkeampi keskiylivirtaama implikoi korkeaa tulvaherkkyyttä.

Kuva 1. Suomen valuma-alueiden tulvaherkkyysindeksit.

Saatu kartta on puutteellinen, ja sen huomaisi kenties maallikkolukijakin, sillä legendassa on esitetty mystinen sininen merkki järsvisyysprosentista, jota kartasta ei löydy lainkaan. Internetistä etsittyänikään en löytänyt selitystä sille, miksi pylväsdiagrammini eivät näy kartassa, mutta vähintään kävin kuitenkin läpi diagrammien kaikki asetukset ja opin niistä paljon. Tähän toivottavasti palaan vielä myöhemmin.

Toisaalta karttaan on merkitty järvet ja siitä näkee jo melko helposti, että tulvaherkimmät alueet eivät sijaitse samoilla alueilla suurimpien järvien kanssa. Vaikka järvisyysprosentti onkin suhteellinen osuus valuma-alueesta ja järven koolla ei sinänsä ole merkitystä, varmistui tieto taulukkoa tarkkailtaessa. Eskelinen (2019) hyvin toteaa blogissaan, että järvet ovat vesivarastoja ja näin ollen säätelevät virtaamaa. Järvet siis saattavat hetkellisesti varastoida potentiaalisia tulvavesiä mutta järvien tilavuuden ollessa suurempi eivät vain hieman nousseet pinnat aiheuta vielä tulvatilannetta. Samalla järvien esiintyminen viittaa paikallisesti suhteellisiin korkeuseroihin – epätasaisemmassa maastossa on myös painaumia, joihin järvet muodostuvat.

Kuva 2. Suomen valuma-alueiden tulvaherkkyysindeksit ja järvisyysprosentit, vaihtoehtoinen visualisointi.

Tehtävät uudelleen tehtyäni nyt kertausvuonna lisään ainakin hieman parannellun version edellisestä esityksestä. Kuvan 2 karttaesityksessä ovat nyt myös näkyvillä järvisyysprosentit, jotka siis kertovat kunkin valuma-alueen järvien osuuden kokonaispinta-alasta. Päädyin prosenttiosuuden mukaan skaalautuviin ympyrädiagrammeihin esitettävyyden vuoksi. Pylväiden kokoeroja (etenkin kapeina, jollaiseksi ne täytyi muokata erottuakseen toisistaan) oli vaikea nähdä – usein visualisoinneissa pinta-alaan nojaavat visualisoinnit antavat katsojalle nopeammin suuntaa-antavan kuvan ilmiöistä. Lisäksi ehdotettu maa-alan ja järvien osuuden suhdetta vertaileva ympyrädiagrammi, joka olisi toki antanut tarkemman kuvan todellisista prosenttiosuuksista, mutta diagrammien koon kanssa tuli ongelmia esitettävyyden kannalta. Lisäksi järvisyysprosentit vaihtelevat välillä 0-20, joten eroja on vaikea vertailla.

Tällä kertaa karttaesityksessä itse järvet eivät enää olekaan niin tärkeitä esitettäviä, joten olisin voinut jättää lisäämättä ne. Visualisointi ja moni muu asia on kaukana täydellisestä, mutta tarkoituksenani ei olekaan viettää tuntikausia jokaisen kartan ja blogiesityksen kanssa. Tavoitteena on vain kerrata aikaisemmin tekemääni ja oppia menetelmiä niin sanotusti kantapään kautta. Onneksi sisällöt eivät sinänsä tutnuneet hankalilta – tietokantaliitokset on aika perusjuttu tässä vaiheessa. Hauskaa kylläkin on se, että aina välillä joku kohta jää ruksimatta tai eksyn työskentelemään väärässä ohjelmistoversiossa ajatuksissani. Google on ystävä.

Lähteet:

Eskelinen, V. (2019) Kolmas kurssikerta: sekoilua tietokantojen kanssa.  https://blogs.helsinki.fi/veesvees/

Raleigh, C., Linke, A., Hegre, H., & Karlsen, J. (2010). Introducing ACLED: an armed conflict location and event dataset: special data feature. Journal of peace research47(5), 651-660.

 

Projektiok(l)ikkailua

Toisen kerran harjoituksissa jäin jumiin muutamaan tekniseen yksityiskohtaan projektioiden vaihtamisessa. Lopulta vika johtui ehkä ohjelmistoversiostani eikä toisella koneella ollut mitään ongelmia. Teen harjoituksia itsenäisesti enkä tietenkään kehdannut kysyä apua, sillä ”pitäis osata jo” (en ole ensimmäisen vuoden opiskelija). Ei jatkoon, kysykäämme kaikki rohkeasti apua!

Taulukko 1. Pinta-ala- ja viivamittausten tuloksia eri projektioilla.

Mittaustyökalujen avulla tehtyjen tulosten erot (taulukko 1) olivat hyvin linjassa odotusteni kanssa. Tyypillisimmin Suomessa käytetyissä projektioissa, kuten ETRS89/-TM35 ja Lambertin oikeapintaisessa, Euroopan komission suosittelemassa kartioprojektiossa sekä alueet että etäisyydet projisoituvat toisiinsa nähden yhdenmukaisesti. Hämäläinen (n.d, ilmeisesti kurssiaineistoa, soveltuu tähän kertaukseen hyvin) tarkasteli Lambertin projektioita ja totesi, että vaikka niistä yleiseurooppalainen projektio soveltuu huonommin Suomeen (oikeapintaisempi itä-länsisuuntaan ulottuessaan kuin pohjois-eteläsuunnassa, Suomi kun on melko pitkulainen), ne sopivat hyvin pienimittakaavaisiin yleiskarttoihin.

Sen sijaan Mercatorin oikeakulmainen projektio (tässä sphere Mercator) tunnetusti tietysti esittää pinta-alat todellisuutta suurempina erojen kasvaessa rajusti napoja lähestyttäessä. ”Suomi-neidon päälaki” sijaitsee jo lähes 70. leveyspiirillä ja mittaamani alan pinta-ala siellä on yli 800% suositusprojektioista. Mitatun suoran pituudessa ero ei ollut lainkaan yhtä suuri, ja Huhdanpään (2018) sanojen mukaan harjoitus konkretisoi hyvin, miten Mercator vääristää nimenomaan pinta-alaa.

Robinsonin projektiot puolestaan ovat niin sanottuja komprimissiprojektioita, joissa mikään piirteistä (oikeapituisuus, -kulmaisuus ja -pintaisuus) ei ole täysin oikein muttei toisaalta liioittele mitään. Molemmilla mittauksilla Robinsonilla arvot tuplaantuivat, mutta ero Mercatoriin oli huima. Lisäksi kokeilin muutamaa projektiota umpimähkäisesti nimien perusteella, kuten taulukossa näkyvää Lambert 1 -projektiota, jossa koordinaatit projisoituivat mystisiin lukuihin ja joka ei varmastikaan ole tarkoitettu käytettävästi Suomessa. Läksynä tästä se että kannattaa käyttää vain sellaisia projektioita ja koordinaattijärjestelmiä, jotka tietää (korjaus: Tämä versio taulukosta olikin mystisesti hävinnyt artikkelimedioista, joten nämä kuuluisat mystiset luvut puuttuvat. Hyvä opetus joka tapauksessa).

Kuva 1. Suomen kuntien pinta-alat Mercatorin projektiossa verrattuna Lambertin oikeapintaiseen projektioon prosentteina.

Karttaesitykseni ovat vielä toistaiseksi vähäisiä, sillä nyt on korkeaakin korkeampi aika päästää ensimmäinen versioni tämän viikon kurssikerrasta maailmalle ja palata asiaan myöhemmin.

Kertausvuonna palailen nyt asiaan ja aiemmat kohdat läpi klikkailtuani tuotan tänne vielä viimeisen esityksen. On aika näppärää, että kurssin sisällöt eivät ole paljoa muuttuneet (kiitosta siitä), joten omista aikaisemmista tuotoksista todella on hyötyä ja kertausmateriaalia itselleni.

Kuva 2. Väestöntiheyksiä Suomen kunnissa Mercatorin ja Lambertin oikeapintaisen projektion mukaisilla pinta-alan laskuilla. 

Kuvassa 2 on visualisoituna Mercatorin ja LAEAn projektioiden välinen pinta-alaero väestöön suhteutettuna, väestöntiheys laskee huomattavasti Mercatorin pinta-alojen mukaisesti. Kuvien elementit jäivätkin hieman erikokoisiksi (mukaan lukien hienoinen skaalaero), ja niitä nyt vierekkäin tarkastellessa olisi tietenkin ollut kannattavampaa käyttää samaa print layoutia ja vaihtaa vain visualisointiin käytettävä sarake. Lisäksi Mercatorin mukaisessa asukastiheydessä ylinkin luokka olisi todellisuudessa ollut alle 600 asukastiheydeltään (Helsinki), joten sen olisi voinut rajata myös legendaan. Oikeapintaisessa projektiossa juuri Helsinki saa korkeimman asukastiheyden 2355, joten Mercator vääristää Helsinginkin leveyspiireillä pinta-alan nelinkertaiseksi. Savukoski oli puolestaan harvimmin asuttu molemmissa, LAEA-projektiossa 0,17 as/km² ja Mercatorissa 0,02 as/km². Siitä voi laskeskella, että ero on jo melkoinen! Pientä häikkää tuloksissa aiheutti se, että saman aiheiston sisältämän väestöntiheysluvun mukaan Maarianhaminan pitäisi olla kaikista tiuhimpaan asuttu, mutta molemmissa projektioissa se jäi kauas kärjestä. Ehkä kunnan geometria- tai väestötieto aineistossa on erilainen kuin millä valmis väestöntiheys-sarake oli laskettu. 

Lähteet:

Huhdanpää, J. (2019). Viikko 2: Uutta opittavaa. https://blogs.helsinki.fi/joonatah/

Hämäläinen, M. (n.d). Karttaprojektion vaikutus alueittaisten geometristen
tunnuslukujen määritykseen. Saatavissa: https://foto.aalto.fi/opetus/220/luennot/1/geodeettiset_jarjestelmat/Karttapro-vertailu.pdf

Ensimmäiset tuotokset

Ensimmäisellä kurssikerralla tutustuttiin QGIS-ohjelman käyttöön perusteellisesti. Olen käyttänyt QGIS:iä ja muita paikkatieto-ohjelmia aikaisemminkin, mutta tämä peruskurssi on jäänyt tekemättä loppuun. Voinkin heti alkuun myöntää, että harjoitusohjeen yksityiskohtaiset selostukset eri toiminnoista tekivät hyvää hieman nurinkurisessa järjestyksessä muotoutuneelle gis-osaamiselleni. Se on ollut kuin päälaellaan oleva pyramidi, jonka perustukset kaipaavat tukea. Asiaan.

Kurssikerran aineistosta löytyi mielenkiintoinen tilasto Itämereen päätyvien typpipäästöjen määrästä, Laskettuani suhteelliset osuudet päästömääristä sain selville, että Puolan typpipäästöt Itämereen ovat HELCOMin mukaan kaikista suurimmat. Tämä tieto yllätti minut, sillä oletin luvun nousevan suurimmaksi Venäjän kohdalla. Toisaalta ravinnepäästöjä tarkastellessa on olennaista ottaa huomioon valuma-alueet ja niiden ihmistoiminta.  Tuuli Pfeifer arvioi blogissaan, että Venäjän kokonaispäästöt kaikkiin meriin olisivat näistä maista suurimmat. Tämä kuulostaa järkevältä siinäkin mielessä, että Venäjällä on suuria jokia, joiden valuma-alue kattaa lähes koko pohjoisen Euraasian. mutta Sekä maatalousmaan osuus että väestöntiheys on alueella suurimmillaan Puolan ympäristössä (HELCOM 2018). Juurikin alueen ihmistoiminnan keskittyminen ja ympäröivien alueiden päästöjen kumuloituminen selittänevät sitä, että Oderin (Puolan ja Saksan rajajoki) ja Veikselin (Wisła, Itä-Puola) päästöt olivat suurimmat. Kokonaisvirtaamaltaan taas Neva on suurin, mutta Pietaria lukuunottamatta ihmistoiminta on vähäisempää, esimerkiksi suuri osa Saimaasta kuuluu sen valuma-alueelle. 

Kuva 1. Itämeren ympärysvaltioiden typpipäästöt

Syntyneessä koropleettikartassa (kuva 1) on viisi luokkaa, jotka yritin jaotella jokseenkin järkeenkäyvästi ja välit ovat tasaiset viimeiseen luokkaan asti, joka on hieman suurempi väli jotta sain Puolan mahtumaan siihen. Toisaalta luokka 15-20 ei ole kartalla lainkaan edustettuna. Silmään pistää ainakin se, miten voimakas Puolan väri on muihin verrattuna ja englanninkieliset maiden nimitykset hämmentävät. Halusin kokeilla nimien tuomista ja ne olivat aineistossa englanniksi. Legendan tekeminen ja muokkaaminen sujui huomattavasti nopeammin kuin ennen! Lisähuomiona en ole aivan varma syvyyskäyrien informaatioarvosta tässä esityksessä mutta sisällytin ne kuitenkin karttaan.

Kuva 2. Typpipäästöt Itämerellä, kertausvuoden versio.

Kertausvuodelta lisään tähän vielä tuoreimman karttani samasta aiheesta (Kuva 2). Ennen jatkamista oli siis järkevää palautella perusteita taas mieleen. Mieltymykset eivät selvästi ole kovin paljon muuttuneet, sillä kartasta tuli kovin samanlainen, saatoin toki ottaa inspiraatiota katsomalla mitä olikaan tullut tehtyä. Syvyyskäyrät ovat edelleen mukana menossa, ja näillä luokkaväleillä ja värivalinnoilla on ainakin helppo huomata, kuinka matala Itämeri oikeastaan on – yli 300 metrin syvyyksiin kartassa pääsee vain Norjan kaakkoisrannikon edusta, joka ei enää kuulu Itämereen virallisesti. Suomenlahti taas enimmäkseen jää alle 100 metrin.

Kuva 3. Muunkielisten osuus kunnittain vuonna 2015

Toisena esityksenä tein kartan, jossa käy ilmi muunkielisten osuus asukkaista kunnittain vuoden 2015 tietojen perusteella (kuva 3). En löytänyt ainakaan vielä täsmällistä määritelmää muunkielisille, mutta ainakin tämän aineiston perusteella olisi pääteltävissä, että saamenkieliset sisältyvät luokitukseen, mutta ruotsinkieliset eivät. Kaikista suurin osuus muunkielisiä oli Utsjoella (huomattavan korkea luku muihin verrattuna, luokkaväli hyppää yli 30 prosenttiyksikköä), Enontekiöllä ja pääkaupunkiseudulla. Karttaesityksestä oli ainakin se hyöty, että muistutin itseäni suhteellisten osuuksien esitettävyydestä; Helsingissä muunkielisiä oli 70 000 ja Utsjoella saamenkielisiä 614. Aineistosta löytyi tässä yhteydessä pieni epäloogisuus, sillä esimerkiksi juuri Utsjoella muunkielisiksi määrällisesti oli luokiteltu vain 28 ihmistä, kun taas suhteellinen osuus viittasi siihen, että saamenkieliset sisältyvät määritelmään. Karttaesityksen aihe olisi voinut olla haastavampi ja ulkoasu viimeistellympi. Tee-se-itse -luokitteluni näyttää lukuina epämääräiseltä, mutta oli esitettävyyden kannalta järkevä valinta.

Jos tekisin kartan nyt uudelleen, siihen olisi asiallista lisätä ainakin reunukset.

Lähteet:

HELCOM (2018), The seven biggest rivers in the Baltic Sea region. Saatavissa: https://helcom.fi/wp-content/uploads/2019/12/BSEP163.pdf

Pfeifer, Tuuli. Kurssikerta 1 – QGIS:iin tutustumista. https://blogs.helsinki.fi/tpfeifer/ (luettu 28.1.2019)