Uudet taidot käyttöön (vk7)

Kurssin lopuksi teimme omat kartat valitsemastamme aiheesta. Valitsin aiheeksi koulutuksen. Halusin vertailla löytämieni aineistojen avulla, onko koulupudokkaiden määrä suurempi sellaisilla alueilla joissa toisen asteen koulutusta ei ole tarjolla tai on vain vähän tarjolla. Koulupudokkailla tarkoitan tässä sellaisia nuoria jotka eivät ole peruskoulun jälkeen hankkineet muuta tutkintoa. Tilastokeskuksen sivuilta löysin tietokannat kaikista oppilaitoksista ja rajasin sen koskemaan vain lukioita ja ammattikouluja/-oppilaitoksia. (Tilastokeskus 2020) Tilastokeskukselta löytyi myös tiedot väestön koulutusasteesta jota löytyi kohdat “Ei peruskoulun jälkeistä tutkintoa” ja “Peruskoulun jälkeinen tutkinto”. (Tilastokeskus 2019) Koostin näistä ikäluokan yhteissumman ja laskin osuuden niille joilla ei peruskoulun jälkeistä tutkintoa ole. Otin ikäluokaksi käsittelyyn 25-29 -vuotiaat, koska nuoremmalla ikäluokalla voisi vielä olla koulutus kesken jos esimerkiksi miehillä armeija on hidastanut koulun aloitusta tai on pidetty välivuosia. Tiedot väestön koulutusasteeta ovat vuodelta 2019. Oppilaitosten määrät puolestaan ovat vuodelta 2015, jotta ne olisivat lähempänä sitä aikaa kun 25-29 -vuotiaat todennäköisesti ovat valmistuneet.

Teknisiä haasteita

Latasin aineistot pilkkueroteltuina tiedostoina ja taistelin hetken ääkkösongelmien parissa. Tein csv-tiedostoille ensin valintatyökalulla karsintaa jotta jäljelle jäi vain kuntien nimet ja yksi muuttuja per tiedosto. Jouduin siis tekemään erilliset csv-tiedostot muuttujille ei-pk-jälkeistä-tutkintoa, pk-jälkeinen-tutkinto ja oppilaitosten-määrät, koska muuten join-toiminto olisi kadottanut tietoja yhdistäessä kuntatiedostoon. Kuntatiedosto oli aiemmilla kurssikerroilla käytetty pohja, jossa on kuntarajat valmiina polygoneina ja yhdistäminen onnistui kunnan nimen perusteella. Tällä kertaa ei tullut ongelmia nimien yhdistämisessä.

Ennen yhdistämistä tein myös laskentaa kun halusin mm. laskea osuuksia ja yhdistää lukioiden ja ammattikoulujen määrät per kunta. Tämä aiheuttikin hieman enemmän työtä ja suuri osa kurssikerran ajasta kului pohtimiseen, miten saan calculatorilla nuo yhdistettyä. SQL-kielellä se olisi käynyt kätevästi ”SELECT SUM(oppilaitosten-määrä) FROM laitokset GROUP BY kunta” mutta QGIS ei sitä ihan suoraan ymmärtänytkään joten piti etsiä aika kauan tietoa kunnes löytyi komento joka toimi calculatorissa. SUM(oppilaitosten-määrä, kunta) oli lopulta taikasana. Eli GROUP BY menikin sulkujen sisään. Samalla olisi pystynyt filtteröimään jotain ulos mutta en sekaantunut enää siihen!

Visualisointi

Tulostettavien karttojen luominen sujui tällä kertaa jo tottuneesti. Vaikka muuttelin karttaa ja vaihdoin muuttujia kesken tulosteen luomista, sain ne kätevästi siirrettyä suoraan tulosteelle. Kahden muuttujan esittämisen vaikeudesta yhdellä kartalla peloteltiin etukäteen ja en ihmetelekään miksi. Päätin esittää asiat kuntatasolla vaikka Suomessa onkin kuntia melko paljon ja se hankaloittaa hahmottamista. Tein kuitenkin havainnon että koulupudokkaiden määrä vaihtelee todella rajusti kunnittain, joten maakuntakohtainen tarkastelu olisi tasoittanut lukumääriä liikaa. Nyt kun tähän vielä lisäsi tiedon oppilaitoksista, tuli kartasta melko ahdas. Sen vuoksi päätin vielä erotella pääkaupunkiseudun pienet kunnat omaksi leikkauksekseen.

Aluksi kokeilin näyttää oppilaitokset palloina (mitä suurempi pallo, sitä enemmän oppilaitoksia). Sain tästä idean lukiessani Alexanderin blogia jossa pallot toimivat hyvin järvisyyden mittarina. (Engelhardt 2021) Tässä ensimmäinen yritelmä:

Kuva1. Ensimmäinen yritys. Oppilaitosten määrät palloina

Kuten näkyy, isot pallot vain peittävät alleen punaiset värit, joten ei tiedä mikä pudokkaiden ja laitosten määrän suhde on. Muutin pallot numeroiksi joka mielestäni selkeytti karttaa aika tavalla. Edelleen kaikista pienimmät kunnat jäivät hieman sotkuisiksi, esimerkiksi Maarienhaminan 2 oppilaitosta eivät näy kartalla tässä mittakaavassa kun muissa Ahvenanmaan kunnissa luku on 0.

Kuva 2. Lopullinen kartta. Oppilaitosten määrä numeroina

Suomessa on niin paljon pieniä kuntia että se hankaloittaa kartan esittämistä näin. Annikalla (Innanen 2021) oli hyvä esimerkki siitä miten paljon helpommin kartan saa selkeäksi kun tarkastelee isompia alueita. Hänellä oli kaksi muuttujaa kuten minullakin mutta USA:n osavaltioihin jaettuna. Kartta oli selkeä ja informatiivinen!

Miten esittää tietoa

Kuten aiemmissakin postauksissa olen todennut, kaikista vaikein asia tällä kurssilla on ollut tilastotieteellinen puoli. Kuinka valita karttaan oikeat muuttujat ja oikea tarkasteluluku (osuus, lkm/neliökilometri, abs. lkm…). Osuus vaikutti turvalliselta idealta, mutta siinäkin oli pohtimista että mistä sen osuuden ottaisi. koko ikäluokasta joka olisi kaivettava eri aineistosta vai saman aineiston summasta. Päädyin käyttämään saman aineiston vastakkaista arvoa kokonaismäärän laskemisessa. Laskemani prosenttiosuus oli lopulta ei-peruskoulun-jälkeistä-tutkintoa / (ei-peruskoulun-jälkeistä-tutkintoa + peruskoulun-jälkeinen-tutkinto) * 100.

Oppilaitosten osalta päädyin käyttämään absoluuttista lukuarvoa per kunta, koska mielestäni se kuvastaa hyvin sitä että miten asian laita on jos valtavan kokoisessa kunnassa on vain yksi lukio. Tällöin matka sinne voi olla hankala vaikka oppilaitosten määrä väestöön nähden voisikin olla suuri. Kartan tarkastelijat ovat todennäköisesti suomalaisia ja osannevat itse hahmottaa sen että harvaan asutuilla paikoilla on vähemmän oppilaitoksia mutta silti väestöön nähden riittävästi. Harkitsin hetken oppilaitosten esittämistä oppilaitosten suhteellisena määränä väestöön nähden mutta hautasin idean koska se tuntui epäluonnolliselta ja vaikeasti hahmotettavalta tavalta. Kuitenkin Suomessa keskimäärin 2-asteen koulutukseen haluavat pääsevät koulutukseen ennemmin tai myöhemmin joten olisi ollut tässä kontekstissa omituista minusta katsoa sitä että missä kunnissa “mahtuu” oppilaitoksiin parhaiten.

Mitä kartta kertoo

En tiennyt etukäteen lainkaan minkälaisia “tuloksia” kartalta selviäisi. Valitsinkin tarkoituksella sellaisen aiheen, josta en tiedä lopputulosta etukäteen. Esimerkiksi väestöntiheys tai muuttoliike olisi ollut liian ennalta-arvattavaa. Toki oletin että jos oppilaitoksia ei ole kunnassa lainkaan, olisi myös pudokkaiden määrä suurempi. Mutta karttaa tarkastellessa näin ei taida ollakaan. Kartalta löytyy tasaisesti paikkoja joissa ei ole pudokkaita paljoa mutta oppilaitoksia ei yhtään ja toisaalta voi olla useampi oppilaitos mutta silti korkeahko pudokkaiden määrä. Eli se että oppilaitoksia on vähän, ei tunnu lisäävän pudokkaiden määrää, mutta jos vieressä on iso kunta jolla on paljon oppilaitoksia, viereistenkin kuntien pudokasmäärät laskevat.

Kartta kertoi myös jotain mielenkiintoista pääkaupunkiseudusta; näyttäisi siltä että Suomen muiden suurempien kaupunkien ympärillä pudokkaita on huomattavan vähän verrattuna siihen miten paljon heitä on pääkaupunkiseudulla jossa oppilaitostarjontaa on kaikista eniten. Eli pääkaupunkiseudulla suuri tarjonta ei auta asiaa samalla tavalla kuin muualla Suomessa.

Kartan tulkinta menee aika arvailuksi kun ei ole parempaa tilastotieteen osaamista, mutta pohdin myös ajatusta, että mahtaako punaisena hehkuvilla alueilla olla paremmat mahdollisuudet työlllistyä nuorena ja näin unohtaa koko 2-asteen koulutus. Tätä varten voisi alkaa piirrellä seuraavaa karttaa nuorten työnteosta ja vertailla sitä tähän.

Lopuksi

Tätä tehtävää tehdessä huomasi että kurssilla oli tullut opittua monta tapaa kikkailla tilastotietojen parissa. Yhdistelin eri tietoja keskenään, työskentelin eri tiedostomuotojen parissa, latailin sujuvasti WMS-tiedostoja etsiessäni sopivaa dataa karttaani varten ja käytin erilaisia visualisointeja testaillessani miten data näkyisi parhaiten. Lopuksi päädyin yksinkertaiseen malliin ja jätin hienot taustakartat ja muut pois koska kartalla oli jo niin paljon asiaa. Jotain asioita aiemmilta kerroilta oli ehtinyt jo unohtua mutta ne muistuivat nopeasti mieleen kun kävi lukemassa omia blogitekstejä ennen tehtävän aloitusta.

Kaiken kaikkiaan kurssilta jäi käteen hyvä pakillinen työkaluja joita voi käyttää omien karttavisualisointien luomiseen. Kurssi ei ollut mahdottoman raskas mutta silti salakavalasti oppi huomattavan määrän asioita lyhyessä ajassa.

Lähteet:

Engelhardt, Alexander (2021). Lesson 3. Blood Diamonds and River regimes. Haettu 28.2.2021 osoitteesta https://blogs.helsinki.fi/alwengel/

Innanen, Annika (2021). Annikan GIS-blogi. Haettu 4.3.2021 osoitteesta https://blogs.helsinki.fi/anninnan/2021/03/03/harjoitus-7-karttoja-omavalintaisista-aineistoista/

Tilastokeskus (2020)(1). Peruskoulut, lukiot, ammatilliset oppilaitokset ja kansanopistot opiskelijamäärillä mitatun oppilaitoksen koon mukaan, 2005-2020. Haettu 28.2.2021 osoitteesta: https://pxnet2.stat.fi/PXWeb/pxweb/fi/StatFin/StatFin__kou__kjarj/statfin_kjarj_pxt_125k.px/

Tilastokeskus (2019)(2). 15 vuotta täyttänyt väestö koulutusasteen, kunnan, sukupuolen ja ikäryhmän mukaan, 1970-2019. Haettu 28.2.2021 osoitteesta: https://pxnet2.stat.fi/PXWeb/pxweb/fi/StatFin/StatFin__kou__vkour/statfin_vkour_pxt_12bq.px/

 

Hasardit paikat (vk6)

Tällä kertaa harjoittelimme itse tiedonkeruuta epicollect5 -sovelluksella ja sen jälkeen käsittelimme dataa interpoloimalla siitä visualisointeja missä on tiedonkerääjien mielestä turvattomimmat alueet. Kartasta tuli näin melko informatiivinen. Innostuin aiheesta ja päätin tehdä tämän viikon varsinaisen harjoituksen käyttämällä interpolointia hyväkseni.

Maanjäristyksiä

Kokeilin kerätä tietoa maanjäristyksistä hieman eri magnitudeilla ja eri aikakausina. Lopulta päädyin käyttämään aineistoa ajalta 1980-2021 ja maanjäristyksiä magnitudeista 6.0 ylöspäin. Mielestäni se antoi hyvän kuvan siitä missä keskimäärin tapahtuu usein suhteellisen kovia maanjäristyksiä. Korkeimmilla magnitudeilla paikat eivät kuvastaneet yleisiä järistysalueita kovin hyvin.

Kuva1. Maanjäristykset piirtävät mannerlaattojen reunoja näkyviin

Kartalla näkyy hyvin mannelaattojen reunat joissa järistyksiä yleensä tapahtuu ja röpelönä esiintymänä alueet joilla on paljon järistyksiä ja ne ovat erivahvuisia keskenään. Isot pallukat kuvastavat alueita joilla järistysten voimakkuus on tasainen (muutama järistys ja kaikki samoilla magnitudilukemilla) tai on sattunut vain yksi/pari järistystä. Tiheästi järisevillä alueilla kovemmat järistykset eivät pomppaa näkyviin vaan jäävät normaalin vaihtelun välillä ansaitsemaansa kohtaan muiden pienempien järistysten väliin.

Seuraavaksi etsin käsiini tietoja asukasmääristä, koska halusin nähdä kuinka paljon väestöä asuu potentiaalisilla järistysalueilla. Löysin tiedot csv-muodossa sivulta SimpleMaps (Simplemaps.com 2021) ja karsin pois kaikki alle miljoonan asukkaan kaupungit.

Kuva2. Maanjäristykset ja suurkaupungit

Datan käsittely olikin hieman hankalaa koska Aasia monopolisoi dataa niin voimakkaasti että oli hankalaa löytää kuvaaja jolla muutkin maailman kaupungit saisi näkyviin. Lämpökartta vaikutti ensin hyvältä idealta mutta se olikin lopulta vain yksi iso pallo Aasiassa! Lopulta päädyin käyttämään aiemmilta kurssikerroilta tuttua pylväsmallia jossa pylvään pituus kuvaa väestömäärää. Nähdään että Aasiassa ylipäänsä yli miljoonan asukkaan kaupunkeja on todella tiheään ja samoin järistysalueet ovat lähettyvillä. Erityisesti väkirikkaat Japani, Taiwan ja Filippiinit ovat järistysalueiden ympäröimiä. Väli-Amerikka pistää myös silmään järistyksillänsä ja muutamalla korkealla väestöpylväällä, samoin kuin Jakartan ja Singaporen alue.

Jäin pohtimaan kuvastaako karttani hyvin maanjäristysten esiintymistä ja voimakkuutta ja tulin siihen tulokseen, että ehkä se kuvastaa parhaiten esiintymistä. Vertailin omaa karttaa kurssikaverin Villen (Väisänen 2021) blogin karttoihin ja totesin että pallokuvioilla voi periaatteessa saada ilmaistua selkeämmin etenkin jos haluaa vertailla kahta asiaa keskenään kuten Ville oli tehnyt ja vertaillut tulivuorien ja maanjäristysten esiintymistä. Kuten Villekin, jäin kaipaamaan QGIS-ohjelmalta lisää visualisointityökaluja tätä tehtävää varten. En halunnut käyttää pelkkiä palloja (löysin myös muutaman muun yhtä huonosti sopivan symbolin) joten päädyin siksi interpoloimaan, mutta toisaalta lopputulos ei ehkä ole niin selkeä kun voisi olla.

Kartan avulla voitaisiin esitellä sitä miten järistysaltiilla alueilla moni suurkaupunki on ja kuinka vähän ja maltillisia järistyksiä esim. Euroopassa tapahtuu.

 

Lähteet:

SimpleMaps.com (2021). Haettu 23.2.2021 osoitteesta https://simplemaps.com/data/world-cities

Väisänen, Ville (2021). Villen GIS-blogi. Haettu 23.2.2021 osoitteesta https://blogs.helsinki.fi/villvais/

Osaamistason arviointia (vk 5)

Olemme kurssilla tähän mennessä oppineet käyttämään jo melko laajasti erilaisia työkaluja kun ottaa huomioon ettei ohjelma ollut aluksi lainkaan tuttu. Osaisin esimerkiksi tehdä vilkkaasti liikennöidyn tien ympärille 100m suojavyöhykkeen jolta tietäisin olla keräämättä marjoja (Marttaliitto suosittelee) ja jos alueelta olisi vektorimuotoista dataa esimerkiksi asuinrakennuksista, voisin katsoa kuinka monen asunnon kotipihalta ei kannata poimia marjoja.

Olen oppinut tekemään omia tietokantoja piirtämällä viivoja ja pisteitä rasteriaineiston päälle, tekemään laskutoimituksia olemassaolevilla arvoilla, yhdistelemään eri tietokantoja joko intersect-toiminnolla tai vain valitsemalla tiettyjä elementtejä eri kerroksista jos tietoa ei tarvitse pysyvästi yhdistää. Myös karttojen piirtäminen tulostustyökalulla (layout) alkaa sujua nopeammin nykyään. Tähän mennessä mikään työkalu ei ole tuntunut erityisen vaikealle käyttää, mutta tietysti ne joita tarvitsee harvemmin, saattavat unohtua. Esimerkiksi aina ei heti muista minkä nimistä työkalua kannattikaan etsiä työkaluvalikosta. Tänään yritin tehdä Vantaan kuudesta karttalehdestä kokeeksi virtuaalirasteriaineiston mutta se ei onnistunut kovin hyvin vaan kartasta tuli tumma ja melko mahdoton lukea. Tämä on oikeastaan ainoa kohtaamani selvittämätön ongelma kurssin aikana.

Teknisiä haasteita enemmän on tuntunut vaikealta osata tehdä järkevän näköisiä ja informatiivisia karttoja. Aiheen valinta ja sen esittäminen fiksusti on yllättävän vaikeaa. Onneksi kurssilaisilta on saanut myös hyviä vinkkejä näihin kysymyksiin. Esimerkiksi näin jälkikäteen toisten blogeja tutkiessa mm. Rasmuksen hienot visualisoinnit (kurssikerta 3) antoivat lisää ideoita miten jatkossa voisi visualisoida karttoja ja erityisesti ruutuaineistokarttojen vertailu suhteellisten ja absoluuttisten määrien välillä (kurssikerta 4) herätti ajattelemaan miten erilaisia tuloksia voikaan saada riippuen minkä vertailutavan valitsee.

QGIS:in avulla pystyy tutkimaan monenlaisia tietoja, joiden kaikkien ei tarvitse edes olla spatiaalisia. Jos yhdessä tietokannassa on kuntarajat kartalla ja vaikkapa kuntanumerot, niin kuntiin liittyviä muita ei-spatiaalisia tietoja voi yhdistää toisesta tietokannasta kuntanumeron perusteella ja tutkia asioita siten kartalla. Aineistojen käsittelyssä voi kuitenkin tehdä monenlaisia virheitä, jos ei huomaakaan esimerkiksi että on tullut valinneeksi liikaa asioita analyysiinsä tai jos laskutoimitukseen on eksynyt omituisia arvoja (joskus esim -1 tai 999999999 merkitsee sitä ettei tietoa ole) jotka sotkevat kokonaisuuden. Joskus voi myös käyttää vääriä laskutapoja vertailun näkökulmasta. Aineistotkaan eivät ole aina täydellisiä ja puuttuvat arvot täytyisi ottaa myös jotenkin huomioon. Tilastotieteen kurssi olisi hyödyllinen kaikille jotka tekevät analyysejä näillä työkaluilla. QGIS-ohjelman rajoitteista aineistojen käsittelyssä en vielä osaa sanoa tarkemmin, koska tähän mennessä on tuntunut siltä että ohjelma on todella monipuolinen ja en ole keksinyt vielä asiaa jota sillä ei voisi esittää. Toki jotkin käytettävyysratkaisut ovat hieman erikoisia, mutta ne eivät silti estä ohjelman käyttöä vaan hankaloittavat sitä vain.

Tehtävistä saatuja tuloksia

MALMI:
4822 asukasta lentokentästä 2km säteellä
792 asukasta lentokentästä 1km säteellä

HELSINKI-VANTAA:
2235 asukasta 2km säteellä kentästä
65db melualueella asukkaita 17 eli 0,8 prosenttia 2km säteen rajaamasta alueesta
55db tai kovemmalla melualueella asuu 11923 asukasta
26424 Tikkurilan ja lähialueen asukasta melualueella 7km x 1km jos laskeutumissuunta käännetään kaakkosta luoteeseen

ASEMAT:
111765 asuu 500m päässä asemasta eli 2,2%
näistä 72230 on työikäisiä (18-64v) eli 45 %

KOULUT:
Helsingin Yhtenäiskoulun alueella asuu 14 kuusivuotiasta eli oletettavasti he aloittavat koulun seuraavana vuonna
12-14 -vuotiaita alueella on 62, jotka oletetavasti ovat yläasteikäisiä seuraavana vuonna.
159 koululaista alueella eli 8,4% kaikista asukkaista
muunkielisiä on alueella 110 joten heistä kouluikäisiä (8,4%) on noin 9

Lähteet:

Sohlman, Rasmus (2021). Rasmuksen GEM-kurssiblogi. Haettu 16.2.2021 osoitteesta https://blogs.helsinki.fi/sohlrasm/

Oma ruutuaineisto (vk4)

Ruutuaineisto isosta pisteaineistosta

Tällä kertaa teimme itse pisteaineiston pohjalta ruutuaineiston. Tämä oli mielenkiintoista, koska pisteaineisto itsessään ei ole kovin informatiivinen. Mieleen tuli heti monta ideaa mitä haluaisin aineistosta visualidoida.

Löysin Liisan blogista (Ahokas, 2021) hyvin visualisoidun ruutuaineiston, kartta oli sopivan kokoinen, selkeä ja informatiivinen. Päätin ottaa siitä hieman mallia omaan karttaani, mutta jättää taustan vihreän värin pois ja ehkä lisätä vähän läpikuultavuutta. Liisan vinkistä kävin myös vilkaisemassa Ronin blogia (Kurvinen, 2021) ja innostuin Ronin käyttämästä aiheesta! Roni oli havainnollistanut ruutuaineistolla pääkaupunkiseudun vanhimmat asutut talot. Tätä aineistoa katsoessani kiinnostuin siitä, että mikähän on keskimääräinen asuttujen rakennusten ikä per neliökilometri, että olisikohan kartta saman näköinen vai ei, olisiko jollain alueella keski-ikä kuitenkin hyvin nuori, vaikka vanhimmat asutut talot olisivat todella vanhoja. Halusin nähdä tällaisen jaottelun, joten otin siitä itselleni aiheen. Aineistosta ei kuitenkaan löytynyt rakennusten valmistusvuotta, vaan ainoastaan kaavoitusvuosi tai käyttöönottovuosi. Jäi hieman epäselväksi mikä vuosiluku on kyseessä. Käytän jatkossa nimitystä käyttöönottovuosi. Suurimman osan rakennuksia kanssa tämä vuosiluku vastaa melko hyvin rakennusvuotta mutta joidenkin kohdalla ei. Tarkistin tämän muutaman hyvin tuntemani asuinrakennuksen perusteella. Eräs 1995 rakennettu oli merkitty vuodelle 1988 vaikka sen tilalla ei ole ollut 80-luvulla rakennettua taloa. Sitten taas vuonna 1984 rakennettu talo oli merkitty vuodelle 1982. Suurin osa vuosiluvuista oli kuitenkin hyvin lähellä rakennusvuotta, joten en anna tämän häiritä. Ehkä se kuitenkin antaa osvittaa siitä, missä järjestyksessä alueet on rakennettu joten päätin pysyä aiheessa.

Käyttöönottovuosia (aineistossa KAVU) ei ollut saatavissa kaikille rakennuksille ja nämä oli merkitty luvulla 999999999. Poistin tällaiset kohteet ennen käsittelyä, ettei laskutoimitukset vääristyisi. Pätin käyttää keskilukuna mediaania, koska keskiarvo toimii huonosti vuosilukujen kanssa jos esimerkiksi alueella yksi talo saa arvokseen 2015 ja loput 1920, niin luku havainnollistaa hyvin huonosti sitä että pääosin rakennukset ovat 1920-luvulla rakennettuja. Ruutuaineistossa olisi toki voinut esittää myös absoluuttisia arvoja, mutta tähän havainnollistukseen halusin saada alueen keskiluvun jotta näkisi alueiden kehitysjärjestyksen.

Kokeilin kahta eri ruutukokoa, 2km x 2km ja 1km x 1km mutta totesin jälkimmäisen paremmaksi koska uudet asuinalueet eivät yleensä ole edes neliökilometrin kokoisia vaan voivat olla pienempiäkin, joten 2km särmän pituus johti keskilukujen lähestymiseen ja kartan epäselvyyteen. Puolen neliökilometrin ruutujakin harkitsin, mutta se näytti näin laajalla kartalla jo hieman sekavalta.

Ruutujen värien valinta ja kategorioiden rajojen asettaminen tuotti haasteita kun mikään valmiista kategorisoinneista ei minusta tuntunut hyvältä. Rakennuskaudet eivät jakaudu tasaisin väliajoin ja älykäs rypäsjakokaan ei tehnyt loogisia jakoja mielestäni, koska halusin että sota-aika ja sodan jälkeinen aika sivat oma ryhmänsä. Päädyin käyttämään yhdeksää kategoriaa, mikä on hieman epätavanomaista, mutta mielestäni tässä käytössä se toimi hyvin. Kuitenkin varhaisimmat vuodet ovat samansävyisiä joten muodostavat sinänsä oman isomman kategorian.

Kuva 1. Rakennusten käyttöönottovuodet 1km x 1km alueilla

Jos tätä ruututeemakarttaa vertaa kuvitteelliesti koropleettikarttaan, niin tässä näen hyvänä puolena sen, että ruutujen koon voi valita itse teemaan sopivaksi. Jos vastaavan keskiluvun olisi laskenut perustuen esimerkiksi kaupunkien osa-alueisiin, olisi tulokset niin ympäripyöreät, ettei ne oikeastaan kertoisi mitään. Ruututeemakartassa luettavuutta voi kyllä hieman häiritä ruutujen viivat, koska ne helposti peittävät alleen esimerkiksi kuntarajat tai muut hahmottavista helpottavat maantieteelliset merkit. Sen vuoksi vedin kuntarajat punaisella ja nostin järvet ja joet kartan päälimmäiseen kerrokseen, että ne erottuisivat paremmin.

Kartalta nähdään että Espoo on rakentunut melko tasaisesti tietyllä aikakaudella, kun taas esimerkiksi siellä missä Helsingin keskusta aiemmin oli (Helsingin pitäjän kirkonkylä) on hyvinkin vanhoja rakennuksia ryppäänä uusien asuinalueiden keskellä. Sama on nähtävissä Espoon pohjois-osissa (luultavasti vanhoja maatiloja). Tuoreimmat asuinalueet näyttäisivät olevan Vantaalla ja Itä-Helsingissä. Espoon tasaisempi väritys todennäköisesti kertoo siitä, että Espoossa on enemmän tehty viime vuosina täydennysrakentamista kuin ihan uusia asuinallueita. Espoossa tuoreimmat keskiluvut osuvat radan varrelle ja rantatonteille, erityisesti meren lahtien ympärille. Helsingin keskustan väritys taas kertoo että keskusta on ollut jo pitkään niin täynnä vanhoja rakennuksia, ettei mediaania mitenkään saada nostettua rakentamalla väliin muutamia uusia. Keskusta onkin pitkälti vanhaa rakennuskantaa. Ainoastaan uudet täyttömaat loistavat uudiskohteillaan, esimerkiksi Jätkäsaari ja Kalasatama.

Verrattuna Ronin (Kurvinen 2021) tekemään karttaan alueen vanhimmista rakennuksista, tämä näyttää visuaalisesti hyvin samalla tapaa jakautuneelta vaikka itse käsittelen alueiden mediaaneja. Molemmissa kartoissa Helsinki ja Vantaa ovat hyvin kirjavat, eli vierekkäiset alueet voivat olla hyvinkin eri ikäisiä, kun taas Espoo on paljon tasaisemmin jakautunut naapurusalueidensa suhteen.

Rasteriaineiston käsittelyä

Tällä kertaa tutustuimme myös rasteriaineiston käyttöön ja teimme itse vektoriaineistoa rasteriaineiston pohjalta. Merkitsimme asutut rakennukset ja tiet Pornaisten alueelle. Tätä ehkä pääsemme tutkimaan paremmin seuraavalla kerralla, miten tekemiämme aineistoja voi hyödyntää.

Lähteet:

Ahokas, Liisa (2021). Liisan kurssiblogi. Haettu 15.2.2021 osoitteesta https://blogs.helsinki.fi/ahokliis/

Kurvinen, Roni (2021). ronikurv’s blog. Haettu 15.2.2021 osoitteesta https://blogs.helsinki.fi/ronikurv/

Teemakartan tulkintaa (vk 3)

Harjoittelimme erilaisten aineistojen liittämistä toisiinsa ja taistelimme hieman teknisten ongelmien kanssa. Tällä kertaa tuli selväksi mm. missä välissä kannattaa tallentaa tai luoda uusi tietokantatiedosto, ettei menetä kaikkia uusia tietoja joita on saanut yhdisteltyä.

Tein teemakartan josta näkee valuma-alueittain tulva-indeksit. Valuma-alueet koskee aina tiettyä jokea. Kartasta näkee myös punaisena palkkina mikä on kyseisen alueen järvisyys prosentteina. Mitä korkeampi palkki, sitä suurempi osuus valuma-alueella on järviä. Pisimmät palkit lähentelevät 20 prosenttia. Legendaan en saanut merkittyä järkevästi että mitä prosenttilukua minkäkin kokoinen palkki tarkoittaa. Huomasin joidenkin kurssilaisten käyttäneen palloa palkin sijaan ja saaneet selkeämmän legendan aikaiseksi, esimerkiksi Ville Väisänen (Väisänen 2021) oli tehnyt näin.

En ole maantieteen – vaan tietojenkäsittelytieten  – opiskelija, joten minulle on täysin uutta tällaisten karttojen tulkinta tai pohtiminen että mitä kartta mahtaa kertoa. Yritin jakaa kategoriat fiksusti niin että kartta havainnollistaisi tulvien todennäköisyyttä. Kartasta nähdäänkin että Pohjanmaalla joet ovat melko tulvaherkkiä, samoin kuin lounaisrannikolla. Järvi-Suomessa tilanne on toisin, johtuisiko se sitten siitä että sade- ja sulamisvedet valuvat järviin joita on paljon tarjolla ja ei pääse käymään niin että koko alueen vedet yrittävät mahtua samaan jokeen valuakseen mereen.  Yllättävä havainto oli, että Tornionjoen alueella indeksi on niin alhainen että se jää samaan kategoriaan muiden sisämaan alueiden kanssa. Tai olisi alimmat kategoriat voinut vielä erottaa yhdellä pykälällä niin että Tornionjoen alue olisi erottunut Järvi-Suomesta mutta en nähnyt siinä riittävän painavaa syytä kun luvut olivat kuitenkin niin lähellä toisiaan. Pohdin että onkohan Pohjanmaalla maan muoto keskimäärin sen verran vähemmän viettävää, ettei jokien virtaus ole yhtä voimakas joten tulvan aikaan vesi ei “ehdi” virrata mereen vaan jää tulvimaan herkemmin? Tai johtuuko se siitä että maa on hyvin alavaa joen molemmin puolin? Toisin kuin Tornionjoen vierellä alkaa heti maasto nousta. Vai onko kyseessä koko, niin että isoon Tornionjokeen vaan yksinkertaisesti mahtuu enemmän vettä myös tulva-aikaan. Tai mahdollisesti pidemmän talven ansiosta sulaminen tapahtuu maltillisemmin. Jään odottamaan kanssaopiskelijoiden mietteitä aiheesta.

 

Lähteet:

Väisänen, Ville (2021). Villen GIS-Blogi. Haettu 3.2.2021 osoitteesta https://blogs.helsinki.fi/villvais/

Projektiot pielessä (vk2)

Oikean projektion valitseminen on tärkeää! Tarkastelemme tällä kertaa projektioita QGIS-ohjelman käytössä.

Mercator-projektio ja Lambert-projektio pinta-alojen mittauksessa

Alustavat tietoni projektioista ovat johdantokurssin muistojen varassa ja en tiennyt mitä projektiota kannattaa käyttää jos haluaa saada oikeapintaisen Suomen kartan. Materiaalista löytyi että Lambertin (EPSG: 3035) projektiota suositellaan siihen käyttöön. Harjoittelimme geometrisen tiedon tallentamista eri projektioista ja tein kartan jossa verrataan Mercatorin projektion (EPSG: 53004) pinta-alojen kokoa Lambertin projektioon. Väritetty karttakuva on piirretty ETRS89 / TM35FIN -projektiolla jotta se näyttää katsojan silmään järkevältä. Toisaalta myös Mercatorin -projektion käyttäminen piirtämisessä olisi  voinut olla hauskan havainnollistava.

Mittasuhteita havainnollistin prosentteina siten, että jos verrattavat pinta-alat ovat täysin samat, niin luku olisi tällöin 0. Eli esimerkiksi Inarin pinta-ala on 669% suurempi kuin se on Lambertin projektiossa.

Kokeilin erilaisia jakoja väritettyjä luokkia luodessa. Mitä enemmän luokkia oli, sitä tiheämmin ne vaihtuivat etelään päin mentäessä kun käytti ohjelman älykästä luokkajakoa. Tämän vuoksi valitsin 8 luokkaa, koska tätä tihentymistä oli vaikea havaita esim. neljällä luokalla. Mercator-projektio näyttää vääristävän pinta-aloja pohjoista kohti mentäessä enemmän ja enemmän. Vääristymä on jopa kaksikertainen verrattaessa Etelä-Suomen ja Pohjois-Suomen vääristymiä (siis jos Etelä-Suomessa vääristymä on 4-kertainen niin pohjoisessa voi olla 8-kertainen). Tämä johtuu siitä että Mercator-projektio on tarkimmillaan päiväntasaajalla, jolloin napa-alueita lähestyttäessä vääristys on suurimmillaan ja kasvaa “kiihtyvästi” pohjoiseen päin.

Muita projektioita

Tutkin myös muita projektioita ja mittasin miten pinta-alat vaihtelevat. (Taulukko 1) Mitattava ala oli Suomen “päälaella” oleva kolmikulmainen ala. Oli tarkoitus vaihdella mittauksia myös ellipsoidin ja tason välillä mutta oma versioni QGIS:istä ei näyttänyt niiden välillä mitään eroja (A Coruña). En kuitenkaan vielä vaihtanut versiota koska linux-koneessa se aina ole niin yksinkertaista ja toivon että tämä olisi ainoa versioon liittyvä ongelma joka tulee kurssilla vastaan.

Eri projektioilla oli suuria vaikutuksia mitattavaan alaan. Luontevasti Lambert ja Suomen kohdalla tarkka TM35FIN olivat erittäin lähellä toisiaan. Sen sijaan Mercator vääristi valtavasti, ollen n. 760% suurempi kuin pitäisi. Robinsonin projektio ei heittänyt yhtä paljon, sillä se on kompromissiprojektio joka ei ole missään asiassa täysin oikeassa mutta ei hirvittävän pahasti väärässäkään. Gall-Petersin projektio taas näyttä pinta-alat oikein suhteessa toisiinsa, mutta verrattuna oikeaan alaan, siinäkin oli heittoa niin että luku oli 83% suurempi kuin pitäisi. Tämän halusin ottaa mukaan siksi, että ymmärtää kuinka väärä luku silti on jos verrataan Gall-Petersin projektion ulkopuolelle. Eli suhteet ovat oikein vain projektion sisäisesti.

Taulukko 1. Projektioiden pinta-alavertailua (ellipsoidi ja karteesinen ilmoitettu neliökilometreinä)

 

 

 

 

 

Projektion valinnalla on suuri merkitys esitettävän tiedon luotettavuuteen. Uutisissakin näkyy usein virheitä projektion valinnassa. Jos kartoista vähän tietävä piirtää vaikkapa 200km säteen jonkin kaupungin ympärille, saadaan täysin väärää tietoa vaikutusalueesta mikäli kartta on esitetty väärässä projektiossa, esimerkiksi jos käytetään oikeakulmaista projektiota. Täytyy siis olla tarkkana siinä, että valitsee oikean projektion kyseiseen käyttötarkoitukseen. Erityiesti silloin jos tarvitaan isoa aluetta esittävää karttaa, esim. tehdään havaintoja Euroopan alueesta.

Robinson-projektion pinta-alat

Tarkastelin vielä Robinson-projektion pinta-alojen mittavirhettä verrattuna Mercatorin projektioon. Tässäkin on hieman heittoa, pinta-alat ovat 18-42 prosenssia suurempia kuin niiden pitäisi olla (vertailukohtana Lambert), mutta heitto on pienempi kuin Mercatorin projektiolla. Kuitenkin jakauma on hyvin samanlainen, eli pohjoista kohti virhe pahenee, mutta Etelä-Suomea ja Pohjois-Suomea vertailtaessa mittavirhe ei kaksinkertaistu, vaan se on noin 1,16-kertainen.  Tämä kertoo siitä, että vaikka vääristymää tulee lisää pohjoista kohden, niin vääristymän skaala on huomattavasti maltillisempi. Kuvasta nähdään että luokitusrajat menevät hyvin samaan tapaan kuin Mercatorin projektiossa, mutta huomattavasti pienemmillä luvuilla.

Robinson-projektiota oli mielenkiintoista tutkia, koska se näytti aluksi niin hämmentävästi antavan saman näköisen teemakartan kuin Mercatorin projektio. Tutkin kuntien pinta-alojen eroja Etelä- ja Pohjois-Suomessa aika tarkasti jotta sain kunnollisen kuvan siitä, miten projektio elää etelä-pohjois -akselilla. Projektiosta huomaa sen, että se on kompromissi. Se ei ole täysin tarkka missään kohtaa maailmaa, mutta ei täysin väärässäkään. Oletan että sen takia mittavirhe ei pahene yhtä voimakkaasti pohjoista kohti mentäessä kuten Mercatorin projektiossa, vaikka muuten virheen “etenemissuunta” on sama.

Pinta-alaan suhteutetun tiedon esittäminen

Kokeilin esittää lasten asumistiheyttä teemakartalla (lasten määrä neliökilometrillä). Ensin käytin oikeapintaista Lambert-projektiota ja sitten Mercator-projektiota jotta tulokset olisivat selkeästi erilaiset. Nähdään että kartta näyttää molemmissa erittäin uskottavalta jos ei kiinnitä huomiota lukuarvoihin. Molemmat kartat näytävät samalta, mutta koska Mercator vääristää pinta-aloja valtavasti suuremmiksi, niin vaikuttaa siltä kuin lapsia asuisi harvemmassa kuin mikä tilanne oikeasti on.

Mitä jäi päähän

Oli hyvä kerrata projektioita ja erityisesti oppia etsimään niitä QGIS:istä. En ollut huomannut ajatella miten paljon ne voi vääristää jos jotain lukua halutaan suhteuttaa esim. pinta-alaan. Olin ajatellut enemmänkin niin että väärä projektio vääristää kartalle piirrettyjä asioita, esimerkiksi niin että suorin reitti ei kuljekaan siitä missä se on kartalle piirrettynä jos kartta ei ole oikeakulmainen. En ollut sen tarkemmin miettinyt miten väestöntiheys tai muut verrattavat asiat muuttuvat jos esitystapa on väärä. Tämä saa minut varovaiseksi jatkossa projektiota valitessa.

Viikolla tuli opittua myös teknisiä asioita, kuten geometrisen tiedon tallennusta tietystä projektiosta ja rajapintojen käyttöä. Rajapinnoista on varmasti hyötyä paljon jatkossa. Tulostettavan karttakuvan luominen alkoi sujua jo helpommin viimeisiä karttoja tehdessä.

Olisin halunnut ottaa vertailuun mukaan luennolla mainitun Equal Earth -projektion, nähdäkseni miten paljon Robinsonia tarkempi se on. En kuitenkaan löytänyt sitä, mutta huomasin kurssilaisen Kasperin löytäneen sen. (Mickos 2021) Ymmärsin että se täytyisi ladata custom-projektiona jos sitä haluaisi käyttää. Koetan ensi kertaan mennessä saada sen asennettua.

 

Lähteet:

Mickos, Kasper (2021). Kasperin Blogi. Haettu 27.1.2021: https://blogs.helsinki.fi/kmickos/

QGIS-ohjelma auki ensimmäisen kerran! (vk1)

Ensikokemus QGIS-ohjelmistosta oli samanlainen kuin monesta muustakin ammattiohjelmistosta. Ruutu täynnä erilaisia pieniä kuvakkeita joista ei saa aluksi itse tutkimalla mitään selvää mitä niillä voi tehdä. Kuvankäsittelyohjelma on ehkä lähinnä tätä käyttöliittymäkokemusta mutta toki QGIS:in toiminnot ovat erilaisia. Kuitenkin hyvin nopeasti kuvakkeista alkoi saada selkoa ja teimme luennon aikana luennoitsijan esimerkkiä seuraamalla omat koropleettikartat (ensimmäinen opittu uusi termi maantieteestä!) Itämeren typpipäästöistä.

Tulostetta suunnitellessa tuli muutamia teknisiä haasteita mutta sain ne selvitettyä ja tulosteesta tuli juuri sellainen kuin halusin. Näin pienenä kuvana ainoaksi harmittavaksi asiaksi jäi järvien ääriviivojen sumppuuntuminen mustiksi parviksi.

Sitten ryhdyin etsimään netistä aineistoja joita olisi mielenkiintoista tutkia kuntakohtaisesti kartalla. Päätin tehdä tehtävän vaikeustasolla 2. Halusin löytää jotain peruskoululaisiin liittyvää joka olisi valmiiksi .csv-muodossa. Sivustolta avoindata.fi löytyikin useita vaihtoehtoja ja lopulta päädyin Yleisradion julkaisemaan aineistoon, joka kertoo kuinka moni kunnan oppilaista joutuu opiskelemaan väistötiloissa syyslukukaudella 2018. (Yleisradio 2018) Kiinnostukseni heräsi koska en ollut lukenut aiheesta mitään lehdistä ja halusin itsekin tietää onko väistötiloissa opiskelu yleistä koko maan tasolla.

Aineiston liittäminen kuntapohjaan aiheutti ongelmia koska aineistossa oli vain kuntien nimet, eikä yhdistäminen niiden perusteella onnistunut kunnolla vaikka molemmat aineistot olivat merkitty käyttävän UTF-8 merkitstöä. Virheitä tapahtui silti esimerkiksi ääkkösen kohdalla. Aluksi liitetyt aineistot näyttivät tältä, eli monia kuntia jäi puuttumaan:

Yritin muokata aineistoa eri tavoin ja lopulta löysin Sanna Jantusen blogista idean, että voisi yrittää yhdistää tietoja kuntanumerolla. (Jantunen 2021) Aineistossani ei sellaista numeroa tosin ollut, joten etsin ensin käsiini toisen valmiiksi .csv-muodossa olevan aineiston joka sisälsi kuntanumerot. (Digi- ja väestötietovirasto 2021) Liitin tämän ensin väistötila-aineistoon kuntien nimien perusteella ja nyt ääkkösongelmaa ei tullut kun molemmat tiedostot olivat .csv-muodossa. Sitten täytyi vielä tehdä kuntapohjaan uusi kenttä jossa kuntanumero olisi tekstin sijaan kokonaislukuna ja lopulta liittäminen onnistui. Tässä blogissa ei ollut tarkoitus avata tarkemmin teknisiä vaikeuksia mutta toivon että tästä voisi olla toisille apua, kuten minulle oli Sannan kirjoituksesta!

Lopullinen kartta näyttää tältä:

Peruskoululaiset väistötiloissa syksyllä 2018

Kaikista kunnista ei ollut tietoa väistötiloista, mutta suurimmasta osasta kuitenkin oli. Päädyin esittämään asian osuuksina, koska ymmärsin luennolla että tarkkoja lukumääriä ei saa esittää. Tähän täytyy vielä kysyä tarkennusta myöhemmin, että miksi näin on ja mitä tilanteita tämä ohje koskee.

Joissain kunnissa oli alle 10hlö väistötiloissa, jolloin osuuttakaan ei pystynyt laskemaan, joten nämä kunnat jätin harmaaksi. Valitsin kategorioiden rajat aluksi ohjelman älykkäällä toiminnolla ja muokkasin niitä vielä itse. Rajoja valitessa yritin tehdä kartasta mahdollisimman informatiivisen ja ajattelin että tärkeintä on nähdä missä kunnassa ei ole ketään väistötiloissa. Lisäksi halusin että näkyisi selvästi jos yli puolet tai kaikki oppilaat ovat väistötiloissa (55.8% valikoitui rajaksi jotta toisiaan hyvin lähellä olevat arvot pysyisivät samassa kategoriassa). Joissain pienissä kunnissa voi olla vain muutama koulu, ehkä jopa vain yksi, joten minusta on hälyttävä merkki jos kunnalla on yli puolet oppilaista väistötiloissa. Tiheästi asutuilla alueilla puolestaan on varmasti aina jonkin koulun oppilaat väistötiloissa, minkä vuoksi 0-5% luokitus toimii hyvin indikaattorina että väistötila-asiat ovat kunnassa melko hyvällä tolalla. Toisaalta kiinnostavaa olisi myös nähdä aineisto kouluista, joissa epäillään sisätilaongelmia mutta väistötiloja ei ole saatu tai haluttu ottaa käyttöön! Samoin olisi mielenkiintoista nähdä tämä sama aineisto päivitettynä vaikka vuodelta 2020.

Kun sain tulokset kartalle, olin yllättynyt siitä kuinka paljon oppilaita onkaan väistötiloissa. Mielestäni kartta näyttää aika hyvin sen, missä kunnissa tilanne on vakava ja selkeästi sen missä tilanne on hyvä. Tiheämmin asutuilla alueilla joutuu tosin suhteuttamaan prosenttilukuja siihen että pohtii samalla montako koulua alueella on. Esimerkiksi olisi minusta paljon huolestuttavampaa jos kunnan 30 koulurakennuksesta 10 on poissa käytöstä kuin että kunnan 3 koulusta yksi on poissa käytöstä. Eli kartan tarkastelu voi olla vaikeaa sellaiselle joka ei tunne Suomen väestöjakaumaa lainkaan.

Viikon uudet opit

QGIS-ohjelmiston käytöstä opin paljon uusia asioita, koska käyttökerta oli ensimmäinen. Huomasin myös että kun pari päivää oli kulunut luennosta, olin jo ehtinyt unohtaa osan asioista ja sain todella kaivella muistia kun aloin tehdä varsinaista viikon tehtävää. Viikon suurin oivallus oli varmastikin se, että miten tietoja kannattaa muuttaa ja yhdistää jotta tulos on järkevä.

Tällä viikolla sain myös paljon ajatella sitä, mitä haluaisin oikeastaan teemakartalla kertoa ja miten asiat kannattaisi esittää. Tässä aihealueessa minulla on vielä valtavasti opittavaa, koska en ole työskennellyt sen paremmin karttojen kuin tilastotieteenkään parissa tätä ennen juurikaan. Ensi kerralla ehkä koetan valita karttaan aiheen joka on selkeämpi esittää osuuksina kartalla ja on lopuksi vielä informatiivisempi.

Tapani etsiä tietoa on kokeileva. En lukenut kertaakaan QGIS:in ohjeita tai googlannut, vaan sinnikkäästi etsin ohjelmistosta toimintoja, joita toivoin sieltä löytyvän. Matkan varrella löysin myös useita toimintoja joista voi olla hyötyä tulevaisuudessa. Join-toiminto tuntui hankalalta kun on tottunut toimimaan tietokantojen kanssa tietokannan tasolla eikä ohjelmiston välityksellä. Tuntui kuin kädet olisi sidottuna. Toivoisin jatkossa löytäväni jonkin reitin koskea suoraan tietokantaan tai sitten oppivani ymmärtämään vielä paremmin ohjelmiston logiikkaa.

 

Lähteet:

Digi- ja väestötietovirasto 2021. Kuntaluettelo. Haettu 19.1.2021 osoitteesta https://www.avoindata.fi/data/fi/dataset/kuntaluettelo

Jantunen, Sanna (2021). Sannan blogi. Haettu 19.1.2021 osoitteesta https://blogs.helsinki.fi/smjantun/

Yleisradio (2018). Väistötiloissa opiskelevat peruskoululaiset syyslukukaudella 2018. Haettu 19.1.2021 osoitteesta https://www.avoindata.fi/data/fi/dataset/vaistotiloissa-opiskelevat-peruskoululaiset-syksy-2018