Uudet taidot käyttöön (vk7)

Kurssin lopuksi teimme omat kartat valitsemastamme aiheesta. Valitsin aiheeksi koulutuksen. Halusin vertailla löytämieni aineistojen avulla, onko koulupudokkaiden määrä suurempi sellaisilla alueilla joissa toisen asteen koulutusta ei ole tarjolla tai on vain vähän tarjolla. Koulupudokkailla tarkoitan tässä sellaisia nuoria jotka eivät ole peruskoulun jälkeen hankkineet muuta tutkintoa. Tilastokeskuksen sivuilta löysin tietokannat kaikista oppilaitoksista ja rajasin sen koskemaan vain lukioita ja ammattikouluja/-oppilaitoksia. (Tilastokeskus 2020) Tilastokeskukselta löytyi myös tiedot väestön koulutusasteesta jota löytyi kohdat “Ei peruskoulun jälkeistä tutkintoa” ja “Peruskoulun jälkeinen tutkinto”. (Tilastokeskus 2019) Koostin näistä ikäluokan yhteissumman ja laskin osuuden niille joilla ei peruskoulun jälkeistä tutkintoa ole. Otin ikäluokaksi käsittelyyn 25-29 -vuotiaat, koska nuoremmalla ikäluokalla voisi vielä olla koulutus kesken jos esimerkiksi miehillä armeija on hidastanut koulun aloitusta tai on pidetty välivuosia. Tiedot väestön koulutusasteeta ovat vuodelta 2019. Oppilaitosten määrät puolestaan ovat vuodelta 2015, jotta ne olisivat lähempänä sitä aikaa kun 25-29 -vuotiaat todennäköisesti ovat valmistuneet.

Teknisiä haasteita

Latasin aineistot pilkkueroteltuina tiedostoina ja taistelin hetken ääkkösongelmien parissa. Tein csv-tiedostoille ensin valintatyökalulla karsintaa jotta jäljelle jäi vain kuntien nimet ja yksi muuttuja per tiedosto. Jouduin siis tekemään erilliset csv-tiedostot muuttujille ei-pk-jälkeistä-tutkintoa, pk-jälkeinen-tutkinto ja oppilaitosten-määrät, koska muuten join-toiminto olisi kadottanut tietoja yhdistäessä kuntatiedostoon. Kuntatiedosto oli aiemmilla kurssikerroilla käytetty pohja, jossa on kuntarajat valmiina polygoneina ja yhdistäminen onnistui kunnan nimen perusteella. Tällä kertaa ei tullut ongelmia nimien yhdistämisessä.

Ennen yhdistämistä tein myös laskentaa kun halusin mm. laskea osuuksia ja yhdistää lukioiden ja ammattikoulujen määrät per kunta. Tämä aiheuttikin hieman enemmän työtä ja suuri osa kurssikerran ajasta kului pohtimiseen, miten saan calculatorilla nuo yhdistettyä. SQL-kielellä se olisi käynyt kätevästi ”SELECT SUM(oppilaitosten-määrä) FROM laitokset GROUP BY kunta” mutta QGIS ei sitä ihan suoraan ymmärtänytkään joten piti etsiä aika kauan tietoa kunnes löytyi komento joka toimi calculatorissa. SUM(oppilaitosten-määrä, kunta) oli lopulta taikasana. Eli GROUP BY menikin sulkujen sisään. Samalla olisi pystynyt filtteröimään jotain ulos mutta en sekaantunut enää siihen!

Visualisointi

Tulostettavien karttojen luominen sujui tällä kertaa jo tottuneesti. Vaikka muuttelin karttaa ja vaihdoin muuttujia kesken tulosteen luomista, sain ne kätevästi siirrettyä suoraan tulosteelle. Kahden muuttujan esittämisen vaikeudesta yhdellä kartalla peloteltiin etukäteen ja en ihmetelekään miksi. Päätin esittää asiat kuntatasolla vaikka Suomessa onkin kuntia melko paljon ja se hankaloittaa hahmottamista. Tein kuitenkin havainnon että koulupudokkaiden määrä vaihtelee todella rajusti kunnittain, joten maakuntakohtainen tarkastelu olisi tasoittanut lukumääriä liikaa. Nyt kun tähän vielä lisäsi tiedon oppilaitoksista, tuli kartasta melko ahdas. Sen vuoksi päätin vielä erotella pääkaupunkiseudun pienet kunnat omaksi leikkauksekseen.

Aluksi kokeilin näyttää oppilaitokset palloina (mitä suurempi pallo, sitä enemmän oppilaitoksia). Sain tästä idean lukiessani Alexanderin blogia jossa pallot toimivat hyvin järvisyyden mittarina. (Engelhardt 2021) Tässä ensimmäinen yritelmä:

Kuva1. Ensimmäinen yritys. Oppilaitosten määrät palloina

Kuten näkyy, isot pallot vain peittävät alleen punaiset värit, joten ei tiedä mikä pudokkaiden ja laitosten määrän suhde on. Muutin pallot numeroiksi joka mielestäni selkeytti karttaa aika tavalla. Edelleen kaikista pienimmät kunnat jäivät hieman sotkuisiksi, esimerkiksi Maarienhaminan 2 oppilaitosta eivät näy kartalla tässä mittakaavassa kun muissa Ahvenanmaan kunnissa luku on 0.

Kuva 2. Lopullinen kartta. Oppilaitosten määrä numeroina

Suomessa on niin paljon pieniä kuntia että se hankaloittaa kartan esittämistä näin. Annikalla (Innanen 2021) oli hyvä esimerkki siitä miten paljon helpommin kartan saa selkeäksi kun tarkastelee isompia alueita. Hänellä oli kaksi muuttujaa kuten minullakin mutta USA:n osavaltioihin jaettuna. Kartta oli selkeä ja informatiivinen!

Miten esittää tietoa

Kuten aiemmissakin postauksissa olen todennut, kaikista vaikein asia tällä kurssilla on ollut tilastotieteellinen puoli. Kuinka valita karttaan oikeat muuttujat ja oikea tarkasteluluku (osuus, lkm/neliökilometri, abs. lkm…). Osuus vaikutti turvalliselta idealta, mutta siinäkin oli pohtimista että mistä sen osuuden ottaisi. koko ikäluokasta joka olisi kaivettava eri aineistosta vai saman aineiston summasta. Päädyin käyttämään saman aineiston vastakkaista arvoa kokonaismäärän laskemisessa. Laskemani prosenttiosuus oli lopulta ei-peruskoulun-jälkeistä-tutkintoa / (ei-peruskoulun-jälkeistä-tutkintoa + peruskoulun-jälkeinen-tutkinto) * 100.

Oppilaitosten osalta päädyin käyttämään absoluuttista lukuarvoa per kunta, koska mielestäni se kuvastaa hyvin sitä että miten asian laita on jos valtavan kokoisessa kunnassa on vain yksi lukio. Tällöin matka sinne voi olla hankala vaikka oppilaitosten määrä väestöön nähden voisikin olla suuri. Kartan tarkastelijat ovat todennäköisesti suomalaisia ja osannevat itse hahmottaa sen että harvaan asutuilla paikoilla on vähemmän oppilaitoksia mutta silti väestöön nähden riittävästi. Harkitsin hetken oppilaitosten esittämistä oppilaitosten suhteellisena määränä väestöön nähden mutta hautasin idean koska se tuntui epäluonnolliselta ja vaikeasti hahmotettavalta tavalta. Kuitenkin Suomessa keskimäärin 2-asteen koulutukseen haluavat pääsevät koulutukseen ennemmin tai myöhemmin joten olisi ollut tässä kontekstissa omituista minusta katsoa sitä että missä kunnissa “mahtuu” oppilaitoksiin parhaiten.

Mitä kartta kertoo

En tiennyt etukäteen lainkaan minkälaisia “tuloksia” kartalta selviäisi. Valitsinkin tarkoituksella sellaisen aiheen, josta en tiedä lopputulosta etukäteen. Esimerkiksi väestöntiheys tai muuttoliike olisi ollut liian ennalta-arvattavaa. Toki oletin että jos oppilaitoksia ei ole kunnassa lainkaan, olisi myös pudokkaiden määrä suurempi. Mutta karttaa tarkastellessa näin ei taida ollakaan. Kartalta löytyy tasaisesti paikkoja joissa ei ole pudokkaita paljoa mutta oppilaitoksia ei yhtään ja toisaalta voi olla useampi oppilaitos mutta silti korkeahko pudokkaiden määrä. Eli se että oppilaitoksia on vähän, ei tunnu lisäävän pudokkaiden määrää, mutta jos vieressä on iso kunta jolla on paljon oppilaitoksia, viereistenkin kuntien pudokasmäärät laskevat.

Kartta kertoi myös jotain mielenkiintoista pääkaupunkiseudusta; näyttäisi siltä että Suomen muiden suurempien kaupunkien ympärillä pudokkaita on huomattavan vähän verrattuna siihen miten paljon heitä on pääkaupunkiseudulla jossa oppilaitostarjontaa on kaikista eniten. Eli pääkaupunkiseudulla suuri tarjonta ei auta asiaa samalla tavalla kuin muualla Suomessa.

Kartan tulkinta menee aika arvailuksi kun ei ole parempaa tilastotieteen osaamista, mutta pohdin myös ajatusta, että mahtaako punaisena hehkuvilla alueilla olla paremmat mahdollisuudet työlllistyä nuorena ja näin unohtaa koko 2-asteen koulutus. Tätä varten voisi alkaa piirrellä seuraavaa karttaa nuorten työnteosta ja vertailla sitä tähän.

Lopuksi

Tätä tehtävää tehdessä huomasi että kurssilla oli tullut opittua monta tapaa kikkailla tilastotietojen parissa. Yhdistelin eri tietoja keskenään, työskentelin eri tiedostomuotojen parissa, latailin sujuvasti WMS-tiedostoja etsiessäni sopivaa dataa karttaani varten ja käytin erilaisia visualisointeja testaillessani miten data näkyisi parhaiten. Lopuksi päädyin yksinkertaiseen malliin ja jätin hienot taustakartat ja muut pois koska kartalla oli jo niin paljon asiaa. Jotain asioita aiemmilta kerroilta oli ehtinyt jo unohtua mutta ne muistuivat nopeasti mieleen kun kävi lukemassa omia blogitekstejä ennen tehtävän aloitusta.

Kaiken kaikkiaan kurssilta jäi käteen hyvä pakillinen työkaluja joita voi käyttää omien karttavisualisointien luomiseen. Kurssi ei ollut mahdottoman raskas mutta silti salakavalasti oppi huomattavan määrän asioita lyhyessä ajassa.

Lähteet:

Engelhardt, Alexander (2021). Lesson 3. Blood Diamonds and River regimes. Haettu 28.2.2021 osoitteesta https://blogs.helsinki.fi/alwengel/

Innanen, Annika (2021). Annikan GIS-blogi. Haettu 4.3.2021 osoitteesta https://blogs.helsinki.fi/anninnan/2021/03/03/harjoitus-7-karttoja-omavalintaisista-aineistoista/

Tilastokeskus (2020)(1). Peruskoulut, lukiot, ammatilliset oppilaitokset ja kansanopistot opiskelijamäärillä mitatun oppilaitoksen koon mukaan, 2005-2020. Haettu 28.2.2021 osoitteesta: https://pxnet2.stat.fi/PXWeb/pxweb/fi/StatFin/StatFin__kou__kjarj/statfin_kjarj_pxt_125k.px/

Tilastokeskus (2019)(2). 15 vuotta täyttänyt väestö koulutusasteen, kunnan, sukupuolen ja ikäryhmän mukaan, 1970-2019. Haettu 28.2.2021 osoitteesta: https://pxnet2.stat.fi/PXWeb/pxweb/fi/StatFin/StatFin__kou__vkour/statfin_vkour_pxt_12bq.px/

 

2 thoughts on “Uudet taidot käyttöön (vk7)”

Leave a Reply

Your email address will not be published.