Erittäin varteenotettava tiedeblogi

Kurssikerta 1.

Tämän blogin tarkoituksena on toimia oppimispäiväkirjana Geoinformatiikan menetelmät 1 -kurssilla. Jakamalla omia ajatuksia kurssin sisällöstä, lukemalla muiden blogeja ja vuorovaikuttamalla niiden kanssa saadaan aikaiseksi pienimuotoinen yhteisö, jonka kanssa opittuja asioita voidaan käsitellä. Tuotoksena tämä blogi on tietysti erittäin varteenotettava ja tieteellinen – ja vaikkei olisikaan, ainakin pääsen esittämään kaikki mieleen tulevat kysymykset geoinformatiikasta. Mutta mitä tiedeyhteisön leikkimisestä oikein voidaan oppia?

Ensimmäisellä kurssikerralla käytiin läpi paikkatiedon perusjuttuja ja harjoiteltiin käyttämään QGIS-ohjelmistoa. QGIS on avoimen lähdekoodin paikkatieto-ohjelmisto, jonka käyttö tuntuu vielä varsin haastavalta ja aikaa vievältä. Tunnilla piirsimme teemakartan, jossa tarkoituksena oli havainnollistaa tilastotietoa vektoriaineistossa aluejaon mukaisesti. Itsenäiseksi tehtäväksi tuli tehdä vastaava koropleettikartta, jossa pohja-aineistona oli Suomen kunnat vuodelta 2015.

Kuva 1. Typpipäästöt valtioittain Itämerellä.

Tehtäviä oli kolmea vaikeustasoa, ja tartuin niistä numeroon kaksi. Siinä lisähaastetta tuli siitä, että kunta-aineistoon yhdistettävä tilastotieto piti etsiä itsenäisesti netistä sen sijaan, että olisi käyttänyt aineistossa valmiiksi olevia tilastoja. Sopivan tilaston löytäminen ja yhdistäminen vektoriaineistoon osoittautui haastavaksi tehtäväksi. Parin tunnin Excelin ja QGIS:sin kanssa säätämisen jälkeen sain lopulta kartan ulos, mutta kohtasin matkan varrella monta teknistä ongelmaa. Oppimisprosessi meni jotenkin seuraavasti:

Päädyin käyttämään Tilastokeskuksen aineistoa vuoden 2021 kuntavaalien äänestysprosentista, sillä se on esitetty kunnittain ja arvot ovat prosentteja, joita voi esittää koropleettikartalla toisin kuin absoluuttisia arvoja. Aineistoa ei kuitenkaan saanut ladattua sopivassa muodossa CVS-tiedostona, joten jouduin kopioimaan sen Exceliin ja muokkaamaan sen itse sopivaan muotoon. Myös aineiston yhdistäminen Kunnat 2015 -vektoriaineistoon osoittautui haastavaksi. Lisäsin siihen vielä erikseen tilaston kuntanumeroista, jotta QGIS suostui yhdistämään äänestysprosentit tiettyihin kunta-alueisiin.

Seuraava tekninen haaste tuli siitä, ettei QGIS antanut jostain syystä kategorisoida äänestysprosentteja asteikollisiin luokkiin niiden arvojen perusteella. Meinasin jo tehdä kategorisoinnin käsin, kunnes ymmärsin, ettei QGIS pitänyt syöttämiäni tilastoja numeroina vaan pelkkänä tekstinä. Kun sain vaihdettua äänestysprosentit numeroaineistoksi, koropleettikartan teko onnistui viimein niin kuin sen kuuluukin.

Kuva 2. Äänestysprosentti vuoden 2021 kuntavaaleissa. (Tilastokeskus, 2021)

Valmiissa kartassa näkyy äänestysprosentti kunnittain vuoden 2021 kuntavaaleissa. Äänestysprosentin vaihtelussa ei voida erottaa mitään selkeää johdonmukaisuutta, joten pelkästään kartan perusteella ei voitaisi esimerkiksi päätellä eroa kaupunkimaisten ja maaseutumaisten kuntien äänestysprosenttien välillä. Lisäksi joistakin kunnista puuttuu kokonaan tieto äänestysprosentista. Tämä johtuu siitä, että kunta-aineisto on vuodelta 2015 ja äänestysprosentit vuodelta 2021. Tänä aikana kunnissa on ehtinyt tapahtua muutoksia – erityisesti kuntaliitoksia – jonka vuoksi kaikille kunta-aineiston kunnille ei löydy vastinetta äänestysprosenttiaineistosta. Kaiken kaikkiaan kartasta voi kuitenkin havaita, että äänestysprosentissa on jonkin verran eroja eri kunnissa.

Koropleettikartan havainnollistavuutta voidaan pohtia monelta kannalta. Tiina Ilmoniemi pohtii blogissaan sitä, että koropleettikartta aiheuttaa helposti pinta-alaharhoja, mikä Suomen tapauksessa tarkoittaa usein Pohjois-Suomen suurten kuntien korostumista (Ilmoniemi, 2022). Tämä näkyy myös äänestysprosenttikartassa, sillä erityisesti Lapin kunnat erottuvat kartalta hyvin. Sen sijaan esimerkiksi Uudenmaan kunnista äänestysprosentteja on vaikea erottaa. Vaikka koropleettikartta onkin usein osuva tapa visualisoida aineistoa, täytyy sitä tarkastellessa olla tarkka eri kokoisten pinta-alojen vaikutuksesta.

Tehtävän tekemiseen meni siis lopulta aika paljon aikaa, mutta ainakin opin samalla vahingossa aika monta uutta asiaa QGIS:sistä. Entä se tiedeyhteisöllisyys sitten? On ihan kiinnostavaa päästä näkemään, miten vuorovaikutteisuus toimii käytännössä. Opiskelun ollessa varsin etäpainotteista tuntuu myös ylipäätään tärkeältä päästä kuulemaan muiden kurssilaisten kokemuksia kurssin tehtävistä ja sisällöstä. Tiedeyhteisön leikkimisestä voidaan varmasti oppia paljon sekä vuorovaikutuksesta että tekstin julkaisemisesta ylipäätään. Blogini – kuten tuskin kenenkään muunkaan blogi tätä kurssia varten – tulee olemaan erityisen tieteellinen tai varteenotettava, mutta ainakin pääsemme jakamaan oppimiseen liittyviä ajatuksia ja kokemuksia tosillemme.

 

Lähteet:

Tilastokeskus (2021). 12wx — Kuntavaalit äänestystiedot, 2021. Lainattu 27.1.2022. Saatavilla: https://pxnet2.stat.fi/PXWeb/pxweb/fi/StatFin/StatFin__vaa__kvaa__2021_05/statfin_kvaa_pxt_12wx.px/

Tiina Ilmoniemi (2022). Koropleettikarttojen maailmassa. Learning Geography -blogi. Lainattu 27.1.2022. Saatavilla: https://blogs.helsinki.fi/tiinailm/

Vastaa

Sähköpostiosoitettasi ei julkaista. Pakolliset kentät on merkitty *