Tilastoja & onnistumisia

Päätin viimeisellä kurssikerralla tutkia vuoden 2019 eduskuntavaalien äänestysprosentin suhdetta väestöntiheyteen, koulutusasteeseen ja väestön ikärakenteeseen. Hain taustakartan ja tarvittavan datan Tilastokeskuksen sivuilta, jotka onnekseni olivat miellyttävät käyttää. Kartta vuoden 2020 kuntajaolla löytyi googlettamalla ja sain sen QGIS:iin WFS-yhteyden avulla. Datan sai mukavasti tallennettua myös suoraan Tilastokeskuksen sivuilta eikä se vaatinut suurempia muutoksia Excelissä.

Kuvassa 1 on esitetty vuoden 2019 eduskuntavaalien äänestysprosentti kunnittain. Äänekosken kunta näkyy kartalla mustana, sillä datassa ei ollut sille syystä tai toisesta äänestysprosenttia. Ajatukseni oli ensin esittää äänestysprosentti ja väestöntiheys samalla kartalla, mutta totesin, että on kartan luettavuuden kannalta suotavampaa esittää ne erillisinä, jolloin niitä voi helposti vertailla keskenään. Myönnettäköön, että tässä päätöksessä painoi myös omien hermojen säästäminen.

Kuva 1.

Kuvassa 2 on siten esitetty väestöntiheys kunnittain neliökilometriä kohden. Väestöntiheyden esittäminen neliökilometriä kohden näin suhteellisen pienessä mittakaavassa on hieman vaikeaselkoinen lukijalle. Suomessa väestöntiheys pääkaupunkiseudulle on suhteessa valtava verrattaessa muualle, että jo sen takia kartta on suurimmaksi osaksi samaa väriä. Lisäksi kartassa näkyy yksi kunta, joka ei löytänyt pariaan Join attributes by field value -toiminnon jälkeen, vaikka kaiken järjen mukaan koloa ei olisi pitänyt syntyä…

Kuva 2.

Kartat kuitenkin toimivat mielestäni hyvin tarkoituksessaan. Verrattaessa karttoja väestöntiheydestä ja äänestysprosentista, voitaisiin jossakin määrin ajatella, että suurempi väestöntiheys on yhteydessä hieman suurempaan äänestysprosenttiin. Tätä voisi selittää esimerkiksi lyhyempi äänestysmatka alueilla, joilla väestö asuu tiheään. Esimerkiksi Pohjois-Karjalassa ja Kainuussa äänestysprosentti on Suomen mittakaavassa alhaisinta luokkaa ja siellä myös väestöntiheys on hyvin alhaista. Toisaalta taas Oulun seudulla äänestysprosentti on korkeampi Kainuun maakuntaan verrattuna ja väestöntiheyskin suurempi. Kovin suoria johtopäätöksiä ei tästä voi vielä vetää, mutta mielenkiintoisia yhteyksiä joka tapauksessa.

Halusin tarkastella äänestysprosentin yhteyttä myös muihin muuttujiin ja päädyin koulutusasteeseen. Kuvassa 3 on esitettynä äänestysprosentti kunnittain koropleettikarttana ja histogrammein korkea-asteen tutkinnon suorittanut väestö. Tietysti vasta kuvaa blogiin ladatessani huomasin ärsyttävän typon legendassa, olkoon. Histogrammien suuri määrä tekee kartasta hieman vaikeasti luettavan, minkä vuoksi tein samasta kartasta vielä suurennokset eri osista Suomea. Juho Leskinen oli omassa blogissaan tehnyt kartan, joka havinnollisti Yhdysvaltojen vuoden 2018 vaalien äänestystuloksia ja koulutusastetta. Kartalla oli nerokkaasti käytetty ympyrädiagrammia kuvaamaan koulutusastetta, mikä teki kartan tulkinnasta helppoa.

Kuva 3.
Kuva 4.
Kuva 5.

Kuvassa 4 kartta on suurennettu Etelä-Suomen kohdalle ja kuvassa 5 Pohjois-Karjalan ja Kainuun suunnalle. Kuvista 4 ja 5 kartan tulkitseminen jo onnistuu ja siitä onkin nähtävissä jonkinlainen yhteys korkea-asteen koulutuksen lukumäärän ja kunnallisen äänestysprosentin välillä. Toisaalta kuvassa 4 Vaasan lähistöllä äänestysprosentti on korkea, mutta korkea-asteen tutkintoja taas on vähän.

Vielä viimeisenä päätin havainnollistaa ikärakenteen ja äänestysprosentin yhteyttä. Pyrkimys oli saada eri ikäluokat samalle kartalle yhdessä äänestysprosentin kanssa, mutta totesin muuttujia olevan sen verran paljon, että kartasta olisi luultavasti tullut epäselvä eivätkä taitoni riittäneet ihan sinne asti.

Päädyin siten tekemään kaksi karttaa, joista toinen kuvaa 20-24-vuotiaita ja toinen yli 65-vuotiaita kunnittain (kuva 6). Karttaparista käy ilmi, kuinka samoissa kunnissa, joissa 20-24-vuotiaita on paljon, on myös paljon yli 65-vuotiaita, mikä selittyy luultavasti kunnan suurella väestöluvulla. Karttaparista voi myös päätellä yleisesti Suomen ikärakenteen olevan yläpainotteinen, kun 65-vuotiaita on selvästi enemmän kuin 20-24-vuotiaita.

Valitsin kyseiset ikäluokat, sillä mielestäni kiinnostavaa on nuorten äänestysaktiivisuus verrattuna vanhempaan väestöön. Nyt tätä karttaparia tarkastellessani voin todeta, ettei tästä kyllä kovin luotettavasti sellaista tietoa saa irti 😀  Karttaparia voi toki verrata kuvaan 1 äänestysprosenteista ja pohtia mahdollisia yhteyksiä.  Otettakoon tästä se opiksi, että kannattaa ensin miettiä kunnolla loppuun asti, mitä on tekemässä ennen kuin alkaa tekemään.

 

Kuva 6. Ikärakenteet vuodelta 2019.

Karttojen tekninen toteutus onnistui oikeastaan ilman mitään suurempia ongelmia. Myös kurssikerralla 3 pähkäilemäni histogrammit luonnistuivat nyt mukavasti, jee! Hieman viilattavaa esitystavassa toki edelleen on, mutta edistystä joka tapauksessa. Kaiken kaikkiaan Tilastokeskuksen sivuille sukeltaminen ja omien karttojen luominen oli opettavaista ja kiinnostavaa puuhaa. Varmasti nämä opitut taidot tulevat jatkossa käyttöön ja hioutuvat yhä paremmiksi. So long and thanks for all the fish!

Lähteet

Leskinen, J. (2020) Viimeinen näytös: Yhdysvaltojen koulutustaso ja äänestyskäyttäytyminen. https://blogs.helsinki.fi/juhongem1/ Luettu 22.4.20

http://pxnet2.stat.fi/PXWeb/pxweb/fi/StatFin/

https://www.stat.fi/tup/karttaaineistot/index.html

 

Kurssikerta 6

Kurssikerta alkoi harjoittelemalla datan keräämistä Epicollect5-sovelluksen avulla Kumpulassa. Käveleminen ulkona istumisen sijaan teki oikein hyvää. Oli myös mielenkiintoista huomata, kuinka teemakartan tekeminen esimerkiksi jonkin alueen turvallisuudesta ei ole rakettitiedettä vaan vaatii yksinkertaisimmillaan havainnointikykyä, sovelluksen puhelimeen ja hieman QGIS-taitoja. Opettelimme myös interpolointia QGIS:llä, mistä olisin laittanut tähän tekemäni sateenkaarenvärisen kartan, mutta se jäi yliopiston koneen kovalevylle.

Itsenäistehtävänä oli hasardien esittäminen alueellisesti kartalla. Tarkoituksena oli tuottaa sellaisia karttoja, joita voisi käyttää opettamisessa. Näin aineenopettajaopiskelijalle tämä oli mielenkiintoinen tehtävä.

Kuvassa 1 olen esittänyt vuosina 1980-2013 tapahtuneet yli 8 Richterin suuruiset maanjäristykset luokiteltuna kolmeen luokkaan. Tällainen kartta toimisi oppilailla parhaiten sellaisessa muodossa, jota voisi zoomailla haluamallaan tavalla, sillä nyt esimerkiksi Indonesian länsiosassa näkyy ryhmittymä järistyksiä päällekkäin hieman vaikeaselkoisesti.

Kuva 1. Vuosina 1980-2013 tapahtuneet yli 8 Richterin suuruiset maanjäristykset.
Kuva 2. Vuoden 1964 jälkeen purkautuneet tulivuoret.

Toisessa kuvassa (kuva 2) päätin tutustua tulivuorien tietokantaan ja valitsin tarkasteltavaksi tulivuoret, jotka ovat purkautuneet vuoden 1964 jälkeen (luokitus D1). Esitin tulivuoret kartalle niiden korkeuden mukaan merenpinnan tasosta mitattuna. Näin jäkeenpäin ajateltuna legendassa olisi ollut hyvä olla vuosiluku. Rajasin esitettävän alueen Pohjois- ja Etelä-Amerikan kohdalle selkeyden vuoksi. Kartta on kuvana tosin hieman epätarkka suurentamisen takia. Koko maapalloa tarkasteltaessa kartta oli vaikealukuinen, sillä dataa oli paljon.

Kuvassa 2 on nähtävissä, kuinka aktiivisia tulivuoria on myös merenpinnan alapuolella. Mielestäni tällä voisi hyvin havainnollistaa oppilaille erilaisia tulivuoria. Kartasta voi myös havaita puolikkaan Tyynenmeren tulirenkaan. Siiri Nyman esitti blogissaan kartan, jossa näkyi juurikin koko Tyynenmeren tulirenkaan alue. Jostain syystä en kuitenkaan ymmärrä, kuinka olisin voinut esittää kokonaisen Tyynenmeren tulirenkaan, kun käytettävä taustakartta katkeaa juuri keskeltä. Ehkä jos karttoja olisi laittanut kaksi peräkkäin print layoutissa niin koko Tyynenmeren tulirenkaan olisi saanut näkyviin.

Kuva 3. Vuosina 1980-2013 tapahtuneet 6-7 Richterin suuruiset maanjäristykset.

Kolmannen kartan päätin tehdä myös maanjäristyksistä, mutta tällä kertaa 6-7 Richterin suuruisista. Kuvassa 3 on esitettynä 6-7 Richterin suuruiset maanjäristykset vuosina 1980-2013. Kuvassa 4 samat maanjäristykset on luokiteltu kolmeen luokkaan magnitudin mukaan ja kartta on suurennettu samalle alueelle kuin kuvassa 2.

Kuva 4. Vuosina 1980-2013 tapahtuneet 6-7 Richterin suuruiset maanjäristykset luokiteltuna.

Kuvan 3 karttaa voisi käyttää opetustarkoituksissa verrattaessa maanjäristyksien yleisyyttä eri suuruusluokissa. Oppilas voisi havaita karttoja vertaillessa, kuinka suuria yli 8 Richterin järistykset ovat ja kuinka vähän niitä tapahtuu verrattaessa Richterin asteikolla hieman pienempiin, mutta kuitenkin tuhoaviin maanjäristyksiin.

Kuvaa 4 voisi puolestaan verrata kuvaan 2 ja havaita yhteyden Tyynenmeren tulirenkaaseen. Tässä yhteydessä voitaisiin pohtia tulivuorten purkausten ja maanjäristysten yhteyttä, niin 6-7 Richterin kuin 8 Richterin suuruuksilla. Eri magnitudisia maanjäristyksiä pohdittaessa voitaisiin myös tutustua tarkemmin Richterin asteikkoon.

Näiden karttojen yhteydessä olennaista olisi myös pohtia litosfäärilaattojen saumakohtien sijaintia. Hyvä kartta litosfäärilaattojen saumakohdista löytyi EarthHow -sivustolta. Litosfäärilaattojen saumakohtien sijainnit voitaisiin yhdistää tekemiini karttoihin ja siten opetella maanjäristyksien syntytapoja sekä maanjäristyksien, litosfäärilaattojen ja tulivuorenpurkauksien yhteyttä.

 Lähteet

https://earthhow.com/lithosphere/ Luettu 1.3.2020.

Nyman, S. (2020) Kuudes kurssikerta. https://blogs.helsinki.fi/nymsiiri/ Luettu 1.3.2020.

Kurssikerta 5

Viidennellä kurssikerralla oli vuorossa bufferointia ja laskemista karttakohteiden avulla. Ensiksi harjoittelimme edellisellä kurssikerralla piirrettyjen Pornaisten teiden pituuksien laskemista. Näin välihuomiona todettakoon, että QGISillä piirtäminen on sujunut varsin jouhevasti. Syynä varmaan ainakin osittain TEM-kurssilla opittu CorelDRAW:lla piirtäminen, joka toimii pääosin samoilla perusperiaatteilla kuin QGIS:llä piirtäminen.

Bufferointi-työkalulla voi tehdä kohteiden ympärillä halutun kokoisen vyöhykkeen. Työkalu osoittautui oikein käyttökelpoiseksi ja käteväksi. Käytimme puskurointityökalua Pornaisten kartan yhteydessä ja tutkimme esimerkiksi asukkaiden määrää terveyskeskuksen ja koulun lähettyvillä. Puskurointityökalun käyttö jatkui itsenäistehtävän parissa, mutta ei ihan niin miellyttävänä ja yksinkertaisena, kuin Pornaisten kartan kohdalla oli harjoiteltu. Itsenäistehtävässä sai ihan tosissaan pohtia ja ajatella.

Ensimmäisenä tehtävänä oli piirtää QGIS:iin ladatulta kartalta Malmin lentokentän kiitoradat ja laskea niiden ihmisten määrä, jotka asuvat pahimmalla melualueella 2 kilometrin ja yhden kilometrin säteellä kiitoradasta. Tutkimme asutuksen sijoittumista myös Helsinki-Vantaan lentokentän lähettyville 2 kilometrin ja yhden kilometrin päähän kiitoradoista. Tulokset on nähtävissä taulukossa 1. Taulukossa 1 on esitetty niiden asukkaiden määrä, jotka asuvat 2 kilometrin säteellä Helsinki-Vantaan kiitoradoista ja myös 65 desibelin melualueella. Vastaukseksi sain 27 asukasta, mikä tuntuu aika pieneltä luvulta. Tehtävässä kysyttiin edellisen kohdan asukkaiden prosenttimäärää kaikista 2 kilometrin säteellä asuvista henkilöistä ja vastaus olisi taulukossa esitettyjen lukujen perusteella 0,2 %. Epäilen kovasti prosentin paikkaansa pitävyyttä ja verrattaessa tuloksia esimerkiksi Nea Haukan taulukkoon, on 0,2% aika kaukana hänen saamastaan luvusta 3,2 %. Jokin virhe tässä on siis täytynyt tapahtua. Muut saamani luvut olivat samoja tai ainakin lähes samoja kuin Haukalla ja vertailun vuoksi myös Pihla Haapasalon blogin taulukossa.

Taulukko 1.

Taulukossa 2 on esitetty ratkaisut ensimmäisen itsenäistehtävän 2. kohtaan. Tämä tehtävä sujui mukavasti ilman mitään suurempia ongelmia. Taulukossa 3 on puolestaan toisen itsenäistehtävän vastaukset ja taulukossa 4 itsenäistehtävä 4:n vastaukset. Itsenäistehtävä 4:n kohta uima-allasrikkaimmasta alueesta aiheutti harmaita hiuksia enkä (ainakaan vielä) saanut siihen vastausta. Sitä lukuun ottamatta itsenäistehtävät sujuivat oikein hyvin. Jäin myös pohtimaan saunallisten talojen osuutta kaikista taloista, sillä 25 % tuntuu näin Suomessa aika pieneltä prosentilta.

Taulukko 2.

Taulukko 3.

Taulukko 4.

Tehtävät olivat mielestäni kiinnostavia, sillä tuntui, että QGIS:stä sai ihan oikeaa tietoa irti ja tuli tunne, että tässähän on oppinut vaikka vallan mitä! Tällä hetkellä tuntuu, että hallitsen QGIS:ssä ainakin seuraavat toiminnot: open field calculator, select features -toiminnot, bufferin, join attributes by location, select by location, count points in polygon ja teemakarttojen luomiseen tarvittavat toiminnot. Kyseiset toiminnot tulivat ainakin näin ensimmäisenä mieleen. Toiminnoilla pystyy tutkimaan dataa jo suhteellisen kattavasti ja tekemään teemakarttoja erilaisten muuttujien suhteen. Lisäksi toiminnoilla kykenee myös yhdistelemään eri muuttujia ja tutkimaan muuttujien välisiä yhteyksiä.

Huomasin tehtäviä tehdessäni, että jotkin toiminnot tulivat jo automaattisesti. Myös eri toimintoja yhdistelemällä on mahdollista saada lisää QGIS:in saloja käyttöön. Itsenäistehtävien osalta ehkä päällimmäisenä jäi kuitenkin mieleen suuresta datajoukosta tietyn informaation etsiminen ja tutkiminen. Jäin myös pohtimaan, kuinka helppo virheitä on tehdä ja miten pienikin virhe voi vaikuttaa suuresti informaation esittämiseen. Tästä taas päästään kysymykseen karttojen informatiivisuuden tasosta ja siitä, miten ensiarvoisen tärkeää lähdekritiikki karttoja lukiessa on. 

Täytyy tosissaan olla tarkkana lukujen kanssa ja pitää ajatus matkassa mukana. Omassa oppimisessa on ollut oikean layerin kohdalta tiedon etsiminen ja uusien layereiden tallentaminen. Kaiken kaikkiaan tehtävistä jäi onnistumisen fiilis, jihuu!

Lähteet

Haukka, N. (2020) 5-Bufferointia. https://blogs.helsinki.fi/nhaukka/ Luettu 25.2.2020.

Haapasalo, P. (2020) Kädet ilmaan. https://blogs.helsinki.fi/haapalop/ Luettu 25.2.2020.

Ruutuja ja rasterikarttoja

Neljännellä kurssikerralla harjoittelimme ruutukarttojen tekemistä ja tiedon esittämistä niiden avulla. Loimme ruudukon pääkaupunkiseutua esittävään rasteriaineistoon ja keräsimme gridiin tietoa pääkaupunkiseudun väestöstä. Itse ruudukon muodostaminen oli suhteellisen nopea toimenpide. Datan kerääminen ruudukkoon puolestaan vaati pari yrityskertaa, kun klikkailin arvoja miten sattuu Join attributes by location -toimintoon.

Kuva 1. Väestöntiheys pääkaupunkiseudulla ruuduilla 250 m x 250 m.

Kuvassa 1 on esitetty väestöntiheys pääkaupunkiseudulla. Ruudut ovat 250 m x 250 m -kokoisia, mikä tekee kuvasta hieman vaikeasti luettavan. Miellyttävämpi ja ehkä helpommin ymmärrettävä tapa esittää väestöntiheyttä olisi ollut esimerkiksi asukkaiden määrä suhteessa neliökilometriin, kuten esimerkiksi Maija Tapio oli tehnyt. Mahdollisesti myös ruudun koon ilmoittaminen legendassa olisi selkeyttänyt kuvan tulkitsemista.

Kuvasta 1 on havaittavissa väestön keskittyminen Helsingin seudulle. Kuvassa erottuu hauskasti myös Riihimäen suuntaan kulkeva kolmostie väestön keskittymisenä sen varrelle. Lisäksi junaratojen voisi myös ajatella erottuvan Vantaan kautta Keravan suuntaan mentäessä.

Toiseen ruutukarttaan (kuva 2) päätin toteuttaa 1 km2 x 1 km2 -kokoisen ruudukon vertailun vuoksi. Laskin ruudukkoon väestömäärän ja vertasin saamiani tuloksia muiden kurssilaisten tuloksiin. Jostain syystä sain asukkaiden kokonaismäärän maksimiluvuksi neliökilometrillä 15 923, kun monella muulla (Venla Moisio, Vilma Koljonen) arvo oli reilu 30 000. Virheeni on luultavasti tapahtunut joissakin ruudukon esivalmisteluissa. Suuren datamäärän vuoksi ruudukon muodostamisessa kului myös hieman aikaa, mutta mielestäni lopputulos on miellyttävämpää tulkita kuin kuvan 1 ruudukko. Toisaalta nimenomaan väestöntiheyttä kuvatessa, suurilla ruuduilla on vaarana yksinkertaistaa infromaatiota liikaa. Ehkäpä optimiruutukoko olisi jotain näiden välillä. Täytynee yrittää tehdä alusta alkaen tämä ruudukkoteemakartta, sillä jotain on mennyt pieleen. Ruutukartalta on kuitenkin havaittavissa samat asiat kuin kuvasta 1.

Edit: Kokeilin tehdä tehtävän uudelleen, mutta en edelleenkään saanut asukastiheyden maksimiluvuksi neliökilometrille 30 000, mutta en myöskään aikasemmin saamaani numeroa. Voi olla, että jossain kohtaa on kuitenkin käynyt jokin pieni virhe.

Kuva 2. Väestöntiheys pääkaupunkiseudulla ruuduilla 1 km x 1 km.

Päätin vielä kokeilla jotakin toista muuttujaa. Laskin ensin ruotsinkielisten osuuden kaikista asukkaista ja muodostin sen perusteella teemakartan.  Mielenkiintoista kartassa on ruotsinkielisten suurimpien osuuksien sijoittuminen pääkaupunkiseudun reunoille. Eniten ruotsinkielisiä näyttäisi suhteellisesti olevan Espoon alueella.

 

Kuva 3. Ruotsinkielisten osuus koko väkiluvusta ruudukoittain. Ruudut ovat 1 km x 1km -kokoisia.

Edit: Kokeilin tehdä rasterikartan, jolla näkyvät ruotsinkielisten lukumäärät ruutuja kohden (kuva 3.1). Tämän kartan mukaan eniten ruotsinkielisiä määrällisesti ruutua kohden olisi Helsingin seudulla. Tämä kokeilu osoittikin hyvin, kuinka olennaista on esitetäänkö kartalla absoluuttisia arvoja vai prosenttilukuja ja sen, että kustakin kartasta saa eri tietoa irti. Ehkä vielä tarkemman kuvauksen ruotsinkielisen väestön jakaantumisesta olisi saanut pienemmillä ruuduilla.

Kuva 3.1. Ruotsinkielisten lukumäärä per 1 km x 1 km -ruutu.

Absoluuttisten arvojen esittäminen ruututeemakartalla toimii, koska arvot näkyvät kartalla nimenomaan ruutuina. Toisaalta voisi ajatella prosenttilukujen esittämisen kuvaavan todellisuutta paremmin myös ruututeemakartalla. Koropleettiteemakartta tuo mieleeni rankan interpoloinnin ja sitä kautta vaaraksi muodostuu totuuden vääristyminen varsinkin, jos aineisto on hyvin pieni. Pienen aineiston käsittelyyn sopisi paremmin ruututeemakartta tai pisteteemakartta. Koropleettiteemakartta toimii hyvin, kun käsitellään suuria aineistoja ja halutaan esittää lukijalle suuntaa-antavaa informaatiota.

 

 Lähteet

Tapio, M. (2020). Ruutukarttoja, meditointia ja modernia taidetta. https://blogs.helsinki.fi/tapiomai/ Luettu 17.2.2020.

Moisio, V. (2020). Viikko 4 – Ruudukoiden hyödyntämistä ja rasteriaineistoihin tutustumista. https://blogs.helsinki.fi/moivenla/ Luettu 17.2.20.

Koljonen, V. (2020). Ruudut ja rasterit tutuiksi. https://blogs.helsinki.fi/vilmakol/ Luettu 17.2.2020.

Tietokantoja ja tulvaindeksikartta

Harjoittelimme tietojen liittämistä valmiiseen tietokantaan, tietokantojen yhdistelemistä ja uuden tiedon tuottamista vanhan tiedon avulla. Valmiina tietokantana toimi Afrikan valtiot sisältävä tietokanta.

Toimme tietokantaan dataa, joka kertoi väkiluvun sekä internetin ja Facebookin käyttäjien määrän Afrikassa ja yhdistimme datan tietokantaan. Jatkoimme harjoitusta laskemalla internetin ja Facebookin käyttäjien prosentuaaliset osuudet valtioittain, timanttikaivosten ja konfliktien lukumäärät valtioittain sekä öljykenttien lukumäärän. Öljykenttien lukumäärät Afrikassa tuli laskea hieman eri tavalla kuin timanttien ja konfliktien, sillä öljykentät leikkaavat alueina joitakin valtioita.

Tietokantojen avulla olisi mielenkiintoista tarkastella esimerkiksi timanttikaivosten aloitusvuoden tai öljykenttien tuottavuuden vaikutusta internetin käyttäjien lukumääriin. Kuten harjoituksen 3 ohjeissakin todetaan, internetin käyttäjien osuuden voidaan ajatella kertovan suhteellisen hyvin maanosan tai yksittäisen valtion kehittyneisyydestä. Lisäksi mielenkiintoista voisi olla konfliktien vaikutus internetin käyttäjämääriin tai timanttikaivosten löytämisvuoteen. Kuvasta 1 (josta olisi toki voinut tehdä kuvaavan kartankin, mutta tällä kertaa jaksamisen taso ei riittänyt sinne asti) voi havaita esimerkiksi, kuinka Chadin valtiossa konflikteja on ollut paljon ja samaan aikaan internetin käyttäjäprosentti on pieni. Tämänkaltaisia yhteyksiä voisi etsiä enemmän ja sitä kautta pohtia konfliktien roolia valtion kehityksessä (mikäli internetin käyttäjäprosenttia voidaan käyttää kehittyneisyyden suuntaa antava mittarina).

Kuva 1. Attribuuttitaulukko Afrikan valtiot sisältävästä tietokannasta ja tietokantaan tuotetusta datasta.

Kotitehtäväksi jäi tulvaindeksikartan laatiminen. Aloitimme kartan tekemisen jo luennolla, mutta koska en muistanut ollenkaan mitä olin silloin tehnyt, totesin helpommaksi aloittaa koko jutun alusta. Homma sujui diagrammia lukuun ottamatta yllättävän jouhevasti.

Kuva 2. Tulvaindeksikartta.

En tiedä oliko aiemmissa vaiheissa tapahtunut jokin virhe vai mikä oli syynä, mutta sain kartalle vain 3 pylvästä. Pohdin, että ongelma voisi mahdollisesti olla datan liittämisessä tietokantaan, vaikka mielestäni etenin, kuten luennolla oli tehty, tai sitten joissakin diagrammin asetuksissa. Uppouduin googletteluun ja tutoriaalivideoiden katseluun, mutta en löytänyt ratkaisua. Sonja Nylund totesi blogissaan, että QGIS oli tulkinnut järvisyysprosentit tekstiksi eikä tietoa siten pystynyt lisäämään teemakarttaan. Hän oli ratkaissut ongelman laskemalla järvisyysprosentit itse. Toisaalta, jos ongelmani on sama kuin Nylundilla, en ymmärrä mitä nämä mysteeriset kolme pylvästä siinä tapauksessa kuvaavat. Minä 0, QGIS 1. Täytynee syventyä asiaan myöhemmin uudelleen.

Myös värien valinta ei ollut helpoimmasta päästä, sillä mieli teki kuvata kaikki veteen liittyvä sinisellä. Päädyin kuitenkin tulvaindeksin tapauksessa violetin sävyihin jättäen sinisen järville ja joille. Pylväistä tuli punaisia, jotta ne erottuisivat, vaikka järvisyyden kuvaaminen punaisella vähän nurinkurista ehkä onkin.

Hankaluuksista huolimatta tai ehkä juuri niiden takia, oli kuitenkin mukava huomata, kuinka osa toiminnoista sujui jo ilman sen suurempaa pohtimista.

Lähteet

Nylund, S. (2020). Level 2: projektio projekti. https://blogs.helsinki.fi/sonysony/ Luettu 6.2.2020.

Erilaisia projektioita

Opettelimme toisella kurssikerralla visualisoimaan ja vertailemaan erilaisia projektioita. Latasimme Tilastokeskuksen materiaalia QGIS:iin WFS-haun avulla ja tutkimme erilaisten valintatyökalujen käyttöä Suomen kuntien ominaisuustietoa sisältävän tietokannan avulla. QGIS:in käyttö alkoi tuntua jo helpommalta verrattuna ensimmäiseen kurssikertaan, vaikkei se ihan täysin ongelmitta sujunutkaan.

Kuvassa 1 on esitetty Mercator- ja ETRS-TM35FIN-projektioiden pinta-alojen vertailuprosentti kunnittain. Molemmat projektioista ovat oikeakulmaisia, mutta ETRS-TM35FIN on poikittainen Mercator (Transverse Mercator). Tällöin pinta-alojen erot johtuvat pääosin projektioiden eri muodostamistavoista. Erot suurenevat mitä kauempana päiväntasaajalta ollaan, minkä voi huomata esimerkiksi kuvan 1 prosenttiluvuista: vääristymät ovat suuremmat Pohjois-Suomeen mentäessä.

Kuva 1. Mercator- ja TM35FIN-projektioiden suhteelliset erot kunnittain.

Kuvassa 2 puolestaan vertailin ETRS-TM35FIN-projektiota Robinsonin projektioon, joka ei ole oikeakulmainen eikä -pintainen, Transverse Mercatorin ollessa oikeakulmainen. Kuvan tuottamisessa ilmeni jonkin verran hankaluuksia, mutta otettuani hiukan etäisyyttä QGIS:iin ja tavattuani ohjeita tarpeeksi, sain homman toimimaan muutamien yrityksien jälkeen (huh).

Robinsonin projektiossa oikeakulmaisuuden ja oikeapintaisuuden virheet on pyritty minimoimaan tekemällä projektiosta kompromissi näiden välillä. Tämän voi todeta myös pinta-alojen vääristymien huomattavasti pienemmistä prosenttiluvuista (kuva 2) verrattuna kuvan 1 prosenttilukuihin. Riina Hiltula kiteytti projektioiden valinnasta blogissaan hyvin, kuinka ”on otettava huomioon minkälaista informaatiota halutaan välittää ja miten se voidaan esittää luotettavasti”.

Kuva 2. Robinsonin projektion suhteellinen ero kunnittain TM35FIN-projektioon.

Lähteet

Hiltula, R. (2020). Toinen kurssikerta – projektion valinnan merkitys. https://blogs.helsinki.fi/hiltular/ Luettu 30.1.2020.

Ensimmäinen kurssikerta – QGIS tutuksi

Kurssi alkoi tutustumalla käytettävään paikkatieto-ohjelmistoon, QGIS:iin. Ohjelma vaikutti aluksi suhteellisen loogiselta ja miellyttävältä käyttää, kunnes keskittymiseni herpaantui pitkän päivän painaessa ja putosin kärryiltä. Sain kuitenkin kerättyä itseni ja onnistuin kuin onnistuinkin tekemään annetut tehtävät (voittajafiilis!). Ensimmäinen kurssilla opittu asia taisikin siis olla opettajan tekemien klikkauksien herkeämätön seuraaminen.

Muita opittua asioita olivat oikeastaan kaikki QGIS:iin liittyvä, sillä kyseistä ohjelmaa en ollut aikaisemmin käyttänyt. Aloitimme QGIS:iin tutustumisen lataamalla käytettävä data ohjelmaan ja harjoittelimme muutamia perustoimintoja tietokannan avulla. Vaihdoimme esimerkiksi kartan värejä ja harjoittelimme eri tasojen visualisointia attribuuttitaulukon tietojen perusteella. Laskimme myös uutta dataa attribuuttitaulukkoon, mikä aiheutti hieman päänsärkyä monen eri välivaiheen takia.

Kuvassa 1 on esitetty luennolla tehty kartta, joka kuvaa typen päästöjen osuuksia valtioita kohden. Näin jälkeenpäin karttaa tarkastellessani, olisi typen päästöjen prosenttiosuuksien pitkät desimaalit voinut siistiä, minkä lisäksi kaksi tumminta punaista ovat omaan silmääni hieman turhan samanvärisiä, joten hieman parannettavaa olisi. Nea Haukka oli muokannut omaan karttaansa päästöjen prosenttilukemat kolmeen haarukkaan, mikä mielestäni selkeyttää kartan lukemista.

Kuva 1. Typpipäästöt valtioittain.

Kotiin tehtäväksi jäi koropleettikartan tekeminen valitusta aineistosta. Kuntien ikärakenteet ovat mielestäni kiinnostavia, joten päädyin tutkimaan, kuinka eläkeläisten osuus vaihtelee kunnittain. Laskin aluksi eläkeläisten prosenttiosuuden kuntien väestömääriin suhteutettuna, kunnes tajusin, että käytettävässä tietokannassa olevat luvut eläkeläisistä olivat jo valmiiksi prosenttiosuuksia. Tulipahan harjoiteltua field calculator -toiminnon käyttöä.

Kuvassa 2 on muodostamani koropleettikartta, joka kuvaa eläkeläisten suhteellisia osuuksia kunnittain. Legendan otsikko on hieman ontuva, sillä se ei kerro lukujen olevan prosenttiosuuksia. Muuten koen koropleettikartan olevan suhteellisen onnistunut. Siitä on helppo havaita, kuinka eläkeläisten osuudet ovat pieniä pääkaupunkiseudulla ja Oulun alueella sekä suurempia esimerkiksi Kajaanin koillispuolella. Eroja selittää muun muassa asukastiheys ja esimerkiksi työpaikkojen sekä koulutuksen runsaus. Mielenkiintoista voisikin olla sellaisen kartan muodostaminen, joka kuvaisi eläkeläisten osuutta kunnissa yhdessä esimerkiksi koulujen ja yliopistojen sijaintien kanssa.

Kuva 2. Eläkeläisten suhteellinen osuus kunnittain.

Lähteet

Haukka, N. (2020). Tutustumista QGis-ohjelmistoon. Luettu 25.1.2020. https://blogs.helsinki.fi/nhaukka/