Kurssikerta 2 − kartta kieliryhmien tuloeroista

Oppitunti yhdistelmäteemakartasta

 

Toisen kurssikerran pääasia oli yhdistelmäteemakartta. Yhdistelmäteemakartassa on esitetty samalla karttapinnalla vähintään kahden ilmiön vaihtelua. Tarkastelimme eri esitysvaihtoehtoja, joista jokaisia voi luoda myös Mapinfossa monin variaatioin. Myös kahta kolmiulotteista, yksimuuttujaista karttatyyppiä katselimme: prismaattista karttaa ja itse varsinaista 3D-karttaa. Pääpaino kurssikerralla oli kuitenkin koropleettisissa monimuuttujakartoissa, joiden avulla pääsimme ensimmäistä kertaa kosketuksiin joka puolella maantieteellisiä tutkimuskenttiä vilahtelevan tilastollisen termin korrelaatio kanssa.

Korrelaatio vaikuttaa kohtalaisen yksinkertaiselta, mutta kun sitä alkaa tosissaan pyörittelemään, alkaa ainakin minulla mennä ajatus solmuun. Korrelaatio eli yhteisvaihtelu tarkoittaa sitä, että toisen muuttujan pienetessä toinenkin muuttuja pienenee vakioisessa suhteessa. Tai toisen arvon suuretessa myös toinen suurenee. Tai toisen suuretessa toinen pienenee, tai päinvastoin. Oleellista on, että riippuvainen vaihtelu on systemaattista, ja korrelaation tapauksessa lineaarista, eli molemmat muuttujat vähenevät tai lisääntyvät tietyssä suhteessa, esim. toisen lisääntyessä yhdellä lisääntyy toinen kahdella. Toivottavasti tällä kurssilla pääsen enemmän sinuiksi tämän tärkeän termin kanssa. Esimerkiksi puhutaanko silloinkin korrelaatiosta, jos toinen muuttuja muuttuu toisen muuttuessa normaalijakauman mukaisesti?

Korrelaatiota käsitteli osaltaan myös oheislukemistona ollut artikkeli. Artikkelin (Leonowicz 2006) mukaan yhdistelmäteemakartasta on helpompi huomata tämä kahden muuttujan välinen riippuvuussuhde eli kahden ilmiön välinen yhteys eli korrelaatio. Yleisesti artikkeli käsitteli yhdistelmäteemakartan ongelmia. Kahden muuttujan samanaikainen esittäminen sotkee kartan tulkintaa, varsinkin jos ilmiö on jaettu moneen luokkaan. Eli lukija ymmärtää muuttujan spatiaalisen vaihtelun nopeammin, jos se on esitetty yhdellä erillisellä kartalla.

Artikkelin mukaan on kaksi hyvää keinoa lisätä kaksimuuttujaisen koropleettikartan luettavuutta: aineistoluokkia saisi olla ainoastaan yhdestä kolmeen per muuttuja, ja lisäksi värit täytyy valita mahdollisimman havainnollisiksi. Tähän värivalintaan artikkeli antaa ohjeita tietynlaisen väriteorian mukaista värikarttaa esittelemällä. Tämä asia oli tekstin vaikeinta ymmärtää. Sinänsä havaintopsykologiset väritutkimukset, joita tässä värivalinnan problematisoinnissa olivat taustalla, ovat eksaktia ja vakavaa tiedettä, ja ihmisten värierotuskyvyssä on todella säännönmukaisuuksia. Jotkin värit erottuvat toisista helpommin, ja joistain väreistä on helpompi havaita sävy- ja tummuuseroja. Ihmisen silmä on hyvä havaitsemaan näitä eroja: keskimäärin ihminen havaitsee miljoona eri värien sävyä (Greenwood 2012). Menemättä sen pitemmälle evoluutiokysymysten hetteikölle, on selvää, että ihmiselle on ollut verratonta hyötyä erottaa hiuksenhieno leijonan ja heinikon ruskean vivahde-ero tai kypsän marjan väri raa’an marjan vastaavasta. Se, etten ymmärtänyt artikkelin puhetta värivalinnasta ja teoriasta sen taustalla, johtuu ehkä enemmän huonosta väriaististani kuin artikkelin sanomasta itsessään.

 

Oma yhdistelmäteemakartta suomenruotsalaisten tuloista

itäuusimaamukanaverot

kuva 1. Lähteet: Tilastokeskus (2013) ja THL (2013).

 

ahvvarstulot

kuva 2. Lähteet: Tilastokeskus (2013) ja THL (2013).

 

pohjanmaatulot

kuva 3. Lähteet: Tilastokeskus (2013) ja THL (2013).

 

Omassa kartassani lähdin tarkastelemaan suomenruotsalaisten keskimääräisiä tuloja. Uskoakseni harva ajattelee suuren osan ruotsinkielisistä olevan rikkaita, mutta monella lienee kuitenkin käsitys, että joillain suomenruotsalaisilla suvuilla on paljon omaisuutta, josta he lisäksi  maksavat vähemmän veroja kuin ansiotuloillaan elävät, sillä pääomatulojen verotus on Suomessa palkkatulojen verotusta kevyempää. Monella lienee myös käsitys siitä, että suomenruotsalaiset yleensä tienaavat keskimäärin suomea puhuvia enemmän.

Hypoteesini oli, että eroja ruotsinkielisen ja suomenkielisen väestön tulojen, joita tässä mittasin keskimääräisten ansiotuloverojen perusteella, välillä en tulisi löytämään. Koska pääomatuloista maksetaan veroa valtiolle, en analyysissani päässyt kiinni varallisuuseroihin.  Joka tapauksessa kieliryhmien varallisuus- ja tuloerot on mielenkiintoinen ja tutkimuksenarvoinen kysymys. Samalla pystyin jatkamaan korrelaation pohdiskelua.

Jaoin analyysini kolmeen eri karttaan, jotta alueet näkyisivät blogissani tarpeeksi suurina. Alueet ovat Uusimaa, Varsinais-Suomi ja Ahvenanmaa sekä Pohjanmaan ruotsalaisrannikko. Yhdellä kartalla olisi tosin näkynyt paremmin kolmen ruotsalaisalueen erot, joiden mahdollisesta esiintymisestä olin myös kiinnostunut. Juha Lähteenmäki on blogissaan (Juhan PAK-blogi) päätynyt yhden kartan ratkaisuun esittäessään minunkin kohdettani suurempaa kokonaisuutta eritellessään rannikon asuintiheyden korrelaatiota rikollisuuteen. Ratkaisu on toimiva, vaikka rasteripinnat havaitakseen joutuu hieman katsettaan tarkentamaankin.

Tein kartoista graduated-teemakarttojen tyyppisiä, vaikka toinen muuttujistani olikin suhteellinen muuttuja (ruotsinkielisten %-osuus). Graduated-kartat soveltuvat parhaiten luennon mukaan absoluuttisten arvojen kuvaamiseen. Toisaalta ruotsalaisten osuutta kuvatessani olin muutenkin pakotettu pienten arvojen näkyvyyden takaamiseksi skaalaamaan muuttujan logaritmiseksi, joten lukija pystyy ainoastaan jotenkuten arvioimaan, onko ruotsinkielisten määrä jotenkin suuri vai pieni. Toista muuttujaa en joutunut käsittelemään. Jokaisen kolmen kartan muuttuja verotuloista per asukas oli samanlainen. Jakauma oli aavistuksen vino suurempaan päähän; tai ainakin korkeimmassa kvantiilissa vaihteluväli oli selvästi suurin. Jakauman tarkaksi selvittämiseksi histogrammityökalu olisi ollut poikaa, mutta sekä SotkaNETistä että Mapinfosta tietojen siirtäminen osoittautui turhan työlääksi. Joka tapauksessa jaot valmiisiin neljäsosakvantiileihin tuntuivat luontevilta. Täten tuli selkeästi esille se, missä tulotaso on keskimääräistä parempi ja missä huonompi. Oma kysymyksensä on myös, onko neljä luokkaa tulkittavuuden kannalta liikaa: sanottiinhan artikkelissakin (Leonowicz 2006, 35), että yhdeksää luokkaa enempää ei saisi yhdistelmäteemakarttaan laittaa. Toisaalta luennon esimerkeissäkin oli enemmän luokkia, ja oma mielipiteeni on, että myöskään omissa 12-luokkaisissa kartoissani ei ole luettavuutta häiritsevää moninaisuutta. Sitä paitsi Mapinfossa alimmat kaksi luokkaa eroaa sävyiltään todella selvästi kahdesta ylimmästä, mikä parantaa tässä tapauksessa luettavuutta.

Ensimmäinen vaikutelma kartoista tukee käsitystä positiivisesta yhteydestä ruotsinkielisten runsaan osuuden ja suurten henkilöverotulojen välillä. Huolimatta sangen monesta poikkeamasta tämä korrelaatio näkyy karttaa silmäillessä varsinkin Uudenmaan ja Pohjanmaan osalta. Sen sijaan Varsinais-Suomen ja Ahvenanmaan kartoissa samaa positiivista yhteyttä ei ole. Esimerkiksi lähes kokonaan ruotsinkielisellä Ahvenanmaalla monen kunnan asukkaat kuuluvat keskimäärin vähätuloisimpiin.

Jonkinlainen yhteys ruotsinkielisyyden ja hyvätuloisuuden välillä siis löytyi, mutta on hyvin mahdollista, että yhteyttä selittää taustalla oleva kolmas muuttuja, nimittäin sijainti rannikolla. Tullaan klassiseen tilanteeseen, jota useasti kuvataan hukkumiskuolemien ja jäätelönsyönnin välisellä positiivisella korrelaatiolla. Tämä molempien muuttujien samanaikainen runsaus selittyy kesällä. Rannikolla asuvien rikkautta suhteessa sisämaan asukkeihin tutkittaessa paras keino on tietysti verrata ruotsalaisrannikkojen tilannetta rannikkoalueisiin, joissa on melkein pelkästään suomenkielisiä. Tällaisella tekemälläni kartalla oli löydettävissä samansuuntainen, joskin myös verraten heikko positiivinen korrelaatio rannikolla asumisen ja hyvien tulojen välillä. Toki tämäkään fakta, joka selittynee muun muassa paremmilla kaupallisilla yhteyksillä muualle, ei poista sitä faktaa, että reilusti yli puolella paikkakunnista, joissa on paljon ruotsia puhuvia, on keskimääräisesti hieman paremmat tulot. Tämä yhteys vaikuttaa kuitenkin kuten sanottua heikolta.

 

Lähteet

Greenwood, Veronique (2012). The Humans With Super Human Vision. <http://discovermagazine.com/2012/jul-aug/06-humans-with-super-human-vision> 28.1.2015

Juhan PAK-blogi. <https://blogs.helsinki.fi/juhalaht/> 29.1.2015

Leonowicz, Anna (2006). Two-variable choropleth maps as a useful tool for visualization of geographical relationship GEOGRAFIJA. 2006. T. 42. Nr. 1. P. 33–37

 

 

Kurssikerta 1 – Kesäpaikoista ja paikkatiedosta

Paikkatiedon perusteet ja Mapinfo

Onkohan ensimmäisen vuoden opintojen aikana ollut vielä kertaakaan kurssikertaa, etteikö olisi jonkinlaista karttaa tehty tai vähintään analysoitu alueellista rakennetta tai muutosta kartan avulla? Olemme jopa piirtäneet alusta lähtien monia karttoja, emme pelkästään käyttäneet paikkatieto-ohjelmia teemakarttojen laatimiseen. Kun kerroin aloittavani opiskelemaan maantiedettä kahdelle ystävälleni, jotka ovat aiemmin opiskelleet tätä oppiainetta, sanoivat he minulle, että pakko tuottaa sinulle pettymys: et tule kovinkaan paljon piirtämään karttoja opiskelujesi aikana. Toinen ystävistäni, joka oli aloittanut opiskelun 20 vuotta sitten, sanoi heidän ainoastaan piirtäneen piirtoheitinkalvojen läpi joitain karttoja. Toinen, kymmenen vuotta sitten opiskelunsa aloittanut, sanoi puolestaan, että ei hän muista karttoja juuri piirrettäneen. Ilokseni he olivat väärässä: nykyään karttoja piirretään paljon, vielä enemmän niitä laaditaan ohjelmien avulla, ja vielä enemmän niiden avulla analysoidaan ilmiöitä. Mahdoton lienee ajatus, että ystävänikään eivät olisi analysoineet alueellisia ilmiöitä karttojen avulla, taikka laatineet niitä ohjelmilla, vaikka paikkatieto-ohjelmat eivät silloin vielä olleetkaan yhtä kehittyneitä ja käyttökelpoisia kuin nykyään.

Paikkatiedon hankinta, analyysi ja kartografia -kurssikin lähti liikkeelle kartan valmistamisella. Tämä oli luonnollista, sillä paikkatiedon perusteisiin ja analysoimiseen tutustuttiin käytännön kautta karttojen laatimiseen tarkoitetun MapInfo-ohjelman avulla. Paikkatiedon perusteista myös luennoitiin, ja mieleen jäi erityisesti se, että kerrattiin jälleen kerran rasteri- ja vektoriaineiston erot. Tämä ikuinen pääsykoe- ja GIS-tenttitärppi alkaa jo olla perusteiltaan hallussa, mutta vasta, kun näitä paikkatietomuotoja on käytännössä käyttänyt suuressa määrin, tulee ymmärtämään kunnolla niiden vahvuudet ja heikkoudet.

Syksyn opinnoissa olen ymmärtänyt, että kartta on maantieteilijän tärkein työväline, ja hyvä niin, sillä kartat ovat kiinnostaneet minua pikkupojasta lähtien. Mutta kartta yksinään, ilman että tietää minkälaista paikkatietoa siinä on käytetty ja millä perusteilla ja keinoilla se on valmistettu, jättää analyysin puolinaiseksi.

 

Karttaharjoitus – kesämökkejä riittää joka niemeen ja lahdelmaan

 

Capture

Kuva 1. Kesämökkien määrä 2011. Lähde: Tilastokeskus.

 

Harmaat päivät, jatkuva pimeys, saderintamien päättymätön vyörytys, loskaiset ja liukkaat tiet, pitkät päivät luentosalien ja tietokoneluokkien kelmeässä valossa, tipaton. Mieli halajaa jo kesään: lämmin, valoisa kesäilta, laiturinnokka, jota vienot mainingit keinuttavat, tiirojen ja lokkien kisa kalanperkeistä rantaruovikossa, sauna lämpiämässä, oluet viilenemässä, ei kesätenttejä kalenterissa.

Kesäpaikka ja kesämökki merkitsevät monelle suomalaiselle paljon, oli sitten kyseessä kaupunkilainen tai maalainen. Mökille halutaan päästä luonnon keskelle rentoutumaan ja elämään yksinkertaisemmin ja luonnonmukaisemmin. Tosin yhä enemmän kesämökit ovat vakinaisen asunnon veroisia, hyvin varusteltuja kakkosasuntoja. Kesämökkien määrä on ollut vuosikymmeniä jatkuvassa kasvussa (Kauppalehti, 2014). Siitä huolimatta vain 800 000 suomalaista kuuluu perheeseen tai sukuun, jolla on kesämökki. Mökkejä oli vuonna 2014 noin 500 000. (emt.) Vaikka omistajia onkin pieni osa suomalaisista, on mökkielämä suurelle osalle suomalaisista tuttua ja joka kesä koettua.

MapInfon avulla laaditussa kartassani pääasiana oli enemmän aineiston luokittelu sopiviin, havainnollisiin luokkiin kuin itse kartan valmistus ja sen analysointi. Luokkarajoilla voidaan hämärtää ilmiön alueellista vaihtelua ja erityisesti runsautta. Jos, kuten tietokoneohjelma antaa mahdollisuuden, valitsee itse luokkarajat vaikka niin, että suurin osa havainnoista on arvoiltaan suurimmassa luokassa, kartta on kauttaaltaan tumma, ja näyttää kuin ilmiötä esiintyisi todella paljon. Valitsemallani tavalla, jossa jaoin aineiston viiteen suurin piirtein yhtä suureen osaan eli viidesosakvantiileihin, kartalla näkyy selkeästi se, missä ilmiötä, tässä tapauksessa kesämökkejä, esiintyy paljon ja missä vähän. Tämä jakaminen kvantiileihin aiheuttaa vinossa jakaumassa ongelman, jonka Antti Autio (Antin paikkatietoblogi) tuo esiin: ylimmässä luokassa vaihtelu on erittäin suurta, minun kartallani 2120:sta 8380:een. Tämä tarkoittaa sitä, että suurin osa mökeistä on tässä kategoriassa. Löytyy esimerkiksi muutamia poikkeuksellisia paikkakuntia, joissa on huomattavan paljon kesämökkejä: Paraisilla 8400 ja Hämeenlinnassa 7700.

Kunnittaista vertailua vaikeuttaa erittäin paljon kuntaliitokset: Vuoden 2010 lopun tilaston kärkikunnat ovat vaihtuneet, kun tarkastellaan viimeisimpiä Tilastokeskuksen tilastoja (Kauppalehti, 2014). Siinä kärkisijoilla ovat Mikkeli 10 300:lla ja toisena Kuopio 8700 mökillä. Kuntaliitokset sotkevat analyysia muutenkin todella pahasti. Esimerkiksi itäisessä Varsinais-Suomessa, jossa muutama vuosi sitten tehtiin Salon seudulla kymmenen kunnan kuntaliitos, näyttää suureksi kasvanut Salo olevan erittäin runsaan mökkiasutuksen paikkakunta, kun viereisissä Marttilan ja Koski Tl:n kunnissa ei ole mökkejä paljoakaan. Pohjoinen Salo on kuitenkin samanlaista, vähäjärvistä aluetta, jossa ei juuri hyviä mökkipaikkoja ole. Onkin niin, että mitä suurempi alue on, sitä todennäköisemmin siellä on paljon kesämökkejä. Esimerkiksi Mikkelin monet kuntaliitokset ovat paisuttaneet kaupungin aluetta niin, että se on päässyt mökkitilaston kärkeen. Havainnollisempi kartta olisikin voinut syntyä, jos tarkastelun kohteena olisi ollut kesämökkien määrä suhteessa kunnan pinta-alaan.

Huolimatta suurista analyysia vaikeuttavista ongelmista, joitain yleisiä huomioita kesämökkien alueellisesta jakautumisesta voidaan tehdä. Ensimmäinen muuttuja on luonnollisesti vesistöjen runsaus. Onkin niin, että merenrantavyöhykkeellä ja runsasjärvisillä sisämaan alueilla on eniten paikkakuntia, joilla on runsaasti mökkejä. Ja toisaalta kartalta erottuvat selkeästi vähine mökkineen sellaiset paikkakunnat, joissa järviä ei ole nimeksikään: Varsinais-Suomen sisämaa ja Pohjanmaan lakeus ja Suomenselkä. Toisaalta myös Lapissa, jossa järvien rantaviivaa on runsaimmin vain Inarissa, on monella paikkakunnalla runsaasti mökkejä. Tämän selittää ennen kaikkea suurten hiihtokeskusten liepeillä olevat mökkitihentymät. Tosin kunnat ovat Lapissa niin suuria, että mökkipaikkoja löytyy näiltä yleisesti huonommin soveliailta alueiltakin melko runsaasti.

Yksi erittäin tärkeä tekijä mökkien alueellisessa jakautumisessa on yleinen väestön jakautuminen. Olisi mielenkiintoista selvittää, kumpi on tärkeämpi mökkitiheyttä selittävä muuttuja, vesistöjen määrä vai väestöntiheys. Esimerkiksi kartassa näkyy keskinen Uusimaa alueena, jolla tosin itse on vähän mökkejä, mutta sen ympärillä on erittäin laaja alue, jolla mökkejä on runsaasti. Toisaalta väestöntiheys selittää huonosti Lapin ja Kainuun runsaat mökkimäärät. Ylipäätään kaupungit ovat suurelta osin kahdessa ääripäässä: joko mökkejä ei juuri ole tai niitä on runsaasti. On vaikea ymmärtää, mikä selittää sen, että Kokkolassa mökkejä on paljon, mutta Oulun seudulla ei nimeksikään.

Summain summana on todettava, että teemakarttani ei analyysin kannalta osoittautunut hääviksi, mutta se ei ollutkaan tämän tehtävän tärkein anti, vaan se oli aineiston luokittelu sekä kartan tekninen laatiminen.

Lähteet

Antin paikkatietoblogi. <https://blogs.helsinki.fi/anttiaut/> 19..12015

Kauppalehti (2014). Mökkibuumi elää vahvasti: puoli miljoonaa pian rikki. <http://www.kauppalehti.fi/uutiset/mokkibuumi-elaa-vahvasti-puoli-miljoonaa-pian-rikki/VDbbhFFJ> 17.1.2015