Toinen kurssikerta: Karttadiagrammit ja päällekkäiset teemakartat

Toisella kurssikerralla jatkettiin teemakarttojen tuottamista MapInfolla. Tällä kertaa teimme karttoja, joissa alueisiin yhdistettiin erilaisia tilastodiagrammeja. Näitä esityksiä kutsutaan karttadiagrammeiksi tai kartogrammeiksi. Yhdistimme karttoihin pylväs- ja ympyrädiagrammeja. Tämän jälkeen harjoittelimme päällekkäisten teemakarttojen tekoa ja niiden ulkonäön säätämistä kohdalleen. Päällekkäisissä teemakartoissa oli kaksi aineistoa, joista toinen kuvattiin tuttuun tapaan väreillä ja toinen esimerkiksi pisteillä tai viivoituksilla. Kokeilimme myös vähän näyttävämpää prismaattista 3d-karttaa, josta oli kuitenkin mielestäni melko vaikea saada informatiivista.

Kurssikerran varsinainen tehtävä oli kaksitasoisen teemakartan tekeminen vapaavalintaisista teemoista. Tavoitteena oli valita sellaiset teemat, joilla olisi jonkinlainen yhteys toisiinsa. Päällekkäisen teemakartan avulla voidaan ikään kuin herättää eloon tilastoaineistoja, joiden vertaaminen toisiinsa pelkkiä numeroita tuijottaen olisi aika tylsää puuhaa.

Kartassani on kaksi teematasoa, joista alimpana on työttömien määrä työikäisestä (15-64v) väestöstä. Aineiston kolme luokkaa ovat kartassa vaaleilla sinisen, vihreän ja keltaisen sävyillä. Työttömyystason päällä on Terveyden ja hyvinvoinnin laitoksen sairastavuusindeksi. Indeksin suurusluokkaa kuvaavat viivoitukset ja ruudukko. Sairastavuusindeksin matalin luokka on vaakaviivoin, keskimmäinen luokkan pystyviivoin ja suurin luokka vaaka- ja pystyviivoin eli ruudukkona. Luokkarajat ovat tässäkin kartassa Equal Count eli kvantiilien mukaan. Tämä luokitus pyrkii asettamaan rajat siis siten, että jokaiseen luokkaan tulee yhtä monta havaintoa.

Hain molemmat aineistot Terveyden ja hyvinvoinnin laitoksen tilasto- ja indikaattoripankki SOTKAnetistä. Molemmat ovat vuodelta 2010. Toisin kuin työttömyyden kohdalla, sairastavuusindeksin monimutkaisuuden vuoksi aivan tuoreimpia tietoja ei ole vielä saatavilla. SOTKAnet oli pullollaan vaikka mitä mielenkiintoista dataa, jota olisi voinut yhdistellä keskenään. Harmikseni todella monen mielenkiintoisen aiheen kohdalla palvelu kuitenkin ilmoitti, ettei tietoja löydy kunta- tai maakuntatasolla. Aiheen valinta ja erilaisten teemojen kokeilu vei tässä tehtävässä suurimman osan ajasta. Samasta valinnanvaikeudesta kärsivät muun muassa opiskelutoverini Pauliina ja Antti.

Sairastavuusindeksi on THL:n määrittelemä mittari, jonka avulla tarkastellaan väestön sairastavuuden eroja alueittain. Sairastavuusindeksistä löytyi ikävakioitu ja ikävakioimaton versio. Käytin ikävakioitua versiota, sillä se sopii paremmin käytettäväksi tämän kaltaisiin vertailuihin jonkin toisen ilmiön kanssa. Ikävakioimaton indeksi sopii tarkasteltavaksi vain sellaisenaan, sillä se korostaa alueiden sairastavuutta voimakkaasti niiden ikärakenteen vuoksi (vanha väestö sairastaa enemmän). Tällöin sairastavuuden mahdolliset yhteydet muihin ilmiöihin hämärtyvät. Tarkempaa tietoa indeksin rakenteesta ja siinä käytettyjen sairauksien painoarvoista löytyy täältä.

PAKkuva2

Kuva 1. Sairastavuusindeksi ja työttömien osuus Suomen maakunnissa (2010). Lähde: Tilasto- ja indikaattoripankki SOTKAnet, THL.

Työttömien korkean osuuden ja korkean sairastavuusindeksin välillä on havaittavissa korrelaatiota. Neljä kuudesta keltaisista maakunnista (paljon työttömiä) kuuluu korkeimman sairastavuusindeksin luokkaan. Luokittelun perusteella työttömyys ja sairastavuus näyttävät painottuvan selvästi Suomen pohjoisiin, itäisiin ja keskisiin osiin.Vain etelessä sijaitsevat Kymenlaakso ja Päijät-Häme kuuluvat sairastavuusindeksin keskimmäiseen luokkaan.

Vihreiden maakuntien (kohtalainen työttömyys) kohdalla sairastavuusindeksi vaihtelee paljon, mutta selvä alueellinen painotus on nähtävissä. Pohjois-Pohjanmaa ja Pohjois-Savo kuuluvat korkeimman sairastavuusindeksin luokkaan. Etelämmässä ja lännemmässä sijaitsevissa saman työttömyysluokan maakunnissa terveystilanne on parempi.

Alhaisimman työttömyyden maakuntia löytyy etelä-lounaasta ja keski-lännestä. Näissä maakunnissa sairastavuusindeksi on joko pienimmässä tai keskimmäisessä luokassa. Ahvenanmaan tilannetta ei pysty erottamaan kartasta, mutta se kuuluu matalimman sairastavuusindeksin ja pienen työttömyyden luokkiin.

En osaa oikeastaan ottaa kantaa siihen, kuinka merkittävää työttömyydestä aiheutuva sairastavuus on sairastavuudesta aiheutuvaan työttömyyteen verrattuna. Suomen hallituskaan tuskin saisi muodostettua tällaiseen sosiaalipoliittiseen kysymykseen mitään selkeää linjaa. Molemmat vaihtoehdot ovat varmasti totta, mutta niiden painoarvoa on vaikea arvioida.

Mielestäni kartasta tuli ulkonäöltään selkeä. Värien valinta ja ruudukon säätäminen, joihin käytin todella vähän aikaa, onnistuivat hyvin. Teemojen tarkastelu maakuntien laajuudella tekee kartasta helppolukuisen. Aluksi yritin vertailla ilmiöitä kunnittain koko Suomen laajuisesti, mutta en onnistunut saamaan kartasta tarpeeksi helppolukuista ja selkeää. Samaan ongelmaan törmäsivät monet m

Lähteet:

Tilasto- ja indikaattoripankki SOTKAnet. http://uusi.sotkanet.fi/portal/page/portal/etusivu/hakusivu. Terveyden ja hyvinvoinnin laitos. Luettu 27.1.2015

Sairastavuusindeksin painoarvot ja lähteet. http://www.terveytemme.fi/sairastavuusindeksi/atlas/notes/taulukko1.htm. Terveyden ja hyvinvoinnin laitos. Luettu 27.1.2015

Hongisto, P. (2015) PAK à la Pauliina -blogi. https://blogs.helsinki.fi/pauliinh/. Luettu 28.1.2015

Autio, A. (2015). Antin paikkatietoblogi. https://blogs.helsinki.fi/anttiaut/ Luettu 28.1.2015

 

Ensimmäinen kurssikerta: MapInfo ja teemakartan tuottaminen

Paikkatiedon hankinta, analyysi ja kartografia 1 pyörähti käyntiin viime torstaina. Kurssi suoritetaan pitämällä kurssin tapahtumista blogia, jota kurssitoverit ja muutkin pääsevät tarkastelemaan.

Ensimmäisellä kurssikerralla palauteltiin mieleen MapInfo-ohjelman perustoimintoja. Pikainen ensikosketus MapInfoon oli tapahtunut jo aiemmin syksyn ensimmäisen periodin TAK1-kurssilla. Silloin ohjelmaa käytettiin kuntaraporttiin liitetyn sijaintikartan tekemiseen.

Ohjelman perustoimintojen haltuunoton jälkeen harjoiteltiin teemakartan tekemistä. Harjoituskartta sijoittui Helsinkiin ja sille valittiin jokin aihe Helsinkiin liitetyistä ominaisuustiedoista. Kartassa halutun ilmiön (minun tapauksessa ruotsinkielinen väestö) osuutta tai esiintyvyyttä tarkasteltiin Helsingin eri kaupunginosissa.

Tämän jälkeen siirryttiin tekemään kurssikerran varsinaista työtä, joka löytyy tästä blogikirjoituksesta. Tarkoituksena oli juuri opituin keinoin tuottaa teemakartta, jonka aihe yhtälailla valittiin Suomen kuntiin sisällytetyistä ominaisuustiedoista. Aineistot olivat monipuolisia ja jokaisesta kunnasta löytyi pitkä lista eriaiheista tietoa aina väkiluvusta teollisuustyöpaikkojen määrään asti. Teemakarttojen teko onnistui ohjelmalla varsin helposti. Kartassa esitettävät ilmiöt ja muuttujat oli helppo valita ohjelman teemakarttatyökalulla. Aineistosta oli mahdollista tuottaa hyvin eriaiheisia karttoja, mikä varmasti näkyy muiden blogeja lueskellessa.

Teemakarttani aiheena on selvitettyjen rikosten osuus suhteessa poliisin tietoon tulleisiin rikoksiin vuoden 2010 aikana. Selvitettyjen rikosten määrä ja tietoon tulleiden rikosten määrä olivat kaksi erillistä ominaisuustietoa taulukossa, mutta niiden vertaaminen toisiinsa ja prosenttiosuuden laskeminen onnistui teemakarttatyökalulla helposti.

rikokset

Kuva 1. Selvitettyjen rikosten osuus tietoon tulleista rikoksista (2010)

Kartan sisällöstä voidaan pääpiirteittäin sanoa, että suuren väkiluvun omaavissa kunnissa selvitettyjen rikosten osuus jää pienemmäksi. Tämä ei kuitenkaan ole koko totuus, sillä myös monet syrjäisetkin pikkukunnat kuvautuvat kartassa punaisen sävyillä. Selvitettyjen rikosten osuus suhteessa poliisin tietoon tulleisiin rikoksiin näyttääkin olevan melko kuntakohtaista. Joitakin alueellisia painotuksia voi kuitenkin nähdä, esimerkiksi Länsi-Suomen sisämaassa on huomattava korkeamman selvitysosuuden alue. Aivan rannikolla sijaitsevat kunnat puolestaan jäävät lähes aina keskimmäisiin tai alimpiin luokkiin. Suurin matalan selvitysosuuden alue painottuu Keskisuomesta etelään ja kaakkoon. Huonoin tilanne on tiheän asutuksen alueilla, esimerkiksi Uudenmaan kunnissa. Lapin kunnissa luokkavaihtelu on suurta. Rikoksia tapahtunee eniten suuren väkiluvun alueilla, jolloin poliisin resurssit kuormittuvat ja selvittämisessä kestää kauemmin.

Yli sadan prosentin lukemiin yltävät Länsi-Suomessa sijaitsevat Töysän ja Kaskisen kunnat. Töysä erottuu kartasta jotenkuten, jos etsii tosissaan, mutta Kaskinen on niin pieni että se häviää näkyvistä. Kaskinen sijaitsee länsirannikolla suurin piirtein samalla korkeudella Töysän kunnan kansa. Yli sadan prosentin selvitysaste tarkoittaa sitä, että vuoden aikana on saatu selvitettyä enemmän vanhoja rikoksia kuin on uusia tullut poliisin tietoon.

Pendelöinti

Kuva 2. Aineiston jakauma histogrammityökalulla

Aineiston luokittelu tuotti ongelmia, enkä ole vieläkään ihan varma onko “equal count” paras tapa tällaisen asteikon luokitteluun. Pitää opetella kunnolla erilaisille jakaumille sopivat luokittelutavat. Samaa miettivät muun muassa Leila Soinio ja Toni Ruikkala blogeissaan. Töysän kunnan 392 prosentin selivtysosuus aiheutti sen, että automaattisella luokittelulla aineiston ylimmästä luokan väliksi tuli 74-392%. Tämä ei mielestäni ollut kovin havainnollista ja tein yli sadan prosentin osuuden ylittäville kunnille kuudennen luokan 100-392%, johon tuli kaksi kuntaa. Muita luokkarajoja en muokannut.

 

Lähteet:

Leilan paikkatietopulinaa -blogi, Leila Soinio. https://blogs.helsinki.fi/lsoinio/luettu 21.1.2015

PAK 2015 -blogi, Toni Ruikkala. https://blogs.helsinki.fi/ruikkala/luettu 21.1.2015