Artikkeli 1: Kahden muuttujan koropleettikartoista

Anna Leonowiczin artikkeli “Two-variable choropleth maps as a useful tool for visualization of geographical relationship” oli juuri sopiva artikkeli toisen kurssikerran harjoituksen pariksi. Leonwiczin mukaan kahden muuttujan kartat voivat olla oikein toteutettuna hyviä esittämään muuttujien suhdetta mutta kadottavat helposti yhden muuttujan koropleettikarttojen hyvän maantieteellisen jakauman kuvauskyvyn.

Harjoituskartan luomisen ja artikkelin lukemisen myötä pohdin erityisesti kahden muuttujan karttojen graafisia ominaisuuksia ja haasteita. Kahta asiaa kartalla tutkittaessa on ensinnäkin selvää että informaatiota voi tulla liikaa luettavuuden kustannuksella. Pieni luokkien määrä on tähän ensimmäinen ja tärkein lääke. Lisäksi kahden muuttujan esitysten graafinen yhteensopivuus on mielenkiintoinen kysymys. on erittäin haastavaa saada muuttujien suhde näkyviin pitäen samalla molemmat muuttujat erikseen havainnoitavana. Tällöin eri muuttujien vaihteluun liittyvien graafisten ominaisuuksien tulisi olla sllelvästi erottautuvia, kuitenkin niin että niiden yhdistelmänä myös syntyy ikään kuin oma muuttujansa. Tämä onnistuu esimerkiksi Leonowiczin mainitsemilla kahdella sekoittuvalla väriskaalalla, jossa esimerkiksi sinisen ja punaisen tummuusasteilla esitetään yksittäisten muuttujien vaihtelua yhteisvaihtelun voimakkuus näkyy violetin määränä. MapInfossa tälläinen ei valitettavasti taida onnistua.

Toimivassa kahden muuttujan koropleettikartassa siis graafiset esitykset sekoittuvat ja kahden muuttujan suhteesta muodostuu tavallaan oma graafinen muuttujansa tai voidaan ajatella että graafinen muuttuja on kaksiulotteinen. Tällöin esimerkiksi MapInfossa tuotetut erilliset legemdat voivat olla tulkinnan kannalta vaikeita. luettava kartta vaatii kaksiulotteisen legendan joka osoittaa myös yhteisvaihtelun graafisia ominaisuuksia. Näin vähennetään virheitä kartan tulkinnassa kun kaikki kartassa esiintyvät esitysmuodot esiintyvät myös legendassa.

Toinen kurssikerta: toistoa ja yhteisvaihtelua

Toisella kurssikerralla tutustuttiin loppuihin MapInfon teemakarttatoimintoihin sekä pohdittiin kahden päällekäisen teemkartan toteuttamista.

Selkeästi toistosta oli hyötyä. Joitain työvaiheita kartan luomisessa en muistanut enää edes viikon takaa kunnolla vaan toimintoja piti kaivella MapInfon valikoiden uumenista.

Karttatehtäväksi annettu kahden päällekäisen teemakartan esittäminen osoittautui työlääksi kahdesta syystä. Ensinnäkin sopivan aineiston löytäminen ei ollut helppoa. Ehkä tarkoituskaan ei ollut löytää välttämättä yhteisvaihtelua osoittavaa aineistoa, mutta mukavampihan sellaista on tulkita kuin täysin kaoottista. SotkaNetin aineistossa oli paljon kiinnostavaa tutkittavaa ja hypoteesien tekeminen erilaisten muuttujien yhdistelmistä on mielenkiintoista, mutta osa aineistosta vaikutti vanhentuneelta tai epäluotettavalta, joten selailu oli jossain määrin työlästä. Päädyin tutkimaan tulojen yhteyttä äänestysaktiivisuuteen eduskuntavaaleissa 2011. Tuloja edustavaksi muuttujaksi SotkaNetin aineistosta löytyi pienituloisuusaste. Selkeämpiäkin mittareita olisi saattanut löytyä ja täytyy myöntää etten vieläkään ole täysin selvillä pienituloisuusasteen yksityiskohdista.

Toinen suhteellisen työläs osuus tehtävän suorittamisessa oli kahden päällekäisen koropleettikartan ulkonäön säätäminen sellaiseksi että niiden yhteisvaihtelua ja toisaalta kummankin jakaumaa pystyisi tutkimaan. Kartta-alueen kooksi päätin ottaa suuralueen kompromissina luettavuuden ja otannan koon väliltä. Alueeksi valikoitui tuttu Etelä-Suomi.

Histogrammien perusteella molempien muuttujien jakaumat vaikuttivat mielestäni hieman vinoilta normaalijakaumilta. Vaikka Antti tulkitsi omassa blogissaan (Antin paikkatietoblogi) pienituloisuusasteen tasaisesti jakautuneeksi toisin kuin minä, päädyimme kuitenkin molemmat käyttämään kvantiileja eli tasamääräisiin luokkiin. [JÄLKIHUOMIO: Itse olin tainnut tutkia koko Suomen jakaumaa valitsemani alueen sijaan, minkä takia tulkistin sen vinoksi normaalijakaumaksi. Tämä ei välttämättä päde valitsemalleni alueelle, mutta luokkajako lienee joka tapauksessa toimiva.] Itse tosin en säätänyt luokkavälejä tasalukuihin, mikä voisi olla hyvä käytäntö jatkossa legendojen selvyyden ja siten koko karttaesityksen selkeyden kannalta.

MapInfon teemakarttojen tyylien valmisvalikoiman rajallisuus tuli vastaan erilaisia kuviointeja värien päälle kokeillessa. Tekemääni karttaan valitsin viivoituksen, josta kolme luokkaa oli mielestäni helpompi havaita kuin muista kuvioinneista. Äänestysaktiivisuutta kuvaava väri puolestaan vaihtelee luokkien välillä tummuuden avulla. Tämä tulee viivoituksen kanssa ongelmalliseksi, koska tiheämpi viivoitus saattaa myös tuoda vaikutelmaa tummuudesta. Tällöin muuttujat eivät erotu toisistaan ja vastakkaisten ääripäiden yhdistelmä voi näyttää yhden muuttujan ääripäältä. Jälkikäteen ajatellen värisävyä muuttava väriteemakartta oli äänestysaktiivisuudelle parempi.

2teemaa

Edellä mainituista ja mahdollisista muista puutteista huolimatta kartta ei ole täysin analyysikelvoton. Voidaan esimerkiksi nähdä, että useissa rantakunnissa Helsingin ja Turun ympäristössä äänestysaktiivisuus on korkealla ja pienituloisuusaste matalalla. Itä-osissa karttaa puolestaan näkyy useita kuntia, joissa on samaan aikaan matala äänestysaktiivisuus ja korkea pienituloisuusaste. Näitä vastakkaisten ääripäiden yhdistelmiä jossain määrin aineistosta oletinkin. Yhteisvaihtelun seuraaminen olisi ehkä helpompaa ylipäätään, jos pienituloisuusasteen sijaan olisi tutkittu jotain tulojen myötä kasvavaa muuttujaa. Negatiivista korrelaatiota on hankalampi tutkia päällekäisistä teemakartoista kuin positiivista tai ainakin sopiva esitysmuoto on vaikeampi löytää.

 

Lähteet:

Antin paikkatietoblogi. Antti Autio. Luettu 29.1.2015. https://blogs.helsinki.fi/anttiaut/

Ensimmäinen kurssikerta

PAK-kurssi aloitettiin johdannolla paikkatietoon ja MapInfon käyttöön. Paikkatietoasioiden perusteet tässä mitassa olivat varsin tuttua asiaa, mutta MapInfosta löytyi heti uutta opittavaa. Aiempi kokemukseni ohjelman kanssa rajoittui pieneen harjoitukseen TAK-kurssilla.

Kurssikerran olennaisinta antia olivat MapInfon tasojen ja tietokantojen hallinta sekä koropleettikarttojen luonti. Kyse oli muuten lähinnä teknisestä opastuksesta ja harjoittelusta, mutta yksinkertainenkin teemakarttaharjoitus sai pohtimaan aineiston luokittelua ja tiedon välitystä karttojen avulla.

Helsingin aineistoilla kokeilemisen jälkeen yritin löytää sopivaa aihetta Suomen teemakartalle blogia varten. Kunnat2011-tietokannassa riitti mielenkiintoisia muutujia, tosin lähes jokaisen kohdalla mieleeni nousi epäilys kartan syvemmästä tulkinnasta. Yhden muuttujan tutkiminen johtaa usein väärin johtopäätöksiin yksinään. Päätin kuitenkin pitäytyä perusasioissa ja valita vain yhden muuttujan ja sen valmiista valikoimasta. Kartalle muutamaa kokeiltuani huomasin että eläkeläisten osuus näytti mielenkiintoiselta analysoitavalta kartalta. Ainakin siitä näki heti, että joitain tulkintoja koko Suomen kartalla on tehtävissä. Kuten Mirka blogissaan (Paikannettua tietoa) huomauttaa, tämä muuttuja on suhteellinen (osuus kunnan kokonaisväestöstä) ja siksi sopii sellaisenaan koropleettikartan aineistoksi.

Ennen lopullisen kartan luontia oli tarpeen tutkia aineiston jakaumaa histogrammin (alla) avulla. Olin yllättynyt, että aineisto näytti näinkin normaalijakautuneelta. Tosin jakauma on ehkä jossain määrin vino: häntää suurissa prosenteissa ei ole yhtä paljon kuin pienissä ja joitain piikkejä on nähtävissä keskiarvoa suuremmissa luokissa.

eläkehist2

Ohjeita noudattaen aloin pohtia normaalijakaumalle sopivaa luokitusta tasamääräisten luokkien ja keskihajonnan muodostamien luokkien väliltä. Päätin tuottaa molemmista kartat tähän alle. Keskihajontaan perustuva luokittelun myötä ääripäät erottuvat selkeämmin ja luokkavälit ovat tasaisemmat. Tasamääräisiin luokkiin perustuvassa kartassa on helpompi erottaa laajemmat alueet, joiden välillä erot ovat selkeitä. Toisaalta keskimmäisten luokkien luokkarajat muodostuvat kapeiksi ja niiden vertailu keskenään vaikuttaa turhalta.

eläkesuomi_std copy

eläkesuomi_eqCount

Molemmista kartoista erottuu pienen eläkeläisten osuuden alueina suurten yliopistokaupunkien ympäristöt. Keskihajonnan mukaan luokitellusta kartasta voisi karkeasti arvioida että pinta-alaltaan suuret kunnat ovat useammin eläkeläisten osuudeltaan kuntien keskiarvon yläpuolella ja pinta-alaltaan pienet kunnat keskiarvon alapuolella.

 

Lähteet

Paikannettua tietoa. Mirka Jokela-Määttä. Luettu 22.1.2015. https://blogs.helsinki.fi/mijokela/