Toinen kurssikerta: päällekkäiset teemat

Toisella kurssikerralla tutustuimme syvemmin MapInfon käyttömahdollisuuksiin teemakarttojen tuotannossa. Kävimme läpi mahdollisten esitystapojen skaalaa sekä niiden soveltuvuutta eri muuttujien kuvaamiseen. Kurssikerran itsenäisesti suoritettavan osuuden aiheena oli päällekkäisten teemojen käyttö koropleettikarttaesityksissä: tarkoitus oli tuottaa informatiivinen ja moniuloitteinen karttaesitys, jossa yhdistyisivät samaa ilmiötä kuvaavat aineistot toisiaan tukevalla tavalla (esimerkiksi absoluuttiset ja suhteelliset arvot kuten työttömyysaste ja työttömien työnhakijoiden määrä). Vaihtoehtona oli tuottaa päällekkäisesitys kahdesta eri ilmiöstä, joiden yhteisvaihtelua tarkastelemalla voitaisiin tehdä havaintoja ilmiöiden välisestä mahdollisesta tilastollisesta riippuvuussuhteesta.

Aineiston valinta oli minulle hankalaa, sillä halusin esittää kartallani kaksi selkeästi korreloivaa ilmiötä. Toisaalta en kuitenkaan halunnut tarttua liian itsestäänselviin teemoihin korrelaation kuvaamisessa. Suljin siis ulkopuolelle lähes tai täysin samaa aihetta kuvaavat aineistot, joiden yhdistämisen ja tuplaesittämisen tuottama lisäinformaatioarvo jäisi mielestäni olemattomaksi – tällaisia olisivat olleet esimerkiksi yli 65-vuotiaiden osuuden ja eläkkeellä olevien osuuden yhdistäminen samaan karttaesitykseen. Lisäksi halusin välttää sellaisten aineistojen yhdistämistä, joissa korrelaation aiheuttajana oli selkeästi jokin tarkastelun ulkopuolinen syy. Esimerkiksi vältin tietoon tulleiden rikosten määrän ja työttömien määrän kuvaamista samalla karttapohjalla absoluuttisina lukuina, sillä molempien esiintyvyys on todellisuudessa eniten riippuvainen kunnan väkiluvusta. Toisaalta näiden muuttujien arvojen muuttaminen suhteellisiksi (esim. työttömyysaste + tietoon tulleet rikokset/väestömäärä) nostaisi kartan informaatioarvoa jo huomattavasti.

Muutaman tunnin toivottoman ähellyksen jälkeen päädyin kuitenkin tarkastelemaan suhteellisen helppoa ja itsestäänselvää kombinaatiota: pohjakarttani sävyt kuvaavat 65 vuotta täyttäneiden prosentuaalista osuutta kunnan väestöstä ja pisteobjektit taas luonnollisen väestönlisäyksen määrää suhteessa kunnan väkilukuun. Jaoin siis luonnollisen väestönlisäyksen väkiluvulla, jotta kartan visuaalinen ilme ei johtaisi virheellisiin tulkintoihin alueen syntyneisyydestä ja kuolleisuudesta. Kun arvot kuvataan valmiiksi suhteellisina, kartta on helpompi ymmärtää myös sellaiselle henkilölle, joka ei tunne aihealueen terminologiaa (esim. luonnollinen väestönlisäys eli kuolleiden määrä vähennettynä syntyneiden määrästä) tai huomaa ajatella kuntien välisiä eroja väkiluvuissa ja suhteuttaa esitettyjä arvoja niihin. Kartaltani (kuva 1) on luettavissa selkeä korrelaatio, mikä tuskin yllättää ketään: kunnissa, joissa vanhusikäisten osuus on korkea, on sekä suurin kuolevuus että alhaisin syntyvyys, jolloin myös luonnollisen väestönkasvun (syntyneiden määrä – kuolleiden määrä) on oltava heikompaa kuin nuoremman väestöpohjan kunnissa. Kartan varsinainen informaatioarvo liittyykin muuttujien toisiaan vahvistavaan ja tukevaan vaikutukseen – mielestäni kartta korostaa hyvin eroja taantuvien kuntien ja kasvukuntien välillä ja toisaalta tuo ilmiöiden alueellisen ulottuvuuden selkeästi esiin.

pak_karttakk2

Kuva 1. 65 vuotta täyttäneiden osuus ja luonnollinen väestönkasvu suhteutettuna väkimäärään Uudellamaalla. Muuttujien korrelaatiota on havainnollistettu päällekkäisillä teemoilla. Lähde: Tilastokeskus 2010.

Oppimisprosessistani voin tässä vaiheessa todeta, että vaikka ohjelman mekaaninen käyttö teemakarttatuotannossa alkaakin hiljalleen sujua, en koe vielä olevani kovinkaan hyvin perillä MapInfon toimintalogiikasta. Yhdynkin vuolaasti Tiia Seeven turhautumiskokemukseen, josta hän kirjoittaa blogissaan seuraavaa:

“Mekaaninen ulkoaopettelu tai onnistunutkaan ohjeiden seuraaminen ei tuo minulle oppimisen tunnetta, koska en varsinaisesta ymmärrä, mitä teen. Osaanhan minä komentaa MapInfon tekemään minulle koropleettikartan, mutta jos jokin menee vikaan, korjauskeinoni ovat kovin rajalliset.”

Kykyni muokata ja korjata tuottamiani karttaesityksiä MapInfossa on enemmänkin kuin rajallinen. Siksi veinkin tuottamani karttatiedoston vektorimuotoisena CorelDraw -ohjelmaan, jossa kaikenlainen muokkaus ja visuaalisen ilmeen hiominen on helpompaa. Myös Johanna Hakanen kirjoittaa blogissaan MapInfon ja CorelDraw- ohjelman käyttäjäystävällisyydestä:

“Kartan muokkaaminen Corelilla oli helppoa ja nopeaa ja sai MapInfon tuntumaan todella jäykältä ja epäloogiselta.”

Mutta kuten Johannakin myöhemmin blogissaan toteaa, on turhautumisessa luultavasti kyse vain tottumattomuudesta ja uuden toimintalogiikan opettelemiseen kuuluvasta alkukankeudesta. Uskon siis, että kurssin edetessä ja ohjelman tullessa tutummaksi myös sen käyttölogiikka aukeaa, oli pääni sitten puusta tahi ei. 😉

Lähteet:

Hakanen, J (2014). Kurssikerta 2: Lisää teemakarttoja ja kaksi päällekkäistä teemaa. <https://blogs.helsinki.fi/johakane/2014/01/21/kurssikerta-2-lisaa-teemakarttoja-ja-kaksi-paallekkaista-teemaa/> Viitattu 28.1.2014.

Seeve, T (2014). Kurssikerta 2 osa 1: Tuplateemat. <https://blogs.helsinki.fi/setiseti/2014/01/24/kurssikerta-2-tuplateemat/> Viitattu 28.1.2014.

Tilastokeskuksen tilastotietokanta. Tilastokeskus 2010.

Näkökulmia kahden muuttujan koropleettikarttoihin

Anna Leonowicz käsittelee vuonna 2006 ilmestyneessä artikkelissaan “Two-variable choropleth maps as a useful tool for visualization of geographical relationship” kaksimuuttujaisten koropleettikarttojen hyötyjä ja puutteita visuaalisena esitystapana. Kattavan pohdintansa tukena Leonowicz esittelee artikkelissa kahta tutkimusta: omaansa, sekä erästä 80-luvulla tuotettua yhdysvaltalaista tutkimusta siitä, kuinka kaksimuuttujaisten koropleettikarttojen viesti aukeaa keskimääräiselle katsojalle verrattuna yksimuuttujaisiin karttaesityksiin. Mielenkiintoista on, että tutkimukset ovat päätyneet pääosin eriäviin tuloksiin: 80-luvulla toteutetun mukaan kaksimuuttujaiset karttaesitykset ovat ylipäätään liian vaikeita tulkita, kun taas Leonowiczin oma tutkimus näkee kaksimuuttujaiset kartat yksimuuttujaisia sukulaisiaan parempina muuttujien tilastollisen riippuvuuden esittämisessä.

Leonowiczin tutkimuksesta, jossa yksi- ja kaksimuuttujaisten karttojen luettavuutta vertailtiin opiskelijaotoksen avulla Varsovan yliopistossa (Leonowicz, 2006) käy ilmi, että yksimuuttujaiset koropleettikartat soveltuvat alueellisen jakautumisen esittämiseen kaksimuuttujaisia esityksiä paremmin. Sen sijaan kaksimuuttujaiset esitykset ovat omiaan ilmentämään tilastollista korrelaatiota ja ovat sen osoittamisessa yksimuuttujaisia, vierekkäisiä karttaesityksiä parempia juuri tulkittavuudeltaan. Edellisessä esitystavassa kartanlaatijan on kuitenkin tärkeää ymmärtää, mitä muuttujia on aiheellista tarkastella päällekkäin: olisi hyvä muistaa, että tilastollinen korrelaatio ei välttämättä kerro kausaalisuhteesta ja voi olla jonkin tarkastelun ulkopuolisen muuttujan tai toisaalta pelkän sattuman aiheuttamaa.

Yhdysvaltalaistutkimus taas todisti monimuuttujaisten koropleettikarttojen vaikealukuisuuden kokeellisesti 1980 -luvulla (Weiner, Francolini, 1980; Olson, 1981). Sen mukaan päällekkäisiä teemoja sisältävät karttaesitykset olivat katsojalle niin vaikealukuisia, että niiden lopullinen informaatioarvo jäi vierekkäisiä yksimuuttujaisia koropleettikarttoja köyhemmäksi. Etenkin legendojen tulkinta koettiin vaikeana. Leonowicz esittää tutkimusten tulosten johtuneen kuitenkin vain kyseisen kokeen karttaesitysten puutteellisesta visuaalisesta suunnittelusta sekä niissä käytetyn luokittelun ongelmallisuudesta: hänen mukaansa tutkimuksessa käytetyissä kartoissa käytettiin liian montaa luokkaa, käytetyt värit olivat kiistanalaisia ja täten kartat jäivät vaille visuaalista logiikkaa.

Olen kirjoittajan kanssa yhtä mieltä siitä, että vierekkäisiä koropleettikarttoja vertailemalla aineistojen tilastollinen riipuvuus ei avaudu katsojalle kovin helposti, sillä on teknisesti mahdotonta katsoa kahta karttaa samanaikaisesti. Jotta yhtäläisyys olisi helppo havaita vierekkäisistä kartoista, tulisi korrelaation olla äärimmäisen selkeää ja kuvattavan alueen visuaalisesti yksinkertainen. Kaksimuuttujaisen koropleettikartan edut taas tulevat esiin juuri sen käytännöllisyydessä ja moniulotteisuudessa. Antti Kinnunen pohtii blogissaan oivallisesti kaksiulotteisen esitystavan jopa matemaattista ulottuvuutta seuraavasti: “Kahden muuttujan koropleettikartalla toteutuu eräänlainen versio yhtälöstä xy=?, jossa muuttuja x:n värisävy yhdistettynä muuttujan y värisävyyn määrää tuloksen ?, eli sen värisävyn jonka tarkasteltava alue saa kartalla. Kaksimuuttujaista koropleettikarttaa voisi näin ollen pitää eräänlaisena visuaalisena representaationa ensimmäisen asteen yhtälöstä, jossa numeroiden sijaan muuttujina toimivat värit.”

Tästä huolimatta artikkelin lopussa oleva kaksimuuttujainen esimerkkikartta (kuva 1) on mielestäni ensivilkaisulla vaikeatulkintaisempi kuin vertailukohtana oleva kahden yksimuuttujaisen koropleettikartan muodostama kokonaisuus (kuva 1). Mielestäni kahdesta vierekkäisestä koropleettikartasta korrelaation havaitsee jopa paremmin kuin kaksimuuttujaisesta lajitoveristaan. Tämä voi osaltaan johtua tottumattomuudestani kaksimuuttujaiseen esittämistapaan, mutta koen myös, että kartta ja sen sävyt ovat intuitiivisesti harhaanjohtavia. Sen lisäksi, että sinisten luokkien sävyt ovat hyvin lähellä toisiaan, vahvaa lineaarista korrelaatiota kuvaavat luokkasävyt eivät ole intuitiivisesti tulkittavissa legendan värisävyjen yhdistelmiksi. Karttaesitys vaatii siis lukijalta suhteellisen suurta panosta ja kykyä legendan ja kartan tutkimiseen.

Pak artikkeli karttakuva

 

Kuva 1. Artikkelin esimerkkikuva yksi- ja kaksimuuttujaisesta koropleettikarttaesityksestä. Ylinnä on kaksi vierekkäistä yhden muuttujan koropleettikarttaa, alla olevassa kartassa nämä kaksi on aseteltu päällekkäin. Lähde: Leonowicz, 2006.

Kaksimuuttujaisten koropleettikarttojen tulkittavuuteen liittyy vielä yksi rajoittava seikka, joka palauttaa meidät takaisin yksiulotteisten vierekkäisten koropleettikarttojen ongelmaan. Koska katsetta on mahdotonta kohdistaa kahteen objektiin samanaikaisesti, ei tarkastelun yhtäaikaisuus pääse toteutumaan myöskään kaksimuuttujaisen kartan ja sen legendan välillä. Tavallisessa yksiulotteisessa legendassa luokat kasvavat vain yhden muuttujan suhteen ja yhteen suuntaan, jolloin luokat ja niiden järjestys on helppo muistaa ulkoa itse karttaa tarkastellessa. Kaksimuuttujaisen koropleettikartan legenda on kuitenkin niin moniuloitteinen, ettei sen luokkien ominaisuuksia voi muistaa karttaa tarkastellessa, vaan huomio on kohdistettava kerrallaan vain yhteen luokkaan niin legendassa kuin kartallakin. Mutta kuinka mahdollistaa legendan ja karttaesityksen päällekkäistarkastelu? Kenties sijoittamalla legendan arvoja kartalle mahdollisimman havainnollisesti ja yksinkertaisesti? Mielestäni tämä olennainen kysymys jää Leonowiczilta huomaamatta.

Jos tavoitteenani olisi havainnollistaa koropleettikartalla ainoastaan kahden muuttujan tilastollista riippuvuutta, luultavasti sijoittaisin kartalle jonkinlaisen luokittelun, joka perustuisi havaintopisteen virhetermin suuruuteen eli sen etäisyyteen regressiosuorasta. Olen esittänyt esimerkkikuvan luokittelun periaatteesta kuvassa 2 (alla). Tällöin lähimpänä regressiosuoraa sijaitsevat havaintopisteet muodostaisivat oman luokkansa (kuvassa luokka 3), keskimääräisen virhetermin pisteet keskimmäisen luokan (luokka 2) ja suurimman virhetermin pisteet viimeisen luokan (luokka 1).

Pak luokitteluehdotus

Kuva 2. Suuntaa-antava havainnollistukseni siitä, kuinka korrelaatiota esittävän karttaesityksen aineiston voisi luokitella suhteessa regressiosuoraan.

Näin hajontakäyrän sisältämän informaation voisi siirtää karttapohjalle havainnollistamaan, millä alueilla muuttujien välillä on voimakas tilastollinen yhteys ja toisaalta millä alueilla sitä ei ole havaittavissa. Mielestäni kahden muuttujan riippuvuutta voisi siis ilmentää kartalla funktionaalisemminkin kuin käyttämällä päällekkäisiä teemoja lopullisessa esityksessä. Toisaalta päällekkäisten teemojen vahvuus on juuri moniulotteisuudessa: ne eivät ilmennä ainoastaan korrelaatiota vaan myös tarkasteltavien muuttujien arvoja ja niiden vaihtelua eri alueilla. Taitavalle tulkitsijalle päällekkäiset teemat tarjoavatkin aivan erinomaisen havainnointilähteen.

Lähteet:

  • Leonowicz, A (2006). Two-variable choropleth maps as a useful tool for visualization of geographical relationships. Geografija T. 42. Nr. 1. P. 33–37.