Näkökulmia kahden muuttujan koropleettikarttoihin

Anna Leonowicz käsittelee vuonna 2006 ilmestyneessä artikkelissaan “Two-variable choropleth maps as a useful tool for visualization of geographical relationship” kaksimuuttujaisten koropleettikarttojen hyötyjä ja puutteita visuaalisena esitystapana. Kattavan pohdintansa tukena Leonowicz esittelee artikkelissa kahta tutkimusta: omaansa, sekä erästä 80-luvulla tuotettua yhdysvaltalaista tutkimusta siitä, kuinka kaksimuuttujaisten koropleettikarttojen viesti aukeaa keskimääräiselle katsojalle verrattuna yksimuuttujaisiin karttaesityksiin. Mielenkiintoista on, että tutkimukset ovat päätyneet pääosin eriäviin tuloksiin: 80-luvulla toteutetun mukaan kaksimuuttujaiset karttaesitykset ovat ylipäätään liian vaikeita tulkita, kun taas Leonowiczin oma tutkimus näkee kaksimuuttujaiset kartat yksimuuttujaisia sukulaisiaan parempina muuttujien tilastollisen riippuvuuden esittämisessä.

Leonowiczin tutkimuksesta, jossa yksi- ja kaksimuuttujaisten karttojen luettavuutta vertailtiin opiskelijaotoksen avulla Varsovan yliopistossa (Leonowicz, 2006) käy ilmi, että yksimuuttujaiset koropleettikartat soveltuvat alueellisen jakautumisen esittämiseen kaksimuuttujaisia esityksiä paremmin. Sen sijaan kaksimuuttujaiset esitykset ovat omiaan ilmentämään tilastollista korrelaatiota ja ovat sen osoittamisessa yksimuuttujaisia, vierekkäisiä karttaesityksiä parempia juuri tulkittavuudeltaan. Edellisessä esitystavassa kartanlaatijan on kuitenkin tärkeää ymmärtää, mitä muuttujia on aiheellista tarkastella päällekkäin: olisi hyvä muistaa, että tilastollinen korrelaatio ei välttämättä kerro kausaalisuhteesta ja voi olla jonkin tarkastelun ulkopuolisen muuttujan tai toisaalta pelkän sattuman aiheuttamaa.

Yhdysvaltalaistutkimus taas todisti monimuuttujaisten koropleettikarttojen vaikealukuisuuden kokeellisesti 1980 -luvulla (Weiner, Francolini, 1980; Olson, 1981). Sen mukaan päällekkäisiä teemoja sisältävät karttaesitykset olivat katsojalle niin vaikealukuisia, että niiden lopullinen informaatioarvo jäi vierekkäisiä yksimuuttujaisia koropleettikarttoja köyhemmäksi. Etenkin legendojen tulkinta koettiin vaikeana. Leonowicz esittää tutkimusten tulosten johtuneen kuitenkin vain kyseisen kokeen karttaesitysten puutteellisesta visuaalisesta suunnittelusta sekä niissä käytetyn luokittelun ongelmallisuudesta: hänen mukaansa tutkimuksessa käytetyissä kartoissa käytettiin liian montaa luokkaa, käytetyt värit olivat kiistanalaisia ja täten kartat jäivät vaille visuaalista logiikkaa.

Olen kirjoittajan kanssa yhtä mieltä siitä, että vierekkäisiä koropleettikarttoja vertailemalla aineistojen tilastollinen riipuvuus ei avaudu katsojalle kovin helposti, sillä on teknisesti mahdotonta katsoa kahta karttaa samanaikaisesti. Jotta yhtäläisyys olisi helppo havaita vierekkäisistä kartoista, tulisi korrelaation olla äärimmäisen selkeää ja kuvattavan alueen visuaalisesti yksinkertainen. Kaksimuuttujaisen koropleettikartan edut taas tulevat esiin juuri sen käytännöllisyydessä ja moniulotteisuudessa. Antti Kinnunen pohtii blogissaan oivallisesti kaksiulotteisen esitystavan jopa matemaattista ulottuvuutta seuraavasti: “Kahden muuttujan koropleettikartalla toteutuu eräänlainen versio yhtälöstä xy=?, jossa muuttuja x:n värisävy yhdistettynä muuttujan y värisävyyn määrää tuloksen ?, eli sen värisävyn jonka tarkasteltava alue saa kartalla. Kaksimuuttujaista koropleettikarttaa voisi näin ollen pitää eräänlaisena visuaalisena representaationa ensimmäisen asteen yhtälöstä, jossa numeroiden sijaan muuttujina toimivat värit.”

Tästä huolimatta artikkelin lopussa oleva kaksimuuttujainen esimerkkikartta (kuva 1) on mielestäni ensivilkaisulla vaikeatulkintaisempi kuin vertailukohtana oleva kahden yksimuuttujaisen koropleettikartan muodostama kokonaisuus (kuva 1). Mielestäni kahdesta vierekkäisestä koropleettikartasta korrelaation havaitsee jopa paremmin kuin kaksimuuttujaisesta lajitoveristaan. Tämä voi osaltaan johtua tottumattomuudestani kaksimuuttujaiseen esittämistapaan, mutta koen myös, että kartta ja sen sävyt ovat intuitiivisesti harhaanjohtavia. Sen lisäksi, että sinisten luokkien sävyt ovat hyvin lähellä toisiaan, vahvaa lineaarista korrelaatiota kuvaavat luokkasävyt eivät ole intuitiivisesti tulkittavissa legendan värisävyjen yhdistelmiksi. Karttaesitys vaatii siis lukijalta suhteellisen suurta panosta ja kykyä legendan ja kartan tutkimiseen.

Pak artikkeli karttakuva

 

Kuva 1. Artikkelin esimerkkikuva yksi- ja kaksimuuttujaisesta koropleettikarttaesityksestä. Ylinnä on kaksi vierekkäistä yhden muuttujan koropleettikarttaa, alla olevassa kartassa nämä kaksi on aseteltu päällekkäin. Lähde: Leonowicz, 2006.

Kaksimuuttujaisten koropleettikarttojen tulkittavuuteen liittyy vielä yksi rajoittava seikka, joka palauttaa meidät takaisin yksiulotteisten vierekkäisten koropleettikarttojen ongelmaan. Koska katsetta on mahdotonta kohdistaa kahteen objektiin samanaikaisesti, ei tarkastelun yhtäaikaisuus pääse toteutumaan myöskään kaksimuuttujaisen kartan ja sen legendan välillä. Tavallisessa yksiulotteisessa legendassa luokat kasvavat vain yhden muuttujan suhteen ja yhteen suuntaan, jolloin luokat ja niiden järjestys on helppo muistaa ulkoa itse karttaa tarkastellessa. Kaksimuuttujaisen koropleettikartan legenda on kuitenkin niin moniuloitteinen, ettei sen luokkien ominaisuuksia voi muistaa karttaa tarkastellessa, vaan huomio on kohdistettava kerrallaan vain yhteen luokkaan niin legendassa kuin kartallakin. Mutta kuinka mahdollistaa legendan ja karttaesityksen päällekkäistarkastelu? Kenties sijoittamalla legendan arvoja kartalle mahdollisimman havainnollisesti ja yksinkertaisesti? Mielestäni tämä olennainen kysymys jää Leonowiczilta huomaamatta.

Jos tavoitteenani olisi havainnollistaa koropleettikartalla ainoastaan kahden muuttujan tilastollista riippuvuutta, luultavasti sijoittaisin kartalle jonkinlaisen luokittelun, joka perustuisi havaintopisteen virhetermin suuruuteen eli sen etäisyyteen regressiosuorasta. Olen esittänyt esimerkkikuvan luokittelun periaatteesta kuvassa 2 (alla). Tällöin lähimpänä regressiosuoraa sijaitsevat havaintopisteet muodostaisivat oman luokkansa (kuvassa luokka 3), keskimääräisen virhetermin pisteet keskimmäisen luokan (luokka 2) ja suurimman virhetermin pisteet viimeisen luokan (luokka 1).

Pak luokitteluehdotus

Kuva 2. Suuntaa-antava havainnollistukseni siitä, kuinka korrelaatiota esittävän karttaesityksen aineiston voisi luokitella suhteessa regressiosuoraan.

Näin hajontakäyrän sisältämän informaation voisi siirtää karttapohjalle havainnollistamaan, millä alueilla muuttujien välillä on voimakas tilastollinen yhteys ja toisaalta millä alueilla sitä ei ole havaittavissa. Mielestäni kahden muuttujan riippuvuutta voisi siis ilmentää kartalla funktionaalisemminkin kuin käyttämällä päällekkäisiä teemoja lopullisessa esityksessä. Toisaalta päällekkäisten teemojen vahvuus on juuri moniulotteisuudessa: ne eivät ilmennä ainoastaan korrelaatiota vaan myös tarkasteltavien muuttujien arvoja ja niiden vaihtelua eri alueilla. Taitavalle tulkitsijalle päällekkäiset teemat tarjoavatkin aivan erinomaisen havainnointilähteen.

Lähteet:

  • Leonowicz, A (2006). Two-variable choropleth maps as a useful tool for visualization of geographical relationships. Geografija T. 42. Nr. 1. P. 33–37.

Leave a Reply

Your email address will not be published. Required fields are marked *