KK 7: Loppu tulee (ou PHAK)!

Kurssimme lähenee loppuaan, ja viimeisen blogikirjoitukseni aika on tullut. Taipaleeni MapInfo-artistina jää siis toistaiseksi katkolle. Kurssin myötä innostukseni GISsiä kohtaan on lisääntynyt huimasti. Hieman harmittaa tämä oppimisprosessin keskeytyminen, sillä koen juuri nyt olevani kaikista hedelmällisimmässä vaiheessa uusien toimintojen omaksumiselle. MapInfon kanssa olen aivan kuin pieni lapsi, joka on juuri oppinut kävelemään – askellus sujuu, mutta hetkittäinen horjuminen saa aikaan refleksinomaista tarrautumista pöydänreunaan tai ympäröiviin ihmisiin. Ja jos Arttu ei ole paikalla, voi iskeä hätä; tätä kurssi-isää kun eivät parhaimmatkaan tutoriaalit korvaa. Tällä aka seitsemännellä aka viimeisellä kurssikerralla opin kuitenkin pyllähtämään pehmeästi ja nousemaan ilman apua, mikä kasvatti MapItsetuntoani huomattavasti. Luottamukseni tutoriaaleihin sen sijaan kärsi jälleen kolauksen – niistä kun ei tunnu löytyvän ratkaisua ikinä siihen kysymykseen, johon kipeimmin tarvitsisi vastauksen.

Kurssikerran oppimistavoitteena oli irtipäästäminen (Artusta) ja itseohjautuvaan työskentelyyn siirtyminen MapInfon käytössä. Kurssin kaikkia osa-alueita kokoava tehtävänanto olikin laaja mutta vapaa: tarkoituksena oli tehdä kahden muuttujan teemakartta vapaavalintaisesta aiheesta ja alueesta. Tehtävän luonteeseen kuului, että myös kaikki data eli tilastotieto ja pohjakartta tuli hankkia itsenäisesti. Poimin Tilastokeskuksen Amerikan tilastovirastot -sivulta alueekseni Argentiinan täysin satunnaisesti ja sen enempää valintaani pohtimatta. Onnekseni Argentiinan virallisen tilastokeskuksen INDEC:in sivuilta löytyi mukavasti englanninkielistä aineistoa. Päätin keskittyä aineistoon, jossa tieto oli esitetty provinsseittain, sillä aluejaoksi provinssit olivat mielestäni sopivan yleistävä ja kuitenkin riittävän erotteleva ja yksityiskohtainen. Ajattelin ensin tarkastella maanomistuksen keskittyneisyyden indeksiä (= väkiluvun ja viljelyalan tulo suhteutettuna maatilojen määrään) ja maatalouden tuottavuutta sekä hyvinvoinnin jakautumista provinsseittain. Tässä törmäsin kuitenkin käsillä olevan tiedon puutteeseen – joko tietoa haluamastani aiheesta ei ollut tai sitten sitä ei ollut saatavana provinsseittain. Ehkäpä hyvä niin, sillä tutustuessani tarkemmin Argentiinan demografisiin piirteisiin huomasin, että Argentiinan kaupungistuneisuusaste on huimat 93 % (The World Bank, 2013). Maanomistuksen jakautumisen tutkiminen maatilojen omistussuhteiden perusteella olisi siis tällä aluella ollut jokseenkin epätarkoituksenmukaista.

Päädyin lopulta tarkastelemaan köyhyyteen, tulonjakoon ja rikollisuuteen liittyviä teemoja, sillä niistä oli dataa saatavilla edes auttavasti. Yleinen harhaluulo on, että köyhyys ja rikollisuus korreloivat alueellisesti ja ovat toisistaan riippuvaisia ilmiöitä. Tämä ei kuitenkaan pidä paikkaansa, kuten edellisessä lauseessa jo vihjaankin. Ilmiöt ovat tahoillaan niin moniriippuvaisia, monisyisiä ja dynaamisia, että helppoja ja yksinkertaisia selittäviä tekijöitä on mahdotonta löytää. Rikollisuuden alueelliseen esiintymiseen vaikuttavat lukuisten kulttuurillisten, sosio-ekonomisten, lainsäädännöllisten, ja inhimillisten seikkojen ohella pelotteen (poliisivoimien ja oikeusjärjestelmän vahvuus, kiinnijäämisen todennäköisyys) voimakkuus ja jopa suhdannevaihtelut. Jotta rikolliseen tekoon ryhtyminen on kannattavaa, tulee pelotteen uhan olla huomattavasti potentiaalista saavutettavaa hyötyä pienempi (Cerro, A; Andres, A; 2011).

Karttojani varten päädyin imuroimaan dataa sekä Argentiinan virallisen tilastokeskuksen INDEC:in että talouden ja työllisyyden kehitystä tutkivan instituution IELDE:n (Instituto de Estudios Laborales y del Desarrollo Económico) ylläpitämiltä sivustoilta. Hain tiedot provinsseittain niin töttömyysasteesta, NBI eli Unsatisfied Basic Needs -indeksistä, tietoon tulleiden rikosten määrästä, väkiluvusta, bruttokansantuotteesta kuin GINI-kertoimistakin. Tiedon saaminen vertailukelpoiseen muotoon vaati jonkin verran operointia ja laskemista; jaoin esimerkiksi rikosten määrän aina kyseisen provinssin kokonaisväkimäärällä, jotta analyysini tulokset eivät kärsisi mittakaavavirheistä. Samalla tutustuin kahden itselleni entuudestaan tuntemattoman indeksin ominaisuuksiin, jotka esittelen seuraavaksi lyhyesti:

  • NBI-indeksi (Unsatisfied Basic Needs) on köyhyyttä ja tyydyttämättä jääneitä perustarpeita indikoiva luku, joka huomioi asumisoloihin (mm lämmitysjärjestelmän puutteet, käytössä oleva pinta-ala asukasta kohden), sanitaatioon ja puhtaan veden saatavuuteen, koulutuksen tasoon ja työllisyyteen liittyvät seikat. Koska tietoa oli saatavilla vain NBI-talouksissa asuvien absoluuttisista määristä provinsseittain, olen analyysejäni ja karttaani varten muuttanut NBI-talouksissa asuvien absoluuttiset määrät prosentuaalisiksi osuuksiksi provinssien kokonaisväkimääristä. NBI-indeksistä voi lukea lisää täältä.
  • GINI-kerroin on tulonjakoa kuvaava mittari, joka kuvaa tuloerojen äärevyyttä asteikolla nollasta yhteen. Tämä tarkoittaa, että täydellisen tasaisessa tulonjaossa GINI:n arvo on 0 (kaikki saavat täsmälleen saman verran tuloja) ja maksimaalisen epätasaisessa tulonjaossa GINI:n arvo on 1 (yksi henkilö saa kaikki tulot). GINI lasketaan asettamalla havaintoarvot suuruusjärjestykseen, minkä jälkeen ne jaetaan esimerkiksi desiileihin tai kvintiileihin. Tämän jälkeen kunkin lohkon arvo suhteutetaan kaikkien arvojen kokonaissummaan. GINI-kertoimen matemaattisesta perustasta voi lukea lisää täältä.
File:Economics Gini coefficient2.svg


Kuva 1. Graafinen esitys GINI-indeksin muodostumisesta (Lorenzin käyrä). Kuviossa x-akseli muodostuu tulonsaajien kumulatiivisesta määrästä siten, että tulot kasvavat järjestyksessä vasemmalta oikealle. Y-akseli taas muodostuu tulojen kumulatiivisesta määrästä, ja yksittäisten tuloerien arvot kasvavat alhaalta ylöspäin. Kuviossa GINI:n arvo muodostuu lausekkeesta A/(A+B).
Lähde: Wikipedia, 2014

Pienen operoinnin jälkeen vein uteliaisuudesta taulukot SPSS:sään, jossa tein muuttujilla regressioanalyysejä. Suurin osa muuttujista ei korreloinut Pearsonin kertoimen mukaan ollenkaan: tällaisia olivat esimerkiksi rikollisuus ja työttömyysaste (korrelaatio vaivaiset 0,2; merkitsevyystaso 20 %) sekä rikollisuus ja NBI-indeksi (korrelaatio vaivaiset 0,05; merkitsevyystaso 79 %). Yllättäjäksi nousi kuitenkin GINI-indeksin ja rikollisuuden välinen riippuvuus: näiden kahden korrelaatiokerroin oli 0,5 ja tuloskin tilastollisesti merkittävä (merkitsevyystaso 2 %). Päätin siis valita pääteemoikseni epätasaisen tulonjaon indeksin sekä sen suhteen rikollisuuden alueelliseen esiintyvyyteen.


Kuva 2. Hajontakuvio Argentiinan provinssien sijoittumisesta GINI-kertoimen ja rikollisuuden suhteellisen määrän mukaan.

Vaikka korrelaatio ei ole suuren suuri, se on kuitenkin huomattava ja tilastollisesti merkittävä. Hajontadiagrammista voi erottaa kaksi selkeästi muista poikkeavaa havaintopistettä eli provinssia, joiden poikkeavuus pienentää kokonaiskorrelaatiota – ilman näitä kahta korrelaatio olisi siis jopa suurempi. Analyysini perusteella voisikin siis pikaisesti päätellä, että köyhyyden ja työttömyyden sijaan rikollisuutta selittääkin eriarvoisuus: mitä suuremmat ovat tuloerot, sitä enemmän rikollisuutta ja päinvastoin. Mielestäni tulos on looginen: köyhässä mutta tulonjaoltaan tasaisessa yhteisössä rikollisilla toimilla tuskin saa kasvatettua elintasoaan merkittävästi, sillä rikoksen kohteena ovat tällöin ne samat niukat resurssit, joilla koko yhteisö tulee toimeen. Sen sijaan suurten tuloerojen määrittämässä yhteisössä köyhän on rikollisuudella mahdollista tienata enemmän, sillä kohteeksi voidaan valikoida vauraimmat yksilöt ja toiminnasta tulee kannattavampaa. Tässä kohtaa voinen kuitenkin todeta, ettei analyysini tulos ole tilastollisesta merkittävyydestään huolimatta tieteellisesti mistään kotoisin, sillä tilastollinen riippuvuus ei kerro suoraan ilmiöiden välisestä kausaalisuhteesta. Lisäksi otokseni on pieni, käyttämäni tilastot vanhoja ja paikallistuntemukseni huonoakin huonompi. Kartalta tekemäni päätelmät eivät siis perustu asiantuntijuuteen vaan puhtaaseen mutuun sekä yhteen tieteelliseen artikkeliin, joka esittelee rikollisuuden syitä ja esiintyvyyttä Argentiinan provinsseissa (Cerro, A; Andres, A; 2011).

Lopullista karttaani varten sidoin netistä hakemani pohjakartan koordinaatistoon, piirsin Argentiinan provinssit, nimesin piirtämäni alueobjektit, toin excelistä tarvittavan tiedon MapInfoon ja yhdistin sen piirtämieni alueobjektien sarakkeisiin. Kaikista pisimmän ajan vei kuitenkin visualisoiminen, sillä halusin lopullisen, viimeisen karttaesitykseni olevan tähän mennessä tekemistäni paras. Esitettäviksi muuttujiksi valitsin NBI-indeksin, GINI-kertoimen ja tietoon tulleiden rikosten määrän suhteutettuna kunkin provinssin väkilukuun. Koska kolmen muuttujan kartasta olisi tullut yksi epäinformatiivinen sotku, tein yhden sijaan kaksi karttaa, jotka esittävät yhteensä kolmea muuttujaa. Lisäksi kaikkien kolmen änkeminen yhteen karttapohjaan olisi ollut epätarkoituksenmukaista, sillä Pearson-analyysini mukaan NBI ei korreloinut GINI:n tai rikollisuuden kanssa ollenkaan. Tarkoituksenani onkin esittää näiden karttojen avulla juuri kahden, keskenään korreloivan ilmiön suhdetta kolmanteen ilmiöön, jolla ei ole kahden edellisen kanssa suoraa tilastollista riippuvuutta.

Lopputyö_valmis2


Kuva 3. Karttaesitys Argentiinan NBI- ja GINI-indekseistä sekä rikollisuuden alueellisesta esiintyvyydestä. Vasemmanpuoleinen kartta kuvaa NBI-talouksissa asuvien prosentuaalista osuutta provinssin kokonaisväkimäärästä punaisen ja keltaisen sävyin. Oikeanpuoleisen kartan rasterisävyt taas kuvaavat provinssien GINI-arvoja, ja mustat pallot kuvaavat tietoon tulleiden rikosten määriä suhteutettuna provinssin väkilukuun.

Karttaesityksestä rikollisuuden ja eriarvoisuuden korrelaatiota ei juuri voi lukea (vaikka sellainen onkin olemassa), ja mitään selkeää alueellista järjestymistä tai ryhmittymistä ei kummankaan ilmiön kohdalla ole havaittavissa. Sen sijaan NBI-indeksiä kuvaava vasemmanpuoleinen kartta tuo hyvin esiin alueelliset, suhteelliset erot vaurauden jakautumisessa, ja kartta vaalenee etelää kohti lähes portaittain. Pohjoisen provinsseissa asuu siis suhteellisesti enemmän köyhää väestöä kuin etelän provinsseissa. Tulosten varsinaiseen selittämiseen ei paikallistuntemukseni yksinkertaisesti riitä, joten jätän syiden pohtimisen astetta asiantuntevammalle (hieman vähemmän mutua ja enemmän asiaa voinee tehdä blogilleni oikein hyvää). Aihe on kuitenkin tärkeä ja mielenkiintoinen, ja tulen varmasti perehtymään siihen vielä lisää muissa yhteyksissä.

Karttaesitykseni visuaaliseen ilmeeseen ja havainnollisuuteen olen kokonaisuudessaan tyytyväinen, mutta puutteitakin löytyy: kartoista puuttuu orientaatio eli pohjoisnuoli, mikä heikentää esityksen informaatioarvoa vaikka indeksikarttani antaneekin osviittaa pohjoisen mahdollisesta suunnasta. Suurimmat puutteet ovat kuitenkin otsikon puuttuminen (se ei vain mahtunut karttaikkunaan!) ja graduated-pistesymbolien selitteen kämmi: olen unohtanut selitteestä tiedon, että mustien palluroiden saamat arvot (15, 7.5, 1.5) on saatu kertomalla väkilukuun suhteutettu rikosten määrä sadalla. Nyt pistearvot ovat siis lukijalle pelkkää hepreaa. Jälkeenpäin ajateltuna arvot olisivat muutenkin voineet olla havainnollisemmat – jos vielä saisin vaihtaa, esittäisin ne tietoon tulleiden rikosten määränä tuhatta asukasta kohti.

Lopuksi haluan vielä sanoa, että muiden opiskelijoiden kurssiblogien seuraaminen on ollut hieno kokemus ja oppimiseni kannalta ensiarvoisen tärkeää. Kurssin hienoin puoli on ollut vuorovaikutteisessa, keskustelevassa ja ideoita jakavassa oppimisessa sekä sen todistamisessa, kuinka lahjakasta ja fiksua porukkaa laitoksellamme opiskelee. Taidanpa olla eksynyt itseäni parempaan seuraan! Sen kunniaksi haluankin täydellistää tämän imelän loppukaneetin viimeisellä pakollisella viittauksella kurssitoveriini Tiia Seeveen, joka on tiivistänyt kurssin loppufiilikset blogissaan suorastaan oivallisen ytimekkäästi:

“Jes jes! Karttoja!”

Niinpä.

Jes!

 

Lähteet:

Andres, A; Cerro, A (2011). Typologies of Crime in the Argentine Provinces. A Panel Study 2000-2008. <http://mpra.ub.uni-muenchen.de/44460/1/MPRA_paper_44460.pdf> Viitattu 12.3.2014.

I N D E C (2014). Statistical Yearbook of the Argentine Republic. <http://www.indec.mecon.ar/default.htm>. Viitattu 5.3.2014.

IELDE – Instituto de Estudios Laborales y del Desarrollo Economico (2014). Stats: Income and earnings. <http://www.indec.mecon.ar/default.htm> Viitattu 5.3.2014.

Seeve, T. (2014). Kurssikerta 7: It’s the final countdown! Blog-blog-blooog-blooog! Blog-blog-blog-blog-blooog! <https://blogs.helsinki.fi/setiseti/2014/02/28/kurssikerta-7-its-the-final-countdown-blog-blog-blooog-blooog-blog-blog-blog-blog-blooog/> Viitattu 14.3.2014.

The World Bank (2014). Urban population (% of total). <http://data.worldbank.org/indicator/SP.URB.TOTL.IN.ZS> Viitattu 12.3.2014.

UNDP (2014). Unsatisfied Basic Needs Method. <http://www.undp.org.lb/programme/pro-poor/poverty/povertyinlebanon/molc/methodological/C/basicsneed.htm> Viitattu 12.3.2014.

Wikipedia (2014). Gini coefficient. <http://en.wikipedia.org/wiki/Gini_coefficient> Viitattu 12.3.2014.

 

Lisätehtävä: SWOT-analyysi “Mapping America: Every City, Every Block” -paikkatietopalvelusta

Mapping America: Every City, Every Block on New York Timesin ylläpitämä paikkatietopalvelu, joka sisältää dataa USA:n demografisista ja sosioekonomisista piirteistä piirikuntatasolta (county) aina kortteliryhmistä muodostuviin yksiköihin (census tract) asti. Palvelussa voi valita tarkasteluun yhden karttateeman kerrallaan, ja tarkasteltavien yksiköiden koko muuttuu lähemmäs tai kauemmas zoomatessa. Karttakategorioita on yhteensä neljä, ja jokaisen kategorian alla on useampia erikseen tarkasteltavia teemoja.

SWOT-analyysi on menetelmä, jolla arvioidaan tutkittavan tahon (kuten yrityksen tai palvelun) sekä sisäisiä että ulkoisia heikkouksia ja vahvuuksia. Käsite SWOT on lyhenne sanoista Strengths, Weaknesses, Opportunities and Threats. Analyysissä näistä sanoista muodostetaan nelikenttä, johon arviot kultakin osa-alueelta syötetään. SWOT on siis hyvin yksinkertainen mutta käytännöllinen työkalu stategisessa ongelmien ja vahvuuksien tunnistamisessa, ja sitä voidaan käyttää esimerkiksi yrityksen toiminnan yleisluontoiseen analysointiin ja kehittämisideointiin.

SWOT-analyysi Every City, Every Block -paikkatietopalvelusta

Sisäiset vahvuudet:

  • Data on avointa, ja palveluun ja sen tietoihin pääsevät käsiksi kaikki tietokoneelliset ja internet-yhteydelliset heput.
  • Sovellus on helppokäyttöinen ja kartat selkeitä ja helppolukuisia.
  • Alueellisten erojen tarkastelussa karttapalvelu on avointa tilastotietokantaa käytännöllisempi, havainnollistavampi ja houkuttelevampi.
  • Sivuston kartat sisältävät tietoa suhteellisen kattavasti mm. etnisyyteen, tulotasoon ja alueiden rahalliseen arvostukseen liittyvistä teemoista.
  • Tietoa on tarjolla monella tasolla: palvelun karttoja voi tarkastella joko piirikunta- tai kortteliryhmätasolla zoomauksesta riippuen.
  • Hiiren osoittimella saa myös paikkakohtaista, eksaktia tilastotietoa alueyksiköistä zoomauksen asteesta riippuen joko piirikunta- tai kortteliryhmätasolla. Esimerkiksi asuntojen vuokrien mediaanihintoja ja muutosprosentteja tai eri tuloluokkien prosentuaalisia osuuksia voi tarkastella eri kokoisilla alueyksiköillä muuttamalla zoomausta ja siirtämällä osoitinta sen alueen päälle, jolta numerotietoa halutaan. Näin legenda on onnistuttu perinteisen, sivussa näkyvän legendan lisäksi upottamaan karttaan tyylikkäästi ja käytännöllisesti.
  • Sivuston visuaalinen ilme on tyylikäs ja houkutteleva.

Sisäiset heikkoudet:

  • Käyttäjä ei voi itse hallita layereita ja tehdä päällekkäistarkasteluja tai valikoida esitettäviä muuttujia, vaan kartat ovat palvelussa valmiiksi visualisoituina ja yksittäin tarkasteltavina. Lisäksi suurin osa muuttujista on sidottu yhteen esitystapaan, eikä käyttäjä voi itse valikoida muuttujan osalta, esitetäänkö se esim. koropleettikarttana vai pistekarttana.Tämä rajoittaa palvelun käyttömahdollisuuksia huomattavasti.
  • Datan määrä on kokonaisuudessaan vähäistä ja tarkasteltavia teemoja on tarjolla vain vähän.
  • Tiedot perustuvat alueilta otettuihin ja otannan mukaan yleistettyihin näytteisiin, eli tietojen luotettavuus on hieman kyseenalainen. Katsoja kuitenkin erehtynee helposti luulemaan tietoa eksaktiksi, sillä esimerkiksi rotuun liittyvissä pistekartoissa tieto on esitetty hämmästyttävänkin yksityiskohtaisesti.
  • Esitetyn tiedon tarkkuus vaihtelee karttaesitysten sisällä: osa kortteliryhmistä on huomattavasti toisia kortteliryhmiä suurempia, ja varsinkin pienemmistä kaupungeista tietoa on tarjolla huomattavasti vähemmän kuin suuremmista kaupungeista.
  • Koska tieto on sidottu kiinteästi karttoihin eikä varsinaisia tilastoja ole palvelussa saatavilla, aineistoa ei voi tarkastella taulukkotasolla. Käyttäjä ei siis voi itse tehdä tilastollisia, laskennallisia analyysejä palvelun pohjana olevista tietokannoista.
  • Tieto soveltuu huonosti tutkimuskäyttöön juurikin sen arvioihin perustuvan luonteen sekä kopiointimahdollisuuksien puuttumisen takia.

Ulkoiset mahdollisuudet:

  • Palvelu on hyvällä pohjalla ja nimekkään tahon ylläpitämä, ja kehittämällä siitä voisi helposti saada kattavan ja monipuolisen. Tämä lisäisi varmasti palvelun kysyntää kansainvälisestikin.
  • Kysyntä tämäntyyppisille sovelluksille on jo valmiiksi laajaa ja nopeasti kasvavaa, joten kasvumahdollisuuksia löytynee.
  • Yrittäjälle tai yksityishenkilölle palvelu tarjoaa oivallisen työkalun esim. toimipaikan tai asuinpaikan valintaan liittyvissä kysymyksissä, ja lisäksi palvelusta hyötyvät toimittajat, opettajat, mainostajat, asuntosijoittajat ja yhteiskunnalliset vaikuttajat.
  • Opetuskäytössä palvelu olisi suorastaan oivallinen, jos sitä vielä kehitettäisiin.

Ulkoiset uhat:

  • Avoimesti saatavilla oleva rotuja ja tuloluokkia koskeva data saattaa kiihdyttää alueiden segregaatiota, kun ihmiset pääsevät helposti ja keskitetysti arvioimaan eri alueiden sosiodemografisia piirteitä.
  • Kartoilta tehdyt päätelmät voivat johtaa joidenkin alueiden maineen heikkenemiseen, mikä kurjistaa alueen asemaa entisestään.
  • Ihmisten yksityisyydensuoja kärsii, kun tietoa on saatavilla jopa korttelikohtaisesti.
  • Palvelua voidaan käyttää myös rikollisiin tarkoituksiin. (Esim. rikkaiden asuntoihin kohdistuvat asuntomurrot.)
  • Viharikokset ja terrorismi saattavat lisääntyä palvelun avoimuuden myötä. Karttapalvelussa esitetään useiden etnisten- ja vähemmistöryhmien (esimerkiksi homoseksuaalien) osuuksia väestöstä jopa korttelitasolla, mikä saattaa olla uhka joidenkin vähemmistöryhmien turvallisuudelle.
  • Asuntojen arvoon ja vuokrahintoihin liittyvä avoimesti saatavilla oleva tieto saattaa kiihdyttää asuntojen hintakuplan syntymistä alueilla, joille on jo valmiiksi paljon kysyntää. Kiinteistöjen keskimääräinen arvonmuutos on esitetty eri asuinalueilla jopa korttelitasolla, mikä voi lisätä spekulaatiota ja kasvattaa kalliiden asuinalueiden sijoituskysyntää.

Verrattuna suomalaisiin avoimiin tilasto- ja paikkatietopalveluihin tiedon määrä on vähäisempää ja yleistetympää mutta helpommin saatavilla. Mielestäni on järkevää, että osoitekohtainen tilastodata ei ole kaikkien saatavilla, sillä ihmisten yksityisyyttä tulee suojata. Yleistetty, esimerkiksi kunta- tai pienaluetasoinen väestöllisiä muuttujia kuvaava paikkatietopalvelu olisi kuitenkin tilastokeskuksen taulukkomuotoisen vapaan tilastodatan rinnalle loistava lisä.

Lähteet:

New York Times (2014). Mapping America: Every City, Every Block. <http://projects.nytimes.com/census/2010/explorer> Viitattu 2.3.2014.

Kurssikerta 6: Geokoodaamaan!

Kuudennella kurssikerralla opimme, kuinka pistedata sidotaan karttakoordinaatistoon tai muuhun sijaintitietojärjestelmään (esim. katuosoitteet ja postinumerot) ja saadaan sijoitettua kartalle. Aivan aluksi pääsimme itse keräämään pisteaineistoa Kumpulan ympäristöstä pienryhmissä GPS-paikantimia apunamme käyttäen. Oma ryhmäni keräsi kampuksen ympäristön pyörätelineiden koordinaatteja ja tietoa siitä, kuinka monta pyörää kuhunkin telineeseen oli jätetty. Reippailun jälkeen pääsimme kurssikerran aiheen ytimeen eli harjoittelemaan MapInfon “create points” ja “geocode” -toimintojen käyttöä keräämiemme koordinaattipisteiden avulla. Toimintojen eroista sen verran, että create points -toiminnolla voidaan sijoittaa kartalle kordinaatteihin sidottua tietoa, kun geocode -toiminnolla taas pisteet voidaan sijoittaa kartalle myös muun sijaintitiedon (esim. katuosoite) perusteella. Hankalinta create points -toiminnon käytössä oli karttakoordinaattijärjestelmän valinta, jonka avulla pisteet sijoitettiin. Täytyy siis ilmeisesti vielä kerrata koordinaattijärjestelmien eroja, jotta välttyy ensi kerralla turhalta päänraapimiselta.

Opastusta seurasi jälleen itsenäisharjoitus, joka jatkoi saman teeman käsittelyä. Tehtävänä oli hakea netistä valmis pistetietokanta tulivuorenpurkauksista, maanjäristyksistä tai meteoriittitörmäyksistä ja kokeilla eri hauin saatujen tietokantojen koodaamista kartalle. Itse valitsin aineistokseni vuoden 1964 jälkeen purkautuneet tulivuoret ja 1964 jälkeen sattuneet maanjäristykset. Tuotin yhteensä neljä karttaa, joista valitsin esitettäväksi kaksi. Alla olevista kartoista ylemmässä kuvautuvat maanjäristysherkät alueet ja alemmassa olen liittänyt tulivuoritietokannan pisteet maanjäristysaineiston päälle.

Maanjäristykset

Kuva 1. Kartta vuoden 1964 jälkeen tapahtuneista maanjäristyksistä.

Maanjäristykset ja tulivuoret 1964 jälk

Kuva 2. Kartta maanjäristysalttiista alueista ja aktiivisista tulivuorista. Oranssina näkyvät vuoden 1964 jälkeen tapahtuneet maanjäristykset ja punaisina kolmioina vuoden 1964 jälkeen purkautuneet tulivuoret.

Ongelmallista pistedatan visualisoinnissa on se, että tiheimpien esiintymien alueilla pisteet menevät päällekkäin. Pisteiden päällekkäisyyttä taas on kartalta vaikea havaita, eivätkä tiheimmät esiintymät siksi näytä juuri eroavan keskimääräisen tiheyden alueista. Mielestäni Joose Helle on päätynyt tämän ongelman tiimoilta suorastaan oivalliseen ratkaisuun: hän on pistekartan sijaan syöttänyt aineistonsa korologiseen matriisiin ja luonut maanjäristysaineistosta ruututeemakartan. Alueluokituskarttana se tuo alueiden väliset erot järistysten esiintymistiheydessä oivallisesti esiin.

Alla (kuva 3) on Planetolog -sivustolta löytämäni kartta viimeisimmistä maanjäristyksistä ja tulivuorenpurkauksista. Kartassa maanjäristys- ja tulivuoripisteet sijoittuvat hyvin samalla tavalla kuin omassani, mutta projektio on erilainen – oman karttani pohjana on sovellettu Robinsonin projektio, kun taas alla olevaan karttaan on valittu oikeakulmainen mutta pinta-aloja vääristävä Mercatorin projektio. Projektiot on myös keskitetty eri tavoin: omassa kartassani y-akselina toimii 0-pituuspiiri kun taas alla olevassa y-akseliksi on valittu 100°W eli Pohjois-Amerikan leikkaava pituuspiiri. Mielestäni alla olevan kartan projektio- ja keskittämisvalinnat ovat oman karttani vastaavia huomattavasti paremmat tulivuori- ja maanjäristysteeman havainnollistamisessa. Alla olevassa kartassa Tyynenmeren tulirengas kuvautuu paremmin ja muutenkin seismisen ja vulkaanisen  aktiivisuuden “nauhamaisuus” eli yhteys mannerlaattojen rajoihin korostuu paremmin kuin omassa kartassani. Opetuskäyttöön valitsisin siis alla olevan kartan, sillä se kuvastaa riippuvuutta mielestäni omaa karttaani paremmin. Lisäksi on virkistävää ja oppilaiden maailmankuvan kehittymisen kannalta tärkeää käyttää opetuksessa erilaisia ja eri tavoin keskitettyjä projektioita, sillä se kehittää sekä oppilaiden kartografista lukutaitoa että kriittistä visuaalista tulkintakykyä.

Map of recent earthquakes and volcanic eruptions of the world

Kuva 3. Planetolog -sivuston kartta viimeisimmistä maanjäristyksistä ja tulivuorenpurkauksista. Kartan projektio on oikeakulmainen Mercatorin projektio, ja keskimeridiaanina toimii pituuspiiri 100°W.

Netissä seikkaillessani löysin lisäksi hienon, WGBH Educational Foundationin ylläpitämän interaktiivisen karttasovelluksen, jossa käyttäjä voi tarkastella mannerlaattareunojen ja seismisesti ja vulkaanisesti aktiivisten alueiden päällekkäisyyttä säätelemällä itse kartalla esitettäviä tasoja (kuva 4, alla). Sovellusta pääsee käyttämään tästä. Soisin interaktiivisia karttoja käytettävän opetuksessa useamminkin, sillä ne antavat oppilaille mahdollisuuden kokeilla, tutkia ja soveltaa opetettua paremmin kuin tavalliset paperikartat. Tämä kuitenkin vaatisi myös teknisten sovellusten käytön lisäämistä opetuksessa, mihin kouluilla valitettavan harvoin on resursseja.

maanjäristykset_leikattu

Kuva 4. Screenshot interaktiivisesta seismologiaa, laattatektoniikkaa ja vulkanismia käsittelevästä karttasovelluksesta. Sovellukseen pääsee tästä.

Lähteet:

Helle, J (2014). KK6 ja seikkailu kentällä. <https://blogs.helsinki.fi/joohelle/2014/02/21/kk6-ja-seikkailu-kentalla/> Viitattu 1.3.2014.

NCEDC (2014). Northern California Earthquake Data Center. <http://quake.geo.berkeley.edu/anss/catalog-search.html>. Viitattu 1.3.2014.

NOAA (2014). Global Volcano Locations Database. <http://catalog.data.gov/dataset/global-volcano-locations-database>. Viitattu 1.3.2014.

WGBH Educational Foundation (2006). Tectonic plates, earthquakes, and volcanoes. <http://www.pbslearningmedia.org/asset/ess05_int_tectonic/> Viitattu 1.3.2014.

Planetolog.com (2014). Map of recent earthquakes and volcanic eruptions of the world. <http://planetolog.com/map-world-detail.php?type=TEC&id=1> Viitattu 1.3.2014.

5. kurssikerta: Bufferointia, hikeä ja innostusta!

Viides kurssikerta oli mielestäni tähän mennessä hauskin ja innostavin, sillä pääsimme lyhyen bufferianalyysiperehdytyksen jälkeen testaamaan taitojamme MapInfon käytössä itsenäisten ja soveltavien analyysiharjoitusten avulla. Harjoitukset olivat juuri sopivan haastavia ja monipuolisia ollakseen mielenkiintoisia, ja ne kokosivat ja yhdistelivät kurssilla aikaisemmin harjoiteltua soveltavaksi kertauspaketiksi. Parasta oli, että tehtävärakenteet sallivat luovan päättelyn ja kokeilemisen, sillä erehtyminen, pähkäily ja oivallukset ovat valttia syvällisessä ja tutkivassa oppimisprosessissa.

Bufferi- eli naapuruusanalyysi on laskennallinen analyysitapa, jossa bufferoitavan kohteen ympäriltä lasketaan tietyn etäisyyden päässä olevat pisteet. Näiden pisteiden ja kohteen väliin muodostuvalta vyöhykkeeltä voidaan laskea erilaisia arvoja esimerkiksi asukaslukuun, infrastruktuuriin tai vaikkapa maankäyttöön liittyen. Yksi yleisimmistä bufferianalyysin hyödyntämistavoista liittyy riskien ja haittojen alueellisen ulottuvuuden kartoittamiseen: bufferianalyysin avulla voidaan luoda kohteen (esim. joki) ympärille halutun kokoinen vyöhyke (esim. kohonneen tulvariskin alueet), ja tämän jälkeen selvittää laskennallisesti vaikkapa riskivyöhykkeen alle jäävien alueiden väestöllisiä ominaispiirteitä. Tämän lisäksi bufferianalyysillä voidaan tutkia esimerkiksi päästöille tai melulle altistuvia alueita moottoritien lähiympäristössä, kuuluvuutta, yrityksen potentiaalisen toimipaikan läheisyydessä asuvien ja kohderyhmään kuuluvien asiakkaiden määrää tai vaikka luonnonsuojelualueen ja viljellyn alueen väliin jäävän siirtymävyöhykkeen biologista monimuotoisuutta. Analyysitavan huono puoli on sen yksiuloitteisuus: se mittaa ainoastaan horisontaalista etäisyyttä kohteesta jättäen huomiotta mm. vertikaalisen ulottuvuuden sekä sen, että bufferin sisäpuolelle jäävät alueet ovat harvoin homogeenisia. Säteen sisäpuolelle voi jäädä hyvinkin erilaisia alueita, ja esimerkiksi maastonkorkeuden vaihtelut vaikuttavat tulvaherkkyyteen ja kuuluvuuteen merkittävästi. Säteen perusteella muodostettu bufferi kuitenkin laskee saman tulvaherkkyysalueen sisään sekä alavat että korkeammat alueet, vaikka todellisuudessa alueet eivät käyttäydy tulvan sattuessa samalla tavalla. Tulvaherkkyyttä tarkasteltaessa jonkinlainen korkeusmallia myötäilevä spatiaalinen analyysi olisikin bufferointia parempi vaihtoehto.

Kurssikerran itsenäisesti suoritettavat tehtävät koostuivat bufferoimisesta, tietokantojen muokkaamisesta, kyselyistä, piirtämisestä, mittaamisesta ja laskutehtävistä. Alla on taulukoitu vastaukseni tehtävämonisteen kysymyksiin:

Kysymys Vastaus
Malmin lentokenttä
a) 1 km etäisyydellä asuvien määrä 8239
b) 2 km etäisyydellä asuvien määrä 53092
Helsinki -Vantaa
a) alle 2 km etäisyydellä asuvien määrä 9241
b) yli 65 dB melualueella asuvien määrä % 0,32 %
c) vähintään 55 dB melualueella asuvien määrä 11370
d) Tikkurilan hypoteettisella melualueella suvien määrä 12583
2. Asemat
a) alle 500 m päässä asuvien määrä 80576
b) alle 500 m päässä asuvien % osuus 16,80 %
c) työikäisten % osuus a-kohdan asukkaista 71,30 %
Itsenäistehtävä 2
a)Taajamissa asuvien % -osuus 86,40 %
b) taajamien ulkopuolella asuvien kouluikäisten määrä 7536 eli 15%
c) ulkomaalaisten osuus
Yli 10 % 19
Yli 20 % 5
Yli 30% 4
4.Uima-altaat
Pääkaupunkiseudulla uima-altaita yhteensä 856
Kuinka paljon asukkaita sellaisissa taloissa, joissa uima-allas? 12687
Kuinka moni taloista on
a) omakotitaloja 336
b) paritaloja 158
c) rivitaloja 114
d) kerrostaloja 186
Kuinka monessa talossa enemmän kuin 1 allas? 0
Uima-allasrikkaimmat alueet
1) Länsi-Pakila 52 allasta
2) Lauttasaari 51 allasta
3) Marjaniemi 46 allasta

Valinnaiseksi tehtäväkseni valitsin tutkia uima-altaiden määrää ja alueellista jakautumista pääkaupunkiseudulla (vastaustaulukon itsenäistehtävä 4). Kyselyiden pohjalta tuli tehdä uima-altaiden määrää pienalueittain pylväsdiagrammeina ja absoluuttisina lukuarvoina kuvaava teemakartta (kuva 1). Tein kartan ohjeistuksen mukaan. Siitä tuli kuitenkin niin sekava ja sotkuinen, että päädyin poistamaan kaikki alle 10 jäävät numeroarvot kartalta. Niinpä karttani esittääkin vain kaikista uima-allasrikkaimpien pienalueiden allasmäärien absoluuttiset arvot. Pylväät jätin myös pienimpiä arvoja saaville pienalueille, mutta nolla-arvoja saavilta alueilta poistin sekä pylväät että numeroarvot.

Uima-altaiden määrä pks

Kuva 1. Uima-altaiden määrä pääkaupunkiseudulla pienalueittain.

Korostin absoluuttisia arvoja kirkkaanpunaisella, sillä ne eivät olisi muutoin erottuneet kartalta ollenkaan. Mielestäni kartta on edelleen epäesteettinen ja epähavainnollinen. Ilkka Saarinen ja Niklas Aalto-Setälä ovat päätyneet omien karttojensa osalta mielestäni toimivaan ratkaisuun: molemmat ovat päättäneet pienin vapauksin tehdä kartastaan absoluuttisia arvoja kuvaavan koropleettikartan pylväsdiagrammikartan sijaan. Vaikka absoluuttisia arvoja ei normaalisti tulisi esittää koropleettikartalla, on ratkaisu tässä tapauksessa havainnollinen ja toimiva, sillä tarkoituksena on vain näyttää kartalla uima-allasrikkaimmat pienalueet. Jos uima-altaiden määrä olisi esitetty suhteellisena lukuna jakamalla altaiden määrä asukasmäärällä, olisi kartoista tullut esiin toisenlainen ulottuvuus. Suhteelliset arvot olisivat saattaneet kuitenkin jättää kaikista uima-allasrikkaimmatkin alueet alimpaan luokkaan keskimääräistä suuremman asukasmäärän pienalueilla. Tämä olisi puolestaan kadottanut kartan alkuperäisen tarkoituksen, joten absoluuttisten arvojen käyttäminen on mielestäni ollut tässä tapauksessa todella perusteltua. Lisäksi koropleettikarttojen ulkoasu on katsojaystävällinen ja helppolukuinen, kun taas pylväskartastani on vaikea hahmottaa, mille alueelle kukin pylväs kuuluu.

Koen, että perustaitoni MapInfon käytössä alkavat olla jo kohtalaisen hyvät. Vaikka ongelmatilanteitakin tulee, itsenäinen työskentely tuntuu sujuvan suhteellisen mukavasti. Alun turhautuminen on vaihtunut kokeilevaan oikean työkalun etsimiseen (ja nettitutoriaalin selaamiseen, heh). Parhaiten koen hallitsevani erilaiset kyselyt (query) ja tietokantojen päivittämisen, vaikkakin sarakkeen tyypin valinta sekä datan tuontimuoto (value, sum, avg…) on välillä tuottanut päänvaivaa. Vastaan tulee myös jatkuvasti toimintoja, joita en ole vielä käyttänyt, ja monissa valintaikkunoissa on kohtia, joissa on valintana valmiiksi jokin automaattinen oletus. Näihin kohtiin ei ole tullut edes koskettua, ellei niiden käyttöön ole ollut selvää ohjeistusta. Tuntuu hieman häiritsevältä, että useinkin käyttämieni työkalujen valintaikkunoissa on valintamahdollisuuksia, joiden merkitystä en ole tullut tutkineeksi. Ehkäpä pääsen perehtymään niihin tarkemmin vielä ennen kurssin loppumista.

Lähteet:

Aalto-Setälä, N (2014). Kerta 5. Bufferoimaan Mars! <https://blogs.helsinki.fi/niklasaa/2014/02/15/kerta-5-bufferoimaan-mars/> Viitattu 24.2.2014

Saarinen, I (2014). KK5 – Larppausta ja menneitä aikoja. <https://blogs.helsinki.fi/ilkkasaa/2014/02/13/kk-5-larppausta-ja-menneita-aikoja/> Viitattu 24.2.2014.

4. kurssikerta: Ruutua pukkaa!

Neljännellä kurssikerralla opettelimme ruututeemakarttojen tekemistä MapInfolla. Ruututeemakartoissa aineisto esitetään korologisella matriisilla eli koordinaatistoon sidotulla ruudukolla, jonka yksikköjen koko on vakioitu johonkin tiettyyn mittaan. Esitystavan ehdoton etu on se, että ruudukolla tietoa voidaan esittää yhtä aikaa sekä laaja-alaisesti että paikkatarkasti: ruutukartta on kuin tasakokoisiin ja pieniin yksiköihin pilkottu koropleettikartta, joka antaa yksityiskohtaista tietoa ilmiön esiintymistiheydestä ja alueellisesta jakautumisesta. Ruutukartta on kuitenkin usein koropleettikarttaa yksityiskohtaisempi ja paikkatarkempi, sillä sen yksiköt ovat tyypillisesti paljon koropleettikartan hallinnollisiin rajoihin perustuvia alueyksiköitä pienempiä. Tällöin ne myös kuvaavat ilmiön esiintymistä ja tiheyttä suhteessa eksaktiin sijaintiin koropleettikarttaa paremmin. Toisaalta ruutujako on ilmiöiden esiintymisen kannalta aivan yhtä teennäinen kuin hallinnollinenkin aluejako, ja liian suurella tai pienellä ruutukoolla voi kartasta tulla joko liian yleistetty tai aivan liian pikkutarkka. Loppujen lopuksi tässäkin esitystavassa informatiivisuus on siis täysin kartanlaatijan valinnoista kiinni.

Päädyin kokeilemaan väestöaiheisella teemakartallani kahta ruutukokoa. Ensin kokeilin pienempää, 250 m x 250 m kokoisista yksiköistä koostuvaa ruudukkoa. Lopputulos oli kuitenkin huono, sillä liian pieniä ruutuja oli hankala erottaa toisistaan. Ongelmaa eivät juuri helpottaneet edes voimakkaat luokkavärit, sillä värit puuroutuivat ja muistuttivat lopulta enemmän pisterykelmää kuin ruudukkoa. Tein kartan valmiiksi aikoen julkaista sen malliesimerkkinä oikein perusteellisen huonosti toteutetusta ruututeemakartasta. Corelin kautta pyöräyttäminen ja jpg:ksi tallentaminen vääristivät kuitenkin kartan alkuperäisiä värejä paljon, eikä ruututeemaa enää juuri tunnistanut pikselimössöstä. Esitys oli loppujen lopuksi niin järkyttävän laaduton, että päätin säästää blogiani (toivottavasti) lukevat herkät ja viattomat opiskelijasielut törkeän kartografisen häirinnän aiheuttamilta sydämentykytyksiltä. Ehkäpä pääsemme niihin vielä myöhemmin.

Karttani teemaksi valitsin alle kouluikäisten eli 0-6 -vuotiaiden määrän pääkaupunkiseudulla. Loin karttaa varten uuden ruudukon, jonka yksiköiden kooksi valitsin 500 m x 500 m. Valinta osoittautui onnistuneeksi: se toi ruutumaisuuden hyvin esiin pitäen kartan samalla kuitenkin riittävän tarkkana ja yksityiskohtaisena. Kokoluokan 1000 m x 1000 m ruudut olisivat varmasti olleet jo liian suuria ja yleistäviä, sillä ne olisivat olleet pinta-alaltaan nelinkertaisia suhteessa nykyisiin ruutuihin. Luokittelussa päädyin käyttämään kvantiileja, sillä kuten allaolevasta histogrammista (kuva 1) näkyy, aineisto jakautui vinosti. Kokeilin myös muita luokittelutapoja, mutta ne tuntuivat olevan entistäkin huonompia alueellisten erojen realistisessa esiintuomisessa. Nyt käyttämässäni luokittelussa ongelmaksi muodostuu eri luokkien luokkavälien pituuden keskinäinen suuri vaihtelu: pienimmässä luokassa luokkaväli on huomattavasti pienempi kuin suurimmassa.

histogrammi kk4

Kuva 1. Histogrammi pääkaupunkiseudulla asuvien alle kouluikäisten määrästä 250 000 m² kokoisista ruutuyksiköistä koostuvalla matriisilla.

Lopulliseen karttaani (kuva 2) valitsin esitettäväksi ruutuaineiston lisäksi myös kuntarajat sekä suuralueet nimineen, jotta karttaa olisi helpompi tulkita ja ymmärtää. Kokeilin myös pienalueiden lisäämistä karttaesitykseen, mutta informaatioarvon kasvattamisen sijaan ne heikensivät sen luettavuutta. Myös Laura Hintsanen toteaa blogissaan pienalueiden lisäämisestä seuraavaa:

“Pienalueiden näkyminen kartalla teki esityksestä hyvin sotkuisen, eikä alueiden nimien sijoittamista kartalle voinut edes harkita. Suuralueiden avulla lukija pystyy hahmottamaan suurpiirteisesti myös pienempien alueiden sijainnin.”

Värien valinta tuotti jälleen ongelmia: koin, että riittävän erottuvien ja toisaalta liukuvasti muuttuvien värien sopivaa yhdistelmää oli vaikea löytää. Nyt karttaa katsoessani totean, että värit olisivat voineet olla voimakkaampiakin, sillä etenkin tummin luokka näyttää turhan haalealta. Mielestäni tällaisenaan kartan informaatioarvo on alueellisten erojen tarkastelun kannalta heikohko, sillä se kuvaa oikeastaan paremmin asutuksen yleistä jakautumista kuin lapsiperheiden suosimien alueiden sijoittumista. Kartalla kuvautuvat tummimpina tiheimmän asutuksen keskittymät eli käytännössä suuralueiden keskustat, joissa lapsiakin on luonnollisesti absoluuttisissa määrissä mitattuna eniten, vaikka lasten suhteellinen osuus asutuskeskittymän väestöstä olisikin pieni. Saman huomion on tehnyt blogissaan myös Natalia Erfving, jonka kartta havainnollistaa 1-6 -vuotiaiden määrää pääkaupunkiseudulla:

“- – jos ollaan kiinnostuneita vain siitä, missä lapsia on eniten, on tämä kartta hyvä tiedonlähde. Jos kuitenkin haluttaisiin tarkastella, että mitkä alueet  ovat  etenkin lapsiperheiden suosiossa, pitäisi lapsien määrä suhteuttaa väkilukuun. Näin näkyisi kuinka suuri osa väestöstä on lapsia, jolloin selviäisi, mitkä alueet koetaan esim. lapsiystävällisiksi. Absoluuttiset arvot ovat siis aina hiukan harhaanjohtavia kartoilla, joissa kuvataan jonkin ilmiön alueellista jakautumista.”

Kuten Nataliakin siis toteaa, on kartta oivallinen väline alle kouluikäisten lasten absoluuttisten määrien esittämiseen, mutta teemasta voisi tuoda esiin kiinnostavampiakin ulottuvuuksia suhteellisia arvoja hyödyntämällä. Kartoissamme on pieniä eroavaisuuksia, jotka liittyvät luokittelussa ja luokkamäärässä oleviin eroihin, mutta muuten kartat muistuttavat paljolti toisiaan. Mielestäni Natalian kartan sävyvalinta on onnistuneempi, sillä siinä eri luokat erottuvat paremmin kuin omassa kartassani. Oman karttani väriskaala on myös aivan liian lähellä merialueen sinistä sävyä.

Absoluuttisia arvoja esittävän kartan rajallisesta informaatioarvosta johtuen päädyin luomaan sen rinnalle suhteellisia arvoja kuvaavan kartan samasta aiheesta. Tämän tein jakamalla jokaisen ruudun alle kouluikäisten määrän kyseisen ruudun kokonaisväkimäärällä. Esitän kartat seuraavaksi peräkkäin, jotta niiden keskinäinen vertailu olisi mahdollisimman helppoa:

Uusi ruutukartta alle_kouluik

Kuva 2. Pääkaupunkiseudulla asuvien alle kouluikäisten lasten määrä absoluuttisina arvoina ruututeemakartalla. Kartan ruutukoko on 500 m x 500 m. Kuvassa suurimpia arvoja saavat suuret asutuskeskittymät eli käytännössä suuralueiden keskustat.

Kuva 3. Alle kouluikäisten lasten prosentuaalinen osuus väestöstä ruututeemakartalla esitettynä. Osuus on laskettu erikseen joka ruudulle jakamalla ruudun sisällä asuvien alle kouluikäisten määrä ruudun kokonaisväkimäärällä. Kartan ruutukoko on 500 m x 500 m. Tummina kuvautuvilla eli suurimpia arvoja saavilla alueilla lapsia on siis eniten suhteutettuna väkimäärään.

Huom! Jostain syystä kuva 3 on välillä kadonnut sivulta. Jos kuvaa ei näy, voit katsoa sen tästä linkistä: http://tinypic.com/view.php?pic=jtmdmw&s=8#.UwN0wRAWd49 

Jo nopealla vilkaisulla huomaa, että kartat eroavat toisistaan paljon – itseasiassa ne ovat lähes käänteiset. Absoluuttisia arvoja kuvaavalla kartalla suuria arvoja saavat alueet saavat suhteellisia arvoja esittävällä kartalla pieniä arvoja ja päinvastoin; esimerkiksi kuvassa 2 korkeimpaan luokkaan kuuluvat Helsingin keskustan ja sen lähiympäristön alueet putoavat kuvassa 3 matalimpaan luokkaan. Tämä tukee hypoteesiani siitä, että lapsiperheet hakeutuvat asumaan keskustan ulkopuolisille ja pientalovaltaisille alueille, joilla neliöhinta on tiheästi asuttuihin keskuksiin verraten keskimäärin alhaisempi. Tiiviimmän asumisen keskukset taas houkuttelevat lapsettomia, nuoria ja vanhuksia, joilla tilantarve on pieni eikä neliöhinta muodostu kynnyskysymykseksi asunnon hankinnassa. Oletan myös, että lapsiperheet ja lapsettomat suosivat ensisijaisesti eri asioita asuinpaikkaa valitessaan: siinä missä sinkku asettaa hyvät liikenneyhteydet sekä kulttuuri-, viihde- ja palvelutarjonnan etusijalle, painavat lapsiperheen vaakakupissa luultavasti eniten turvallisuus, rauhallisuus, luonnonläheisyys ja hinta.

Mielestäni suhteellisia arvoja esittävä kartta tuo alle kouluikäisten alueelliseen sijoittumiseen liittyvästä teemasta esiin mielenkiintoisen ulottuvuuden. Kartat tarkastelevat samaa aihetta mutta eri painotuksin, ja yhdessä esitettynä niiden informaatioarvo on  parempi kuin kummankaan yksittäin. Mielestäni esittämäni lähestymistavat tukevat toisiaan, joten ilmiön mahdollisimman realistiseksi havainnollistamiseksi on siis hyvä esittää molemmat kartat rinnakkain. Ilokseni voin tässä vaiheessa kurssia todeta, että MapInfon käyttö tuntuu jo huomattavasti helpommalta ja loogisemmalta kuin alkukurssista. Tietokantojen muokkaaminen ja tiedon siirto eri tietokantojen välillä tuntuu sujuvan ongelmitta, ja ohjelman kanssa pärjää luovaa ongelmanratkaisua vapaasti soveltamalla. Hyvästi siis MapTuska! Ehkäpä tässä on orastavan MapRakkauden siemen. 🙂

Lähteet:

Erfving, N. (2014): Kurssikerta 4: Ruutuja, rasterikarttoja ja alle kouluikäisten määrä pääkaupunkiseudulla. <https://blogs.helsinki.fi/nataliae/2014/02/03/kurssikerta-4-ruutuja-ja-rasterikarttoja-alle-kouluikaisten-maara-paakaupunkiseudulla/> Viitattu 18.2.2014.

Hintsanen, L. (2014): Kurssikerta 4: Rasterikarttoja. <https://blogs.helsinki.fi/lhintsan/2014/02/04/kurssikerta-4-rasterikartta/> Viitattu 18.2.2014.

Kolmas kurssikerta ja MapTuska

Kolmas kurssikerta koetteli hermojani: onnistuin tekemään MapInfolla luultavasti kaikki mahdolliset virheet ennen kuin sain kurssikerran itsenäisen karttatyön valmiiksi. Onneksi opettajamme Arttu ja muut kurssilaiset olivat enemmänkin kuin kärsivällisiä ja auttavaisia MapTuskani suhteen (kiitos Johanna!). Tärkein oppimani asia kurssikerralta on se, ettei Pakittamaan sovi tulla alle kuuden tunnin yöunilla. MapInfon kanssa ei pärjää ilman riittävää tarkkuutta ja keskittymiskykyä – ainakaan tällainen aloitteleva paikkatietoartisti.

Kurssikerran aikana harjoittelimme tietokantojen muokkaamista käytettävämpään  muotoon. Opettelimme yhdistämään dataa tietokantojen sisällä ja tuomaan lisää dataa sekä toisista tietokannoista että ulkopuolisista lähteistä. Harjoitus toteutettiin valmiin afrikkateemaisen aineiston avulla, joka kuvasi muutamia erilaisia muuttujia (mm. internetkäyttäjien osuus, facebook -käyttäjien osuus, timanttikaivosten, öljykenttien ja konfliktien määrä) valtioittain.

https://blogs.helsinki.fi/tuomasli/files/2014/01/Afrikkakesken.png


Kuva 1.
Tuomas Lillebergin harjoituskartta Afrikan konfliktialueista (vihreällä) ja timanttikaivoksista (mustalla). Lähde: Lilleberg, T (2014).

 

Harjoituskarttatuotokseen (kuva 1: Lilleberg, 2014) valittiin viimeisimmät konfliktit (vihreällä) ja timanttikaivokset (mustalla). Varsinaisiin tietokantoihin oli tallennettu tietoa konfliktien laajuudesta ja alkamisvuodesta, timanttikaivosten löytämisvuodesta, kaivausten aloitusvuodesta ja tuottavuudesta sekä öljylähteiden löytämisvuodesta, poraamisen aloitusvuodesta ja tuottavuudesta. Lisäksi tietokanta sisälsi tietoa internetin käyttäjämääristä eri vuosina. Olisi mielenkiintoista tarkastella aineistosta näiden muuttujien välisiä riippuvuussuhteita – onko esimerkiksi arvomineraalin löytymisvuodella ja konfliktin puhkeamisvuodella selkeää korrelaatiota, kuinka löydöksen laajuus ja tuottavuus vaikuttavat konfliktin puhkeamiseen ja laajuuteen ja kuinka konfliktin puhkeaminen tai arvomineraalin löytyminen vaikuttavat internetkäyttäjien määrään vuosien mittaan. Tuotetulta harjoituskartalta ei ole suoraan luettavissa selkeää korrelaatiota mineraalilöydöksen ja konfliktin syttymisen välillä. Se ei kuitenkaan tarkoita, etteivät nämä kaksi voisi korreloida tapauskohtaisesti voimakkaastikin.

Kurssikerran itsenäisesti suoritettava osuus oli tulvaindeksikartan (kuva 2) tuottaminen. Kartan alueyksiköt muodostuvat valuma-alueista eivätkä siksi noudattele hallinnollisia rajoja kovinkaan hyvin. Tulvaindeksiteeman päälle tuli lisäksi liittää järvisyysprosentteja kuvaava pylväsdiagrammiesitys. Histogrammikuvaajan perusteella aineiston jakaumassa oli sekä vinon että epämääräisen jakauman piirteitä. Valitsin aineiston luokittelutavaksi luonnolliset luokkavälit, joita lisäksi pyöristin helpommin hahmotettavaan suuntaan. Valitsin tämän luokittelutavan, sillä halusin sijoittaa selvästi muista havainnoista poikkeavat arvot omaan luokkaansa. Tämän takia ylimpään luokkaan sijoittuukin ainoastaan kaksi havaintoa.

Tulvaindeksikartta


Kuva 2.
Tulvaindeksi ja järvisyys päävaluma-alueittain.

Kartalta voi tehdä kaksi kiinnostavaa havaintoa: sen lisäksi, että kaikki suuren tulvaindeksin valuma-alueet sijaitsevat rannikolla, järvisyyden ja tulvaindeksin välillä näyttäisi olevan voimakas negatiivinen korrelaatio. Toisin sanottuna suuri järvisyysprosentti näyttäisi vähentävän tulvahuippuja ja pieni vastaavasti äärevöittävän virtaaman vaihtelua. Havaintoa voidaan selittää sillä, että tulvahuippujen aikana järvialtaat hidastavat virtausnopeutta, sillä ne toimivat väliaikaisina vesivarastoina. Lisäksi järvialtaat sijaitsevat tasaisilla maastonkohdilla, joilla virtausnopeus on luonnollisesti alhainen. Tarkastelun ulkopuolisena selittävänä tekijänä voidaankin nähdä maaston viettoon ja topografiaan liittyvät seikat: joen yläjuoksun ja alajuoksun välisen korkeuseron kasvaessa myös joen virtausnopeus kasvaa. Voimakas maastonvietto sekä äärevöittää tulvahuippuja että vaikeuttaa järvialtaiden syntymistä. Toisaalta tasaiset ja alavat alueet ovat kaikista eniten alttiina tulvien aiheuttamille haitoille, sillä alavalla maalla vesi leviää laajalle aluelle ja tulvahuiput myös kestävät kauemmin. Myös maaperän ominaisuudet ja maankäyttö vaikuttavat tulvahuippujen äärevyyteen: rannikoiden savimaa on tiivistä ja vettä läpäisemätöntä, mikä osaltaan kasvattaa tulvariskiä. Lisäksi jokirantojen tiivis rakentaminen heikentää maaperän kykyä absorboida vettä.

Lähteet:

Lilleberg, T (2014). Kuva 1. <https://blogs.helsinki.fi/tuomasli/files/2014/01/Afrikkakesken.png> Viitattu 29.1.2014.

Toinen kurssikerta: päällekkäiset teemat

Toisella kurssikerralla tutustuimme syvemmin MapInfon käyttömahdollisuuksiin teemakarttojen tuotannossa. Kävimme läpi mahdollisten esitystapojen skaalaa sekä niiden soveltuvuutta eri muuttujien kuvaamiseen. Kurssikerran itsenäisesti suoritettavan osuuden aiheena oli päällekkäisten teemojen käyttö koropleettikarttaesityksissä: tarkoitus oli tuottaa informatiivinen ja moniuloitteinen karttaesitys, jossa yhdistyisivät samaa ilmiötä kuvaavat aineistot toisiaan tukevalla tavalla (esimerkiksi absoluuttiset ja suhteelliset arvot kuten työttömyysaste ja työttömien työnhakijoiden määrä). Vaihtoehtona oli tuottaa päällekkäisesitys kahdesta eri ilmiöstä, joiden yhteisvaihtelua tarkastelemalla voitaisiin tehdä havaintoja ilmiöiden välisestä mahdollisesta tilastollisesta riippuvuussuhteesta.

Aineiston valinta oli minulle hankalaa, sillä halusin esittää kartallani kaksi selkeästi korreloivaa ilmiötä. Toisaalta en kuitenkaan halunnut tarttua liian itsestäänselviin teemoihin korrelaation kuvaamisessa. Suljin siis ulkopuolelle lähes tai täysin samaa aihetta kuvaavat aineistot, joiden yhdistämisen ja tuplaesittämisen tuottama lisäinformaatioarvo jäisi mielestäni olemattomaksi – tällaisia olisivat olleet esimerkiksi yli 65-vuotiaiden osuuden ja eläkkeellä olevien osuuden yhdistäminen samaan karttaesitykseen. Lisäksi halusin välttää sellaisten aineistojen yhdistämistä, joissa korrelaation aiheuttajana oli selkeästi jokin tarkastelun ulkopuolinen syy. Esimerkiksi vältin tietoon tulleiden rikosten määrän ja työttömien määrän kuvaamista samalla karttapohjalla absoluuttisina lukuina, sillä molempien esiintyvyys on todellisuudessa eniten riippuvainen kunnan väkiluvusta. Toisaalta näiden muuttujien arvojen muuttaminen suhteellisiksi (esim. työttömyysaste + tietoon tulleet rikokset/väestömäärä) nostaisi kartan informaatioarvoa jo huomattavasti.

Muutaman tunnin toivottoman ähellyksen jälkeen päädyin kuitenkin tarkastelemaan suhteellisen helppoa ja itsestäänselvää kombinaatiota: pohjakarttani sävyt kuvaavat 65 vuotta täyttäneiden prosentuaalista osuutta kunnan väestöstä ja pisteobjektit taas luonnollisen väestönlisäyksen määrää suhteessa kunnan väkilukuun. Jaoin siis luonnollisen väestönlisäyksen väkiluvulla, jotta kartan visuaalinen ilme ei johtaisi virheellisiin tulkintoihin alueen syntyneisyydestä ja kuolleisuudesta. Kun arvot kuvataan valmiiksi suhteellisina, kartta on helpompi ymmärtää myös sellaiselle henkilölle, joka ei tunne aihealueen terminologiaa (esim. luonnollinen väestönlisäys eli kuolleiden määrä vähennettynä syntyneiden määrästä) tai huomaa ajatella kuntien välisiä eroja väkiluvuissa ja suhteuttaa esitettyjä arvoja niihin. Kartaltani (kuva 1) on luettavissa selkeä korrelaatio, mikä tuskin yllättää ketään: kunnissa, joissa vanhusikäisten osuus on korkea, on sekä suurin kuolevuus että alhaisin syntyvyys, jolloin myös luonnollisen väestönkasvun (syntyneiden määrä – kuolleiden määrä) on oltava heikompaa kuin nuoremman väestöpohjan kunnissa. Kartan varsinainen informaatioarvo liittyykin muuttujien toisiaan vahvistavaan ja tukevaan vaikutukseen – mielestäni kartta korostaa hyvin eroja taantuvien kuntien ja kasvukuntien välillä ja toisaalta tuo ilmiöiden alueellisen ulottuvuuden selkeästi esiin.

pak_karttakk2

Kuva 1. 65 vuotta täyttäneiden osuus ja luonnollinen väestönkasvu suhteutettuna väkimäärään Uudellamaalla. Muuttujien korrelaatiota on havainnollistettu päällekkäisillä teemoilla. Lähde: Tilastokeskus 2010.

Oppimisprosessistani voin tässä vaiheessa todeta, että vaikka ohjelman mekaaninen käyttö teemakarttatuotannossa alkaakin hiljalleen sujua, en koe vielä olevani kovinkaan hyvin perillä MapInfon toimintalogiikasta. Yhdynkin vuolaasti Tiia Seeven turhautumiskokemukseen, josta hän kirjoittaa blogissaan seuraavaa:

“Mekaaninen ulkoaopettelu tai onnistunutkaan ohjeiden seuraaminen ei tuo minulle oppimisen tunnetta, koska en varsinaisesta ymmärrä, mitä teen. Osaanhan minä komentaa MapInfon tekemään minulle koropleettikartan, mutta jos jokin menee vikaan, korjauskeinoni ovat kovin rajalliset.”

Kykyni muokata ja korjata tuottamiani karttaesityksiä MapInfossa on enemmänkin kuin rajallinen. Siksi veinkin tuottamani karttatiedoston vektorimuotoisena CorelDraw -ohjelmaan, jossa kaikenlainen muokkaus ja visuaalisen ilmeen hiominen on helpompaa. Myös Johanna Hakanen kirjoittaa blogissaan MapInfon ja CorelDraw- ohjelman käyttäjäystävällisyydestä:

“Kartan muokkaaminen Corelilla oli helppoa ja nopeaa ja sai MapInfon tuntumaan todella jäykältä ja epäloogiselta.”

Mutta kuten Johannakin myöhemmin blogissaan toteaa, on turhautumisessa luultavasti kyse vain tottumattomuudesta ja uuden toimintalogiikan opettelemiseen kuuluvasta alkukankeudesta. Uskon siis, että kurssin edetessä ja ohjelman tullessa tutummaksi myös sen käyttölogiikka aukeaa, oli pääni sitten puusta tahi ei. 😉

Lähteet:

Hakanen, J (2014). Kurssikerta 2: Lisää teemakarttoja ja kaksi päällekkäistä teemaa. <https://blogs.helsinki.fi/johakane/2014/01/21/kurssikerta-2-lisaa-teemakarttoja-ja-kaksi-paallekkaista-teemaa/> Viitattu 28.1.2014.

Seeve, T (2014). Kurssikerta 2 osa 1: Tuplateemat. <https://blogs.helsinki.fi/setiseti/2014/01/24/kurssikerta-2-tuplateemat/> Viitattu 28.1.2014.

Tilastokeskuksen tilastotietokanta. Tilastokeskus 2010.

Näkökulmia kahden muuttujan koropleettikarttoihin

Anna Leonowicz käsittelee vuonna 2006 ilmestyneessä artikkelissaan “Two-variable choropleth maps as a useful tool for visualization of geographical relationship” kaksimuuttujaisten koropleettikarttojen hyötyjä ja puutteita visuaalisena esitystapana. Kattavan pohdintansa tukena Leonowicz esittelee artikkelissa kahta tutkimusta: omaansa, sekä erästä 80-luvulla tuotettua yhdysvaltalaista tutkimusta siitä, kuinka kaksimuuttujaisten koropleettikarttojen viesti aukeaa keskimääräiselle katsojalle verrattuna yksimuuttujaisiin karttaesityksiin. Mielenkiintoista on, että tutkimukset ovat päätyneet pääosin eriäviin tuloksiin: 80-luvulla toteutetun mukaan kaksimuuttujaiset karttaesitykset ovat ylipäätään liian vaikeita tulkita, kun taas Leonowiczin oma tutkimus näkee kaksimuuttujaiset kartat yksimuuttujaisia sukulaisiaan parempina muuttujien tilastollisen riippuvuuden esittämisessä.

Leonowiczin tutkimuksesta, jossa yksi- ja kaksimuuttujaisten karttojen luettavuutta vertailtiin opiskelijaotoksen avulla Varsovan yliopistossa (Leonowicz, 2006) käy ilmi, että yksimuuttujaiset koropleettikartat soveltuvat alueellisen jakautumisen esittämiseen kaksimuuttujaisia esityksiä paremmin. Sen sijaan kaksimuuttujaiset esitykset ovat omiaan ilmentämään tilastollista korrelaatiota ja ovat sen osoittamisessa yksimuuttujaisia, vierekkäisiä karttaesityksiä parempia juuri tulkittavuudeltaan. Edellisessä esitystavassa kartanlaatijan on kuitenkin tärkeää ymmärtää, mitä muuttujia on aiheellista tarkastella päällekkäin: olisi hyvä muistaa, että tilastollinen korrelaatio ei välttämättä kerro kausaalisuhteesta ja voi olla jonkin tarkastelun ulkopuolisen muuttujan tai toisaalta pelkän sattuman aiheuttamaa.

Yhdysvaltalaistutkimus taas todisti monimuuttujaisten koropleettikarttojen vaikealukuisuuden kokeellisesti 1980 -luvulla (Weiner, Francolini, 1980; Olson, 1981). Sen mukaan päällekkäisiä teemoja sisältävät karttaesitykset olivat katsojalle niin vaikealukuisia, että niiden lopullinen informaatioarvo jäi vierekkäisiä yksimuuttujaisia koropleettikarttoja köyhemmäksi. Etenkin legendojen tulkinta koettiin vaikeana. Leonowicz esittää tutkimusten tulosten johtuneen kuitenkin vain kyseisen kokeen karttaesitysten puutteellisesta visuaalisesta suunnittelusta sekä niissä käytetyn luokittelun ongelmallisuudesta: hänen mukaansa tutkimuksessa käytetyissä kartoissa käytettiin liian montaa luokkaa, käytetyt värit olivat kiistanalaisia ja täten kartat jäivät vaille visuaalista logiikkaa.

Olen kirjoittajan kanssa yhtä mieltä siitä, että vierekkäisiä koropleettikarttoja vertailemalla aineistojen tilastollinen riipuvuus ei avaudu katsojalle kovin helposti, sillä on teknisesti mahdotonta katsoa kahta karttaa samanaikaisesti. Jotta yhtäläisyys olisi helppo havaita vierekkäisistä kartoista, tulisi korrelaation olla äärimmäisen selkeää ja kuvattavan alueen visuaalisesti yksinkertainen. Kaksimuuttujaisen koropleettikartan edut taas tulevat esiin juuri sen käytännöllisyydessä ja moniulotteisuudessa. Antti Kinnunen pohtii blogissaan oivallisesti kaksiulotteisen esitystavan jopa matemaattista ulottuvuutta seuraavasti: “Kahden muuttujan koropleettikartalla toteutuu eräänlainen versio yhtälöstä xy=?, jossa muuttuja x:n värisävy yhdistettynä muuttujan y värisävyyn määrää tuloksen ?, eli sen värisävyn jonka tarkasteltava alue saa kartalla. Kaksimuuttujaista koropleettikarttaa voisi näin ollen pitää eräänlaisena visuaalisena representaationa ensimmäisen asteen yhtälöstä, jossa numeroiden sijaan muuttujina toimivat värit.”

Tästä huolimatta artikkelin lopussa oleva kaksimuuttujainen esimerkkikartta (kuva 1) on mielestäni ensivilkaisulla vaikeatulkintaisempi kuin vertailukohtana oleva kahden yksimuuttujaisen koropleettikartan muodostama kokonaisuus (kuva 1). Mielestäni kahdesta vierekkäisestä koropleettikartasta korrelaation havaitsee jopa paremmin kuin kaksimuuttujaisesta lajitoveristaan. Tämä voi osaltaan johtua tottumattomuudestani kaksimuuttujaiseen esittämistapaan, mutta koen myös, että kartta ja sen sävyt ovat intuitiivisesti harhaanjohtavia. Sen lisäksi, että sinisten luokkien sävyt ovat hyvin lähellä toisiaan, vahvaa lineaarista korrelaatiota kuvaavat luokkasävyt eivät ole intuitiivisesti tulkittavissa legendan värisävyjen yhdistelmiksi. Karttaesitys vaatii siis lukijalta suhteellisen suurta panosta ja kykyä legendan ja kartan tutkimiseen.

Pak artikkeli karttakuva

 

Kuva 1. Artikkelin esimerkkikuva yksi- ja kaksimuuttujaisesta koropleettikarttaesityksestä. Ylinnä on kaksi vierekkäistä yhden muuttujan koropleettikarttaa, alla olevassa kartassa nämä kaksi on aseteltu päällekkäin. Lähde: Leonowicz, 2006.

Kaksimuuttujaisten koropleettikarttojen tulkittavuuteen liittyy vielä yksi rajoittava seikka, joka palauttaa meidät takaisin yksiulotteisten vierekkäisten koropleettikarttojen ongelmaan. Koska katsetta on mahdotonta kohdistaa kahteen objektiin samanaikaisesti, ei tarkastelun yhtäaikaisuus pääse toteutumaan myöskään kaksimuuttujaisen kartan ja sen legendan välillä. Tavallisessa yksiulotteisessa legendassa luokat kasvavat vain yhden muuttujan suhteen ja yhteen suuntaan, jolloin luokat ja niiden järjestys on helppo muistaa ulkoa itse karttaa tarkastellessa. Kaksimuuttujaisen koropleettikartan legenda on kuitenkin niin moniuloitteinen, ettei sen luokkien ominaisuuksia voi muistaa karttaa tarkastellessa, vaan huomio on kohdistettava kerrallaan vain yhteen luokkaan niin legendassa kuin kartallakin. Mutta kuinka mahdollistaa legendan ja karttaesityksen päällekkäistarkastelu? Kenties sijoittamalla legendan arvoja kartalle mahdollisimman havainnollisesti ja yksinkertaisesti? Mielestäni tämä olennainen kysymys jää Leonowiczilta huomaamatta.

Jos tavoitteenani olisi havainnollistaa koropleettikartalla ainoastaan kahden muuttujan tilastollista riippuvuutta, luultavasti sijoittaisin kartalle jonkinlaisen luokittelun, joka perustuisi havaintopisteen virhetermin suuruuteen eli sen etäisyyteen regressiosuorasta. Olen esittänyt esimerkkikuvan luokittelun periaatteesta kuvassa 2 (alla). Tällöin lähimpänä regressiosuoraa sijaitsevat havaintopisteet muodostaisivat oman luokkansa (kuvassa luokka 3), keskimääräisen virhetermin pisteet keskimmäisen luokan (luokka 2) ja suurimman virhetermin pisteet viimeisen luokan (luokka 1).

Pak luokitteluehdotus

Kuva 2. Suuntaa-antava havainnollistukseni siitä, kuinka korrelaatiota esittävän karttaesityksen aineiston voisi luokitella suhteessa regressiosuoraan.

Näin hajontakäyrän sisältämän informaation voisi siirtää karttapohjalle havainnollistamaan, millä alueilla muuttujien välillä on voimakas tilastollinen yhteys ja toisaalta millä alueilla sitä ei ole havaittavissa. Mielestäni kahden muuttujan riippuvuutta voisi siis ilmentää kartalla funktionaalisemminkin kuin käyttämällä päällekkäisiä teemoja lopullisessa esityksessä. Toisaalta päällekkäisten teemojen vahvuus on juuri moniulotteisuudessa: ne eivät ilmennä ainoastaan korrelaatiota vaan myös tarkasteltavien muuttujien arvoja ja niiden vaihtelua eri alueilla. Taitavalle tulkitsijalle päällekkäiset teemat tarjoavatkin aivan erinomaisen havainnointilähteen.

Lähteet:

  • Leonowicz, A (2006). Two-variable choropleth maps as a useful tool for visualization of geographical relationships. Geografija T. 42. Nr. 1. P. 33–37.

Ensimmäinen kurssikerta: tutustumista MapInfoon

Tämä blogi on päiväkirjamuotoinen kurssiblogi, jonka tarkoitus on toimia alustana Paikkatiedon hankinta, analyysi ja kartografia -kurssilla toteutettaville tehtäville sekä kurssikertoihin ja tehtäviin pohjautuvalle kriittiselle oppimis-ja itseanalyysille. Kurssin tavoitteena on tutustuttaa opiskelijat paikkatiedon maailmaan sekä antaa käytännön kokemusta karttaohjelmien ja erilaisten paikkatietosovellutusten käytöstä.  Kurssilla toteutettavat tehtävät tulevat koostumaan sekä kuvallisista tuotoksista että niihin liittyvästä kirjallisesta analyysista, joiden julkaisualustana tämä blogi toimii. Kurssin aikana tulen siis seuraamaan ja erittelemään oppimisprosessiani tämän blogin puitteissa.

Ensimmäisellä kurssikerralla aloitimme tutustumisen MapInfo -ohjelman ominaisuuksiin ja mahdollisuuksiin sekä sen käyttöön paikkatietodatan saattamisessa esitettävään muotoon. Aluksi kävimme läpi ohjelman perusperiaatteita, rakennetta ja “työkalupakkia”, mikä tuntui tällaisesta MapInfo-noviisista äärimmäisen hyödylliseltä. Koska kyseinen ohjelma on minulle ennestään tuntematon, myös sen toimintalogiikka tuntui aluksi vieraalta ja haastavalta. Kurssikerralla edettiin kuitenkin rauhalliseen tahtiin ja harjoitukset toteutettiin ohjatusti askel askeleelta. Vaikka satunkin olemaan tietotekniikkaneron lähes täydellinen vastakohta, rauhallinen lähestymistapa toimi todistetusti myös allekirjoittaneen äärimmäisen puiseen päähän, sillä tehtäväksi saatu itsenäinen karttatyö oli loppujen lopuksi helppo toteuttaa. Myös .wor ja .tab -tiedostomuotojen ero selvisi tietämättömälle vihdoin.

Kurssikerran itsenäisesti toteutettava osuus oli karttatehtävä, jonka tehtävänantona oli tuottaa koropleettikarttaesitys MapInfolla vapaavalintaisen aineiston pohjalta. Valitsin aineistokseni Suomen kuntien työttömyysasteen vuodelta 2011. Histogrammityökalulla tulkittuna aineisto näytti normaalijakautuneelta, joten päätin säilyttää MapInfon ehdottaman kvantiileihin perustuvan luokittelun karttaesitykseni pohjana. Mielestäni kvantiileihin perustuva jako toi hyvin kuntien väliset erot ja alueellisen vaihtelun esiin, muttei virheellisesti korostanut yhtäkään luokkaa. Kvantiililuokittelun heikkoutena voidaan kuitenkin pitää sitä, että luokkavälien pituus saattaa vaihdella luokittain hyvinkin paljon. Oman normaalijakautuneen aineistoni kohdalla tämä tarkoitti sitä, että ääriluokkien sisäinen vaihtelu oli hyvinkin voimakasta, kun taas keskimmäisten luokkien sisäinen vaihtelu ja luokkavälin pituus jäivät hyvin pieniksi. Koin tämän seikan silti siedettävänä, sillä tarkoitukseni oli kartalla erotella nimenomaan keskimääräistä korkeamman ja keskimääräistä alhaisemman työttömyysasteen kuntia ja niiden alueellista järjestymistä, jolloin kokonaiskuva muodostui yksittäisten ääriarvojen esittämistä tärkeämmäksi.

Kuntien työttömyys histogrammi

Kuva 1. Suomen kuntien työttömyysaste 2011 -aineiston pohjalta tuotettamani histogrammiesitys. Yksihuippuinen ja selkeä muoto osoittavat aineiston olevan normaalijakautunutta.

Kokeilin luokittelua valitessani myös keskihajontaa (standard deviation) luokitteluperusteena, mutta se korosti mielestäni lopullisessa karttaesityksessä tiettyjä marginaalisia alueita epätarkoituksenmukaisesti. Vaikka keskihajonta tasasikin luokkien välistä luokkavälin pituuden vaihtelua, se johti havaintojen voimakkaaseen painottumiseen kolmeen suurimman työttömyysasteen luokkaan. Tämä puolestaan johti mielestäni lopullisella kartalla vääristyneeseen visuaaliseen tulkintaan, sillä havaintojen epätasaisen jakautumisen lisäksi suurin osa suuren työttömyysasteen kunnista on pohjoisia suuren pinta-alan kuntia. Tästä johtuen lähes koko Suomi näytti kuuluvan hälyttävän työttömyysasteen luokkaan, eivätkä alueelliset erot korostuneet riittävästi. Parhaimman työllisyystilanteen luokkaan ylsi tällä luokittelutavalla vain 2 % kaikista kunnista.

joopajoo

Kuva 2. Koropleettikartta Suomen kuntien työttömyysasteesta vuonna 2010. Kartalla kuvautuvat punaisina korkean työttömyysasteen kunnat ja vastaavasti sinisinä alhaisen työttömyyden kunnat. Lähde: Tilastokeskus 2010.

Kuten oli odotettavissa, suurimman työttömyysasteen kunnat painottuvat kartalla Suomen pohjoisiin ja itäisiin osiin. Toki poikkeuksiakin on – esimerkiksi Kittilän kunta erottuu kartalla sinisenä värialueena muiden pohjoisten ja punasävyisten kuntien keskeltä. Paras työllisyystilanne taas on eteläisissä ja läntisissä kunnissa, joissa työpaikkojen tarjonta on suuremman asutustiheyden, rikkaamman elinkeinoelämän ja elinvoimaisen teollisuuden takia runsaampaa. Korkean työttömyysasteen kunnissa kunnan talouden tila on usein heikko, sillä työttömyyden lisääntyessä verotulot pienentyvät ja toisaalta kunnan sosiaalimenot kasvavat yhtäaikaisesti. Tämä heijastuu väistämättä kunnan peruspalvelutarjontaan sekä sen kykyyn tarjota erilaisia sosiaalisia tukia ja palveluita.

Tutkimusten mukaan yksilön työttömyys ja sekä fyysinen että henkinen pahoinvointi  kulkevat käsi kädessä (Nyman, 2002). Tämä tarkoittaa, että kartalla punaisina kuvautuvat alueet ovat siis myös keskimääräistä korkeamman pahoinvoinnin kuntia. Sen lisäksi, että vaikea työllisyystilanne vaikuttaa ihmisten hyvinvointiin keskimäärin negatiivisesti, asukkaiden pahoinvointi voi alkaa nopeasti heijastua asukkaiden työssäkäymisprosentteihin ja -kykyyn, kuten Natalia Erfvingkin (2014) blogikirjoituksessaan “Kurssikerta 1: MapInfoon tutustuminen & koropleettiteemakartta” osuvasti toteaa. Kyseessä on siis noidankehä, jossa työttömyys johtaa pahoinvointiin ja pahoinvointi työttömyyteen. Pitkään työttömänä olleen yksilön uudelleentyöllistäminen voi siis käydä hankalaksi muistakin kuin vain koulutusteknillisistä syistä.

Mielestäni karttani on kokonaisuudessaan onnistunut, sillä sen visuaalinen ilme ja värimaailma ovat selkeät, ja lisäksi kuntien väliset erot näkyvät kartalla hyvin. Punainen ja sininen väri myös toimivat mielestäni hyvinä ensivaikutelman synnyttäjinä ja ohjaavat intuitiivisesti tulkintoja tekevää katsojaa oikeaan suuntaan. Sininen koetaan usein neutraalina ja kirkas punainen jopa hälyttävänä värinä. Symboliikaltaan nämä värit sopivat siis työttömyysaiheiseen teemakarttaesitykseen mielestäni erittäin hyvin, etenkin jos tarkoitus on esittää huolestunut puheenvuoro kuntien välisestä taloudellisesta eriarvoisuudesta ja polarisaatiosta. Muissa yhteyksissä kartan värimaailmaa voisi muokata kyseiseen julkaisukontekstiin sopivaksi, joko valitsemalla neutraalimpia värejä tai voimakkaasti arvo- ja mielikuvaväritteisiä sävyjä kuten mustaa tai kirkkaan oranssia. Värimaailman valinnassa on siis mielestäni ensisijaisesti kyse kartantekijän pyrkimysistä joko neutraaliin karttaesitykseen tai voimakkaita ja tietynlaisia mielikuvia synnyttävään visuaaliseen esitykseen.

Lähteet:

Erfving, N (2014). Kurssikerta 1: MapInfoon tutustuminen & koropleettiteemakartta. <https://blogs.helsinki.fi/nataliae/> Viitattu 22.1.2014.

Histogrammityökalu 2014. <http://illuminations.nctm.org/Activity.aspx?id=4152> Viitattu 12.1.2014.

Nyman, J. (2002). Does Unemployment Contribute to Ill-being: Results from a Panel Study among Adult Finns, 1989/90 and 1997. <http://ethesis.helsinki.fi/julkaisut/laa/kliin/vk/nyman/doesunem.pdf> Viitattu 22.1.2014.

Tilastokeskus 2010. Kuntien työttömyysaste.

.