KK 7: Loppu tulee (ou PHAK)!

Kurssimme lähenee loppuaan, ja viimeisen blogikirjoitukseni aika on tullut. Taipaleeni MapInfo-artistina jää siis toistaiseksi katkolle. Kurssin myötä innostukseni GISsiä kohtaan on lisääntynyt huimasti. Hieman harmittaa tämä oppimisprosessin keskeytyminen, sillä koen juuri nyt olevani kaikista hedelmällisimmässä vaiheessa uusien toimintojen omaksumiselle. MapInfon kanssa olen aivan kuin pieni lapsi, joka on juuri oppinut kävelemään – askellus sujuu, mutta hetkittäinen horjuminen saa aikaan refleksinomaista tarrautumista pöydänreunaan tai ympäröiviin ihmisiin. Ja jos Arttu ei ole paikalla, voi iskeä hätä; tätä kurssi-isää kun eivät parhaimmatkaan tutoriaalit korvaa. Tällä aka seitsemännellä aka viimeisellä kurssikerralla opin kuitenkin pyllähtämään pehmeästi ja nousemaan ilman apua, mikä kasvatti MapItsetuntoani huomattavasti. Luottamukseni tutoriaaleihin sen sijaan kärsi jälleen kolauksen – niistä kun ei tunnu löytyvän ratkaisua ikinä siihen kysymykseen, johon kipeimmin tarvitsisi vastauksen.

Kurssikerran oppimistavoitteena oli irtipäästäminen (Artusta) ja itseohjautuvaan työskentelyyn siirtyminen MapInfon käytössä. Kurssin kaikkia osa-alueita kokoava tehtävänanto olikin laaja mutta vapaa: tarkoituksena oli tehdä kahden muuttujan teemakartta vapaavalintaisesta aiheesta ja alueesta. Tehtävän luonteeseen kuului, että myös kaikki data eli tilastotieto ja pohjakartta tuli hankkia itsenäisesti. Poimin Tilastokeskuksen Amerikan tilastovirastot -sivulta alueekseni Argentiinan täysin satunnaisesti ja sen enempää valintaani pohtimatta. Onnekseni Argentiinan virallisen tilastokeskuksen INDEC:in sivuilta löytyi mukavasti englanninkielistä aineistoa. Päätin keskittyä aineistoon, jossa tieto oli esitetty provinsseittain, sillä aluejaoksi provinssit olivat mielestäni sopivan yleistävä ja kuitenkin riittävän erotteleva ja yksityiskohtainen. Ajattelin ensin tarkastella maanomistuksen keskittyneisyyden indeksiä (= väkiluvun ja viljelyalan tulo suhteutettuna maatilojen määrään) ja maatalouden tuottavuutta sekä hyvinvoinnin jakautumista provinsseittain. Tässä törmäsin kuitenkin käsillä olevan tiedon puutteeseen – joko tietoa haluamastani aiheesta ei ollut tai sitten sitä ei ollut saatavana provinsseittain. Ehkäpä hyvä niin, sillä tutustuessani tarkemmin Argentiinan demografisiin piirteisiin huomasin, että Argentiinan kaupungistuneisuusaste on huimat 93 % (The World Bank, 2013). Maanomistuksen jakautumisen tutkiminen maatilojen omistussuhteiden perusteella olisi siis tällä aluella ollut jokseenkin epätarkoituksenmukaista.

Päädyin lopulta tarkastelemaan köyhyyteen, tulonjakoon ja rikollisuuteen liittyviä teemoja, sillä niistä oli dataa saatavilla edes auttavasti. Yleinen harhaluulo on, että köyhyys ja rikollisuus korreloivat alueellisesti ja ovat toisistaan riippuvaisia ilmiöitä. Tämä ei kuitenkaan pidä paikkaansa, kuten edellisessä lauseessa jo vihjaankin. Ilmiöt ovat tahoillaan niin moniriippuvaisia, monisyisiä ja dynaamisia, että helppoja ja yksinkertaisia selittäviä tekijöitä on mahdotonta löytää. Rikollisuuden alueelliseen esiintymiseen vaikuttavat lukuisten kulttuurillisten, sosio-ekonomisten, lainsäädännöllisten, ja inhimillisten seikkojen ohella pelotteen (poliisivoimien ja oikeusjärjestelmän vahvuus, kiinnijäämisen todennäköisyys) voimakkuus ja jopa suhdannevaihtelut. Jotta rikolliseen tekoon ryhtyminen on kannattavaa, tulee pelotteen uhan olla huomattavasti potentiaalista saavutettavaa hyötyä pienempi (Cerro, A; Andres, A; 2011).

Karttojani varten päädyin imuroimaan dataa sekä Argentiinan virallisen tilastokeskuksen INDEC:in että talouden ja työllisyyden kehitystä tutkivan instituution IELDE:n (Instituto de Estudios Laborales y del Desarrollo Económico) ylläpitämiltä sivustoilta. Hain tiedot provinsseittain niin töttömyysasteesta, NBI eli Unsatisfied Basic Needs -indeksistä, tietoon tulleiden rikosten määrästä, väkiluvusta, bruttokansantuotteesta kuin GINI-kertoimistakin. Tiedon saaminen vertailukelpoiseen muotoon vaati jonkin verran operointia ja laskemista; jaoin esimerkiksi rikosten määrän aina kyseisen provinssin kokonaisväkimäärällä, jotta analyysini tulokset eivät kärsisi mittakaavavirheistä. Samalla tutustuin kahden itselleni entuudestaan tuntemattoman indeksin ominaisuuksiin, jotka esittelen seuraavaksi lyhyesti:

  • NBI-indeksi (Unsatisfied Basic Needs) on köyhyyttä ja tyydyttämättä jääneitä perustarpeita indikoiva luku, joka huomioi asumisoloihin (mm lämmitysjärjestelmän puutteet, käytössä oleva pinta-ala asukasta kohden), sanitaatioon ja puhtaan veden saatavuuteen, koulutuksen tasoon ja työllisyyteen liittyvät seikat. Koska tietoa oli saatavilla vain NBI-talouksissa asuvien absoluuttisista määristä provinsseittain, olen analyysejäni ja karttaani varten muuttanut NBI-talouksissa asuvien absoluuttiset määrät prosentuaalisiksi osuuksiksi provinssien kokonaisväkimääristä. NBI-indeksistä voi lukea lisää täältä.
  • GINI-kerroin on tulonjakoa kuvaava mittari, joka kuvaa tuloerojen äärevyyttä asteikolla nollasta yhteen. Tämä tarkoittaa, että täydellisen tasaisessa tulonjaossa GINI:n arvo on 0 (kaikki saavat täsmälleen saman verran tuloja) ja maksimaalisen epätasaisessa tulonjaossa GINI:n arvo on 1 (yksi henkilö saa kaikki tulot). GINI lasketaan asettamalla havaintoarvot suuruusjärjestykseen, minkä jälkeen ne jaetaan esimerkiksi desiileihin tai kvintiileihin. Tämän jälkeen kunkin lohkon arvo suhteutetaan kaikkien arvojen kokonaissummaan. GINI-kertoimen matemaattisesta perustasta voi lukea lisää täältä.
File:Economics Gini coefficient2.svg


Kuva 1. Graafinen esitys GINI-indeksin muodostumisesta (Lorenzin käyrä). Kuviossa x-akseli muodostuu tulonsaajien kumulatiivisesta määrästä siten, että tulot kasvavat järjestyksessä vasemmalta oikealle. Y-akseli taas muodostuu tulojen kumulatiivisesta määrästä, ja yksittäisten tuloerien arvot kasvavat alhaalta ylöspäin. Kuviossa GINI:n arvo muodostuu lausekkeesta A/(A+B).
Lähde: Wikipedia, 2014

Pienen operoinnin jälkeen vein uteliaisuudesta taulukot SPSS:sään, jossa tein muuttujilla regressioanalyysejä. Suurin osa muuttujista ei korreloinut Pearsonin kertoimen mukaan ollenkaan: tällaisia olivat esimerkiksi rikollisuus ja työttömyysaste (korrelaatio vaivaiset 0,2; merkitsevyystaso 20 %) sekä rikollisuus ja NBI-indeksi (korrelaatio vaivaiset 0,05; merkitsevyystaso 79 %). Yllättäjäksi nousi kuitenkin GINI-indeksin ja rikollisuuden välinen riippuvuus: näiden kahden korrelaatiokerroin oli 0,5 ja tuloskin tilastollisesti merkittävä (merkitsevyystaso 2 %). Päätin siis valita pääteemoikseni epätasaisen tulonjaon indeksin sekä sen suhteen rikollisuuden alueelliseen esiintyvyyteen.


Kuva 2. Hajontakuvio Argentiinan provinssien sijoittumisesta GINI-kertoimen ja rikollisuuden suhteellisen määrän mukaan.

Vaikka korrelaatio ei ole suuren suuri, se on kuitenkin huomattava ja tilastollisesti merkittävä. Hajontadiagrammista voi erottaa kaksi selkeästi muista poikkeavaa havaintopistettä eli provinssia, joiden poikkeavuus pienentää kokonaiskorrelaatiota – ilman näitä kahta korrelaatio olisi siis jopa suurempi. Analyysini perusteella voisikin siis pikaisesti päätellä, että köyhyyden ja työttömyyden sijaan rikollisuutta selittääkin eriarvoisuus: mitä suuremmat ovat tuloerot, sitä enemmän rikollisuutta ja päinvastoin. Mielestäni tulos on looginen: köyhässä mutta tulonjaoltaan tasaisessa yhteisössä rikollisilla toimilla tuskin saa kasvatettua elintasoaan merkittävästi, sillä rikoksen kohteena ovat tällöin ne samat niukat resurssit, joilla koko yhteisö tulee toimeen. Sen sijaan suurten tuloerojen määrittämässä yhteisössä köyhän on rikollisuudella mahdollista tienata enemmän, sillä kohteeksi voidaan valikoida vauraimmat yksilöt ja toiminnasta tulee kannattavampaa. Tässä kohtaa voinen kuitenkin todeta, ettei analyysini tulos ole tilastollisesta merkittävyydestään huolimatta tieteellisesti mistään kotoisin, sillä tilastollinen riippuvuus ei kerro suoraan ilmiöiden välisestä kausaalisuhteesta. Lisäksi otokseni on pieni, käyttämäni tilastot vanhoja ja paikallistuntemukseni huonoakin huonompi. Kartalta tekemäni päätelmät eivät siis perustu asiantuntijuuteen vaan puhtaaseen mutuun sekä yhteen tieteelliseen artikkeliin, joka esittelee rikollisuuden syitä ja esiintyvyyttä Argentiinan provinsseissa (Cerro, A; Andres, A; 2011).

Lopullista karttaani varten sidoin netistä hakemani pohjakartan koordinaatistoon, piirsin Argentiinan provinssit, nimesin piirtämäni alueobjektit, toin excelistä tarvittavan tiedon MapInfoon ja yhdistin sen piirtämieni alueobjektien sarakkeisiin. Kaikista pisimmän ajan vei kuitenkin visualisoiminen, sillä halusin lopullisen, viimeisen karttaesitykseni olevan tähän mennessä tekemistäni paras. Esitettäviksi muuttujiksi valitsin NBI-indeksin, GINI-kertoimen ja tietoon tulleiden rikosten määrän suhteutettuna kunkin provinssin väkilukuun. Koska kolmen muuttujan kartasta olisi tullut yksi epäinformatiivinen sotku, tein yhden sijaan kaksi karttaa, jotka esittävät yhteensä kolmea muuttujaa. Lisäksi kaikkien kolmen änkeminen yhteen karttapohjaan olisi ollut epätarkoituksenmukaista, sillä Pearson-analyysini mukaan NBI ei korreloinut GINI:n tai rikollisuuden kanssa ollenkaan. Tarkoituksenani onkin esittää näiden karttojen avulla juuri kahden, keskenään korreloivan ilmiön suhdetta kolmanteen ilmiöön, jolla ei ole kahden edellisen kanssa suoraa tilastollista riippuvuutta.

Lopputyö_valmis2


Kuva 3. Karttaesitys Argentiinan NBI- ja GINI-indekseistä sekä rikollisuuden alueellisesta esiintyvyydestä. Vasemmanpuoleinen kartta kuvaa NBI-talouksissa asuvien prosentuaalista osuutta provinssin kokonaisväkimäärästä punaisen ja keltaisen sävyin. Oikeanpuoleisen kartan rasterisävyt taas kuvaavat provinssien GINI-arvoja, ja mustat pallot kuvaavat tietoon tulleiden rikosten määriä suhteutettuna provinssin väkilukuun.

Karttaesityksestä rikollisuuden ja eriarvoisuuden korrelaatiota ei juuri voi lukea (vaikka sellainen onkin olemassa), ja mitään selkeää alueellista järjestymistä tai ryhmittymistä ei kummankaan ilmiön kohdalla ole havaittavissa. Sen sijaan NBI-indeksiä kuvaava vasemmanpuoleinen kartta tuo hyvin esiin alueelliset, suhteelliset erot vaurauden jakautumisessa, ja kartta vaalenee etelää kohti lähes portaittain. Pohjoisen provinsseissa asuu siis suhteellisesti enemmän köyhää väestöä kuin etelän provinsseissa. Tulosten varsinaiseen selittämiseen ei paikallistuntemukseni yksinkertaisesti riitä, joten jätän syiden pohtimisen astetta asiantuntevammalle (hieman vähemmän mutua ja enemmän asiaa voinee tehdä blogilleni oikein hyvää). Aihe on kuitenkin tärkeä ja mielenkiintoinen, ja tulen varmasti perehtymään siihen vielä lisää muissa yhteyksissä.

Karttaesitykseni visuaaliseen ilmeeseen ja havainnollisuuteen olen kokonaisuudessaan tyytyväinen, mutta puutteitakin löytyy: kartoista puuttuu orientaatio eli pohjoisnuoli, mikä heikentää esityksen informaatioarvoa vaikka indeksikarttani antaneekin osviittaa pohjoisen mahdollisesta suunnasta. Suurimmat puutteet ovat kuitenkin otsikon puuttuminen (se ei vain mahtunut karttaikkunaan!) ja graduated-pistesymbolien selitteen kämmi: olen unohtanut selitteestä tiedon, että mustien palluroiden saamat arvot (15, 7.5, 1.5) on saatu kertomalla väkilukuun suhteutettu rikosten määrä sadalla. Nyt pistearvot ovat siis lukijalle pelkkää hepreaa. Jälkeenpäin ajateltuna arvot olisivat muutenkin voineet olla havainnollisemmat – jos vielä saisin vaihtaa, esittäisin ne tietoon tulleiden rikosten määränä tuhatta asukasta kohti.

Lopuksi haluan vielä sanoa, että muiden opiskelijoiden kurssiblogien seuraaminen on ollut hieno kokemus ja oppimiseni kannalta ensiarvoisen tärkeää. Kurssin hienoin puoli on ollut vuorovaikutteisessa, keskustelevassa ja ideoita jakavassa oppimisessa sekä sen todistamisessa, kuinka lahjakasta ja fiksua porukkaa laitoksellamme opiskelee. Taidanpa olla eksynyt itseäni parempaan seuraan! Sen kunniaksi haluankin täydellistää tämän imelän loppukaneetin viimeisellä pakollisella viittauksella kurssitoveriini Tiia Seeveen, joka on tiivistänyt kurssin loppufiilikset blogissaan suorastaan oivallisen ytimekkäästi:

“Jes jes! Karttoja!”

Niinpä.

Jes!

 

Lähteet:

Andres, A; Cerro, A (2011). Typologies of Crime in the Argentine Provinces. A Panel Study 2000-2008. <http://mpra.ub.uni-muenchen.de/44460/1/MPRA_paper_44460.pdf> Viitattu 12.3.2014.

I N D E C (2014). Statistical Yearbook of the Argentine Republic. <http://www.indec.mecon.ar/default.htm>. Viitattu 5.3.2014.

IELDE – Instituto de Estudios Laborales y del Desarrollo Economico (2014). Stats: Income and earnings. <http://www.indec.mecon.ar/default.htm> Viitattu 5.3.2014.

Seeve, T. (2014). Kurssikerta 7: It’s the final countdown! Blog-blog-blooog-blooog! Blog-blog-blog-blog-blooog! <https://blogs.helsinki.fi/setiseti/2014/02/28/kurssikerta-7-its-the-final-countdown-blog-blog-blooog-blooog-blog-blog-blog-blog-blooog/> Viitattu 14.3.2014.

The World Bank (2014). Urban population (% of total). <http://data.worldbank.org/indicator/SP.URB.TOTL.IN.ZS> Viitattu 12.3.2014.

UNDP (2014). Unsatisfied Basic Needs Method. <http://www.undp.org.lb/programme/pro-poor/poverty/povertyinlebanon/molc/methodological/C/basicsneed.htm> Viitattu 12.3.2014.

Wikipedia (2014). Gini coefficient. <http://en.wikipedia.org/wiki/Gini_coefficient> Viitattu 12.3.2014.

 

Leave a Reply

Your email address will not be published. Required fields are marked *