Tietokantojen yhdestelemistä ja Suomen valuma-alueet

Tällä kertaa harjoittelimme tietojen yhdistämistä eri tietokannoista ja uuden tiedon luomista uusiin taulukon sarakkeisiin MapInfossa.

Se kuulostaa yksinkertaiselta – “copy” ja “paste”. Mutta rakkaan MapInfon kanssa se ei suju ihan niin helposti. Kyselyjen ja taulukonmuokkaustyökalun kautta mennään ja sitten pitää vielä muistaa miten uusi taulukko tallennetaan oikeaoppisesti, mikä tuotti minulle ongelmia kun en saanut uutta taulukkoa avattua tallentamisen jälkeen. Nämä toiminnot osaa vasta sitten kun sitä on harjoitellut monta kertaa, sillä yhden opastetun harjoituksen jälkeen ei vielä ollut helppoa muistaa miten kaikki piti tehdä.

Aloitimme Afrikan kartan avaamisella, ja siinä kaikkien maiden eri osien yhdistämisellä yhdeksi objektiksi (enkä rehellisesti sanottuna enää päivää myöhemmin muista miten se toimi). Tämän jälkeen lisäsimme muutaman saraketiedon internetin käytöstä samaan taulukkoon, ja tämän jälkeen loimme uutta tietoa mm. laskemalla internetin käyttäjien prosentuaalista kasvua (jopa 80 000 % 14 vuodessa jossakin maassa!) ja Facebookin käyttäjien osuutta kaikista internetkäyttäjistä. Saimme huomata että tulee olla kriittinen tilastojen paikkaansapitävyyteen ja että pitää huomioida miten tilastoja on kerätty – miten on mahdollista että Facebookin käyttäjiä olisi yhdessä maassa tuplasti enemmän kuin internetin käyttäjiä?

Viimeinen opastettu osuus oli Afrikan konfliktien, timanttikaivosten ja öljylähteiden sijoittaminen kartalla olevasta tiedosta tilastolliseen muotoon taulukkoon. Mikäli vain muistaa millä toiminnolla se tehdään niin se on melko yksinkertaista.

Kartasta (kuva 1) voi päätellä että useimmat konfliktialueet/paikat eivät sijaitse timanttikaivosten tai öljylähteiden lähistöllä, joskin monien konfliktien vaikutusalue peittää suuren osan näistä.Timanttikaivokset ovat painottuneet Etelä-, Keski- ja Länsi-Afrikkaan kun taas Afrikan pohjoisrannikolla on melkein kaikki alueen öljylähteet. Itä-Afrikassa ja Saharan autiomaassa ei luonnonvaroista ainakaan timantteja tai öljyä esiinny niin paljon että ihminen niitä sieltä ottaisi käyttöön.

Suuri osa konflikteista sijoittuu kumminkin juuri näille alueille. Syitä tähän voisi olla esimerkiksi kuivuus ja sen aiheuttama nälänhätä ja kilpailu puhtaasta vedestä. Kolonialismi on Afrikan konfliktien takana kun maat jaettiin ilman kunnioitusta luonnollisille ihmisryhmien rajoille.

Monessa Afrikan maassa konfliktit ovat nimenomaan maan sisäisiä. Esimerkiksi Somalia on ollut sisällissodassa 1990-luvun alusta saakka vallankaappauksen jäljiltä. Monissa muissa maissa, esim. Algeria, Liberia ja Burundi, sisällissodat eri etnisten ryhmien välillä ovat piinanneet maiden asukkaita (YK-liitto 2013).

Vaikka kartalla kuvataan timanttikaivoksia, öljylähteitä ja konflikteja ei näiden välille voi väittää syy-seuraussuhdetta ilman tarkkaa asiaan paneutumista. Varmasti kiistelyt arvokkaista maista ovat voineet johtaa konflikteihin, tai ehkä ennemminkin olla osasyynä niihin. Siksi olisikin informatiivisempaa kuvata esimerkiksi samoina vuosina alkaneita konflikteja sekä löydettyjä jalokivi- ja öljyesiintymiä. Jos näiden välillä löytyisi yhteyttä, voisimme varmemmin sanoa että niillä on ollutkonfliktin syntyyn vaikutusta. Muuten voisimme/voimme nähdä kartalta korrelaation 100 vuotta sitten löytyneen öljylähteen ja 5 vuotta sitten alkaneen konfliktin välillä, vaikka niiden välillä ei olisi mitään yhteyttä.

Internetkäyttäjien määrä voisi pitää jonkinlaisena mittarina kehittyneisyydestä, tai varallisuudesta ja tasaisemmasta tulonjaosta kuten Pinja Myllykoski kirjoittaa blogissaan: “Öljyvaltiot ovat tunnettuja siitä, että öljystä saadut tulot eivät jakaudu tasaisesti valtion asukkaiden kesken, vaan tuloerot kasvavat. Tässä tapauksessa voisi internetkäyttäjien määrää käyttää eräänlaisena varallisuuden jakautumisen ja kehityksen mittarina: internetkäyttäjien määrän kasvaessa valtion tulot jakautuvat tasaisemmin tavallistenkin kansalaisten käyttöön.” 

Antti Autio on tehnyt kartan internetin ja Facebookin käyttäjien määrästä Afrikassa. Hänen kartastaan näemme että internetkäyttäjien osuus valtion väestöstä on korkein Marockossa. Marockon Gini-kerroin on noin 0,4 mikä on Afrikan alimpia muttei alin. Esimerkiksi Egyptissä internetkäyttäjien määrä on Afrikan oloissa suhteellisen korkea, 30-40 prosentin luokkaa, ja siellä Gini-kerroin onkin 0,3. Keski-Afrikan tasavallassa, jossa internetkäyttäjien määrä on hyvin pieni, Gini-kerroin on yli 0,6. Näiden kahden tekijän välillä ei kuitenkaan ole suora korrelaatio ja internetkäyttäjien määrään on muitakin syitä kuin tasainen tulonjako. Esimerkiksi turistialueilla voisi uskoa internetin levinneisyyden olevan laajempi.


Kuva 1. Afrikan konfliktit ja niiden laajuus, timanttikaivokset ja öljylähteet (Paarlahti 2015).

Suomen valuma-alueet

Tämän viikon itsenäisharjoitus  käsitteli valuma-alueita. Tehtävänä oli tehdä karttaesitys Suomen valuma-alueista ja niiden tulvaindeksistä ja järvisyydestä. Tehtävässä ei tarvinnut itse piirtää karttaa, sen ja tarvittavat tilastot saimme valmiina aineistona.

Itse jouduimme laskemaan tulvaindeksin ensin yhdistämällä kaksi eri taulukkoa, ja tämän jälkeen suorittamalla laskutoimituksen jossa jaettiin jokien  keskiylivirtaama keskialivirtaamalla. Järvisyyden, eli järvien osuuden alueen pinta-alasta, saimme Excelissä olevasta taulukosta ja se esitetään pylväsdiagrammein. Yritin ensin tehdä tehtävän haastavamman ohjeen mukaan mutta totesin että minä en osaa mitään.

Tämän jälkeen tarvitsi enää tehdä teemakartta (kuva 2). Minä vein kartan vielä Coreliin viimeisteltäväksi, siellä oli helppo siirtää huonosti sijoittuneita pylväitä. Corelissa on myös todella paljon helpompi sijoittaa mittakaava ja pohjoisnuoli juuri sinne minne itse haluaa, joten tulen varmaan toimimaan näin jatkossakin. Lisäksi sain helposti vähän nimistöä lisättyä karttaan.

Kartasta voi päätellä että pahimmat tulva-alueet sijaitsevat rannikon lähistöllä olevissa joissa, etenkin Pohjanmaalla mutta myös etelärannikolla, esimerkiksi Vantaanjoki.

Karttaa nopeasti vilkaisemalla huomaa korrelaation tulvaindeksin ja järvisyyden välillä. Siellä missä tulvaindeksi on korkea ei ole paljon järviä mutta jokien virtaama on iso. Sisämaassa missä järvien osuus on reilusti suurempi ei käänteisesti ole paljon tulvia, sillä järvet pystyvät varastoimaan paljon vettä eikä jokien virtaama siten edes pahimpaan tulva-aikaan ole kovin suuri rannikon jokiin verrattuna.

Yhteistä kaikille kahden ylimmän tulvaindeksiluokan valuma-alueille on että järvien osuus niiden pinta-alasta on korkeintaan noin viiden prosentin luokkaa. Kahden alimman luokan alueiden järvisyys ei kuitenkaan aina ole kovinkaan paljon näitä korkeampi, eli muitakin syitä matalaan tulvaindeksiin on kuin järvien suuri pinta-ala.

Järvien lisäksi myös esimerkiksi suot sitovat paljon vetta ja vähentävät jokien ylivirtaamaa. Etelä-, Keski- ja Rannikko-Pohjanmaan soista noin 80 % on ojitettu, ja tämä lisää veden nopeaa valumista jokiin (SLL 2012). Tämän takia soita pitäisi ennallistaa, eli tukkia niiden ojat, jotta vesi varastoituisi sinne. Veden valunta on myös nopeaa ojitetuilta pelloilta ja metsistä, sekä rakennetuilta alueilta ja silloin jokien huippuvirtaamat ovat korkeita.

valuma-aluuet
Kuva 2. Suomen valuma-alueiden tulvaindeksi ja järvisyys. Tulvaindeksi kuvaa jokien virtaaman vaihtelua ottaen huomioon sekä kuivat että tulvaisat kaudet (Paarlahti 2010). Järvisyys tarkoittaa järvien osuutta valuma-alueen pinta-alasta. 

Kaiken kaikkiaan voin tämän kurssikerran jälkeen todeta, että vaikka harjoittelimme itse monen uuden asian tekemistä MapInfossa en kuitenkaan oppinut mitään niin hyvin että osaisin ja hallitsisin sitä ja osaisin tehdä kaiken uudestaan kompuroimatta. Luulenpa että tällä viikolla ohjelmassani on harjoitella uudestaan itsenäisesti kolmannen kurssikerran aineistolla. Ehkäpä yrittäisin ladata MapInfon uudelle tietokoneelleni?

 

LÄHTEET

Autio, A. (2015). Internet ja Facebook Afrikassa. <https://blogs.helsinki.fi/anttiaut/files/2015/02/Internet-Afrikassa.jpg> Luettu 12.2.2015

Central Intelligence Agency (2015) The World Factbook. <https://www.cia.gov/library/publications/the-world-factbook/fields/2172.html> Luettu 12.2.2015

Myllykoski, P. (2015). Kurssikerta 3: timantteja ja tulvia. <https://blogs.helsinki.fi/myxmy/2015/02/09/kurssikerta-3/> Luettu 12.2.2015

Paarlahti, A. (2010). Tulvaindeksi. TVT3-Geoinformatiikka, kevät 2010. <https://blogs.helsinki.fi/tvt3-2010/2010/02/01/tulvaindeksi/> Luettu 12.2.2015

Paarlahti, A. (2015) Afrikkaa ja konflikteja. Paikkatiedon hankinta, analyysi ja kartografia 2015. <https://blogs.helsinki.fi/pak-2015/2015/01/30/afrikkaa-ja-konflikteja/> Luettu 12.2.2015

SLL=Suomen Luonnonsuojeluliitto (2012). Soiden ennallistaminen vähentää tulvia. <http://www.sll.fi/ajankohtaista/tiedotteet/2012/soiden-ennallistaminen-vahentaa-tulvia> Luettu 12.2.2015

YK-liitto (2013). Globalis, interaktiivinen atlas. <http://www.globalis.fi/Konfliktit> Luettu 12.2.2015

Artikkeli 1: Pohdintoja päällekkäisistä koropleettikartoista

Toisen kurssikerran tehtäviin kuului myös artikkelin lukeminen ja siitä reflektiopaperin kirjoittaminen. Kyseinen artikkeli on Anna Leonowiczin kirjoittama Two-variable choropleth maps as a useful tool for visualization of geographical relationship joka nimensä mukaan käsittelee päällekkäisiä koropleettikarttoja.

Leonowicz tutki ensimmäisen vuoden yliopisto-opiskelijoiden näkemyksiä koropleettikartoista. Tulokseksi hän sai että yhden muuttujan koropleettikartat ovat käytännöllisiä ilmiön alueellisen jakautumisen esittämiseksi, kahden muuttujan kartta taas on käytännöllisempi kahden muuttujan välisiä suhteita tulkittavaksi.

Artikkelin johtopäätökset ovat hyvin samankaltaisia kuin omat ajatukseni. Kahden eri muuttujan tilallista suhdetta on helpompi verrata mikäli ne esitetään samalla kartalla kuin että katsoisi kahta erillistä karttaa. Kun kaksi asiaa esitetään päällekkäin on toki vaikea hahmottaa vain toisen ilmiön alueellista jakautumaa. Siksi on hyvin käytännöllistä että on mahdollisuus käyttää eri esitystapoja.

Artikkelin kartoissa molemmat muuttujat kuvattin väreillä. Legenda oli tällöin 3×3 (ja 4×4) -ruudukko jossa yhden muuttujan väriskaala on yhdellä ja toinen toisella akselilla. Välissä olevat ruudut saavat siten sävynsä molempien muuttujien väristä yhdistelemällä (kuva 1).

legenda-1
Kuva 1. Legendaesimerkki Leonowiczin artikkelista. Asettamalla kahden eri muuttujan esitysvärit päällekkäin saadaan päällekkäisten koropleettikarttojen esitysvärit. Valkoinen tarkoittaa että molempien muuttujien määrä on pieni, tummansininen muuttujan 1 sekä tummanpunainen muuttujan 2 suurta esiintymistä. Tumma punsisesta ja sinisestä väristä sekoittunut väri taas tarkoittaa molempien muuttujien korkeaa esiintymistä (Leonowicz 2006).

Leonowicz laittoi artikkelissaan yhden painopisteen näiden värien yhdistelemiseen. Minusta ei yleensä ole hyvä käyttää värejä molempien ilmiöiden kuvaamiseen, sillä vaikka käyttäisi korkeintaan yhdeksää luokkaa sävyt voivat olla hyvin lähellä toisiaan, jos ei löydä todella hyvää vaihtoehtoa. Siksi minun mielestä on parempi käyttää jotain muuta rasteria (esim. viiva- tai piste-) toisen muuttujan kuvaamiseksi. Tällöin on toki myös tärkeätä huomioida että rastereiden hierarkia tulee säilyä hyvin ymmärrettävänä.

Lukijalta tällaisten kartografisten esitysten lukeminen edellyttää useimmiten hieman syvempää paneutumista kartan sisältöön. Mitä kartalla esitetyt värit oikeasti tarkoittavat? Mikä on kartalla näkyvien eri värien välinen suhde? Erityisesti legendaan kannattaa tutustua huolella mikäli haluaa ymmärtää kartan sanoman. Taas tulemme siihen että kartan laatijan on käytettävä toisistaan erottuvia värejä, esimerkiksi artikkelissa olevassa Mazowsze -alueen kartassa minun on aika vaikea hahmottaa värien erottelu kun siinä on käytetty sinistä ja liilaa värisävyä (kuva 2).

Miikka Lappalaisella on samanlaiset mietteet kuin minulla – on selkeämpi käyttää läpinäkyvää koropleettikartaa kuin tällaista kahde värin yhdistelmää jota värisokeiden ehkä on vaikea lukea.

mazowsze
Kuva 2. Leonowiczin tutkimuksessa käytetty kartta, jossa muuttujat esitetään sinisellä ja liilalla värillä. (Leonowicz 2006).

Emme tunnilla käyneet läpi miten MapInfolla tehdään tällainen karttaesitys taikka legenda, mitä mielellään olisin harjoitellut. Olisi ollut kiinnostavaa kokeilla jos itse saan tehtyä hyvän karttaesityksen jossa molemmat muuttujat kuvataan väreillä. Voihan se tietenkin olla että sillä ei voi tehdä semmoista. Kuten tehtävänannossa vihjaillaan, käytössä olevan paikkatieto-ohjelman toiminnot rajaavat tehokkaasti esitysmahdollisuuksia. Varmaan huomaamattakin jokaisesta samalla ohjelmalla tehdystä karttaesityksestä tulee jonkin verran toistensa kaltainen, esimerkiksi värien, rastereiden, luokkajaon ja muiden esitysteknisten yksityiskohtien osalta.

LÄHTEET

Lappalainen, M (2015). 2. kurssikerta: Päällekkäiset koropleettikartat. <https://blogs.helsinki.fi/mwlappal/2015/02/04/2-kurssikerta-paallekkaiset-koropleettikartat/> Luettu 12.3.2015.

Leonowicz, A (2006). Two-variable choropleth maps as a useful tool for visualization of geographical relationship.  Geografija. T. 42. Nr 1. 33–37.

Päällekkäiset koropleettikartat

Toisella kurssikerralla jatkoimme teemakarttojen laatimista. Tällä kertaa kävimme läpi erilaisten teemakarttojen laatimisen teknisiä yksityiskohtia ja teimme jopa kolmannella ulottuvuudella varustetun kartan Suomen väkiluvusta.

Pääpaino oli kahden eri tekijän näyttämistä samalla kartalla. Tämän voi tehdä joko kartogrammilla, jossa alla on koropleettikartta ja tämän päällä esim. pylväs- tai ympyrädiagrammi. Diagrammin sijasta voi myös kuvata haluttua ilmiötä jollakin skaalatulla symbolilla, esimerkiksi muuttoliikettä tikku-ukoilla. Toinen vaihtoehto on näyttää yksi ilmiö eri värisävyillä ja toinen ilmiö viiva- tai pisterastereilla.

Esittelyn ja harjoituksen jälkeen oli meidän vuoromme tehdä oma vapaavalintainen teemakartta jossa verrataan kahta eri tekijää. Minä näytän Uudenmaan kuntien korkea-asteen tutkinnon suorittaneiden osuuden verratuna valtionveron alaisiin tuloihin.

Korkea-asteen tutkinnon suorittaneiden aineisto jakautui aika lailla epämääräisen tasaisesti. 30 prosenttiyksikön kohdalla tilastossa näkyy erityinen piikki, ja tätä suurempia arvoja on enää muutama. Valtionveron alaisien tulojen aineisto on normaalijakautunutta, poikkeuksena yksi havainto, Kauniainen, jossa veron alaiset tulot ovat muita kuntia merkittävästi suuremmat.

Päädyin käyttämään kvantiililuokitusta molemmista ilmiöistä siitä syystä että kaikissa luokissa silloin on suunnilleen yhtä monta kuntaa. Muilla mahdollisilla vaihtoehdoilla aina johonkin luokkaan olisi jäänyt vain 1-3 kuntaa, jolloin yhtäältä niiden erilaisuus verratuna muihin kuntiin olisi korostunut entisestään, mutta toisaalta muiden kuntien välinen vaihtelu olisi jäänyt huomaamattomammaksi.

Kun näytämme kahta koropleettikarttaa päällekkäin voimme luettavuuden säilyttämisen takia käyttää korkeintaan kolmea luokkaa kartta kohden. Tällöin yhdistetyllä kartalla voi olla yhteensä yhdeksän eri luokitusta (3×3).

Minä näytän korkea-asteen tutkinnon suorittaneiden osuuden eri vihreän sävyillä, joista tummin kuvaa korkeakoulutetuinta luokkaa. Valtionveron alaiset tulot tulonsaajaa kohtaan näytän pisterasterein jolloin korkeimman tulon kunnat on merkitty tiheimmillä pisteillä. Matalimpien tulojen kunnat jätin täysin pisterasteritta, tavoitteena luokkien erottelun helpottuminen ja siten kartan helpompi luettavuus (kuva 1).

Jostakin syystä täällä blogissa tiheintä pisterasteria ei erota, joten karttaa kannatta klikata ja katsoa suurempana…

korkeakoulutus-veronalaiset tulotKuva 1. Korkea-asteen tutkinnon suorittaneiden osuus 15 vuotta täyttäneestä väestöstä sekä valtionveron alaiset tulot tulonsaajaa kohtaan Uudenmaan kunnissa. Suluissa olevat luvut kertovat kyseiseen luokkaan kuuluvien kuntien lukumäärän.

Hypoteesini ennen kartan tekoa oli että siellä, missä on paljon korkeakoulutettuja, myös tulot ovat korkeampia kuin alueilla joissa väestö on alemmin koulutettua.’

Ja näinhän se todellisuus onkin. Aika loogistakin se on – tulot kasvavat koulutusasteen kasvaessa (kuva 2).

koulutuksen vaikutus tuloihin
Kuva 2. Kotitalouden vuositulot viitehenkilön (kotitalouden jäsen jonka henkilökohtaiset tulot ovat suurimmat) koulutusasteen mukaan (Suomen virallinen tilasto).

Korkeakoulutettujen, ja siten varakkaampien, alueellinen jako on merkittävä Uudellamaalla. Yksinkertaistetusti voi sanoa että korkeakoulutus ja tulotaso muodostavat kehämallin: mitä kauemmas pääkaupunkiseudusta tullaan, sitä suuremmalla todennäköisyydellä sekä korkeakoulutettujen että veronalaisten tulojen määrä on matala.

Kahdeksan korkeakoulutetuinta kuntaa ovat Inkoo, Siuntio, Kirkkonummi, Espoo, Kauniainen, Helsinki, Tuusula ja Järvenpää. Näistä kaikki paitsi Helsinki ja Järvenpää kuuluvat ylimmän tulotason (valtionveronalaiset tulot) kuntiin. Tähän ryhmään kuuluu näiden lisäksi Nurmijärvi.

Alimpiin luokkiin kuuluvat kunnat sijaitsevat kaikki Uudenmaan reuna-alueilla, etenkin Itä-Uusimaalla.

Minkä takia koulutus ja varallisuus on maantieteellisesti näin epätasaisesti jakautunutta? Yksinkertaisin selitys jonka keksin on että työpaikat ovat keskittyneet pääkaupunkiseudulle (tämän vahvistan vielä tekemällä karttaesityksen siitä), jossa myös useimmat maakunnan korkeakouluista sijaitsee. Ja yleisesti ottaen halutaan asua lähellä työpaikkaansa, joten matalammin koulutetut jäävät suureen enemmistöön kauempana pääkaupunkiseudun työpaikkaryppäästä.

Jos katsomme viime kurssikerralla laatimaani koropleettikarttaa työttömyysasteesta Suomen kunnissa huomaamme että työttömyys on hieman korkeampaa Uudenmaan reuna-alueilla kuin pääkaupunkiseudun ympäristössä. En toki voi vahvistaa että tällä olisi yhteys alueen matalampaan koulutusasteeseen ja tulotasoon.

Jussi Jurvala on verrannut korkeakoulutusasteen ja kuntien väkiluvun välistä korrelaatiota. Hän toteaa että “[y]li 10 000 asukkaan kuntien korkeakoulutusaste on enimmäkseen ylintä luokkaa ja jonkin verran keskimmäistä luokkaa – – – Alle 5000 asukkaan kunnista suurimmassa osassa on enimmäkseen alimman koulutusasteen luokkaa”. Hänen luokkajakonsa eroaa toki minun luokituksesta – hänen esityksessä melkein kaikki Uudenmaan kunnat kuuluvat ylimmän korkeakoulutusasteen luokkaan. Voi toki olettaa että väkiluvulla ja korkeakoulutusasteella olisi korrelaatio myös Uudellamaalla.

Kun vertaan omaa karttaani Tuure Takalan karttaan, jossa hän esittää korkeakoulutettujen ja työssäkäyvien määrän suhdetta. Huomaan että eniten töissäkäyviä on etenkin niissä kunnissa joissa verotulot tulonsaajaa kohtaan ovat suurimmat, esim. Siuntio, Kirkkonummi, Nurmijärvi ja Tuusula. Näissä kunnissa myös koulutusaste on korkea. Työssäkäyvien osuus on toki korkea myös Mäntsälässä ja Pornaisissa, missä korkeakoulutettujen ja veronalaisten tulojen määrä on selvästi matalampi – eli näillä muuttujilla ei ole selvää syy-seuraussuhdetta.

Mitä minä opin?

Oli hyödyllistä joutua miettimään miten kahden eri muuttujan välistä suhdetta kannatta esittää kartalla. Minä jäin miettimään erityisen pitkään luokittelua: pitäisikö minun jollakin tavalla luokitella molemmat muuttujat toisiinsa “synkronoituneina”? Totesin lopulta että eihän mitään semmoista oikeastaan ole, mutta näin tärkeänä että jos minulla yhdestä asiasta on kvantiililuokitus, eli yhtä monta havaintoa jokaisessa luokassa, niin minä johdan lukijaa vähiten harhaan jos myös toisesta muuttujasta on samanlainen luokitus.

Toinen kohta jossa jouduin miettimään oli rasterin valinta sille aineistolle jota en näyttänyt eri värisävyillä. Kuten edellä mainitsin totesin että on hyvä että alin luokka on täysin ilman rasteria luettavuuden parantamiseksi. Toiseksi kuin minulla oli vain kaksi muuta luokkaa oli helppo valita että korkein luokka oli huomattavan tiheillä pisteillä merkattu, niin että se erottuu keskimmäisestä luokasta. Mikäli luokkia olisi useampi voisi pohtia jospa olisi motivoitua käyttää kahta erilaista rasteria, mutta en tiedä kuinka helppoa olisi saada erottumaan selvästi niiden hierarkia.

Muuten tämän kurssikerran tehtävässä ei mielestäni ollut mitään ihmeellisyyksiä. On toki tullut selväksi että MapInfo ei ole se ohjelma mitä pitää käyttää mikäli haluaa olla kreatiivinen. En oikein ymmärrä miksi yksinkertaisten asioiden tekemiseen täytyy kulkea niin monen mutkan kautta. Esimerkiksi tietokannasta tiedon kopiointi esimerkiksi histogrammia varten. Miksi tietoa jonka haluaa ei voi vain maalata niin kuin Excelissä?

 

LÄHTEET

Jurvala, J (2015). Jurvala’s blog: Kuntien väkiluku ja korkeakoulutusasteLuettu 25.1.2015

Suomen virallinen tilasto (verkkojulkaisu). Tulonjakotilasto. Tilastokeskus, Helsinki. Luettu 25.1.2015.

Takala, T (2015). Takalan PAK-blogi: 2. kurssikerta. Luettu 27.1.2015

Teemakartan laadintaa

Ensimmäisellä kurssikerralla teemana oli uudelleentutustuminen paikkatieto-ohjelma MapInfoon sekä sen avulla teemakartan laatiminen.

Teemakartta oli tarkoitus tehdä jostakin aiheesta käyttäen valmiita tietoja Suomen kunnista 2011. Minä valitsin aiheekseni työttömyysasteen, joka metatietojen mukaan on ennakkotietoja vuodelle 2010. Työvoimaan kuuluvat ne 18–74 -vuotiaat, jotka 31.12.2010 olivat joko työllisiä tai työttömiä.

Kun tietoja tarkastelee histogrammityökalun avulla (kuva 1) niin näemme että aineisto on selvästi normaalijakautunutta. Matalan työttömyysasteen kuntia on vähän, “havantojen”, eli kuntien määrän lisääntyessä ylempiin luokkiin siirryttäessä. Eniten kuntia on siinä luokassa jossa työttömyys on 10 prosentin paikkeilla (histogrammissa on 12 luokkaa havaitsevuuden lisäämiseksi, mutta karttaesityksessäni on vain 4 luokkaa). Tämän jälkeen havaintojen määrä luokkaa kohti kääntyy laskuun ja kuntia joissa noin joka viides on työtön on vain muutamia.

Histogrammityökalussa huomasin että histogrammi voi näyttää todella paljon erilaiselta riippuen siitä kuinka monta luokkaa siihen valitsee. Minä valitsin luokkien määrän niin että aineisto näyttää niin normaalijakautunellta kuin mahdollista. Jenni-Maria taas on käyttänyt useampaa luokkaa ja hänen histogrammissa näkyy enemmän vaihtelua puhtaasti normaalijakautuneesta aineistosta. Minä tein tietoisen valinnan kun tein niin symmetrisen “portaat ylös, portaat alas” -histogrammin kuin vain mahdollista. Kun käyttää harvempaa luokkamäärää, eli yleistettäessä, saa selvemmän tuloksen.

histogrammi kk1

Kuva 1. Histogrammi aineiston jakautumisesta.

Normaalijakautunutta aineistoa suositellaan luokiteltavaksi joko kvantiileittain, keskiarvoin tai hajontaluvuin. Keskiarvoluokittelua suositellan toki eniten tasaisille jakaumille, joten en valinnut sitä. Kvantiililuokittelu taas sopii oikeastaan kaikentyyppisille aineiston jakautumille. Kokeilin tätä, mutta verratessani tulosta hajontalukujen luokkaväleihin huomasin että kvantiililuokitus ei antanut yhtä monipuolista karttanäytöstä.

Jenni-Maria puolestaan valitsi keskiarvoluokittelun käyttäen viittä eri luokkaa. Ihmeissäni katson että hänen kolme ylintä luokkaa ovat identtiset minun kolmen ylimmän luokan kanssa, eli tässä tapauksessa keskiarvoilla tehty luokittelu ei poikkea keskihajonnasta tehdyllä. Hänen alimmassa luokassa (1,7–3,1 %) on toki vain kahdeksan kuntaa, eikä niitä oikein erota kartalta niiden kaikkien ollessa Ahvenanmaan pienillä saarilla.

Hajontalukuluokituksessahan luokkaväleinä käytetään keskihajontaa, jolloin neljää luokkaa käytettäessä kahteen keskimmäiseen luokkaan jää yhtä paljon ja eniten havaintoja. Ensimmäiseen ja neljänteen luokkaan taas sijoittuu puolet vähemmän havaintoja kuin keskimmäisissä.

Luokkaväleistä tuli epätasaiset, eli luokkien vaihteluväli ei ole yhtä suurta eivätkä luokkien rajat ole tasalukuja. Tämä tietenkin vaikeutta tai ainakin hidastaa kartan täydellistä ymmärtämistä, etenkin kokemattomamman lukijan kohdalla.

En käyttänyt MapInfon valmiita väriskaaloja vaan valitsin itse yhden värin ja annoin ohjelman tehdä siitä neljä eri sävyä. Koska työttömyys useimmiten katsotaan huonoksi asiaksi valitsin väriksi punaisen joka yleisesti (politiikka, karkit ja urheilu poislukien) merkitsee jotakin negatiivista. Mielestäni sävyt erottuvat hyvin toisistaan, eli minulla ei ole liian monta luokkaa.

Jenni-Maria on valinnut värinsä ajatellen niitä jotka erottavat läheisiä värisävyjä huonosti, ja täten valinnut kaikille luokille omat värit. Hänen valintansa toimii hyvin (toki kahden keskimmäisen luokan värit ovat hyvin lähellä toisiaan), mutta itse suosin yhden värin sävyjen käyttöä sen yksinkertaisuuden takia. Ihmettelen hieman miksi hänen väriskaalansa menee sinisestä ruskeaan eikä punaiseen.

Tuloksia tarkasteltaessa (kuva 2) silmään pistää heti itä- ja pohjoisosien tumma punainen, eli korkea työttömyys (14,5–22,6 %), sekä pääkaupunkiseudun ja Keski-Pohjanmaan vaalea sävy, eli pieni työttömyysaste (1,7–6,9 %).

 

Työttömyysaste 31.12.2010Kuva 2. Työttömyysaste Suomen kunnisa vuoden 2010 lopussa. Suluissa olevat luvut kertovat kyseiseen luokkaan kuuluvien kuntien lukumäärän.

Yksinkertaistettuna voisi sanoa että työttömyys kasvaa rannikolta sisämaahan mentäessä. Melkein kaikki alimman luokan kunnat sijaitsevat alle sadan kilometrin päässä merestä, poikkeuksena etenkin Paltamo Kainuussa. Toki korkeimman luokan edustajia löytyy rannikoltakin, esimerkiksi Hailuoto Oulun edustalla ja Merikarvia Porin pohjoispuolella.

Syitä näihin alueellisiin eroihin on varmasti monia. Yleisesti on ollut havaittavissa työpaikkojen keskittymistä etenkin pääkaupunkiseudulle. Pienillä paikkakunnilla suuren työnantajan toiminnan alasajaminen vaikuttaa suuresti paikkakunnan työllisyyteen.

Pertti Böckermanin mukaan syynä työttömyyden alueellisiin eroihin on “vientijohteinen elpyminen 1990-luvun  alun syvästä lamasta.” Talouskasvu työllistää myös Etelä-Suomessa itää ja pohjoista paremmin, johtuen Etelä-Suomen palveluvaltaisammasta tuotantorakenteesta. Toistuvaistyöttömyys on yleisintä Itä- ja Pohjois-Suomessa, mutta työttömyysjaksoja katkotaan aktiivisella työvoimapolitiikkalla (Böckerman 2000).

 

LÄHTEET

Bergman, Jenni-Maria (2015) Jenni-Marian blogi, Jenni-Marias blogg <https://blogs.helsinki.fi/jibergma/> Luettu 22.1.2015.

Böckerman, Pertti (2000) Suomen työttömyys – alueellinen näkökulmaArtikkeliluonnos teokseen Suomalaisen Sosiaalipolitiikan Alueellinen Rakenne (toim. Loikkanen, H.A., Saari, J). Palkansaajien tutkimuslaitos, Helsinki.