Kurssikerta 7: Rosvoja ja poliiseja Euroopassa

Viimeisellä kurssikerralla tehtävämme oli etsiä itse jokin kiinnostava aineisto sekä laatia sitä ja kurssillamme opittuja taitoja hyväksikäyttäen jonkinlainen karttaesitys.

Upeaa! Saan valita aiheen itse! Ooh, mitä upeita ja aiheita voinkaan louhia netin loputtomista vapaan datan tietokannoista ja hioa niistä nerokkaita ja oivaltavia timantteja.

Helpommin sanottu kuin tehty. Meinasi tulla infoähky. Noin 4h kattavia tilastotietokantoja kahlattuani ja kolme kertaa aiheeni (rahanpesu, aikuisviihteen suosio USA:n osavaltioissa, veroparatiisit) jo vaihdettua päätin vain tarttua ja pitäytyä seuraavassa vastaantulevassa ideassa.

Päädyin vertailemaan Eurostatin tilastoja eri Euroopan valtioiden poliisien ja vankien määristä ja osuuksista väestöstä. Pyörittelin dataa hetken Excelissä ja tuikkasin sen MapInfoon. Käytin pohjakarttana ilmaisen Natural Earth -karttapaketin aineistoa valtioiden rajoista. Projektiona Mollweiden Equal area, muodot ja kulmat vääristyvät mittasuhteiden kustannuksella. (jus for da kicks).

Missä maissa on eniten/vähiten poliiseja/vankeja suhteessa 100 000 asukkaaseen? Entä korreloivatko edelliset lukemat ja miten? Tilastot ovat vuodelta 2012 (joidenkin maiden tapauksessa ei ollut tilastoa saatavilla kyseiseltä vuodelta, esim. Bosnia Hertsegovina. Käytin silloin tuoreinta saatavilla olevaa aineistoa.)

Molempien aineistojen histogrammit. Luokittelutapaa voisi käsin viilata, mutta päätin käyttää tässä vaiheessa luokitustapana nopeasti kvantiileja (syy selviää pian).

vankia_sata_hstgr

Kuva 1. Vankia 100 000 asukasta kohti Euroopan eri valtioissa.

 

poliisia_sata_hstgr

Kuva 2. Poliisia100 000 asukasta kohti Euroopan eri valtioissa.

Syntyi karttoja!

Kuva 3. Vankien määrä eurooppalaisissa valtioissa.

Kuva 3. Vankien määrä eurooppalaisissa valtioissa.

poliisien_maara_PNG

Kuva 4. Poliisien määrä väestöstä eurooppalaisissa valtioissa

Vankien osuus väestöstä vaikuttaisi olevan korkeimmillaan Itä-Euroopassa, Bosniassa ja Turkissa. Poliiseja taas eniten löytyisi Välimeren maista ja Belgiasta. Keski-Eurooppa puksuttaa keskikastisssa.

Käytin molemmissa kartoissa vain kolmea luokkaa tarkoituksella, sillä halusin koittaa tuottaa 2. kurssikerralla luetun artikkelin mukaisen kahden muuttujan koropleettikartan. Projekti hieman epäilytti, mutta samalla innosti. En ole kovin vakuuttunut kyseenlaisen karttaesityksen pätevyydestä, mutta sellaisen laatimisen oppiminen kiinnosti.

SPSS apuun! Korrelaatiodiagrammi osoitti, että muuttujat korreloivat. Tarpeeksi myös siihen, että kahden muuttujan koropleettikartta olisi järkevää toteuttaa.

korrelaatio_diagrammi_spss

Kuva 5. Korrelaatiodiagrammi poliisien ja vankien osuuuksista (%) 100 000 asukkaasta euroopan eri valtioissa.

Entäpä luokitusmetodi? Kvantiilit sopivat melko hyvin, mutta parempi karttaesitys syntyi hieman luokkarajoja viilailemalla. Käytin kvantiilieihin pohjautuvaa rajausta, hieman yhdistelleen joitakin luokkia yhdistellen ja pyrkien korostamaa ns. “keskiluokkaa” ja siitä poikkeavia molempiin suuntiin poikkeavia arvoja. Muunsin arvot myös “helpommin” luettaviksi prosenttiluvuiksi .

dogemandering

Kuva 6. Doge luonnehtii aineiston luokitteluprosessia

Kuten Atte Mäkikin blogissaan toteaa, aineiston haku, muokkaaminen ja yhdistely Excelisssä ja MapInfossa sujui melko vaivattomasti. Kiitos Eurostat ja hyvä aineisto.

Entäpä legendan tuottaminen ja sopivien yhdeksän värisävyn valitseminen? Exporttia SPSS:stä ja CorelDraw apuun! Värit matriisin saikin hienosti aikaan CorelDrawin blend-työkalulla (kiitos vinkistä Arttu). Asiassa edettiin valitsemalla molemmille muuttujille oma väri ja blend-työkalulla tuottamalla tarvittava määrä laatikoita (luokkia) valkoisen ja valitun värin välille (tapauksessani siis vain yksi luokka valkoisen ja valitun värin välille). Työkalu jakoi kahden määritetyn värisävyn välille sopivassa suhteessa sekoituksia luokkamäärän mukaan.

Samalla työkalulla saikin sitten syntyneistä väreistä määritettyä muidenkin luokkien tarvitsemat värit. Lisäsin vielä pienen tekstuurinkuvion värien päälle “yhdentämään” ja osoittamaan, että kartan eri värit kuvaavat samaa ilmiötä. Hieman hankala selittää, kuvat kertonee enemmän:

korrelaatiodiagrammi_with_colors

Kuva 7. Värimääritelty korrelaatiodiagrammi ja maat.

Noniin, sitten itse kartan tekoon. Kahden muuttujan koropleettikartta toimi mielestäni parhaiten karttakollaasina, eli päätin käyttää karttaesityksessä yhteensä kolmea karttaa. Käytin kahta aikaisempaa MapInfossa tekemääni karttaa (muutin vain luokituksen kvantiileista omakseni) pienoiskarttoina. Ne yhdistyisivät isoon kahden muuttujan koropleettikarttaan.

Päätin suosiolla käyttää yhdeksän luokan fuusioteemakartan tekemiseen Corelia MapInfon sijaan (teoriassa se olisi onnistunut MapInfossakin, mutta silloinkin se olisi pitänyt tehdä pääosin käsin. Corel oli tähän työkaluna tehokkaampi). Hieman mutkia matkaan tuotti se, etten saanut MapInfosta ulos vektoriaineistoa jota olisin voinut käyttää Corelissa. Ainoastaan bittikarttoja ja vielä aika alhaisella resoluutiolla. Päätin turvautua ulkopuoliseen aineistoon ja käytin netistä löytyvää ilmaista vektorikarttaa Euroopan valtioista. Ei sijainnillisesti eksakteinta, mutta karkeahkon koropleettiteemakartan tapauksessa menettelee mielestäni tarpeeksi hyvin.

Dataa ja elementtejä oli paljon ja kaiken mahduttaminen yhteen karttaan haastavaa. Sommittelusta tulikin ahdasm mm. Baltian maa jäävät hieman legendan alle, mutta en halunnut pienenentää vaikealukuista legendaa liian pieneksi.Lisäsin sen rinnalle vielä frekvenssidiagrammin joka kertoo kuinka monta maata kussakin luokassa on.

finaalia_viimein_FOR_WEBZ

Kuva 8. Kahden muuttujan teemakartta poliisen ja vankien osuuksista (%) eurooppalaisten valtioiden väestöstä 2012.

Olen syntyneeseen karttaan suhteellisen tyytyväinen. Onko se helppolukuinen ja sopiiko se hyvin kuvaamaan kuvattuja ilmiöitä? Noo… ei oikeastaan, tai ehkä joten kuten.

Yhdeksän luokkaa on paljon aineistolle jossa on vain 38 havaintoa (maata). Kartasta saa melko sekavan ja repaleisen vaikutelman. Kartta olisi saattanut olla kiinnostavampi jos sama data olisi ollut saatavilla pienemmissä alueellisissa ja hallinnollisissa yksiköissä. Itselle helpointa olikin oikeastaan silmäillä kahta pientä karttaa ison kartan sijasta.

Mitä kartta sitten kertoo? Jaa-a. Pohjoismaat, Sveitsi ja Alankomaat loistavat onneloina, joissa poliisien ja vankien suhteelliset määrät ovat Euroopan pienempiä. (Suomessa vähiten poliiseja ja toiseksi vähiten vankeja). Montenegro ja Turkki puolestaan näyttäytyvät maina, joissa puolestaan poliiseja ja myös vankeja on paljon.

Edellisen tulkinnan voisi myös kääntää: Pohjoismaat loistavat valtioina jossa poliisin resurssit ovat pienet ja vankilat tyhjinä rikollisuuden rehottaessa. Montenegrossa ja Turkissa puolestaan on turvallista aktiivisesti ja hyvillä resursseilla toimivien poliisivoimien ansiosta jotka saavat paljon rikollisia kiinni ja jossa vankilat pullottavat rikollisista.

Eli eihän näiden kahden muuttujan pohjalta voi juuri kovin paljoa juuri mistään sanoa, muuta kuin, että ne tuntuvat jossain määrin korreloivan. Olin kerännyt aineiston poliisien ja vankien määrien lisäksi myös rikoksista. Suunnitelmassani verrata myös kolmanne muuttujan poliisin ylöskirjaamien rikosten määrää. Hetkinen.. Kuinkahan kolmen muuttujan koropleettikartta onnistuisi? Kuinkahan se onnistuisi. jonkinlainen 3d-karttaprojektio? Avataanpas SPSS.

pls_no

Kuva 9. Kolmiulotteinen scatter plot. Vankien, poliisien ja raportuitujen rikosten suhde eurooppalaisissa valtioissa.

….

no-bird

Tämä blogitehtävä on nyt valmis.

Jos tekisin tehtävän uudestaan valitsisin esim. USA:n piirikuntiin jaoteltavissa olevia muuttujia, jolloin havaintoyksikköjä riittäisi. Sellaisen kartan naksuttelu käsin Corelissa ei tosin houkuttele. Koko viimeisen blogikerran työmäärä yllätti ja en ehkä ryhtyisi siihen uudestaan. Tuntikaupalla turhauttavaa vektorien naksuttelua. Oppimisen ja itse löytämisen iloa ja innostusta matkaan mahtui kuitenki paljon. Ehkäpä sittenkin ryhtyisin.

Hiirinaksutelun sijaan tälläisiä karttaesityksiä olisi toki fiksumpaa tehdä jonkinlaisen automaation avulla. En projektin alussa nopealla googlailulla löytänyt ainakaan mitään työkalua kuinka tehdä se MapInfossa.

Ehkäpä tästä saisi hyvän aiheen vaikka kandityöksi koodamalla kahden muuttujan teemakarttaesityksiä pulauttelavan pluginin johonkin GIS-softaan johon voisi määritellä aineiston ja luokittelun lisäksi suoraan halutun väriavaruuden ja joka osaisi piirtää legendan lennosta…

…kolmiulotteisena?

Linkit ja lähteet:

Atte Mäen blogi, https://blogs.helsinki.fi/attemaki/2015/03/02/7-kurssikerta/

Eurostat: poliisien määrät

Eurostat: vankien määrät

Natural Earth 1:10m Cultural Vectors

Kurssikerta 6: Luonnon- ja MapInfon-hasardeja

Kuudennella kurssikerralla tehtävämme oli yhdistää pisteaineistoa hasardeista ja tuottaa kolme karttaa joita voisi käyttää kuvitteellisesesti tuntiopetuksessa. Pistemäistä hasardiaineistoa oli maanjäristyksistä, tulivuorenpurkauksista ja meteoriittien putoamispaikoista vaihtelevalla aikavälillä.

Kuvitteellisella lukion maantiedon oppitunnilla olemme käyneet oppilaiden kanssa läpi perustietoja kustakin edellä mainitusta hasardista, niiden syntytavoista, yleisyydestä ja vaikutuksista. Karttapohjaisessa harjoitteessa keskityn tulivuorien ja maanjäristyksien sijoittautumisen sidonnaisuuteen: molemmat sijoittuvat tektonisten laattojen reuna-alueille. En kuitenkaan kerro tätä suoraan oppilaille vaan pyrin saattamaan heidät sokraattiseen oivalluksen tilaan kysymyksillä, kuten: ”Kun katselette seuraavia karttoja, niin mitä voitte sanoa niiden ilmiöiden sijoittumisesta? Onko niillä yhtäläisyyksiä? Jos on, niin millaisia? Mistä mahdolliset yhtäläisyydet saattaisivat johtua (muistelkaa edellisillä kurssikerroillanne oppimianne teemoja)? ”

Ensiksi läväyttäisen heidän eteenne tämän.

Kuva 1. Holoseenin aikana varmennetusti purkautuneet tulivuoret

Kuva 1. Holoseenin aikana varmennetusti purkautuneet tulivuoret

Oppilaat saavat tarkastella karttaa hetken smart boardilta.

maanjaristykset_yli6mw_kartta

Kuva 2. Yli 6 Mw maanjäristysten sijainnit 1960-luvulta lähtien.

Sitten edellisen kartaan viereen lävähtäisi suuri määrä pistedataa sisältävä, kaikkien yli 6 Mw (momenttimagnitudi) maanjäristyksen sijainnin 1960-luvulta lähtien paljastava kartta. Nyt toivottavasti oppilaiden oivalluksen kilikellot kilkattaisivat. Molemmat ilmiöt sijoittuvat pääosin samoille alueille! Esimerkiksi Tyynenmeren tulirenkaalle kuten Joonas Alankokin blogissaan toteaa. Mistä on kyse? No tektonisten laattojen raja-alueideilla tapahtuvasta liikkeistä tietenkin. Tästä hieno aasinsilta laattatektoniikan kertaamiseen. Oppiminen oivalluksen kautta on tapahtunut!

Edelliset kartat ovat tosin hieman tylsiä ja niissä on ongelmia. Pisteaineiston esittämisessä kartalla on omat haasteensa, etenkin jos pisteiden määrä on suuri. Pistetiheällä alueella ilmenee päällekkäisyyksiä eli pisteiden lukumäärästä tai sijainnista välttämättä saa selkeää kuvaa. Tässä tapauksessa maanjäristysaineistossa yli 6 Mw maanjäristyksiä oli 2144 kpl. Sen lisäksi pisteisiin liittyy laadullista tietoa, esim. tietoa järistysten voimakkuudesta. Ratkaisuksi näiden asioiden ilmaisemiseen mieleeni pompsahti edellisillä kurssikerroilla esitelty korologisen matriisin käyttö karttaesityksessä.

Laadin koko maailmankartan kattavan ruudukon (ruutuleveys 0,5 astetta, noin 18 000 ruutua) jonka tietokantaan tallensin kunkin ruudun sisältämät järistykset ominaistietoineen. Lisäsin ruututietokantaan sarakkeen johon laskin kunkin ruudun sisältämän järistysten määrän. Syntyi ruutukartta josta selviää määrällisesti suurimmat maanjäristysalueet. Aineisto oli momenttimagnitudi-asteikon mukaisesti epä-aritmeettinen eli logaritminen enenen käytössä ollutta Richterin asteikkoa mukaillen. Eli esim 8 Mw järistykset ovat monta suuruusluokka (tuhatkertaisia) 6 Mw järistyksiä suurempia. 1960-luvun jälkeen yli 8 Mw järistyksiä on sattunut 18kpl. Merkitsin ne karttaan erilaisella symbolilla.

Kuva 3.

Kuva 3. Yli 6 Mw maanjäristysen määrä ja jokaisen yli 8 Mw (19kpl) maanjäristyksen sijainti 1960-luvulta lähtien.

Ei ollut suuri yllätys, että ne usein (mutta eivät aina) korreloivat maanjäristystiheimpien alueiden kanssa.

Ja nyt tarkkaavainen varmaan on jo huomannut virheeni molemmissa maanjäristyskartoissa. Mitkä ovat esim. nuo kaksi 8 Mw pistettä Oklahomassa Yhdysvaltojen keskiosissa tai Arizonan eteläosissa? Aineistooni oli vahingossa lipsahtanut 8 Mw sijaintien lisäksi aineistosta kaikki ne järistykset joista jostain syystä järistyksen magnitudi on jäänyt tuntemattomaksi (5kpl). Noilla “0” Mw järistysalueilla kyllä järisee, mutta ei todellakaan 8 Mw voimasta. Eli tulipa tyrittyä. No korjataanpa kartta..

Ei… ei… Unohdin, että grid täytyy tallentaa  erikseen tietokannaksi, muuten MapInfo varastoi sen temp-hakemistoon. Olen nyt eri koneella. Aargh! Homma on menetetty, en ehdi aloittaa alusta. Suolaisinta tästä kaikessa on, että toistin saman virheen ruutukartta-kurssikerran karttoja tehdessäni. Silloin tein kaikki kartat uusiksi, mutta tällä kertaa en vain ehdi.

Lähteet:

Alanko’s blog, Alanko, Joonas <https://blogs.helsinki.fi/jbalanko/2015/02/18/pak-kerta-6/>

ANSS Catalog Seach, NCEDC (2014), Northern California Earthquake Data Center. UC Berkeley Seismological Laboratory. Dataset. doi:10.7932/NCEDC. <http://quake.geo.berkeley.edu/anss/catalog-search.html>

Global Volcano Database, DOC/NOAA/NESDIS/NGDC  National Geophysical Data Center, NESDIS, NOAA, U.S. Department of Commerce, <http://catalog.data.gov/dataset/global-volcano-locations-database>

How Are Earthquake Magnitudes Measured? UPSeis, Michigan Technological University <http://www.geo.mtu.edu/UPSeis/intensity.html>

 

Kurssikerta 5. bufferointia ja putkiremontteja

Uutena asiana kurssikerralla tuli tutuksi analyysimenetelmä ”bufferointi”. Bufferoitavan kohteen ympärille määritellään etäisyys joka laskee kaikki tietyllä etäisyydellä olevat pisteet kohteesta. Bufferoinnilla pystytään luomaan vektorimuodon ympärille ”puskurivyöhyke” jota voidaan käyttää hyödyksi GIS-analyysien laatimisessa. Bufferointi on tehokas työkalu esim. vaikutusalueiden määrittämiseksi. Teimme kurssilla paljon itsenäisiä tehtäviä joissa yhdistettiin pääkaupunkiseudun karttaan paljon väestödataa. Esimerkiksi tutkimme pääkaupunkiseudun lentokenttien eri meluhaitta-alueita ja kuinka suuri osa väestöstä jää kunkin melualeen vaikutusalueelle.

Bufferointia voisi käyttää myös vaikka erilaisissa saavutettavuusanalyyseissä (esim. huoltoasemien sijoittuminen suhteessa tieverkkoon ja asutukeskuksiin) tai erilaisten liikkeiden toimipisteiden sijainnin optimoinnissa kaupungissa (asukkaita kävelymatkan päässä liikkeen sijainnista). Nykypäivän esimerkkejä käytännön (automatisoidusta ja reaaliaikaisesta) bufferoinista tarjoavat esim. perinteiset taksipalvelut haastavat yritykset. Uber ja Lyft käyttävät asiakkaan älypuhelimeen sijaintiin perustuvaa reaaliaikaista bufferointia lähimmän/sopivimman taksikyydin tarjoamiseksi (tai vaihtoehtoisesti keskuspisteenä on Uber- tai Lyft-kuskin sijainti ja jonka vaikutusalueen sisältä valikoituu optimaalisin/priorisoiduin kyyti). Voisin kuvitella, että esim. HSL:n noutobussi KutsuPlus käyttänee bufferianalyysia KutsuPlus-bussivuorojen asiakkaiden matkustustarpeiden mukaan alati muuttuvan reitin optimoinnissa.

Kartan tuottamisen sijasta oli tarkoitus arvioida omaa MapInfo-osaamista.

Mielestäni olen oppinut käyttämään MapInfoa paremmin kuin olisi voinut lyhyessä ajassa luulla. Paljon liikun toki  täsmällisten tehtäväohjeiden varassa ja usein valikoissa eteenpäin klikkailessa ihmettelee eri asetusvaihtoehtoja joiden laadusta tai toimintaperiaatteesta ei ole syvempää ymmärrystä. Siitä huolimatta suhteeni (kuten Leila Soinion blogitekstisään toteaa) MapInfoon on lämmenyt vaikka leimuavasta lemmestä on turha puhua. Suurinta röpelöä suhteeseen lykkää MapInfon käyttöliittymän köykäisyys ja näennäisesti hidas prosessointi laskennallisesti yksinkertaistenkin tehtävien ratkaiseminen ja sattumanvarainen jäätyminen. Myöskin kartan viimeistely ja “taittaminen” on kovin työlästä. Jotain prosessista kertonee se, että kätevin tapa kartan tuottamiseen (ainakin nettijulkaisuun riittävällä resoluutiolla) on kuvanruutukaappauksen ottaminen MapInfon ikkunasta.

Olemme kurssilla oppineet puljaamaan paikkatietotietokantojen kanssa, luomaan niitä ”tyhjästä” ja erilaisista aineistoista, tietokantojen rakenteen lennossa muokkaamista sekä yhdistelemään niitä. Olemme oppineet luomaan teemakarttoja ja käsittelemään niiden pohjalla olevaa tilastollista aineistoa ja tilastolliseen analyysiin ja luokitteluun liittyviä teemoja. Lisäksi tutuksi ovat tulleet ruudukkkokartan luominen ja aineiston lajittelua sen sisään, rasterointia (johon mielestäni Mapinfon työkalut ovat aika köykäiset vs. esim. Corel) ja ulkoisen karttakuvan rekisteröinti.

Yhdeksi tärkeimmäksi elementeistä on onnistuneen paikkatietoanalyysin tuottamiseen (ja prosessinvaivattomuuteen) on hyvä ja kattava, eksakti aineisto, johon sisältyy metadataa aineston luonteesta. Tälläisiä olemmekin kurssilla päässet maistelemaan, esim. aineisto pääkaupunkiseudun rakennuksista ja niiden asukkaista.

Suoritimme kurssilla myös bufferointia hyödyntäviä harjoitustehtäviä, alla tehtävien vastauksia (kuvana, koska en saanut Excelistä tuotua html-tiedostoa toimimaan blogialustalla.

Kuva 1. Kurssikerran tehtäväharjoituksien vastauksia

Kuva 1. Kurssikerran tehtäväharjoituksien vastauksia

Viimeiseksi valinnaiseksi harjoitustehtäväksi valitsin tehtävän 5. Tehtävässä tuli tarkastella Helsingin putkiremppa-alttiita 1965-1970-luvuilla rakennettuja kerrostaloja ja pyrkiä selvittämään millä alueella noina vuosina rakennettuja kerrostalojen osuus alueen kerrostaloista on suurin. Eli tuottaa kartta siitä, mitkä alueet ovat putkiremonttiyritysten potentiaalisimmat kultakentät.

Tehtävässä piti rajata aineistoa rakennuksen iän, tyypin ja kunnan mukaan (aineistona koko pääkaupunkiseutu) ja laskea niiden suhteellinen osuus verrattuna samaan rakennustyyppiin (kerrostalot). Sen lisäksi tuloksia tuli tarkastella alueittain ja esittää osuudet teemakartalla.

Kuva 1. Helsingissä 1965-1970 rakennettujen kerrostalojen osuus (%) kaikista kerrostaloista alueittain.

ja Kuva 2. Helsingissä 1965-1970 rakennettujen kerrostalojen osuus (%) kaikista kerrostaloista alueittain.

Aineisto oli todella vino ja luokkajaottelua olisi voinut näin jälkikäteen viilata käsinkin yhdistelemällä luokkia (esim. niputtamalla alimpia luokkia yhteen ja vähentämällä luokkamääriä). Kiire ja dedikset kuitenkin painavat päälle joten käytin oletus luonnollisia luokkavälejä. Mielestäni kartasta ilmenee dollarinvihreimmät putkiremppa-alueet melko selkeästi. Vaikka tehtävänannossa pyydettiin tarkastelamaan suhteellisia osuuksia remppataloista, olisi ollut ehkä kiinnostavampaa ja firmoille otollisempaa tutkia absoluuttisia määriä.

Tulokset olivat kuitenkin sen verran samanlaiset (samat alueet korostuivat), että en kokenut sitä aiheelliseksi. No ok ei ihan.  Yllä olevan kartan Lehtisaaren korkea osuus johtuu sen suhteellisen pienestä kerrostalokannasta. Absoluuttisia arvoja tarkastellessa Lauttasaari on ehdottomasti otollisempaa aluetta rempoille.

Kuva 3. 1965-1970 valmistuneiden kerrotalojen määrät eri alueilla Helsingissä

Kuva 3. 1965-1970 valmistuneiden kerrotalojen määrät eri alueilla Helsingissä

 

Tein vielä kuitenkin absoluuttisia määriä kuvastavan teemakartan. Luokkajaotteluna kvantiilit. Lauttasaari lunastaa paikkansa ja Lehtisaari ei enää näyttäydykään niin potentiaalisena kohteena.

Ilmensi kartta määriä tai osuuksia, Itä-Helsinki korostui, etenkin Vuosaari ja Kontula.

Testailin karttaa myös kaksiteemaisena, jossa alueiden värit olisivat ilmentäneet absoluuttisia määriä remonttitaloista ja pylväsdiagrammi remppatalojen suhteellista osuutta. Kartasta tuli kuitenkin turhan sekava ja koin erilliset kartat parempana ratkaisuna. Myös MapInfon rajaustyökalut hajottivat niin paljon, että teki mieli itkeä. Kuinka tuhansia euroja maksavassa softassa ei ole toimivaa undota?

Muuten mukava tehtävä.

Lähteet:

Leilan paikkatietopulinaa, Soinio, Leila <https://blogs.helsinki.fi/lsoinio/2015/02/24/kurssikerta-5-aineiston-bufferointi/>

How Uber Puts Location Intelligence in the Fast Lane, Spinney, Jon, MapInfo <http://www.mapinfo.com/uber-puts-location-intelligence-fast-lane/>

Histogrammi-työkalu <http://www.shodor.org/interactivate/activities/Histogram/>

 

 

Kurssikerta 4. Ruututeemakartta ja ruotsinkieliset pääkaupunkiseudulla.

Aiheena kurssikerralla 4 oli ruututeemakartat. Sen lisäksi harjoittelimme MapInfolla karttojen digitointia Pornaisia käsittelevällä harjoitusmateriaalilla CorelDrawin monipuolisiin vektorityökaluihin tottuneena Matias Pajosmäkeä mukaillakseni MapInfon työkalut tuntuivat kömpelöhköiltä. Erona grafiikkaohjelma Coreliin on tietenkin se, että MapInfo liittää piirrettyihin vektoreihin lisäksi myös sijaintitietoa.

Mutta takaisin ruutukarttoihin. Päätin tarkastella pääkaupunkiseuden ruotsinkielisten sijoittumista. Aineistona käytössämme oli pistekartta-aineisto pk-seudun rakennuskannasta ja väestöstä. Ruutukartta sopii etenkin hankalasti kartalla esitettävän pisteaineiston esittämiseen kuten Juhakin blogissaan toteaa. Ruututietokannan jokainen ruutu saa sen sisältämien pistearvojen summan. Ruutukartan ruutukoon voi myös itse määritellä ja kuten Olli Kauppi toteaa sillä saa hallinnolliseen alueisiin rajoittuvaa koropleettiteemakarttaa tarkempaa sijainnillista tietoa.

Laadin Helsingin, Espoon, Kauniaisen ja Vantaan kuntien sisältävän ruutumatriisin jonka ruutukoko oli 500m. Tein ensiksi absoluuttisia määriä kuvaavaan teemakartan eli siis kuinka monta ruotsinkielistä asukasta kussakin ruudussa on. Tein myös vastaavalla menetelmällä teemakartan kokonaisasukkaiden määrästä.

ruotsinkiel_abs

Kuva1. Pääkaupunkiseudun ruotsinkielinen väestö, 500m x 500m ruutumatriisi.

pk_kokonaisväestö

Kuva 2. Pääkaupunkiseudun väestö, 500m x 500m ruutumatriisi.

Odotettavasti ruotsinkielisiä oli tietenkin eniten siellä missä asukkaitakin, tosin karttoja vertaillessa paljastui alueellisia eroja. Selkeimpänä pienempi määrä ruotsinkielisiä Itä-Helsingiissä ja suurempi esim Kauniaisissa kuin yleisestä väestökeskittymistä voisi olettaa.

Absoluuttisen määrien sijaan olisi ehkä mielenkiintoisempaa tarkastella ruotsienkielisten suhteellista osuutta koko väestöstä samalla ruutumatriisilla.

ruotsinkieliset_suht

Kuva 3. Ruotsinkielisten osuus (%) pääkaupunkiseudun väestöstä. 500m x 500m ruutumatriisi.

Aikaisemmat havainnot vahvistuivat ja sen lisäksi suhteellisia osuuksia kuvaasta kartasta erottui paremmin ruotsinkielisten suhteellinen osuus alhaisen väkiluvun alueilla, kuten esim. Landbon alueella aivan koillisessa Helsingissä kuin absoluuttisia arvoja kuvaavasta ensimmäisestä kartasta.

Harkitsin edellisen tehtävän innoittamana kahden muuttujan 3 x 3 luokan koropleettikartan tekemistä kunnes tajusin millä softalla kunnianhimoista projektiani olin aikeissa toteuttaa ja hylkäsin sen välittömästi.

Harjoitus oli poikkeuksillisen työläs, sillä jouduin tekemään sen virheeni vuoksi kahdesti. Sain kartat ensimmäisellä työrupeamalla valmiiksi ja tallensin workspacen MapInfossa tajuamatta, että luotu ruudukko tallentuu omaksi tietokannakseen (siis .tab, tiedostoksi) ja joka oletusasetuksilla tallentuu MapInfon väliaikaiseen hakemistoon. Viikkoa myöhemmin palatessani projektin pariin muilta kiireiltä huomasinkin harmikseni temp-hakemiston tyhjentyneen. Tulipahan kerrattua perusteellisesti ruutukarttojen tekeminen.

Lähteet:

Olli Kaupin paikkatietoblogi, Kauppi, Olli <https://blogs.helsinki.fi/okauppi/kk4/>

Paikkatietoblogi, Pajosmäki, Matias <https://blogs.helsinki.fi/pajosmaa/2015/02/10/neljas-kurssikerta/>

Juhan PAK-blogi, Lähdesmäki, Juha <https://blogs.helsinki.fi/juhalaht/2015/02/09/kurssikerta4/>

Kurssikerta 3 ja timantit, öljy ja konfliktit

Kolmanella kurssikerralla harjoiteltiin useiden eri lähteiden tietokantojen yhdistämistä yhdeksi karttaesitykseksi. Laadimme tunnilla kartaan Afrikan timanttikaivoksista, öljykenttistä ja konflikteista ja siitä kuinka ne jakautuvat Afrikan eri valtioiden alueille.

Uppsala Conflict Data Programin tuottamiin tietokantoihin Afrikan konflikteista on yhdistetty sijaintitiedon lisäksi myös temporaalista tietoa 1960-luvulta asti. Tämä on syytä muistaa kun katselee kurssikerralla syntynyttä karttaesitystä lähes koko Afrikan kattaavasta konfliktipisteidenpeitosta. Kyseessä on siis dataa vuodesta 1946 asti. Esim. konfliktipisteitä ja niiden suhdetta esim. uusiin öljykenttien tai timanttikaivosten perustamiseen voi (ja tulisikin) tarkastella myös aikanäkökulmasta, esim. kuinka monta konfliktia syttyi vuonna 1974.

Pidän kvantitiivista spatiaalista analyysia luonnonvarojen ja konfliktien sijaintien suhteesta mielenkiintoisena. Havard Hegre artikkelissaan Population Size, Concentration, and Civil War. A Geographically Disaggerated Analysis (2006) tarkastelee konfliktien suhdetta alueiden väestönmäärään ja etäisyyksiin toisistaan. Artikkelissa Hegre toteaa suurien alueiden ja väestömäärien korreleloivan keskenään konfliktiherkkyyteen. Suurin osa konflikteista sattuu kuitenkin suhteellisen harvaan asutulla seudulla ja eri toten raja-alueilla. Konfliktit Afrikassa voivat olla valtioiden välisiä, mutta usein kyseessä ovat myös valtioiden sisäiset konfliktit.

Olen samaa mieltä Oskar Rönnbergin (Oskarin PAK-blogi) kanssa siitä Vaikka luonnonvarojen ja konfliktien sijaintia on mielenkiintoista tarkastella, ei tule silti hypätä liian aikaisin johtopäätöksiin. Vaikka korrelaatiota ilmiöiden välillä onkin (tosin eniten mielestäni mututuntumalla kurssilla syntynyttä karttaa tarkastellessa konflikteja oli juurikin ensisijaisesti valtioiden raja-alueilla), mielestäni tästä olisi typerää vetää liian suuria päätelmiä kausaliteetista. Ensisijaisiksi konfliktien syiksi tulisi hakea  sosiopoliittisiä syitä. Esim. Euroopan siirtomavaltojen mielivaltaisesti vetämien valtioiden rajojen kylvämät konfliktien siemenet.

Lähteet:

Oskarin PAK-blogi, Rönnberg, Oskar <https://blogs.helsinki.fi/oskaronn/>

Afrikan pohjakartta: http://www.maplibrary.org/stacks/Africa/index.php

Timantit: http://www.prio.no/CSCW/Datasets/Geographical-and-Resource/Diamond-Resources/

Öljyvarat: http://www.prio.no/CSCW/Datasets/Geographical-and-Resource/Petroleum-Dataset/Petroleum-Dataset-v-12

Data on Armed Conflict <http://www.prio.no/CSCW/Datasets/Armed-Conflict/Conflict-Site/>

Hegre, H. (2006) Population Size, Concentration, and Civil War. A Geographically Disaggerated Analysis. Centre for the Study of Civil War.

Kurssikerta 3 ja valuma-alueiden tulvaherkkyys

Kolmannella kurssikerra harjoiteltiin useiden tietokantojen tietojen yhdistelyä. Opimme tekemään tietokantoihin erilaisia kyselyjä, sekä luomaan uusia tietoja tietokantaan aikaisempien tietojen pohjalta.

Tehtävänä oli selvittää Suomen eri valuma-alueiden tulvaherkkyys yhdistelemällä eri tietokannoissa olevia ominaisuusarvoja ja esittää koottu aineisto teemakarttana. Lisäksi tuli osoittaa valuma-alueen järvisyyttä teemakartan ylle asetetuilla pylväsdiagrammeilla.

Tulvaindeksin laskemiseen on useita laskutapoja. Päätin käyttää keskiylivirtaaman suhdetta keskivirtaamaan (MHQ/MQ). Tällöin nk. yleinen tulvaindeksi kuvaa sitä kuinka moninkertainen tulvahuipun vesimäärä on keskimääräiseen joen keskivirtaamaan verrattuna. Syntynyt eri valuma-alueiden tulvaindeksiaineisto osoittautui histogrammityökalulla tarkasteltuna frekvenssijakaumaltaan erittäin vinoutuneeksi. Aurajoki (ja pienemmissä määrin Halikonjoki) ovat erittäin tulvaherkkiä! Vinoutuneiden jakautumien aineistojen käsittelyssä on syytä määritellä luokkarajat itse. Yhdistin histogramissa näkyvät kaksi suurinta havaintoa yhdeksi luokaksi ja viilailin muittakin luokkarajoja kvantiililuokitusta pohjana käyttäen.

tulvaindeksi_histogrammi

Tulvaindeksiaineiston vahvasti vino frekvenssijakauma.

tulva_indeksiv2

Suomen valuma-alueiden tulvaindeksit ja järvisyys (%).

Valitsin karttaan väreiksi vaarallista punaista ja pylväsdiagrammiin järvisen sinistä!. Neutraalilla vaaleammalla näkyvät luokat joissa indeksi on alhainen, tummin punainen kuvaa todella korkean tulvaindeksin omaavia valuma-alueita. Pylväsdiagrammit kuvaavat valuma-alueen järvisyyttä (järvien osuus pinta-alasta).

Tehtävässä sai halutessaan määrittää järvisyyden itse erillisestä järvitietokannasta. Tietokannasta piti ensin luokitella järvet valuma-alueittain ja sen jälkeen muuntaa valuma-alueiden ja järvien polygonien pinta-ala neliökilometreiksi ja laskea järvien osuus valuma-alueiden pinta-alasta. Tehtävä oli loppujen lopuksi melko yksinkertainen kun tajusi mitä piti tehdä ja miten sen saa aikaan. Eniten tuotti haastavuuttaa juuri polygonien pinta-alatiedon muuttaminen neliökilometreiksi.

Kartoista voi todeta, ettät korkeimman tulvaindeksin alueet löytyvät sieltä missä suuret joet laskevat mereen. Kuten Sara Todorovickin blogissaa toteaa, Pohjanmaa erottuu alueena selkeästi korkeamman tulvariskin alueena koska alueen maasto on alavaa ja tulvaherkkää etenkin keväällä lumien sulamisvesistä johtuen. Nopeasti voisi todeta, että valuma-alueilla joilla järvisyys on suuri tulvaindeksi on alhainen. Näin päättelee blogissan myös Riina Koskinen Tämä johtunee siitä, että järvialtaat varastoivat vettä ja jos pienellä alueella on paljon vettä ilman varastoaltaita niin tulviahan siitä seuraa.

Linkit

Histogrammityökalu <http://www.shodor.org/interactivate/activities/Histogram/>

Color Brewer 2.0 – color advice for cartography <http://colorbrewer2.org/>

SARAN BLOGI. Todorovic, Sara <https://blogs.helsinki.fi/stodorov/2015/02/01/kurssikerta-3/>

Riina & 38 päivää paikkatietoa. Koskinen, Riina <https://blogs.helsinki.fi/riinakos/2015/02/02/kurssikerta-3-harvinaisia-onnistumisia/>

Kurssikerta 2 ja kahden muuttujan koropleettikartat (artikkelianalyysi)

Toisella kurssikerralla oli kartan laatimisen lisäksi viikkoverkkotehtävänä lukea Anna Leonowiczin artikkeli ”Two variable choropleth maps as a useful tool for visualization of geographical relationship” ja laatia tekstistä pieni sisällönanalyysi ja blogiteksti.

Artikkelissan Leonowicz käsittelee yksi- ja kaksiteemaisia koropleettikarttoja ja niiden toimivuutta kartografisen viestinnän välineenä tiedon esittämisessä. Artikkelissa Leonowicz valaisee, että yhden muuttujan koropleettikartoilla helppo esittää alueellista jakautumista. Muuttujien riippuvuussuhteiden esittäminen on usealla erillisellä kartalla vaikeaa. Hän tutkii artikkelissa kahden muuttujan koropleettikarttan toimivuutta. Kahden muuttujan koropleettikartassa tarkastellaan kahta erillistä ilmiötä samaan aikaan samalla kartalla.

 Tiedon luokittelu on kartan kuin kartan, mutta erityisesti kahden muuttujan koropleettikartan laadinnassa olennaista, koska muuttujia on kaksi. Onkin suositeltavaa pyrkiä pitäytymään pienessä luokkamäärässä. Esim. kolme luokkaa molemmilla muuttujilla synnyttää 3×3 matriisin joka tarkoittaa siis jo yhdeksää kokonaisluokkaa. Koska päällekkäisen kahden teeman koropleettikarttan on tarkoitus esittää kahden muuttujan suhdetta, on olennaista luokkarajoja valitessa varmistaa, että aineiston muuttujien välillä on korrelaatiota ja, että valitut luokkarajat tukevat esitystä. Aineisto jakautuu kahteen ryhmään:

  1. ryhmä jossa kahden muuttujan välillä on selkeä lineaarinen korrelaatio
  2. ryhmä, jonne päättyvät poikkeavat havainnot (positiiviset ja negatiiviset)
luokkavali

Aineiston luokittelu. Lineaarinen korrelaatio valkoisissa ruuduissa. Positiiviset ja negatiiviset poikkeushavainnot

 

Värijaottelu on kartan ymmärtämisen helpottamiseksi tärkeä suunnitella tarkoin. Artikkelissa esitetään legendamatriisiin molemmille muuttujille omaa väriä joiden värisävyjen eri intensiteetit erottavat luokat toisistaan. Esimerkkinä esitetään J. R. Eytonin väripaletti. Varoittavana esimerkkinä esitetään myös U.S. Bureau of Censuksen väripaletteja, joiden keskeisimmäksi ongelmaksi nostetaan liian useat luokat. 4×4 paletti tuottaa jo 16 eri värisävyä!

 

varit

Enemmän ja vähemmän toimivia väriteemoja kaksiosaiselle koropleettikartalle. A.) J.R. Eyton (1984). B) US Bureau of Census

 

Artikkelissa esitellään myös pieni ensimmäisen vuoden yliopisto-opiskelijoille tehty koe, jossa vertailtiin yhden- ja kahden muuttujan koropleettikarttojen toimivuutta tiedonvälittämisessä. Kokeen tulos on sama kuin artikkelin yhteenveto:, yhden muuttujan koropleettikartat ovat helppolukuisia ja niillä on hyvä esittää alueellista levinneisyyttä/hajontaa. Kahden muuttujan koropleettiteemakartat ovat vaikeatajuisempia, mutta soveltuvat paremmin muuttujien välisen suhteen esittelyyn. Kahden muuttujan teemakartat vaativat myös kartanlaatijalta paljon taitoa ja erityistä huolellisuutta luokittelussa ja värien valinnassa.

Mielestäni tekniikassa on mahdollisuutensa, mutta sen saa kanssa olla tarkkana. Mielestäni kahden muuttujan alueellista jakautumista ja niiden suhdetta kuvaa parhaiten yhdistelmäkartta. Esimerkiksi artikkelin liitteenä on kartta, jossa kuvaillaan Varsovaa ympäröivällä alueella kahden muuttujan (alle 18-vuotiaiden osuuus ja maalla-asuvien osuuus väestöstä) levinneisyyttää. Kutakin kuvataan ensiksi pienillä yhden muuttujan erilliskartoilla ja lopuksi kolmannella muuttujien suhdetta kuvaavalla isommalla kahden muuttujan kartalla. Kaikki kolme karttaa on kuitenkin koottu legendoineen yhdeksi koropleettikarttaesitykseksi.

Lähteet:

Leonowicz, A (2006). Two-variable choropleth maps as a useful tool for visualization of geographical relationship. Geografija (42) pp. 33–37.

Eyton J. R. (1984). Complementary-color, two-variable maps.
Annals of the Association of American Geographers. 74(3).
477–490.

Ruikkalan PAK-blogi 2015, Toni Ruikkala <https://blogs.helsinki.fi/ruikkala/> Luettu 3.2.2015

Kurssikerta 2 ja Pohjois-Karjalan kuntien vanhukset ja nuoret.

Toisella kurssikerralla jatkoimme teemakarttojen suloisessa maailmassa ja tarkastelimme kuinka esittää kaksi tai useampaa koropleettikartta päällekkäin. Tämä mahdollistui esimerkiksi käyttämällä läpinäkyvää rasterikuviointia (viiva, piste, ruutu). Tai lisäämällä karttaan tilastollista dataa erilaisten pylväs – tai piirakkadiagrammien avulla. Kävimme myös läpi kuinka heijastaa kartalle tietoa symbolilla jonka koko on suhteellinen edustettavaan arvoon ja kuinka pistekartoilla voidaan heijastaa alueille absoluuttisia arvoja heijastavia pisteitä (jotka eivät kuitenkaan kuvaa sijaintia). Lisäksi opimme yhdistämään ulkoisista lähteistä hankittua tilastollista dataa MapInfossa. (esim. SotkaNET)

Tehtävänä oli pylläyttää ulos teemakartta jossa esitetään samanaikaisesti useampia teemoja. Tuumasta toimeen. Halusin edellisen kerran kartan innoittamana testata muuttotappiollisuuden ja eläkeläisten osuuden korreloimista alueella, jonka kunnissa oli edellisen karttani informaation perusteella huomattavan suuri eläkeläisten osuus Suomen keskiarvoon verrattuna. Mistä suhteellisen korkea eläkeläisten määrä johtuu? Eikö alueiden väestö enää osaa lisääntyä? Muuttavatko lapset ja niitä tekevät pois? Onko alueilla suurempi lapsikuolleisuus? Vai vallitseeko alueella ikärasistinen – ja fasistinen vanhusten geritokratia, jossa eliitti hankkiutuvat nuorista eroon kyseenalaisin keinoin? Oi tilastotiedon ja kartografian oraakkeli, tarjoatko vastauksia pohdintoihini!? (Okei oikea vastaus lienee kaikkien tiedossa, mutta olkoon näin

pohjois-karjala

Nettomuuton suhde lasten ja vanhusten osuuksiin väestöstä Pohjois-Karjalan kunnissa 2013

Valitsin tarkastelukohteeksi hieman edellisen blogi-postaukseni havaintoja mukaillen Pohjois-Karjalan maakunnnan joka koostu 13 kunnasta. Havaintokohteiden määrästä tuli siis huomattavasti pienempi edelliseen karttaan verrattuna, jossa kohteina olivat kaikki Suomen kunnat (992 kpl). Suomen kuntien väestöstä eläkeläisten osuus on keskimäärin noin 28%. Pohjois-Karjalassa keskiarvo on korkeampi 32%. Selittyisikö korkeampi eläkeläisten osuus poismuutolla? Nuoret muuttavat kuihtuvalta maaseudulta kaupunkeihin opiskelemaan, töihin ja harrastamaan? Ja nuo samaiset nuoret sattuvat olemaan vielä niitä jotka tekevät vauvoja, joka entisestään nostaa eläkeläisten suhteellista osuutta.

Tein teemakartan jossa kuvataan viidellä luokalla nettomuuttoa Pohjois-Karjalan kunnissa. Koska arvo voi olla positiivinen (muuttovoittoinen kunta) tai negatiivinen (muuttotappiollinen kunta) päätin käyttää jälleen ns. divergent eli eriytyvää väriteemaa (sinen vs. punainen). Punainen kuvaa muuttotappiollisia ja sininen muuttovoittoisia kuntia. Käytin värien valinnassa apua Color Brewer 2.0 –verkkosivua.

Päätin myös määrittää pienen aineistoni (13) luokkarajat itse. Keskimmäinen luokka ns. neutraaliteema sisältää kunnat joiden nettomuutto on (-10…+10). Olisin toki voinut käyttää absoluuttisempaa nollaa raja-arvona. Halusin kuitenkin luokittelulla taata sen, että kunta josta on muuttanut kaksi asukasta ja jonne on muuttanut yksi tuloasukas ei kartalla kuitenkaan näyttäytyisi muuttotappiollisena (vaikka se sitä määritelmän tarkassa merkityksessä olisikin), koska halusin pystyä osoittamaan, että tilanne on voinut myös säilyä suhteellisen samana. Muuttovoittoisia ja muuttotappiollisia kuvaavien siniten ja punaisten eri sävyjen luokat rajautuivat ääriarvojen mukaan tarkastellessani aineistoa histogrammilla.

Päätin kuvata kuntien ikäjakaumaa pylväsdiagrammilla jossa verrataan kahta suhteellista tekijää, yli 65-vuotiaiden osuutta ja 0-14 –vuotiaiden osuutta kunnan väestöstä. Suomen asukkaista noin 16% on 0-14 –vuotiaita ja noin 21% yli 65-vuotiaita. Pohjois-Karjalassa samat luvut ovat noin 14% ja 23% .Toki eläkkeellä oleminen ja yli 65-vuotiaisuus eivät ole sama asia, mutta uskon iän tässä korreloivan tarpeeksi hyvin eläkeläisyyden kanssa tämän karttaharjoituksen tarpeisiin. (Toinen eläkeläisyyden määritelmää pohdituttava tekijä on, luetaanko aineistossa eläkeläisiin esim. sairaseläkeläiset? Metadata ei tätä kerro. Hyvä esimerkki oman aineiston tuntemisen tärkeydestä!)

Sellainen karttaesitys sieltä pyllähti. Alueen suurin kaupunki ja kasvukeskus Joensuu oletetusti näyttäytyikin selkeän muuttovoittoisena. Maalaiskunnat ja pienemmät kaupungit (paitsi Lieksa, palataan tähän vielä!) ovat muuttotappiollisia. Poikkeuksena luoteiskulman Valtimo, jonka nettomuutto säilyi määrittelemässäni +-10 luokassa.

Kuinkas yli 65-vuotiaiden ja 0-14 –vuotiaiden väestönosuuksien suhde korreloi nettomuuton kanssa? Vähän niin ja näin, vaikka trendejä onkin havaittavissa. Olisi kiva sanoa, että seuraavat kolme väittämää pitävät paikkansa:

  • Kaikissa kunnissa vanhusten osuus on suurempi kuin lasten.
  • Muuttotappiollisissa kunnissa on enemmän vanhuksia kuin lapsia
  • Muuttovoittoisissa kunnissa vanhusten ja lasten suhde on lähes sama.

(Huom! Päätin nyt tässä tekstissä leimata kaikki yli 65-vuotiaat vanhuksiksi ja alle 14-vuotiaat lapsiksi. Menköön untuvikkoakateemikon tieteellisen kurinalalaisuuden puutteen piikkiin. Tervetuloa varhaiseen aikuisuuteen Pohjois-Karjalan 15-18 vuotiaat!)

Mutta eiväthän ne pidä paikkaansa, vaikka trendi tuon suuntainen onkin. Jokaiseen väittämään kuitenkin löytyy poikkeus. Kontiolahti on ainoa kunta jossa lasten osuus on suurempi kuin vanhusten. Ja Kontiolahti on… muuttotappiollinen. Lieksassa puolestaan on selkeästi enemmän vanhuksia kuin lapsia, mutta kunta on… muuttovoittoinen.

Entäpä jos vertaisi nuorten ja vanhusten suhteen vertailussa huomioon myös luonnollisen lisääntymisen?

väestönlisäys

Pohjois-Karjalan kuntien väestönlisäys (muuttoliikket+luonnollinen lisäys) suhteessa lasten ja vanhuksien osuuksiin väestöstä.

Luonnollinen lisäys pitää sisällään syntyvyden – kuolleisuuden. Yllä oleva kartta kuvaa väestönlisäystä joka ottaa huomioon luonnollisen lisääntymisen ja nettomuuton.

Aineiston jakauma oli jälleen vinoutunut (ja hyvin samanlainen edellisen kartan kanssa) joten määrittelin luokitteluvälin ja väriteeman tälläkin kertaa itse noudattaen samaa periaattetta kuin edellisessäkin kartassa. Kartta on edeltäjänsä kanssa melko samanlainen.

Huomattavin ero löytyy Lieksan kohdalla, jonka kokonaisväkimäärä siis väheni sen muuttovoittoisuudesta huolimatta. Tarkempi tarkastelu osoittaa, että muuttovoittoisuus selittyy sillä, että valtaosa sisäänmuuttajista oli ulkomailta (125 kpl), joka selittyy Lieksan ohjelmalla sijoittaa kuntaansa oleskeluluvan saaneita pakolaisia. Tämäkään ei riitä nollaamaan korkeasta kuolleisuudesta ja alhaisesta syntyvyydestä kärsivää kuntaa jonka asukkaista suuri osa on vanhuksia – ainakaan vielä. Lasten tekeminen saattaa tulla ajankohtaisemmaksi maahanmuuttajien elämän vakiintuessa (valtaosa pääosin somali- irakilaistaustaisista maahanmuuttajista on alle 35-vuotiaita).

Yhteenveto

Selkeää korrelaatiota ei siis ensimmäisen kartan tapauksessa pystynyt osoittamaan ja kuten Leila Suonio blogitekstissään toteaa, vaikka ilmiöiden suhde olisi ollut vahvempikin niin korrelaatio ei vielä tarkoita kausaalisuutta. Kysymyksenasetteluni oli tiedostetustkin hieman hupsu.

Lopuksi on kuitenkin vielä vastuuvapauslausekkeen omaisesti todettava, että vaikka erilaisia hupsuja “tutkimuskysymyksiä” (fasistinen geritokratia woop woop) oli hauska kartoilla testailla, niin syyt vanhusten suurelle osuudelle väestöstä Pohjois-Karjalassa ovat toki yleisesti tiedossa. Pääsyynä siis suomalaisen yhteiskunnan elinkeinorakenteen muutos ja kaupungistuminen. Jos et hyvä maantieteen kanssaopiskelija vielä näistä aiheista tiedä, niin mars vaikka Wikipediaan! http://fi.wikipedia.org/wiki/Kaupungistuminen ja http://fi.wikipedia.org/wiki/Maaltamuutto

Lähteet:

Color Brewer 2.0 – color advice for cartography <http://colorbrewer2.org/

Maahanmuuttajat hillitsevät Lieksan väestökatoa. YLE Uutiset, <http://yle.fi/uutiset/maahanmuuttajat_hillitsevat_lieksan_vaestokatoa__paaosa_taloutta_hyodyttavaa_aktiivivaestoa/7760764>

Leilan paikkatietopulinaa. Soinio, Leila <https://blogs.helsinki.fi/lsoinio/>

Kurssikerta 1 ja eläkeläisten osuus Suomen väestöstä kunnittain 2011

Ensimmäisessä julkaisussa tarkastelen kurssikerran sisällön pohjalta luomaani teemakarttaa. Aiheena kurssikerralla oli tutustua siihen kuinka luoda teemakartta valmiista aineistosta GIS-ohjelma MapInfolla. Pohjana meillä oli koropleettikartta Suomen kunnista ja kuntajakoon perustuvaa väestötilastotietokanta.
Päätin tarkastelle eläkeläisten prosentuaalista osuutta valtakunnallisesti Suomen eri kuntien väestöstä. Löytyykö suuria alueellisia tai yllättäviäkin poikkeumia keskiarvosta? Alkukäsityksen valossa odotin karttaa, jossa eläkeläisiä on suhteessa eniten Itä- ja Pohjois-Suomen muuttotappioisissa kunnissa ja vähiten muuttovoittoisissa kasvukeskuksissa. Ennen kartan laatimista tarkastelin aineistoa histogrammi-työkalun avulla päättääkseni sopivan luokkajaon. Erilaisilla luokkajaoilla saa aikaan hyvinkin erilaisia lopputuloksia aineistoista riippuen.

Eläkeläisten osuus väestöstä (%) Suomen kunnissa.

Histogrammi eläkeläisten osuudesta kuntien väestöstä (%) Suomessa 2011. X-akselilla luokkarajat ja Y-akselilla havaintojen kappalemäärä. Histogrammissa näkyy kymmenen luokkaa jotka supistin viiteen.

Eläkeläisten osuus (%) kunnan väestöstä -aineisto paljastui kuvaajalla melko selkeäksi normaalijakaumaksi. Eli kauniihko Gaussin kellomainen käyrä jossa suurin osa havainnoista sijoittuu kokonaisvaihteluvälissä keskelle. Lukuarvoltaan pienimmät ja suurimmat havainnot ovat portaisesti kuvaajan alku ja loppupäässä. Valitsin luokittelumenetelmäksi keskiarvon jolloin jakaumasta lasketaan sen keskiarvo ja jaetaan aineisto puoliksi. Lasketaan jälleen syntyneiden luokkien keskiarvo ja edelleen jaetaan luokat puoliksi. Tätä jatketaan niin kauan kunnes saadaan haluttu määrä luokkia. Keskiarvon pitäisi sopia hyvin juurikin normaalijakauma-aineistoilla ja silloin kun halutaan osoittaa tapauksia yli tai alle keskiarvon. Ja sitähän minä juuri haluan!

Suomen kuntien väestöstä keskiarvoltaan 28,72% on eläkeläisiä. Päätin käyttää luokkajaossa viittä luokkaa pitääkseni kartan tarkastelun helpompana ja halutessani korostaa eroja. Valitsin sinisen ja punaisen ääripään väliin jakautuvan väriteeman helpottaakseni alueellisten erojen havaitsemista ja ääripäiden korostamisesta keskiarvosta. Ikärasistisesti valitsin positiivisemmaksi kokemani tumman sinisen (ei sentään vihreän) tarkoittamaan eläkeläisten osuuden olevan kyseisessä kunnassa pieni ja tumman punaisen puolestaan suuri. Väliin jää valtakunnallista keskiarvoa lähentelevä ”neutraali” keltainen. Lisäksi molempiin äärisuuntien ja keskimmäisen luokan väliin jäävät vaaleamman sävyiset sininen ja oranssi. Suurimman osan Suomen kunnista siis kuuluisi näyttäytyä oranssina, keltaisena tai vaalean sinisenä keskiarvoa mukaillen ja ääripäiden näkyä korostetusti sinisenä ja punaisena.

Eläkeläisten osuus väestöstä kunnittain suomessa 2011.

Tadaa! Sen tapainen karttahan sieltä pyllähti. Nyt kartan nähtyäni suhtaudun kriittisesti valitsemaani luokkarajoihin ja luokkien määrään. Keskimmäisen ja toiseksi korkeimman luokan luokkarajojen raja on hieman kallellaan eläkeläisiä paljon sisältävään suuntaan verrattuna kansalliseen keskiarvoon (28,7%). Jos esitystä olisi halunnut vielä entisestään yksinkertaistaa vääristelynkin uhalla, olisi sen voinut ehkä jopa toteuttaa vain kolmella luokalla, joissa keskimmäinen luokka (ylivoimaisesti suurin osa kunnista) yhdistäisi kolme keskimmäistä luokkaa (hieman toki luokkarajoja viilaten). Silloin selkeästä keskiarvoa rajusti ylempää tai alempaa arvoa edustaisi kutakin vain joko punainen tai sininen väri.

Kartan luettavuuden parantamiseksi olisi luokkien todellisten raja-arvojen sijasta voinut käyttää legendassa pyöristettyjä raja-arvoja (käyttäen luokittelun perustana edelleen kuitenkin todellisia luokkarajoja).

On mielenkiintoista leikitellä histogrammi-työkalulla ja katsella millaisia erilaisia vääristymiä aineistoista saa luokkarajauksella leikittelemällä esiin kidutettua.

Alueellisesi ylivoimaisesti eniten eläkeläisiä löytyi kartan mukaan juuri ennustetusti Itä- ja Pohjois-Suomen kunnista, jonka vanhusvoittoista punaoranssia sosioekonomista kuolemanvyöhykettä rikkoivat vain alueellisten keskusten nuoruuden ja toivon vaaleansiniset keidasmaiset läikähdykset (…no niin, rajoitapa sitä kahvinjuontia Juuso. Ja itsesi puhuttelu muille osoitetussa tekstissä. Ainiin, tämä on blogi. Saa kuvailla univajeistakin oppimisprosessia. Huh.). Esim. Joensuu idässä ja Rovaniemi pohjoisessa. Vähiten vanhuksia näyttäisi löytyvän Oulun ja pääkaupunkiseudun kehyskunnista kuten Kirkkonummelta. Kartta siis ainakin päällisin puolin tuntuisi mukailevan Suomen ikä- ja elinkeinorakenteen muutoksen trendejä joissa maaseutu tyhjentyy nuorten (myös vanhemmat työikäiset tehtaiden sulkeutuessa) muuttaessa kaupunkeihin työn- ja opiskelupaikkojen perässä ja jonne suurin osa lapsistakin syntyy, jättäen jälkeensä vanhukset ja vinoutuneen ikärakenteen. Tässä olemme samasta tutkimusaiheesta kirjoittaneen Toni Ruikkalan kanssa samalla linjalla.

Seuraavaksi olisikin mielenkiintoista vertailla vaikka nettomuuttoa ja eläkeäisten osuuden korreloimista jollakin alueella jossa eläkeläisten osuus väestöstä on suuri.

Lähteet:

Histogrammityökalu <http://www.shodor.org/interactivate/activities/Histogram/>

Ruikkalan PAK-blogi 2015. Ruikkala, Toni <https://blogs.helsinki.fi/ruikkala/> Luettu 26.1.2015