Kurssikerta 3: Afrikan yhdistäminen ja Suomen valuma-alueet

Kurssikerralla 3 virallisina oppimistavoitteina oli erilaiset MapInfon perustietokantatoiminnot kuten tiedon haku, tietokantojen yhdistäminen, uuden tiedon lisääminen jne. Valitettavasti työelämässä, vapaa-ajalla ja Aalto-yliopiston Tietokannat-kurssilta hankitun osaamisen ansiosta kurssikerta muodostui kamppailuksi hilpeän ”helppo nakki”-fiiliksen ja totaalisen hajoamisen välillä. Tietokantaharjoitusten oheistuotteena valmistui Afrikka-aiheista tietokanta-aineistoa ja tulvaindeksikartta Suomesta.

Aluksi harjoiteltiin alueiden yhdistämistä. Alkuperäisen aineiston tekotavasta ja luonnonmaantieteellisistä seikoista (joki, järvi, saari, salmi) johtuen samaan valtioon kuuluvat alueet voivat olla useina erillisinä tietueina perusaineistossa. Harjoituksessa yhdistettiin aineisto valtion nimen perusteella, mutta muukin vastaava tunniste kelpaisi. Tällaisten operaatioiden lopputulosta kannattaa tarkastella uudessa taulukossa alkuperäisen taulukon suoran korvaamisen tai uusien tietueiden lisäämisen sijaan.

Toisessa vaiheessa opeteltiin tuomaan tietoa MapInfoon muista ohjelmista kuten Excelistä. Henkilökohtaisesti kiinnostavimpia ovat csv:n kaltaiset tiedostomuodot, joita on helppo tuottaa ja käsitellä omallakin ohjelmakoodilla.

Seuraavaksi suoritettiin joukko tietokantaharjoituksia, joissa opittiin tekemään triviaaleja helpohkoja SQL-toimintoja turvallisesti MapInfo-ympäristössä kliksutellen. Kätevänä GIS-apuna MapInfo tarjoaa ”is within”-toiminnon aineiston yhdistämiseen. Laskettiin timanttikaivosten, öljylähteiden sekä taistelukenttien lukumäärät alueittain. Tämän tiedon hyödyntämistä tulee pohtia kurssikerran blogitekstissä värikkään mielikuvituksen avulla, joten…

Kun on tallennettu timanttikaivosten ja öljykenttien löytämisvuosi sekä konfliktien vuodet, voidaan tutkia, sijoittuvatko konfliktit niiden tapahtumavuonna tunnettujen luonnonvarojen ympäristöön. Teen mielikuvituksellisen olettamuksen, että näin käy ja jatkan päätelmään: Virallisen konfliktin syyn ohella konfliktin käynnistävänä tekijänä on usein halu hallita luonnonvaroja.

Voi käydä niinkin, että surullisesti havaitaan luonnonvaran löytämisen ja alueen konfliktin tapahtuvan käytännössä peräkkäin. Todennäköisesti tällöin luonnonvaran löytämisvuoden ja tuotannon aloitusvuoden välissä on pitkä tauko, jolloin löydös ei hyödynnä kummankaan konfliktin osapuolen kansantaloutta. Käynnissä olevien konfliktien ympäristössä olevien timanttikaivosten ja öljykenttien tuotannossa havaittaneen selvää laskua, koska työvoima ja rahoitus on joko paennut tai siirtynyt toiselle alalle.

Tiedoilla konfliktin säteestä, internetkäyttäjien lukumäärästä vuosittain ja konfliktin tapahtumavuodesta voitaneen havaita konfliktien laaja-alaistuminen, koska kannatuksen kerääminen ja informaation välittäminen on helppoa verkossa. Internetin yleistyminen voi kuitenkin johtaa siihen, että tilastoon päätyy helpomman tiedonvälityksen vuoksi pieniä aseellisia selkkauksia, joista juuri kukaan ei muuten kuulisi. Toivon, että internet ei leviä vain viihdekäyttöön, vaan samalla etenevät rauhanaate, kansainvälinen oikeus, demokratia ynnä muut sivistyksen peruspilarit.

Seuraavaksi tehtiin annetun aineiston pohjalta tulvaindeksikartta Suomen päävaluma-alueilta. Kartta tehtiin valmiina annetun aineiston pohjalta, valuma-alueet ovat Syken Oiva-tietokannasta, joet ja järvet Maanmittauslaitoksen ilmaisia aineistoja vuodelta 2011. Tuotos on esitetty oheisessa kuvassa ja maallikkotulkinta sen alla.

kk3rc2

Kartalta nähdään selvästi yhteys tulvaindeksin ja järvisyyden välillä. Alimman tulvaindeksiluokan valuma-aluiden järvisyysprosentti on lähes poikkeuksetta yli 10 %. Tähän luokkaan kuuluvat alueet sisältävät kaikki Suomen suurimmat järvet ja valtaosan pienemmistä järvistä. Kartalla tämän luokan alueet muodostavat yhtenäisen alueen lounais-Suomesta Oulujärvelle ja vielä idän kautta koukaten Kuusamoon asti. Pohjoisessa Suomessa sijaitsee lisäksi yksittäisiä tämän luokan alueita; merkittävimpänä Paatsjoen vesistö, johon Inarijärvi kuuluu.

Tulvaindeksillä mitattuna tulvariskiltään suurimmat vesistöt sijaitsevat Pohjanmaalla sekä Suomen etelä- ja lounaisrannikoilla. Näille kartan perusteella tyypillistä on järvipinta-alan pieni määrä, mikä näkyy pienenä järvisyysindeksinä. Sen sijaan vesistön pintavalunta kulkee uomissa.

Järvisyyden ja tulvaindeksin yhteys selviää helpolla geofysikaalismatemaattisella pohdinnalla. Tarkastellaan Aurajoen ja Eurajoen valuma-alueita. Käytännössä järvetön Aurajoen valuma-alue on kartalla ainoa ylimpään tulvaindeksiluokkaan (1100) kuuluva alue. Eurajoen valuma-alue puolestaan on pinta-alaltaan samaa suuruusluokkaa, mutta kuuluu pienimpään tulvaindeksiluokkaan ja sijaitsee kaakko-luode-suuntaisesti Aurajoen valuma-alueen pohjoispuolella. Vesimäärä, joka nostaisi esimerkiksi Aurajoen (reilusti alle 100 km pitkä ja leveimmillään muutaman kymmenen metriä) pintaa metrillä ei aiheuttaisi juuri havaittavaa muutosta esimerkiksi Eurajoen vesistöön kuuluvassa Säkylän Pyhäjärvessä (noin 150 neliökilometriä), koska vesipinta-alassa on karkeasti laskettuna 100-kertainen ero. Järvessä veden virtausnopeus on hyvin pieni ja siksi sama vesimäärä etenee paljon hitaammin kuin valuma-alueella, jossa ei järviä ole.

Toinen pienimmän tulvaindeksin alueita yhdistävä tekijä on valuma-alueen keskimäärin suurempi pinta-ala kuin korkeimman tulva-indeksin alueilla. Tämä selittyy sillä, että suurella alueella veden valuminen pääuomaan kestää kauemmin ja että pienelle valuma-alueelle osuva voimakas sadealue kattaa todennäköisemmin suuremman osuuden valuma-alueen pinta-alasta kuin suurella valuma-alueella.

Lapissa tulvaindeksi vaikuttaa keskimäärin korkeammalta järvisyydestä huolimatta. Tämä lienee seurausta viileämmästä ilmastosta, jonka seurauksena suurempi sulamisvesien määrä havaitaan tulvaindeksissä. Muita vaikuttavia tekijöitä voisi olla muuta Suomea voimakaspiirteisempi korkokuva tai muusta Suomesta poikkeava kasvillisuus, joka voisi nopeuttaa pinta-valuntaa. Vaara-Suomen valuma-alueissa korkokuvalla ei vaikuttaisi olevan juurikaan vaikutusta, joten muun kuin ilmastoeron osalta aiheeseen pitäisi perehtyä vielä tarkemmin ennen perusteltuja johtopäätöksiä.

Kurssikerralla syntyneeseen karttaan olen suhteellisen tyytyväinen, mutta toisenlaisiakin luokkarajoja olisi voinut kokeilla. Toisaalta näin pahin ongelma-alue tai suurin lukuarvo erottuu helposti. Valuma-alueiden välinen raja ja joet voisivat erottua kartalta paremminkin; tässä ongelmana on ero MapInfosta exportatun kuvan ja ohjelman ruudulla näkyvän kuvan välillä, kun kuvatiedoston resoluutio on paljon näytön resoluutiota suurempi. Rajat ja joet näyttävät jo paljon paremmalta, kun blogin kuvan avaa täyteen 5000 pikseliä korkeaan kokoonsa. Vihreä väri erottuu pohjalta suhteellisen hyvin. Olisin voinut kuitenkin valita hieman kirkkaamman vihreän sävyn. MapInfon tuottamien pylväiden lukuarvot ovat minusta turhan hankalia tulkita – olisi kätevää, jos niissä olisi esimerkiksi pienet mustat väkäset kuten lukusuoralla vaikkapa yhden tai kahden prosenttiyksikön välein. Valtakunnanrajat jätin tarkoituksella pois, koska ne olisivat turhaan leikanneet valuma-alueita.

Kurssikerta 2: Lisää teemakarttoja

Kurssikerralla 2 jatkettiin MapInfo-ohjelmistoon ja erityisesti sen teemakarttatoimintoihin tutustumista. Opeteltiin erilaisten teemojen esittämistä samalla kartalla joko erityyppisesti, esimerkiksi koropleetti ja alueittaiset diagrammit, tai samantyyppisesti päällekkäisillä koropleettikartoilla. Luokkarajojen määrittäminen käsin kuului virallisesti tämän kurssikerran oppimistavoitteisiin, mutta tätä taitoahan sovelsin jo ensimmäisen kurssikerran kartassani.

Aluksi yritin muodostaa kunta-aineiston pohjalta koropleettikartan ja pylväsdiagrammien yhdistelmää, jossa alkutuotannon prosenttiosuus elinkeinorakenteesta esitettiin koropleettikarttana ja tämän päälle piirrettiin pylväsdiagrammeina avioerojen määrä suhteutettuna väkilukuun.

Hylkäsin tämän tuotoksen, koska pylväsdiagrammien koon arviointi kartalta oli hankalaa enkä löytänyt MapInfosta helppoa tapaa saada pylväsdiagrammit esitettyä tyydyttävästi. Toinen tämän kartan ongelma liittyi aineiston käsittelyyn: väestön määrään suhteuttaminen ei ota huomioon ikärakennetta, mikä vääristää avioerodiagrammia, sillä avioerot painottuvat tietyn ikäiseen väestöön. Avioliittojen määrään suhteuttaminen olisi ollut toinen vaihtoehto, mutta tämäkään ei olisi ottanut huomioon nuorten aikuisten muuttoliikettä: ero ei sijoitu välttämättä saamaan kuntaan kuin liiton solmiminen.

Hylätty kartta tuotti mielenkiintoista paikallista korrelaatiota alkutuotannon osuuden ja avioerojen määrän välillä suuntaan jos toiseenkin. Lopputuloksen totesin suhteellisen karmeaksi eikä se sovi lainkaan tämän kurssikertatekstin kuvitukseksi. Ehkäpä julkaisen sen varoittavana esimerkkinä jonkin epävirallisen blogimerkinnän yhteydessä.

kk2v7

Sitten julkaisukelpoiseen (?!) karttaan, jossa tarkastelin päällekkäisinä koropleettikarttoina alkutuotannon osuutta ja taloudellista huoltosuhdetta. Aluksi otaksuin korkean alkutuotannon osuuden kuntien olevan väestöltään ikääntyneempää ja siksi huoltosuhteeltaan heikoimpia. Noh, lopputulos ei aivan vastannut tätä otaksumaa. Tuotos on esitetty oheisessa kuvassa.

Pohdin pitkään valintaa kolmen ja neljän luokan välillä kummankin muuttujan arvoille. Päällekkäisten koropleettikarttojen kanssa tällä on suuri merkitys: Jos kummallakin muuttujalla on esimerkiksi kolme luokkaa, teoriassa mahdollisia aluetyyppejä on 3×3 eli 9. Jos muuttujat korreloivat hyvin, tämä tuskin on ongelma, mutta korrelaation ollessa heikompaa havaitset täyttäneesi karttasi yhdeksällä eri täyttötavalla alueiden sijaitessa satunnaisesti sikin sokin ympäri karttaa. Oheinen kartta edustaa juuri tätä tyyppiä, joskin kumpikin muuttuja on vielä varmuuden vuoksi jaettu neljään luokkaan, jolloin todellisia luokkia kartalla on 16. Harjoittelemassahan tässä ollaan, joten ei turhaan murehdita vaan siirrytään analysoimaan tuloksia.

Kuten selitteestä ilmenee, luokittelu tehtiin kvartiileittain, joskin yhtä suurten arvojen vuoksi luokkiin kuuluvien kuntien määrissä on pientä vaihtelua. Alkutuotanto sijoittui kartantekijän ennakkokäsitysten mukaisesti erityisesti läntiseen Suomeen, mutta ylimmän kvartiilin kuntia on ripoteltuna ympäri Suomea. Huoltosuhteen osalta heikoimpaan luokkaan kuuluvat kunnat sijaitsivat itäisessä Suomessa ja Keski-Suomen maakunnassa. Maan etelä- ja lounaisosa ovat huoltosuhteeltaan parhaita; lisäksi kartantekijää yllätti Lapin menestys tässä vertailussa.

Hyvän kahden muuttujan teemakartan etuna on muuttujien spatiaalisen korrelaation helpohko havainnointi. Oheisen kartan perusteella voidaan hankalasti havaita, että pienimmän alkutuotanto-osuuden kvartiilin kunnat kuuluvat enimmäkseen kahteen parhaaseen huoltosuhdeluokkaan, mikä oli oletettavissa. Vastaavaa korrelaatiota huonoon huoltosuhteeseen ei kuitenkaan voi havaita alkutuotannon osuudeltaan suurimpien kuntien joukossa. Ne vastaavat huoltosuhteeltaan vähemmän alkutuotantoon tukeutuvia naapurikuntiaan. Sen sijaan heikoimman huoltosuhteen kvartiilin kunnat muodostavat kaksi kutakuinkin yhtenäistä aluetta, joiden sisällä olevien kuntien alkutuotanto-osuus vaihtelee. Vaikuttaisi siltä, että selitys heikkoon huoltosuhteeseen löytyisi pikemminkin kunnan muuttotappion ja ikärakenteen kautta kuin elinkeinorakennetta tutkien.

Lapin kunnista edukseen erottuu Savukoski, jossa alkutuotannon korkeasta osuudesta huolimatta huoltosuhde on hyvä, erityisesti naapurikuntiinsa verrattuna. Korkea alkutuotannon osuus selittynee poronhoidolla ja metsätaloudella. Hyvälle huoltosuhteelle en keksi heti pätevää selitystä. Hmm, mitenköhän Korvatunturi on huomioitu alkutuotannon osuutta ja huoltosuhdetta tilastoitaessa?

Kurssikerta 1: Teemakartta tilaston pohjalta

kk1_1Kurssikerralla 1 tutustuttiin MapInfo-ohjelmiston peruskäyttöön, tietokantatoimintoihin ja teemakarttojen tekemiseen sen avulla.

Harjoitustyönä tehtyyn teemakarttaan valitsin esitettäväksi muuttujaksi kunkin kunnan selvitettyjen rikosten ja tietoon tulleiden rikosten suhteen tilastovuonna 2010. Aineiston perusteella ei ole aivan yksiselitteistä, millä perusteella rikos luokitellaan selvitetyksi tai millä perusteella tapaukset sijoitetaan eri tilastovuosille esimerkiksi tilanteessa, jossa rikos selviää vasta vuoden vaihduttua tai vasta monien vuosien päästä. Lukujen suhde kelpaa kuitenkin alueiden poliisilaitosten toiminnan tehokkuuden keskinäiseen vertailuun, kunhan oletetaan suurimman osan rikoksista selviävän tekovuonna tai että peräkkäisinä tilastovuosina rikosten määrä on kutakuinkin sama.

Harjoitustyön tuloksena syntynyt kartta on esitetty oheisessa kuvassa. Aineisto on tässä luokiteltu 20 prosenttiyksikön välein 100%-arvosta alkaen niin, että kaikki alle 60%-arvot on yhdistetty samaan luokkaan. Kartan ensimmäisessä versiossa luokkia oli 10% välein aina 50% asti, mutta tällöin erilaisia värisävyjä olisi ollut liikaa ja kartan luettavuus olisi kärsinyt. Siksi tässä esitettyä versiota varten yhdistettiin luokat pareittain. Oheisen kuvan kartalla suurin osa kunnista kuuluu keskimmäiseen luokkaan. Tämä ei kuitenkaan haittaa, sillä tutkittavan muuttujan kannalta kiinnostavia ovat poikkeavan suuret ja pienet prosenttiosuudet. Vain kolmen erilaisen luokan teemakarttaa on lisäksi huomattavasti helpompi lukea.

Rikosten selvittämisen tehokkuuteen vaikuttaa ainakin kunnan väestöntiheys, mikä on havaittavissa kartaltakin: Turun ja Helsingin ympäristöt kuuluvat keskimäärin heikompaan selvittämisprosenttiluokkaan kuin Lapin harvaanasutut kunnat. Vastaavasti Rovaniemen prosentti on suhteessa ympäristöönsä hyvin heikko, kuten asutuksen määrän perusteella voi olettaa.

Toisaalta tämä ei ole ainoa vaikuttava syy, sillä esimerkiksi Espoo kuuluu tiheästä asutuksesta huolimatta keskimmäiseen prosenttiluokkaan. Lisäksi mm. Kouvolan ja Mikkelin kautta kulkee yhtenäinen, heikoimpaan luokkaan kuuluva alue, vaikka väestön määrä ei näillä alueilla ole erityisen suuri esimerkiksi Helsingin seutuun verrattuna.