Kurssikerta 3. Aineistojen yhdistely ja uuden tiedon tuottaminen

Kurssikerran alkuun harjoiteltiin eri aineistojen yhdistämistä ja harjoituksessa aineistona käytettiin Afrikan internetin käytöstä, luonnonvaroista ja konflikteista kertovia aineistoja. Taulukoiden yhdistely oli lähinnä MapInfon ja hieman SQL kyselyiden käytännön harjoittelua, mutta silti harjoituksen sivutuotteena saatiin kasaan varsin mielenkiintoinen aineisto. Aineistossa ei oltu eritelty konflikteja tai luonnonvarojen käyttöön liittyvää tietoa ajankohdan mukaan, mutta tässä blogimerkinnässä pohdimme, mitä aineistolla olisi voinut tehdä, jos siitä olisi saatu irti seuraavat tiedot:

  • Konfliktin tapahtumavuosi
  • Konfliktin laajuus/säde kilometreinä
  • Timanttikaivosten löytämisvuosi
  • Timanttikaivoksen kaivausten aloitusvuosi
  • Timanttikaivosten tuottavuusluokittelu
  • Öljykenttien löytämisvuosi
  • Öljykenttien poraamisvuosi
  • Öljykenttien tuottavuusluokittelu
  • Internetkäyttäjien lukumäärä eri vuosina

Ensimmäisenä yllä olevaa listaa tarkasteltaessa tulee tietysti mieleen tarkastella, onko jollakin alueella luonnonvarojen (timanttikaivokset ja öljykentät) käyttöönotto johtanut konfliktin puhkeamiseen. Toisaalta voitaisiin myös tutkia luonnonvarojen tuottavuuden vaikutusta konfliktin laajuuteen. Aineisto olisi vieläkin mielenkiintoisempi, jos siitä selviäisi mahdollinen konfliktin päättymisvuosi, sekä luonnonvarojen kohdalla niiden hyödyntämisen loppumisen ajankohta. Näin voitaisiin selvittää myös päättyvätkö konfliktit sen jälkeen kun luonnonvarojen hyödyntäminen alueella lopetetaan.

Internetkäyttäjien lukumäärää on ainakin minun mielikuvituksellani vaikea nähdä konfliktien aiheuttajana, mutta se voisi hyvinkin olla mittari alueen varallisuudesta ja teknologisesta kehittyneisyydestä. Vertaamalla luonnonvarojen käyttöönoton aloittamista internetinkäyttäjämäärien kasvuun voitaisiin tutkia, kuinka alueen ihmiset mahdollisesti hyötyvät luonnonvarjojen käyttöönotosta. Voitaisiin myös pohtia vaikuttaako internetinkäyttäjämäärät siihen, kuinka hyvin konfliktista saadaan tietoa ja voisiko tämä mahdollisesti näkyä konfliktitilastoissa. Pekka Jalkanen tuo myös hyvän ajatuksen siitä, että internetin käyttäjäaste heijastelee koulutusastetta, vuoden 2013 blogitekstissään. Kuten Pekka mainitseekin, on ajatus järkeenkäypä, onhan lukutaito perusedellytys internetin käyttämiselle.

Kurssikerran toisena tehtävänä oli luoda kartta, josta selviää järvisyysprosentti sekä tulvaindeksi valuma-alueittain. Aineistoina tehtävässä oli valuma-alueittain luokiteltu aineisto, josta selvisi keskialivirtaama (MNQ) ja keskivirtaama (MQ), keskiylivirtaama (MHQ) aineisto, joka oli myös luokiteltu valuma-alueittain, sekä valmis tietokanta eri alueiden järvisyysprosenteista ja polygonitietokanta suomen järvistä. Ensimmäinen tehtävä oli siis yhdistää aineistot yhteen tietokantaan, jotta kartta saataisiin laadittua.

Tulvaindeksin laskemiseen tarvittavat tiedot saatiin varsin suoraviivaisesti virtaama-aineistoja yhdistelemällä, sillä aineistoissa oli käytetty samaa aluejakoa. Järvisyysprosenttia lisättäessä oli valmiissa tietokannassa käytetty samaa aluejakoa, mikä teki aineiston käytöstä myös suoraviivaista. Kun järvisyysprosenttia lähdettiin laskemaan digitoitujen järvien pinta-aloista, täytyi järvet ryhmitellä sen mukaan, minkä valuma-alueen sisään ne jäivät.

Koska minulla oli nyt käytössä kaksi eri lähteistä saatua järvisyysprosenttia eri valuma-alueille, täytyi seuraavakasi valita kumpaa aineistoa tulisin käyttämään varsinaisessa lopputuotoksessa eli teemakartassa. Tietokannan taulukkoa tarkastellessa huomasin digitoitujen järvien pinta-alojen perusteella lasketun järvisyysprosentin olevan kauttaaltaan hieman matalampi, mutta tämä ei vielä kertonut minulle mitään, siitä kumpaa aineistoa pitäisin luotettavampana. Kun laadin pylväskartogrammin, josta näkyi molempien aineistojen perusteella laskettu järvisyysprosentti, kävi selväksi, että digitoitujen järvien perusteella laskettu järvisyysprosentti oli huomattavasti alhaisempi niillä valuma-alueilla, jotka ulottuivat Suomen rajojen ulkopuolelle. Selitys tälle löytyi siitä, että järvi aineistossa oli ainoastaan Suomessa sijaitsevat järvet. Tästä syystä päädyin käyttämään valmiista tietokannasta saamiani järvisyysprosentteja, joiden olettaisin olevan luotettavampia niillä valuma-alueilla, jotka ulottuvat Suomen rajojen ulkopuolelle.

Kuva 1. Järvisyysprosentit valmiista tilastosta sekä digitoitujen järvien pinta-alan mukaan laskettuna.
Kuva 1. Järvisyysprosentit valmiista tilastosta sekä digitoitujen järvien pinta-alan mukaan laskettuna.
Järvet -aineistossa esiintyvien järvien sijainti Suomen rajojen sisäpuolella, vaikka valuma-alueet ulottuisivat rajojen ulkopuolelle.
Kuva 2. Järvet -aineistossa esiintyvien järvien sijainti Suomen rajojen sisäpuolella, vaikka valuma-alueet ulottuisivat rajojen ulkopuolelle.

Tuottamassani teemakartassa kuvataan järvisyysprosenttia pylväsdiagrammilla, ja tulvaindeksiä koropleettikartalla. Koropleettikarttaa laadittaessa päädyin luokittelemaan aineiston luonnollisten luokkarajojen perusteella, sillä aineiston jakauma oli vinoutunut varsin epäsäännöllinen. Päädyin viiteen luokkaan, sillä halusin pitää kartan luettavuuden hyvänä, ja mielestäni viisi luokkaa riitti tuomaan esiin tulvaindeksiin vaikuttavia tekijöitä. Ylimpään luokkaan tuli ainoastaan Aurajoen valuma-alue, joka on 1100 tulvaindeksillään selvästi muiden alueiden yläpuolella. (seuraava alue Halikonjoki 500). Tämä tarkoitti sitä että muu aineisto käytännössä jakautui neljään luokkaan. Mielenkiintoisesti jo aiemmin mainitsemassani Pekka Jalkasen blogissa Pekka oli päätynyt käyttämään samassa tehtävässä neljää luokkaa, perustellen asiaa sillä, että viidennen luokan lisääminen heikentäisi kartan luettavuutta. Verrattaessa minun ja Pekan tuottamaa karttaa täytyy minun ehkä myöntää, että erityisesti pienessä koossa neljä luokkaa tuo selkeämmän kontrastin Pohjanmaan ja etelä-rannikon valuma-alueitten välille, mutta toisaalta mielestäni käyttämäni viisi luokkaa tuovat selkeämmin esille erityisesti Pohois-Suomessa järvisyyden vaikutusta tulvaindeksiin. Hyvänä esimerkkinä Inarinjärvi ja ympäröivät alueet. Kai se mitä tästä pitää oppia, on se, että jo luokkarajoja valittaessa tulee kartan lopullinen käyttötarkoitus ja julkaisumedia pitää mielessä.

Järvisyysprosenttia kuvaavia pylväitä laadittaessa, suurimmaksi ongelmaksi muodostui pienempien valuma-alueiden ahtaus, mutta käyttämällä pieniä pylväitä saadaan pylväät erottumaan toisistaan kohtalaisesti. Koska kartalta ei ole tarkoitus tehdä mitään tarkempia mittauksia, ei mielestäni ole täysin tarpeellista saada pylväitä täysin erilleen vaan riittää, että karttaa katsomalla saa suurpiirteisen kuvan jonkin alueen järveisyysprosentista.

Kuva 3. Tulvaindeksi, ja järvisyysprosentti Suomessa valuma-alueittain
Kuva 3. Tulvaindeksi, ja järvisyysprosentti Suomessa valuma-alueittain

Karttaa tarkasteltaessa huomataan suuren tulvaindeksin omaavien valuma-alueiden olevan sellaisia, että ne eivät jatku laajoille alueille sisämaahan vaan ovat pienempiä alueita rannikon tuntumassa. Järvisyys prosentin ja tulvaindeksin korrelaatiota tarkastellessa havaitaan, että järvisemmillä alueilla tulvaindeksi on pienempi, kuin muutoin saman tyyppisillä alueilla joilla järvisyys on vähäisempää. Tässä erottuu hyvin järvisemmän Etelä-Suomen ja vähäjärvisemmän Pohjois-Suomen välillä. Havaintojen perusteella vaikuttaisi siltä, että laajoja alueita käsittävät valuma-alueet eivät ole niin herkkiä tulvimaan, koska paikalliset sateet eivät vaikuta suurempaan kokonaisuuteen yhtä voimakkaasti, kuin pienemmällä alueella. Toisin sanoen on todennäköisempää, että koko pienen valuma-alueen alueella sataa rankasti, kuin että koko suuren alueen alueella sataa rankasti. Järvisyyden vaikutus selittyy luultavasti sillä, että järvet varastoivat valuma-alueelle satavaa vettä, ja näin tasaavat virtaamaa.

Lähteet:

Pekka Jalkanen “PAK: Kurssikerta 3” Geosciencing and Cartography,  6.2.2013, Luettu 31.1.2015 https://blogs.helsinki.fi/pjalkane/2013/02/06/pak-kurssikerta-3/

Afrikan pohjakartta: http://www.maplibrary.org/stacks/Africa/index.php

Afrikan väestö-ja internetkäyttäjätiedot: http://www.internetworldstats.com/stats1.htm

Timantit: http://www.prio.no/CSCW/Datasets/Geographical-and-Resource/Diamond-Resources/

Öljyvarat: http://www.prio.no/CSCW/Datasets/Geographical-and-Resource/Petroleum-Dataset/Petroleum-Dataset-v-12/

Konfliktien sijainnit: http://www.prio.no/CSCW/Datasets/Armed-Conflict/Conflict-Site/

Valuma-alueet: Syken Oiva-tietokanta http://wwwp2.ymparisto.fi/scripts/paikkatieto.asp
(vaatii käyttäjätunnuksen)

Leave a Reply

Your email address will not be published. Required fields are marked *