Tietokantaliitoksia ja tulvaindeksejä

Tällä kurssikerralla jatkoimme tutustumista eri lähteistä kerätyn aineiston käsittelyyn ja yhdistämiseen. Useinkaan paikkatietoaineiston kanssa työskennellessä ei haluttua tietoa löydy valmiina yhdestä tietokannasta, vaan sen sijaan tausta-aineistoa kerätään useammasta eri lähteestä ja sen pohjalta tuotetaan itse haluttua aineistoa ja karttaesityksiä.

Tästä tilanteesta lähti liikkeelle ensimmäinen, Afrikan valtioita koskeva, harjoituksemmekin. Tausta-aineisto oli lähtöisin useasta tiedostosta ja tietokannasta, eikä ollutkaan heti sellaisenaan yhteensopivaa eikä käyttövalmista. Ensimmäisenä haasteenamme oli siis muokata ja siistiä aineistot sellaisiksi, että ne olivat keskenään yhdistettävissä.

Aineiston siistiminen ja muokkaaminen liittyy olennaisesti eri aineistojen välisiin tietokantaliitoksiin. Jotta eri aineistoja voi liittää samaan tietokantaan, tulee niissä olla ainakin yksi yhdistävä sarake, joka on sisällöltään täysin sama. Muokkasimme siis Afrikan valtioita koskevat tietokannat niin, että niistä löytyi kustakin yhdistämisen perustana toimiva yksilöivä tunnus, tässä tapauksessa valtioiden nimet (kuva 1).

Kuva 1. Tietokantaliitoksessa ominaisuustietokannasta siirretään kaikki tai osa sarakkeista toiseen taulukkoon. Yhdistäminen vaatii, että kummassakin taulukossa on yksi sarake, joka sisältää kohteet yksilöivää tietoa.

Kurssikerran teemana oli myös uuden paikkatiedon tuottaminen jo olemassa olevan aineiston pohjalta. Kurssin alussa olimme lähteneet liikkeelle vaan tietokannalla, joka sisälsi tietoa Afrikan valtioiden nimistä, mutta tietokantaliitosten avulla oli hyödynnettävissämme lopulta tietoa niin väestömääristä, Internetin ja sosiaalisen median käyttäjien määristä, tilastoiduista konflikteista vuosilta 1947–2008 sekä timanttikaivosten ja öljykenttien esiintymistä.

Voikin todeta, että mitä laajempi tausta-aineisto ja tietokanta on hyödynnettävissä, sitä enemmän aineistosta voi tehdä vertailuja ja päätelmiä eri muuttujien välisistä korrelaatioista. Itse kurssikerralla tutkimme muun muassa,  kuinka monta pistemäistä objektia (yksittäistä konfliktia) sijoittui rajatun alueen (valtion) sisälle. Laskelmien tuloksena syntyi uutta paikkatietoa, joka on visualisoitu harjoituksen lopputuloksena syntyneessä karttaesityksessä (kuva 2).

Kuva 2. Ensimmäisen harjoituksen lopputuloksena syntyi useampaa tietokantaa ja päällekkäistä karttatasoa visualisoiva teemakartta, joka esittää Afrikan valtioiden konfliktien määrä vuosina 1947–2008 sekä valtioiden väestön suhteellista Internetin käyttöastetta vuonna 2019. Kartalla on myös kuvattu Afrikassa sijaitsevien timanttikaivoksien ja öljykenttien sijainnit.

Karttaan valittujen muuttujien takia siitä on helposti houkutus vetää johtopäätös, että jollain alueella sijaitsevilla kaivoksilla tai öljyesiintymillä on suora yhteys alueen konfliktiherkkyyteen. Tässä kartassa konfliktien määrää on tarkasteltu kuitenkin pitkällä aikajaksolla ja kokonaisuutena valtiotasolla. Jotta näiden muuttujien välistä yhteyttä voisi tarkemmin analysoida, tulisi niiden kehitystä tarkastella enemmin aikasarjoina sekä huomioiden tarkemmin kunkin muuttujan sijainti.

Erilaisten syy-seuraussuhteiden analysointi olisikin paljon mielekkäämpää, jos hyödynnettävissä olisi konfliktien tapahtumavuosien lisäksi tietokanta timanttikaivosten ja öljykenttien aloitusvuosista sekä tuottavuudesta. Näiden pohjalta voisi jo tarkemmin arvioida, onko öljykenttien löytämisvuosien ja konfliktien alkamisvuosien tai konfliktien ja öljykenttien tuottavuuden välillä havaittavissa yhteyttä.

Raleigh ja Hegre (2005) ovat omassa tutkimuksessaan tutkineet tarkemmin aseellisten konfliktien sijaintia Länsi- ja Keski-Afrikassa ja todenneet, että konfliktien kesto on yleensä sitä pidempi, mitä syrjäisemmillä seuduilla ja kauempana pääkaupungista/hallintoelimistä ne tapahtuvat. Alueella esiintyvät luonnonvarat voivat kuitenkin osaltaan vaikuttaa alueen konfliktien pitkittymiseen, koska alueella toimivat aseistetut kapinallisryhmät voivat rahoittaa toimintaansa kaivosten tuotoilla. (Raleigh ja Hegre 2005.)

Kotsadam, Østby ja Rustad (2017) toteavat myös, että erilaisten kaivannaisten ja fossiilisten energiavarojen esiintyminen valtion alueella voi olla kaksiteräinen miekka. Toisaalta nämä luonnonvarat tuovat alueelle varallisuutta ja taloudellista kasvua kehittäen samalla alueen infrastruktuuria, mutta toisaalta ne voivat tuoda paljon yhteiskunnallisia ongelmia, kuten lisätä alueen rikollisuutta sekä sosiaalista eriarvoistumista. Heidän tutkimuksensa toteaakin, että kaivostoiminnan vaikutuksia valtiotasolla on tutkittu paljon, mutta sen sijaan enemmän tutkimusta kaivattaisiin kaivosten vaikutuksista yhteisöihin ja yksilöihin paikallisella tasolla.

Raleigh ja Hegre (2005) korostavat myös konfliktien alueellisuutta toteamalla, että kiivaimmat taistelut rajoittuvat yleensä vain pienelle alueella valtion sisällä. Myös siis tämän harjoituskerran kartan muuttujien tarkempi alueellinen tarkastelu voisi paljastaa suuriakin valtion sisäisiä alueellisia eroja.

Tulvaindeksikartta Suomen valuma-ominaisuuksista ja tulvaherkkyydestä

Kurssikerran itsenäisenä harjoitustehtävänä oli tuottaa teemakartta, joka esittää Suomen vesistöalueiden virtaaman vaihtelua (tulvaindeksi) sekä tulvaherkkyyttä (kuva 3).

Kuva 3. Suomen valuma-alueiden virtaamavaihtelujen indeksiksi ja järvien osuus pinta-alasta.

Tulvaindeksi kuvaa, kuinka moninkertainen on kunkin valuma-alueen virtaaman huippu verrattuna kaikkein kuivimpaan aikaan. Järvisyysprosentti taas tarkoittaa valuma-alueella sijaitsevien järvien pinta-alan suhdetta (%) valuma-alueen pinta-alaan. (Tulvasanasto.)

Kartalta voikin päätellä, että mitä järvisempi valuma-alue on, sitä taisaisempi sen virtaamavaihtelu on, eikä järvien tasaavan vaikutuksen takia niillä alueille esiinny niin suuria tulvahuippuja. Tällaista aluetta on muun muassa Sisä-Suomen järvialueet, joissa useat suuret järvet tasoittavat vuotuisia virtaaman vaihteluita. (Korhonen 2007.)

Vastaavasti Suomenlahden ja Pohjanlahden rannikkoalueiden valuma-alue on  vähäjärvistä ja virtaaman vaihtelu on hyvin voimakasta. Alueella  esiintyy siis herkästi tulvia, mutta toisaalta myös kuivia kausia. (Korhonen 2007.)

Karttaa katsoessani tunnistin sieltä kuitenkin alueita, joissa järvisyyden ja tulvaindeksin välistä negatiivista korrelaatiota ei ollut niin voimakkaasti havaittavissa. Tehtävää lopetellessani muistuttelinkin mieleeni, että virtaaman suuruuteen ja tulvaherkkyyteen vaikuttaakin järvisyyden lisäksi myös muun muassa valuma-alueen koko ja muoto, topografia, kasvillisuus, maankäyttö sekä maa- ja kallioperäkin. 

Lähteet:

Korhonen, J. (2007). Suomen vesistöjen virtaaman ja vedenkorkeuden vaihtelut. Suomen ympäristökeskus SYKE, Helsinki. Viittauspäivä 2.2.2020. <https://core.ac.uk/download/pdf/14927037.pdf>

Kotsadam, A., G. Østby & S. A. Rustad. (2017). Structural change and wife abuse: A disaggregated study of mineral mining and domestic violence in sub-Saharan Africa, 1999–2013. Political Geography 56, 53–65. Viittauspäivä 2.2020. <https://doi.org/10.1016/j.polgeo.2016.11.004>

Raleigh, C. & H. Hegre (2005). Introducing ACLED: An Armed Conflict Location and Events Dataset.  University of California, Institute of Global Conflict and Cooperation, San Diego, California. Viittauspäivä 2.2.2020. <https://www.prio.org/Global/upload/CSCW/Data/UCSD_paper_final.pdf>

Tulvasanasto. Suomen ympäristökeskus SYKE. Viittauspäivä 2.2.2020. <https://www.ymparisto.fi/fi-FI/Vesi/Tulviin_varautuminen/Tulvasanasto>

Dataa rajapinnasta kartalle

Toisella kurssikerralla sukelsimme tarkemmin erilaisiin paikkatiedon ja datan lähteisiin. Erityisesti INSPIRE-direktiivin myötä paikkatietoaineiston tuottamisessa on tapahtunut suuri muutos ja nykyään kaikki julkisen sektorin ja julkisin varoin tuotettu paikkatietoaineisto tulee olla avoimesti yhteiskäytettävissä.

Tämä on tuonut tarjolle paljon erilaista tietoaineistoa ja tutkimusaineistoa, joita kuka tahansa voi paikkatieto-ohjelmiston avulla hyödyntää kaupallisiin ja ei-kaupallisiin tarkoituksiin. Kurssikerralla testasimmekin käytännössä Tilastokeskuksen WFS-rajapintahakua (Web Feature Service), joka tuo valitun aineiston ominaisuustietoineen paikkatieto-ohjelmaan. Tiedon hakeminen ei vaadi kuin tiedontarjoajan rajapintaosoitteen syöttämistä QGIS-ohjelmaan ja sekunnissa nähtävillä on valtava määrän paikkatietoaineistoa. Aineisto toimii aivan samoin, kun tieto olisi rajapinnan sijaan omalla koneella, ja tätä tietoa voi sitten katsella tai ladata omalla koneelle jatkojalostamista varten.

Kuten aiemmassa blogikirjoituksessani mainitsinkin paikkatietoaineisto koostuu katseltavan karttatason lisäksi ominaisuustiedoista, ja paikkatieto-ohjelmassa keskeistä on tämän aineiston käsittely ja analysointi. Kurssikerralla testailimmekin lisää QGISin tarjoamia aineiston rajaamiseen soveltuvia valintatyökaluja ja paikkatietokyselyitä.

Kuva 1. Paikkatietokysely Suomen kuntien ominaisuustiedon pohjalta.

Tein oman yksinkertaisen paikkatietokyselyn hakemalla Suomen kuntia koskevasta tietokannasta kaikki kunnat, joiden nimet täyttivät hakuehdot Helsinki, Espoo tai Vantaa (kuva 1). Ohjelmisto taipuu paljon monimutkaisempiinkin hakulausekkeisiin, mutta tällä sain jo hyvin havainnollistettua, millä eri tavoilla tietokannasta voi hakea haluttua joukkoa kohteita tarkasteluun. QGIS-ohjelmisto tuo hakuehdot täyttävät kohteet tarkasteluun ja ne voi siitä edelleen tallentaa uudeksi tietokannaksi, jonka kanssa jatkaa työskentelyä.

Kurssikerran toisena harjoituksena tutustuimme  lisää ohjelman laskuominaisuuksiin ja samalla vertailimme, miten kahden eri projektion/koordinaatiston – ETRS89-TM35FIN  ja Mercatorin oikeakulmaisen lieriöprojektion – käyttö vaikuttaa kartalla esitettävien kohteiden pinta-alaa (kuva 2). Projektion pinta-alaan aiheuttamat vääristymät ovat sinänsä erittäin mielenkiintoinen vertailukohde,  koska pinta-ala on usein juuri se tekijä johon eri muuttujia suhteutetaan.

 

Kuva 2. Kartta esittää, kuinka paljon suurempia kuntien pinta-alat ovat Mercatorin projektiossa kuin poikittaisesssa ETRS89-TM35FIN lieriöprojektiossa.

Syy eri projektioiden synnyttämiin pinta-ala eroihin löytyy niiden erilaisista projisointi tavoista. Mercatorin projektio on oikeakulmainen lieriöprojektio, jossa projektion tarkin kohta eli sivuamislinja kulkee päiväntasaajaa pitkin. Projektiossa kartalla esitetyt suunnat pitävät paikkansa, mutta esitettyjen kohteiden pinta-ala ja etäisyys vääristyy erityisesti, mitä lähemmäs mennään napa-alueita. Tomi Kiviluoma (2020) oli omassa blogissaan laittanut merkille myös tämän ja mainitsee osuvasti, että Mercatorin projektio aiheuttaa juurikin pohjois-etelä -suuntaista vyöhykkeistä alojen vääristymää. 

ETRS89-TM35FIN-projektio on sen sijaan tuotettu poikittaisasentoisella lieriöprojektiolla (Transverse Mercator), jonka sivuamislinja kulkee 27° pituuspiiriä pitkin. Sivuamiskohdassa projektion tieto on tarkemmillaan, ja siitä loitontuessa vääristymä kasvaa. Tämä tasokoordinaatisto vääristääkin Suomen pinta-aloja hyvin vähän ja on siitä syystä Suomessa yleisimmin käytettävä järjestelmä. 

Tein vielä itsenäisenä harjoituksena vastaavanlaisen vertailun ETRS89-TM35FIN-projektion ja Robinsonin-projektion välillä (kuva 3). 

Kuva 3. Kartta esittää, kuinka paljon suurempia kuntien pinta-alat ovat Robinsonin projektiossa kuin poikittaisesssa ETRS89-TM35FIN lieriöprojektiossa.

Robinsonin projektio ei ole oikea­pintainen eikä oikea­kulmainen projektio vaan kompromissi niiden välillä, ja siinä virheet pinta-alojen ja kulmien suhteen on pyritty saamaan mahdollisimman pieniksi. Myös tässä projektiossa on havaittavissa vääristymän kasvua, mitä lähemmäs napa-alueita siirrytään, mutta Mercatorin projektioon nähden vääristymät ovat prosentuaalisesti huomattavasti pienempiä.

Pinta-ala voi siis vaihdella suurestikin eri projektioiden välillä. Erilaisten projektioiden vertailu muistuttikin hyvin taas mieleen sen, miten helposti tahallaan tai huolimattomuuttaan kartan tekijä voi valinnoillaan vääristää tietoa ja johtaa harhaan. Myös Tomi Kiviluoma (2020) totesi blogikirjoituksessaan tästäkin osuvasti, että kartografisista valinnoista johtuvien vääristymien ja yleistyksien käytännön ymmärtäminen onkin maantieteellisen ajattelun kehittymisen kannalta keskeistä. Olen samaa mieltä, että on tärkeää muistaa, kuinka paljon myös projektiolla on  merkitystä kartan luettavuuteen ja luotettavuuteen.

Lähteet:

Kiviluoma, T. (2020). Tietokantoja, tykytystä ja toiveita tulevasta.  Viittauspäivä 26.1.2020. <https://blogs.helsinki.fi/tomingeoblogi/2020/01/24/tietokantoja-tykytysta-ja-toiveita-tulevasta/>

QGIS paikkatietojärjestelmä tutuksi

Yhtenä Geoinformatiikan menetelmät -kurssin tavoitteena on ottaa haltuun QGIS paikkatietojärjestelmä, joka on suosittu avoimen lähdekoodin GIS-ohjelmisto. Paikkatietojärjestelmä eli GIS (Geographic Information Systems) mahdollistaa paikkatiedon tallentamisen, hallinnan, analysoinnin sekä esittämisen ja jo heti kurssin alkuun pääsimme tutustumaan, millaisia tiedon hyödyntämis ja analysointi mahdollisuuksia se tuo.

Kurssin ensimmäisenä harjoituksena harjoittelimme ohjatusti sekä vektorimuotoisen paikkatiedon hallintaa että esittämistä tuottamalla koropleettikartan Itämeren ympärysvaltioiden typpipäästöistä. Yksi paikkatietoaineiston keskeinen ominaisuus on sen sisältämä ominaisuustieto, joka voi olla esimerkiksi mittaustietoa. Harjoituksessa hyödynsimme ominaisuustietotaulukkoon tallennettua tietoa kunkin valtion mitatuista typpipäästöistä ja jatkojalostimme niitä laskemalla niistä suhteellisen osuuden määrän suhteessa valtioiden yhteenlaskettuun kokonaistypen päästömäärään. Tämän seurauksena tuotimme siis uutta ominaisuustietoa, jonka visualisoimme koropleettikartan muodossa (kuva 1).

Kuva 1. Itämeren alueen valtioiden typpipäästöjen osuus alueen kokonaispäästöistä.

Ensimmäisen harjoituksen kartasta on havaittavissa, että Itämeren alueen suurin typenpäästöjen aiheuttaja on Puola. Puolasta valuu Itämereen moninkertaisesti enemmän ravinteita kuin muista rantavaltioista ja sen osuus Itämeren päästöistä on noin 34 %. Siinä, missä kartta ilmaiseen suurimman typpipäästöjen lähteen se ei kuitenkaan avaa sen taustalla olevia syitä tai seurauksia.

Teemakartat ovatkin tehokas keino tuoda esiin usein vaikeasti hahmotettavia kokonaisuuksia, mutta ne myös vaikuttavat vahvasti niiden pohjalta muodostettuihin mielipiteisiin ja mielikuviin.  Teemakartan visualisoinnilla on siis suuri vaikutus. Laura Hynynen (2020) toteaakin osuvasti Ominaisuustiedoista teemakartaksi -blogikirjoituksessaan, että kartta on onnistunut visuaalinen esitys silloin, kun jo ensikatsomalla tummuuserojen avulla hahmottaa, missä on jotakin enemmän ja missä vähemmän.

Toisena harjoituksena teimme itsenäisesti vastaavanlaisen koropleettikartan hyödyntäen Suomen kunnista vuonna 2015 kerättyä vektorimuotoista paikkatietoa. Visualisoin omassa kartassani eläkeläisten prosentuaalisen osuuden väestöstä kunnittain (kuva 2) ja valitsin luokkajaon neljään luokkaan käyttäen luonnollisia luokkarajoja. Koska luokittelu vaikuttaa ratkaisevasti koropleettikartan ulkonäköön, oli mielenkiintoista verrata tekemääni karttaa Flaminia Purasen (2020) samasta aineistosta tuottamaan karttaan.

Olimme kumpikin valinneet aineistollemme erilaisen luokittelutavan, mutta tästä huolimatta kummastakin kartasta nousi selkeästi esille eläkeläisten suuri osuus Itä-Suomessa, kuten Etelä-Savossa, Pohjois-Karjalassa ja Kainuussa.

Kuva 2. Eläkeläisten prosentuaalinen osuus Suomen kunnissa vuonna 2015.

Kokonaisuudessaan ensimmäisellä kurssikerralla tuottamani kartat ovat mielestäni kumpikin visuaalisesti ja teknisesti onnistuneita. Pyrin niin värien valinnalla kuin muillakin kartan peruselementeillä varmistamaan, että kartat kuvaavat esittämänsä ilmiötä selkeästi. Kuitenkaan sen tarkemmin kumpikaan teemakartta itsessään ei avaa ilmiöiden taustalla olevia syitä tai seurauksia. Tätä samaa pohti Tiia Laisi (2020) blogikirjoituksessaan todeten, että ”kartta kuvastaa ilmiötä, mutta ei tietenkään anna sille selitystä.” Jotta kummankaan kartoissa kuvaamani ilmiön, typpipäästöjen Itämereen tai väestön ikääntymisen, syy-seuraussuhteista voisi tehdä tarkempia päätelmiä tai analyysejä tulisi niitä tarkastella yhdessä muun ominaisuustiedon kanssa.

Lähteet:

Hynynen, L. (2020). Ominaisuustiedoista teemakartaksi. Viittauspäivä 21.1.2020. <https://blogs.helsinki.fi/lauravel/>

Laisi, T. (2020). Kurssikerta 1. QGIS- ohjelmistoon tutustumista. Viittauspäivä 21.1.2020. <https://blogs.helsinki.fi/tlaisi/2020/01/15/kurssikerta-1-qgis-ohjelmistoon-tutustumista/>

Puranen, F.  (2020). Ensimmäisestä kurssikerrasta. Viittauspäivä 21.1.2020. <https://blogs.helsinki.fi/flaminia/>