Viikko 3 – Taistelua tietokantojen kanssa ja teemakarttoja

Kolmannella kurssikerralla jatkoimme tietokantojen pyörittelyä erityisesti siltä kannalta, mitä toimenpiteitä valmiille tietokannalle voi tehdä, jotta sen saa vastaamaan omia käyttötarpeitaan. Samalla tuli tutuksi useita QGIS:n työkaluja, kuten miten tietokannan kohteita voi yhdistää useammallakin eri tavalla. Harjoitustehtävässä yhdistettiin Afrikka-tietokannan saman valtion eri polygonit yhdeksi tietokannan kohteeksi. Samalla tulin miettineeksi, miten suurta huolellisuutta eri tietokantojen käyttö vaatiikaan, sillä todella huolimattomalta käyttäjältä olisi saattanut jäädä havaitsematta juurikin se, että valtioon kuuluvat saaret on tietokannassa omin kohteinaan ja esimerkiksi valtion pinta-alan määritykset olisivat menneet aivan pieleen. Hyvien ohjeiden kanssa samaan valtioon kuuluvien kohteiden yhdistäminen onnistui lähes mutkitta, mutta itsellä tuli ainakin sellainen olo, että ei ihan heti tulisi omin päin mieleen kokeilla esimerkiksi Geoprocessing Toolsien “Dissolve” -työkalua, jonka nimi ei oikein kuvaa toimintoa. Kun Afrikan valtioita kuvaava tietokanta saatiin kuntoon, yhdistettiin siihen erilaisia tietokantoja teemakarttoja varten.

Yhdistelemällä Afrikan karttaan tietokanta Afrikan väestöstä ja internetin käyttäjistä, sekä tuottamalla tietokantaan uusi sarake itse laskemalla, saatiin tuotettua esimerkiksi teemakartta internetin käyttäjien osuudesta koko väestöstä (kuva 1). Kartasta nähdään, että suurin internentin käyttöaste keskityy Afrikan pohjoisosiin, kuten Tunisiaan, Maliin, Marokkoon Senegaliin ja Libyaan. Suhteellisesti suurin käyttöaste on kuitenkin Keniassa. Matalimman internetin käyttöasteen maita on puolestaan keskittynyt Afrikan keskiosiin, kuten Etiopia, Kongon tasavalta, Somalia, Kongon demokraattinen tasavalta, Keski-Afrikan tasavalta, Chad ja Niger, joissa käyttäjien osuus väestöstä on alle 15 %.

Kuva 1. Internetin käyttäjien osuus väestöstä valtioittain Afrikassa 2018 (%).

Internetin käyttöasteen lisäksi tarkastelimme timanttikaivosten ja konfliktien määrä valtioittain, jotka olivat tietokannassa pistemuodossa, sekä öljykenttien määrää, jotka olivat puolestaan polygoneina.  Kun samaan tietokantaan yhdistetään tietoa monesta lähteestä, voidaan saada osviittaa mahdollisista tekijöiden välisistä yhteyksistä. Olisin esimerkiksi halunnut yhdistää internetin käyttöastetta kuvaavaan karttaan histogrammeina konfliktien määrän valtiossa, mutta jostain syystä en saanut tätä omalla koneellani QGIS:llä toimimaan. Katsoin useita videoita diagrammien teosta ja luin QGIS:n ohjeita, ja olin tehnyt kaiken kuten ohjeissa, eikä pylväät silti näkyneet. Olisin halunnut siis tehdä kartalle vertailun, vaikuttaako maan kehittyneisyysaste konflikteihin, mutta pelkkää taulukkoa tutkimallakin voi päätellä, että yleistä trendiä ei ole havaittavissa.

Kurssilla käytetyissä aineistoissa oli runsaasti tietoa konflikteista (paikka, vuosi, laajuus), timanttikaivoksista (löytämisvuosi, kaivausten aloitus, tuottavuus) ja öljykentistä (löytämisvuosi, poraamisvuosi ja tuottavuus), joita yhdistelemällä saisi mielenkiintoisia teemakarttoja aikaiseksi. Itse yhdistin samalle kartalle öljykenttien ja timanttikaivosten sijainnin, sekä konfliktien määrän (kuva 2). Kuvasta havaitaan, että luonnonvarojen läheisyyteen sijoittuu runsaasti konflikteja, mutta toisaalta konflikteja on myös muualla. Tarkempien syy-seuraussuhteiden selvittämiseen tarvittaisiin siis muutakin tietoa. Havaitsin, että Amanda Ojasalo oli tehnyt hyvin samanlaisen teemakartan aiheesta, jonka hän oli liittänyt blogiinsa. Hän oli myös tehnyt saman havainnon kuin itse, että rauhattomana pitämäni Libyan konfliktien määrä näytti 0. Ojasalo mainitsi Libyan viimeaikaisten ongelmien syntyneen vasta vuoden 2011 jälkeen ja tarkemmin attribuuttitaulukkoa tarkasteltuani havaitsin sen tietojen olevan vuodelta 1963-2003. Muita mielenkiintoisia tarkastelun kohteita olisi esimerkiksi timanttikaivoksen/öljykentän löytymisen tai toisaalta konfliktien vaikutus internetin käyttäjien lukumäärään eri vuosina.

Kuva 2. Timanttikaivosten ja öljykenttien sijainti Afrikassa, sekä konfliktien määrä valtioittain vuosina 1963-2003.

Toinen kurssikerran aikana esillä ollut teema oli Suomen jokien valuma-alueet, järvisyys ja tulvaindeksi. Tässä vaiheessa oli ilo huomata, että field calculatorin käyttö tulvaindeksin laskemiseksi sujui jo kuin vettä vaan (pun intended 😉 ).  Omalla koneella ongelmaksi koitui edelleen järvisyyttä kuvaavan histogrammin lisääminen, joka ei vaan yksinkertaisesti onnistu. QGIS luo kyllä uuden “alatason” layerille, mutta siltikään pylväät eivät näy. Kuvassa 3 on kuitenkin kuvattu Suomen vesistöalueiden tulvaherkkyttä, jonka pohdinnan jätän siihen, kun saan järvisyyden lisättyä esitykseen mukaan.

Kuva 3. Suomen vesistöalueiden tulvaherkkyys.

Lähteet:

Ojasalo, Amanda (2019). Tietokantaliitokset. Amanda Ojasalon blogi, luettu 7.2.2019. (luettavissa: https://blogs.helsinki.fi/amandaoj/2019/02/02/tietokantaliitokset/)

Viikko 2 – Projektioita ja tietokantaliitoksia

Toisella kurssikerralla jatkoimme QGIS:n perustoimintojen opettelua, sekä tarkastelimme projektion vaikutusta kartan muotoon, sekä kartalta mitattaviin etäisyyksiin ja pinta-aloihin. Samalla jatkui tietokantojen käytön opettelu usean eri harjoituksen muodossa.

Vertailimme projektion vaikutusta pinta-aloihin ja etäisyyksiin mittaamalla aivan Suomen pohjoisosasta omavalintaisen alueen pinta-ala (oma alueeni oli vajaa puolet Suomineidon päästä) ja omavalintainen matka Suomen poikki (mittasin suunnilleen Vaasan korkeudelta itään) ETRS89-TM35FIN -projektiossa. Pinta-alaa ja matkaa verrattiin muiden projektioiden mukaan mitattujen vastaaviin ja tulokset koottiin taulukkoihin 1 ja 2. Sekä pinta-alaa, että matkaa vääristivät eniten Lambert I  ja World Mercator. KKJ ja World Bonne säilyttivät pinta-alan ja matkan lähes muuttumattomana. Tuloksia tarkasteltaessa mieleen hiipi väkisinkin ajatus, kuinka paljon projektiovalinnalla voidaan tahallisesti tai tahattomasti luoda vääriä mielikuvia. Karttaa laadittaessa tai tulkittaessa tulisikin siis tuntea projektion käsite ja sen vaikutus karttaan tai siltä tehtäviin mittauksiin.

Taulukko 1. Projektioiden ilmoittaman pinta-alan vertailua ETRS89-TM35FIN -projektiossa mitatun alueen pinta-alaan. Taulukkossa on ilmoitettu absoluuttinen kokoero km²:nä, sekä kokoeron suuruus (%) suhteessa tarkasteltavan alueen pinta-alaan ETRS89-TM35FIN -projektiossa.
Taulukko 2. Projektioiden ilmoittaman matkan pituuden vertailua ETRS89-TM35FIN -projektiossa mitattuun matkaan. Taulukkossa on ilmoitettu absoluuttinen ero matkassa kilometreinä (km), sekä matkan pituuseron suuruus (%) suhteessa tarkasteltavan matkan pituuteen ETRS89-TM35FIN -projektiossa.

Projektioiden vääristymästä tehtiin visuaalinen esitys kartan muodossa (kuva 1), jossa kuvataan Mercator ja Eckert -projektioiden vääristymää Suomessa. Kummallakin projektiolla pinta-alat poikkeavat ETRS89-TM35FIN -projektion pinta-aloista eniten pohjoisessa ja vähiten etelässä, mutta vääristymän suurusluokka on täysin eri. Tämän vuoksi kuvan esitystapa onkin mielestäni hieman hämäävä, sillä vääristymän suuruus tulee vasta legendasta ilmi. Yleinen trendi kummassakin on kuitenkin sama johtuen tietysti maapallon muodosta.

Kuva 1. Mercator ja Eckert -projektioiden virhe (%) pinta-alassa verrattuna ETRS89-TM35FIN -projektiossa mitattuun pinta-alaan

Kurssikerran ohjelmaan kuului myös tietokantaliitoksen opettelu, joka ei ollutkaan yhtään niin vaikeaa kuin miltä se kuulostaa. Liitin kurssikerralla käytettyyn aineistoon, johon oli jo laskettu valmiiksi pinta-aloja eri projektioissa, tilaston kesämökkien määristä Suomen kunnissa. Näin sain laadittua vertailun (kuva 2), kuinka paljon käytetty projektio vaikuttaa muuttujan esittämiseen teemakartalla. Kuvassa vasemmalla on laskettu Suomen kuntien mökkien määrä keskimäärin neliökilometriä kohden World_Mercator -projektion pinta-alojen mukan ja oikealla ETRS89-TM35FIN – projektion mukaan. Johtuen suuresta erosta pinta-aloissa, saadaan myös merkittävät erot mökkien määrissä. Projektiovalinnalla on siis tässäkin merkitystä, minkälaista tietoa Suomen mökkikunnista saadaan. TM35-FIN projektion mukaan lasketuissa määrissä neliökilometriä kohden Keski-Suomi, Turun- ja Ahvenanmaan saaristot erottuvat tiheämmin rakennettuina mökkeilyalueina. Vasemmanpuoleinen kartta puolestaan ei anna todellista kuvaa Suomen mökkien sijoittumisesta. Pinta-alan vielä vääristyessä enemmän kohti pohjoista, näyttää suurin osa Suomesta kovin tyhjältä.

Kuva 2. Vertailu projektion mukaan laskettujen pinta-alojen merkityksestä teemakarttaa laadittaessa. Kuvassa vertailtu kesämökkien määrää kunnittain neliökilometriä kohden oikeapintaisen ja vääristävän projektion kesken.

Sen lisäksi, että sain kurssikerralla ja kotona tehtäviä tehdessä lisää varmuutta QGIS:n käyttöön, oli yksi kurssikerran suurimmista anneista eri projektioista koottu taulukko ja sen mukana tulleet oivallukset. Olen toki aina tiedostanut, että projektiolla on merkitystä pinta-aloihin ja välimatkoihin, mutta kun itse konkreettisesti näki, että virhe saattaa pahimmassa tapauksessa olla tuhansia prosentteja avautui asia vielä aivan uudella tavalla. Lukiessani muiden blogeja, pääsin vielä näkemään useampia vertailuja projektioiden kesken. Huomasin lisäksi, että olin itse toteuttanut vertailun hieman eri tavoin kuin moni muu. Esimerkiksi Nabila vertaili blogipostauksensa kuvassa 1  Lambertin ja Mercatorin projektioita samalla kartalla. Itse olin laatinut esitykset siten, että vertailin kaikkia projektioita TM35-FIN projektioon kartalla ja vertailin sitten näitä esityksiä keskenään.

Lähteet:

Nur, Nabila (2019). Toinen kurssikerta. Nabila Nurin blogi, luettu 1.2.2019. (https://blogs.helsinki.fi/nabila/2019/01/31/toinen-kurssikerta/)