Kurssikerta 4: Ruudukon luominen ja korkeuksia Pornaisissa

Ensimmäisenä tehtävänä oli tehdä ruututeemakartta pääkaupunkiseudusta valitsemallaan aiheella. Olimme tunnilla tehneet 1 km x 1 km kokoisia ruutuja, joten halusin kokeilla hieman pienemmällä ruudukolla ja päätin, että 500 m x 500 m olisi sopiva ruudun koko. Ruudukkoon sai kerättyä tietoa pisteaineistosta ja ottamalla mukaan tiedot 0-, 1- ja 2-vuotiaista sain tehtyä kartan alle 3-vuotiaista. Laskin ne siis yhteen uuteen sarakkeeseen. Unohdin ensin ottaa mukaan tiedon kaikkien asukkaiden yhteismäärästä, joten tein teemakartan absoluuttisin arvoin (kuva 1).

Kuva 1. Alle 3-vuotiaiden määrä pääkaupunkiseudulla.

Eniten alle 3-vuotiaita on Helsingin keskustassa. Se liittyy siihen, että on paljon asukkaita, joten on enemmän lapsiakin. Punaisia ruutuja on myös kauempana keskustasta ja Helsingin ulkopuolella. Lapsiperheitä usein asuukin runsaasti esimerkiksi rauhallisimmilla omakotitaloalueilla. Pääkaupunkiseudun reunoilla on paljon sinisiä ruutuja, jossa alle 3-vuotiaita on alle 10. Siellä on vähemmän asukkaita ja asutuskin usein on harvempaa, joten yhden ruudun alueelle ei osu niin montaa taloa. Meren rannalla olevat ruudut voivat myös osittain osua veden päälle, joka vähentää asukkaiden määrää.

Ruudut ovat kartalla todella hallitseva elementti ja alueiden muodot jäävät niiden alle. Ruudut syntyvät sattumanvaraisesti, jos vertaa esimerkiksi koropleettiteemakarttaan, joka tehdään usein esimerkiksi kuntien rajojen mukaan. Ruudukko ei siis rajaa minkään aluerajoitusten mukaan ja ehkä silloin voi paremmin nähdä alueiden sisällä olevia vaihteluita tarkemmin. Ruututeemakartan avulla saa hyvän yleiskuvan, mutta ruudut ainakin omassa kartassani ovat niin hallitsevat, että muuta tietoa ei kannattaisi edes lisätä karttaan.

Ehkä tieto siitä, paljonko eri alueilla asuu ylipäätään ihmisiä auttaisi tulkinnassa. Palasin muutaman askeleen taaksepäin ja tällä kertaa otin mukaan  asukkaiden kokonaismäärän. Tein sen avulla suhteellisen teemakartan (kuva 2). Kartta ei kuitenkaan ole kovin hyvä. Suurin osa ruuduista on pienen arvon saavia sinisiä ja vihreitä ruutuja. Isompien arvojen oranssit ja punaiset ruudut ovat ihmeellisissä paikoissa ympäri karttaa. Syy tähän löytyi taulukosta. Esimerkiksi isoimman arvon saavassa ruudussa puolet asukkaista on alle kolmivuotiaita. Ruudussa kuitenkin asuu vain neljä ihmistä, eli todennäköisesti yksi perhe, jolla on kaksi pientä lasta. Kaikki suurimpien arvojen ruudut olivat saman tyyppisiä. Se johtaa siihen, että muut alueet eivät erotu, koska niiden erot ovat pienempiä suhteessa toisiinsa, joten liian suuret arvot heittävät koko luokittelun erilaiseksi. Ruudut ovat ehkä liian pieniä, jonka takia outoja arvoja tulee niin helposti. Se onkin ruudukkojen satunnaisuudessa ongelmana, koska silloin ei tiedä mihin ruutu sattuu osumaan eikä sitä pysty oikein hallitsemaan. Isommilla ruuduilla tulisi varmaan parempi suhteellinen kartta, mutta se ei olisi niin tarkka.

Lotta oli tehnyt hyvän lisäyksen karttaansa ja laittanut suuralueet näkyviin. Se tuo lisää informaatiota ja voi auttaa pohdinnassa.

Kuva 2. Alle 3-vuotiaiden suhteellinen osuus pääkaupunkiseudulla.

Toisena tehtävänä oli lisätä Pornaisten karttaan kaikenlaista. Tein tämän itsekseni, koska en kurssikerralla ollut ihan loppuun asti jaksanut pysyä mukana. Avatessani QGIS:in ylälaidan vector-valikko oli täysin tyhjä ja raster-valikostakin puuttui monia toimintoja. Ongelma oli onneksi mainittu tunnilla, joten en mennyt paniikkiin ja sainkin googletuksen jälkeen sen ratkaistua. Pluginseista piti lisätä sellainen kuin processing ja valikot näkyivät taas.

Kuvassa 3 on saamani lopputulos. Kokeilin hillshaden tekemistä vähän eri arvoilla. Liioittelin korkeuseroja ja vaihdoin valon tulosuuntaa. Valo tulee kartassa jostain kaakon suunnasta suunnilleen. Sen kyllä huomaa ja karttaa tarkastellessa se näyttää enemmänkin kuoppaiselta. Korkeusmallin avulla pystyi tekemään myös korkeuskäyrät. Kartalla näkyy myös lisäämäni talokohteet pisteinä ja tiet viivoina. 

Kuva 3. Pornaisten keskusta.

Hain myös Paitulista korkeuskäyrät ja ne näkyvät kuvassa 4 mustalla. Verrattuna korkeusmallin avulla tehtyihin käyriin, jotka ovat ruskeita, Paitulista ladatut ovat siistimmät. Esimerkiksi keskellä kuvaa näkyy ruskealla siksakkia, jonka voisi yleistää. 

Kuva 4. Korkeuskäyriä Pornaisten alueella. Mustat käyrät on ladattu Paitulista, ruskeat taas luotu QGIS:llä korkeusmallin avulla.

 

Lähteet:

    • Mattila, L. (2021) Rasterikartat, luettu 31.3.2021. https://blogs.helsinki.fi/lottmatt/2021/02/09/rasterikartat/

Kurssikerta 3: Uutta ja yhdisteltyä tietoa

Käytimme koko kurssikerran tällä kertaa tutustuen tietokantoihin ja tiedon yhdistelemiseen. Monesti tarvittavat tiedot löytyvät useista paikoista ja tietoa voi joutua muokkaamaan. Harjoitusta varten lisäsimme QGIS:siin aineiston Afrikan maista. Tavoitteena oli ikään kuin tiivistää tietoja, jotta saataisiin yhden maan tiedot yhdelle riville. Tähän oli vaihtoehtona useampikin toiminto. Merge selected features-toiminto sopii parhaiten yksittäisiin muutoksiin. Dissolve-työkalulla saa taas kerralla tehtyä muutoksia koko aineistoon, mutta sillä ei voi esimerkiksi summata kaikkien yhdistettävien rivien arvoja. Monimutkaisempiin yhdistämisiin paras vaihtoehto on aggregate, jolla pystyy tekemään myös laskutoimituksia kun muokkaa koko aineistoa. Tietojen yhdistely on hyödyllistä selkeyden takia ja se voi olla tärkeää, jotta voimme taas muokata ja luoda uutta tietoa. Menetelmä kannattaa siis valita riippuen siitä, mitä on tekemässä ja kuinka laajasti haluaa tehdä muutoksia.

Laskimme pinta-alat uudeksi sarakkeeksi. QGIS:in avulla pystyy tekemään laskutoimituksia helposti ja lisätä tietoa mitä alkuperäisessä tietokannassa ei ole. Laskettuani pinta-alat aggregatella, päätin vielä tarkistaa, että ne tulivat oikein. Huomasin kuitenkin, että pinta-alat olivat edelleen vain yhdeltä riviltä, eikä kaikkien yhden maan alueiden yhteenlaskettu summa. Lopulta ymmärsin, että olin käyttänyt “pohjana” väärää kerrosta (dissolvella tehtyä), kun olisi pitänyt käyttää alkuperäistä, jolloin kaikki pinta-alat ovat mukana. Uutta tietoa tehtäessä syntyykin monesti uusia layereita, joten pitää olla tarkkana mitä niistä käyttää ja että kaikki tarvittava tieto on mukana. Kannattaa varmasti myös poistaa vanhoja layereita. Silloinkin pitää tietysti olla tarkkana, ettei poista mitään tärkeää.

Toinen uusi asia oli tietokantaliitokset. Ensin olimme siis työskennelleet vain yhden tietokannan sisällä. Uusi data voi kuitenkin sijaita jossain ihan muualla, kuten excel-tiedostossa. Afrikan maihin liittyen meillä oli väkiluvut ja internetin sekä sosiaalisen median käyttämisestä tietoa excel-taulukossa. Ensimmäiseksi muutimme sen cvs-tiedostoksi, koska se toimii paljon paremmin yhteen QGIS:sin kanssa. Tietokantaliitos onnistuin join-toiminnolla, joka vaikutti ensimmäisen käyttökerran perusteella aika yksinkertaiselta. Tärkeintä on se, että löytyy jokin sarake, jolla on kaksoiskappale valmiissa aineistossa ja tiedot saadaan liitettyä toisiinsa. Uusien tietojen avulla laskin uuden sarakkeen eri Afrikan maiden Facebookin käyttäjien prosenttiosuuksista.

Seuraavaksi lisäsimme tietoa konflikteista, timanttilouhoksista ja öljykentistä. Kaksi ensimmäistä olivat pistetiedostoja, mutta öljykentät olivat polygoneina. Kun tiedettiin esimerkiksi konfliktien sijainnit, saatiin laskettua taas uutta tietoa siitä paljon konflikteja on ollut maittain. Sama tehtiin timantti- ja öljykenttäaineistoilla. Aineistoon on tallennettu myös konfliktien vuodet, joten sen perusteella pystyttiin tarkastelemaan, kuinka pitkäkestoisia epävakaat ajat ovat olleet. Loimme siis paljon uusia sarakkeita yhdistelemällä eri aineistoista saatua tietoa. Kun tiedetään timanttikaivosten ja öljykenttien löytämis- ja käyttöönottoajankohdat, voitaisiin myös tutkia sitä, onko konflikteja tapahtunut samoina aikoina niiden lähellä tai ylipäätään samassa maassa. Internetin käytön lukumäärä eri vuosina taas kertoo paljon maan kehityksestä. Sitäkin voitaisiin tutkia konfliktien yhteydessä ja miettiä, ovatko konfliktit mahdollisesti vaikuttaneet siihen.

 

Tulvaindeksi ja järvisyys

Lisäksi saimme itsenäiseksi tehtäväksi teemakartan tekemisen Suomen vesistöjen valuma-alueiden tulvaindekseistä. Aineistoissa oli valmiina projekti, josta löytyi tarvittavat tiedot. Ne oli kuitenkin hieman eri paikoissa, joten käytin join-toimintoa ja sain kaiken samaan taulukkoon. Tulvaindeksin laskemiseen tarvitsin keskiylivirtaaman ja keskialivirtaaman, eli tulva-ajan virtaamien keskiarvot ja kuivien kausien virtaamien keskiarvot. Se kertoo paljon virtaaman vaihtelusta, koska käytämme joen virtaaman ääripäitä. Samalle kartalle tarvittiin myös järvisyysprosentti, joka oli excel-tiedostona. Muutin sen cvs-tiedostoksi ja toin QGIS:siin. Laskin sitten tulvaindeksin, joka saadaan jakamalla keskiylivirtaama keskialivirtaamalla calculatorissa ja sain siitä uuden sarakkeen.

Aiemmalla kurssikerralla olimme jo tutustuneet siihen, miten teemakartta saadaan tehtyä. Jonkun muuttujan, eli tässä tapauksessa tulvaindeksin, arvojen avulla kartan alueet jaetaan luokkiin. Tutkittuani ensin histogrammissa arvojen jakautumista päädyin kolmeen luokkaan, vaikka olisin varmaan voinut laittaa enemmänkin. Huomasin myös että yksi arvo oli erityisen poikkeava, 1100, kun muut olivat arvoltaan suurimmaksi osaksi alle kolmen sadan. Menin siis katsomaan taulukosta ja se oli Aurajoki. Sen kummatkaan luvut eivät kuitenkaan olleet mitenkään erityisen poikkeavat muista vesistöistä, keskialivirtaama vain oli todella alhainen ja keskiylivirtaama siihen verrattuna korkea. On vielä hieman vaikeaa tehdä karttoja, koska oma arviointi ei oikein kerro mitään siitä, onko tulokset edes lähellä oikeaa. Päädyin nyt kuitenkin siihen lopputulokseen, ettei arvo ole mitenkään epätavallinen tai väärä.

Aineistossa oli myös järvi- ja joki-layerit ja mietin tekevätkö ne kartasta liian sekavan, jos ne sisällyttää karttaan. Toisaalta ne liittyvät aiheeseen, ja niistä voisi päätellä jotain, joka auttaa kartan tulkinnassa. Päätin siis ottaa ne mukaan kartan ensimmäiseen versioon (kuva 1), mutta laitoin ne vaalealla värillä, jotta ne eivät hirveästi häiritsisi kartan lukemista. Halusin myös lisätä suurimpien tulvaindeksien vesistöjen nimiä kartalle, joten menin labels-osioon. Päätin että sopiva raja olisi 300, jotta nimiä ei tulisi liikaa. Kartalla siis näkyvät niiden vesistöjen nimet, joiden tulvaindeksi on 300 tai yli. Säädin hetken työkalun kanssa, jotta nimet näkyisivät tarpeeksi ja erottuisivat, mutta jottei ne peittäisi liikaa. Parhaan tuloksen sain, kun laitoin niille valkoisen taustavärin.

Kuva 1. Suomen valuma-alueiden tulvaindeksit.

Seuraavaksi lisäsin karttaan järvisyysprosenttia kuvaavat pylväät. Ne sai layerin diagrams osiosta, mutta työkalu oli hieman hankala enkä ensin keksinyt miten se toimii. Sain apua Tapion kurssiblogista, koska hänellä oli ollut sama ongelma. Ratkaisu löytyi diagrams-työkalun size kohdasta, josta sai valittua muuttujan ja lisättyä sen maksimiarvon. Toisesta kartasta otin vesistöt ja nimet pois, jotta kartta olisi selkeämpi. Pylväät ovat aika pieniä, koska osa valuma-alueistakin on pieniä ja osa niistä näyttää vain vaakaviivoilta. Kuva 2 on saamani karttakuva järvisyyspylväiden kanssa. Olisin voinut vielä lisätä järvisyysprosentille paremman selityksen, joka kertoisi pylväiden korkeudesta jotain, mutta se nyt jäi.

Kuva 2. Suomen valuma-alueiden tulvaindeksit ja järvisyysprosentit.

Kartalta erottuu ensimmäisenä se, että kaikki tulvaherkimmät alueet, eli joissa on korkea tulvaindeksi, sijaitsevat rannikolla. Niissä on myös alhainen järvisyysprosentti. Suurilla valuma-alueilla sisämaassa taas on korkea järvisyysprosentti ja pieni tulvariski. Varsinkin nyt karttaa tulkitessa on selvää, että olisin voinut lisätä luokkia, koska pystyisi tulkitsemaan pienempiä eroja alueiden välillä. Monet kuuluu alimpaan luokkaan, mutta järvisyysprosenteissa on suuria eroja. Sen voi kuitenkin päätellä, että järvisyys todennäköisesti mataloittaa tulvariskiä.

 

Lähteet:

  • Turpeinen, T. (2021) 3: Konflikteja ja tulvaindeksejä, luettu 9.2.2021. https://blogs.helsinki.fi/tapiotur/2021/02/04/3-konflikteja-ja-tulvaindekseja/

Toinen kurssikerta: Projektioiden vääristämiä mittoja

Toisella kurssikerralla keskityimme tutkimaan pinta-aloja ja pituuksia sekä sitä, miten käytetty karttaprojektio vaikuttaa niihin. QGIS:sin mittatyökalun avulla mittasimme sekä alueen että pituuden Suomen kartalta ja tarkastelimme sen muutoksia projektiota vaihtaessa. Kuvassa 1 on TM35FIN-projektio, jota suositellaan käyttämään Suomea koskevissa kartoissa ja joka vastaa aika hyvin todellisuutta. Kun sitä vertaa kuvan 2 Mercatorin projektioon, näkee kuinka paljon Mercator venyttää pinta-aloja mitä pohjoisemmaksi mennään. Mercator onkin oikeakulmainen projektio, eikä sitä kannata käyttää alueiden kuvaamiseen. Mercator myös kuvaa koko maapalloa, joka tarkoittaa sitä, että virheetkin on suuria.

Kuva 1. Suomi TM35FIN-projektiolla.
Kuva 2. Suomi Mercatorin projektiolla.

Myös Robinsonin projektio (kuva 3) sekä sinusoidaalinen projektio (kuva 4) ovat  maailmankarttaprojektioita. Robinsonin projektio on kompromissi, joten kaikki ominaisuudet on yritetty saada mahdollisimman oikeiksi, mutta mikään ei ole täysin oikein. Kuvassa Suomi näyttää litistyneeltä, mutta pinta-alat ovat paljon lähempänä todellisuutta. Sinusoidaalinen projektio taas on oikeapintainen, joten pinta-alat ovat aika tarkkoja. Mutta kuten kuvasta 5 näkyy, se on ulkonäöltään aika erikoinen, joten se ei välttämättä ole moneen tarkoitukseen käyttökelpoinen.

Kuva 3. Suomi Robinsonin projektiolla.
Kuva 4. Suomi sinusoidaalisella projektiolla.
Kuva 5. Sinusoidaalinen projektio. (map-projections.net)

Taulukkoon 1 olen kerännyt tiedot mitatuista alueista ja pituuksista (kuvissa 1-4  olevat oranssit kolmiot ja viivat) ja verrannut niitä todellisiin mittoihin. Eniten huomiota kiinnittää Mercatorin projektion aiheuttamat vääristymät. Erotus oikean pinta-alan ja Mercatorin antaman mitan välillä on jopa 40 000 neliökilometriä. Mittaamani viivan pituuskin on tuplaantunut. Robinsoninkin projektio vääristää paljon, muttei läheskään samoissa mitoissa.

Sinusoidaalinen tulee todella lähelle oikeita arvoja maailmankartaksi ja pinta-aloissa on eroa alle prosentti. TM35FIN on luonnollisesti lähellä todellista pituutta ja pinta-alaa.

Taulukko 1.

Projektio Pinta-ala (km²) Pituus (km) Todellinen pinta-ala erotettu (km²) Todellinen pituus erotettu (km) Pinta-alojen prosentuaalinen ero Pituuksien prosentuaalinen ero
TM35 6560,18 504,65 -167.91 -0.06 -2.495656271 -0.011888015
Mercator 50037,78 1091,38 43309.69 586.67 643.7144866 116.2390284
Robinson 9261,17 725,86 2533.08 221.15 37.64931801 43.81724158
Sinusoidal 6774,81 515,96 46.72 11.25 0.694402126 2.229002794
Todellinen pinta-ala/pituus 6728,09 504,71

Teimme QGIS:sin avulla myös teemakartat, joista näkyy pinta-alamuutokset koko Suomessa valitsemillaan projektioilla. Kuvassa 6 olen verrannut Robinsonin ja Mercatorin projektioita TM35FIN-projektioon. Kartoista näkee hyvin kahden maailmankarttaprojektion erot. Mercator moninkertaistaa pinta-aloja Suomessa pahimmillaan yli kahdeksankertaisiksi. Robinsonin aiheuttamat muutokset ovat taas paljon maltillisimpia, vaikkakin nekin suuria. Molemmissa projektioissa vääristymät kasvavat pohjoiseen päin.

Kuva 6.

Kurssikerta oli mielenkiintoinen ja oli todella hyvä havainnollistaa sitä, minkälainen vaikutus projektiolla on karttaan. Sitä on useasti jo korostettu, mutta jostain syystä sitä ei kovin paljon tule ajateltua karttoja katsellessa. Eikä siitä varmastikaan voi koskaan saada tarpeeksi montaa muistutusta miten huono projektio Mercator on pinta-alojen kuvaamiseen. Oli myös ihan kiva huomata, että ekan viikon jäljiltä oli jotain jäänyt mieleen QGIS:sin käyttämisestä. Pieniä ongelmia tietysti tuli eteen mutta niistä päästiin ohi ja onnekseni olen huomannut että muillakin on ollut samoja ongelmia, kuten mittojen häviäminen projektiota vaihtaessa. Päänvaivaa aiheutti Excelissä laskettavat prosenttierot projektioiden välillä, koska en meinannut millään hahmottaa minkä luvun jaan ja millä. Olisin myös voinut siistiä taulukkoa hieman ja pyöristää lukuja.

Ehdin myös lukea hieman enemmän muiden blogitekstejä ja tykkäsin esimerkiksi Oonan ja Antin blogiteksteistä koskien tätä kurssikertaa.

 

Lähteet:

  • https://map-projections.net/single-view/sinusoidal (luettu 7.2.2021)
  • Jalkanen, O. (2021) Kurssiviikko 2. https://blogs.helsinki.fi/jaoona/2021/02/01/kurssiviikko-2/ (luettu 7.2.2021)
  • Ryynänen, A. (2021) GIS menetelmät, kurssikerta 2. https://blogs.helsinki.fi/ryantti/2021/02/05/gis-menetelmat-kurssikerta-2/ (luettu 7.2.2021)