4. Kurssikerta: Ruututeemakarttojen laadintaa ja rasteriaineistoihin tutustumista

Neljännellä kurssikerralla laadimme pääkaupunkiseudun alueelta ruututeemakarttoja. Ruututeemakartan laadinnassa hyödynsimme aiemmilta kurssikerroilta tuttuja taitoja. Opimme lisäksi ruudukon luomisen ja väestötietojen yhdistämisen ruutuihin, sekä tyhjien, asumattomien ruutujen poistamisen. Näin ollen aineiston jatkokäsittely oli nopeampaa.

Kotitehtävänä laadin pääkaupunkiseudulta kaksi ruututeemakarttaa, joista kuvassa 1 on nähtävillä alle 1-vuotiaiden lasten lukumäärä 500x500m ruuduilla esitettynä. Kartalta on nähtävissä, että Helsingin kantakaupungissa alle 1-vuotiaiden lasten lukumäärä on suurimmillaan. Kuten Michaela Söderholm kirjoitti blogissaan, suurimmat tiet, rautatiet ja metroreitin voi selvästi havaita ruutukartalta, joka kuvaa asutuksen sijoittumista (Söderholm 2020). Söderholm oli omassa kartassaan kuvannut asutuksen jakaantumista pääkaupunkiseudulla. Alle 1-vuotiaiden lasten lukumäärä noudattelee yleisiä asutuskeskittymien sijainteja. Olen kuitenkin yllättynyt kartasta Espoon osalta. Onko mahdollista, että Espoossa ei ole juurikaan 500x500m alueilta, joissa asuisi enemmän kuin 1 alle 1-vuotias? Kauniaisten kohdalla on kartalla nähtävillä pieni alle 1-vuotiaiden keskittymä, mutta Espoo ammottaa tyhjyyttään alle 1-vuotiaista. Tähän en ikävä kyllä keksinyt järkevää selitystä.

Kuva 1. Alle 1-vuotiaiden määrä 500x500m ruuduilla pääkaupunkiseudulla

Tein vielä harjoituksen vuoksi toisen kartan, jossa tarkastelin yli 85-vuotiaiden lukumäärää pääkaupunkiseudulla (kuva 2). Tässä kartassa myös Espoon tulos näyttää luotettavalta. Huomionarvoista on, että kartoissa on käytetty eri luokkajakoa ja luokkien lukumäärää. Ensimmäiset neljä luokkaa ovat kartoissa samat, mutta yli 85-vuotiaita on huomattavasti alle 1-vuotiaita enemmän, joten tein yli 85-vuotiaiden karttaan viidennen luokan, 29-147. Jälkeenpäin ajateltuna olisi ollut informatiivisempaa, jos olisin tehnyt samat luokat molempiin karttoihin. Alle 1-vuotiaiden kartassa ylin luokka olisi jäänyt täyttämättä, sillä ylin arvo 500x500m ruudulla alle 1-vuotiaiden osalta oli 29. Tällöin karttojen vertailu keskenään olisi helpompaa.

 

Kuva 2. Yli 85-vuotiaiden määrä 500x500m ruuduilla pääkaupunkiseudulla

Ruututeemakartoilla tässä tehtävässä esitetään absoluuttisia arvoja. Absoluuttisten arvojen esittäminen kartalla on hyväksyttävää, sillä ruudut ovat saman kokoisia keskenään, eivätkä ne noudata hallinnollisia rajoja. Koropleettikartta noudattelee usein hallinnollisia rajoja, kuten kunnan, maakunnan tai valtion rajoja. Koropleettikartta on usein selkeä ja yksinkertainen esitys ilmiöstä. Ilmiöt kuitenkin harvoin noudattelevat hallinnollisia rajoja, jolloin esitys on yleistys ilmiöstä kyseisellä alueella. Ruututeemakartan avulla saadaan yksityiskohtaisempaa ja tarkempaa tietoa. Absoluuttisia arvoja hallinnollisten rajojen sisällä tarkastelemalla saadaan tietoa esimerkiksi asukaskeskittymistä kunnan sisällä.

Rasteriaineisto

Tutustuimme kurssikerralla rasteriaineiston avaamiseen QGIS:ssä ja neljän vierekkäisen ilmakuvan yhdistämiseen yhdeksi ilmakuvaksi. Loimme korkeuskäyrät näiden ilmakuvien avulla ja lisäsimme kyseiset korkeuskäyrät peruskarttalehdelle, jolla ei korkeuskäyriä entuudestaan ollut (kuva 3). Mikko Kangasmaa oli onnistuneesti lisännyt maanmittauslaitoksen korkeuskäyrillä varustetulle peruskarttalehdelle QGIS:n piirtämät korkeuskäyrät. Kokeilin itse samaa valitettavasti siinä onnistumatta. Päädyin siis vertailemaan QGIS:n ja maanmittauslaitoksen korkeuskäyriä erillisistä kuvista.

Kuva 3. Maanmittauslaitoksen peruskarttalehti, jossa QGIS:n piirtämät korkeuskäyrät korkeusmallin avulla (Maanmittauslaitos 2007)

Kuvat 3 ja 4 kuvaavat samaa aluetta. Kuvassa 4 on maanmittauslaitoksen peruskarttalehti, jolla korkeuskäyrät oli valmiiksi esitetty. Kuvia 3 ja 4 vertailemalla voi huomata, että korkeuskäyrät vastaavat toisiaan hyvin. Kuvassa 3 on nähtävillä ”kohinaa” eli tarpeetonta mutkittelua ja rosoisuutta. Maanmittauslaitoksen korkeuskäyriltä tarpeeton kohina on poistettu (kuva 4). Joitain merkittäviä poikkeamiakin löytyy karttojen korkeuskäyriltä. Esimerkiksi kuvien oikealla laidalla Lampisuolle QGIS on piirtänyt korkeuskäyriä, kun maanmittauslaitoksen versiossa alue on tasainen, eikä korkeuskäyriä näin ollen ole käytetty. Kokonaisuudessaan kuitenkin QGIS selviytyi korkeuskäyrien piirtämisestä mallikkaasti ja mikäli tästä haluttaisiin laatia korkeuskäyräkartta, vaatisi lopullinen versio vain hieman hienosäätöä luettavuuden vuoksi.

Kuva 4. Maanmittauslaitoksen peruskarttalehti 1:20 000 (Maanmittauslaitos 2007)

KIRJALLISUUS

Kangasmaa (2020). Sisäinen GIS-nörttini on virallisesti herännyt (Kurssikerta 4). 9.2.2020. https://blogs.helsinki.fi/kanmikko/

Söderholm (2020). Mot ljusare (GIS)tider. 9.2.2020. https://blogs.helsinki.fi/micsoder/

Kurssikerta 3: Tietokantoihin syventymistä & valuma-alueisiin tutustumista

Kolmannella kurssikerralla teimme aluksi ohjatun harjoituksen, joka käsitteli Afrikkaa. Käsittelimme tietokantaa, jossa jokainen pienikin alue oli merkitty omaksi kohteekseen. Aloitimme harjoituksen yhdistämällä kohteet maakohtaisesti, jolloin jäljelle jäi noin 50 kohdetta. Toiminto onnistui helposti Dissolve-työkalulla, jonka avulla pystyi ryhmittelemään kerralla tietokannan kohteet yhdistävän saraketiedon perusteella. Tässä tapauksessa käytimme country-saraketta.

Afrikka-harjoituksessa laskimme vielä QGIS:n avulla konfliktien lukumäärää, vuosien lukumäärää, jolloin konflikteja on tapahtunut, timanttikaivosten lukumäärää ja öljykenttien lukumäärää, sekä toimme Excel-pohjaista tietoa ohjelmistoon. Tietojen avulla olisi mahdollista analysoida timanttikaivosten ja öljykenttien suhdetta konflikteihin.

Kotitehtävänä kurssikerralta oli tutustua Suomen valuma-alueisiin, laskea tulvaindeksi alueille ja avata Excel-pohjainen järvisyystietokanta CSV-muotoisena QGIS:ssä. Tietojen pohjalta tuli laatia koropleettikartta tulvaindeksistä ja pylväsesitys valuma-alueiden järvisyydestä.

Yhdistin tietoja useista tietokannoista, jolloin sain laskettua tulvaindeksin (MHQ/MNQ, eli tulvahuippujen keskiarvo jaettuna kuivien kausien alimpien arvojen keskiarvolla). Tallensin järvisyyttä käsittelevän Excel-tiedoston CSV-muotoon, jolloin sain sen avattua QGIS:ssä. Tiedot avautuivat ensin QGIS:ssä tekstimuotoisena, jolloin se ei osannut käsitellä järvisyysprosentteja numeroina, eikä järvisyyttä kuvaavien pylväiden luominen onnistunut. Kun avasin järvisyystietokannan uudelleen ja lisäsin tietokannan avaamisen yhteydessä valinnan kohtaan ”Decimal separator is comma”, onnistui pylväiden lisääminen normaalisti. Tällöin QGIS tunnisti järvisyysprosentin double-muotoisena tietona, joka vaikutti toimivan normaalisti numeerisen tiedon tapaan. Loppu olikin visuaalisen tulkinnan hienosäätöä: värien ja jakauman valintaa, sekä pohjoisnuolen, legendan ja mittakaavan lisäämistä.

Kuvassa 1 on nähtävillä lopputuotos, josta selviää Suomen valuma-alueiden tulvaindeksi ja järvisyys. Suomen tulvaherkimmät alueet ovat karttaesityksen mukaan pinta-alaltaan pieniä valuma-alueita, jotka sijaitsevat rannikolla ja joiden järvisyysprosentti on pieni.

Kuva 1. Koropleettikartta Suomen valuma-alueiden tulvaindeksistä ja pylväsesitys järvisyydestä

Tämän viikon tehtävän osalta erityisen haastavalta tuntui värien valinta esitykseen. Tehtävä itsessään tuntui aiempien viikkojen tehtäviin verrattuna helpolta. Voi siis olla, että minulla oli vielä käyttämätöntä GIS-energiaa värien valintaan tehtävän loppuvaiheessa. Niinpä kokeilin useita vaihtoehtoja väreiksi, eikä oikein mikään tuntunut hyvältä. Kuten Venla Moisiokin blogissaan pohti, sininen valinta tuntui minustakin luonnollisimmalta kuvaamaan tulvaindeksiä (Moisio 2020). Halusin kuitenkin esittää kartallani myös joet ja järvet ja sininen väri tulvaindeksissä sekoittui liikaa sinisiin jokiin ja järviin. Niinpä päädyin esittämään tulvaindeksin punaisella ja joet, järvet ja järvisyyden sinisellä. Sain myös Moision onnistuneesta karttatulkinnasta idean esittää järvisyyspylväät hieman läpikuultavina (Moisio 2020).

KIRJALLISUUS

Moisio (2020). Viikko 3 – Tietokantojen yhdistämistä ja laskutoimitusten tekemistä. 30.1.2020. https://blogs.helsinki.fi/moivenla/

Kurssikerta 2: Tietokantoihin ja karttaprojektioihin tutustumista

Toisella kurssikerralla syvensimme ensimmäisen kurssikerran oppeja. Ensimmäisellä kurssikerralla avasimme QGIS-ohjelmistossa tietokoneille lataamamme aineiston, mutta tällä kertaa muodostimme QGIS:n kautta Tilastokeskuksen aineistoon yhteyden. Tätä kautta pääsimme käsiksi lukuisiin tietokantoihin. Kuitenkin työskentelyä ja muokkaamista varten aineisto tuli tässäkin tapauksessa ladata koneelle.

Perehdyimme myös karttaprojektioihin. Tunnilla tekemässämme harjoituksessa laskimme pinta-alat oikeapintaisessa projektiossa ja valitsemassamme projektiossa, joka vääristää pinta-aloja. Valitsin esimerkkiin Mercatorin projektion, sillä sen avulla erot oli helppo havaita. Kuvassa 1 on esitetty prosentteina kuntakohtaiset pinta-alan vääristymät Suomen kunnissa verrattuna todellisiin pinta-aloihin. Kuvasta voi huomata, että vääristymät ovat huomattavia kaikkialla Suomessa, mutta suurempia pohjoisessa. Pohjoisimmassa Suomessa Mercatorin projektio vääristää kuntien pinta-aloja suuremmaksi jopa 600-722%.

Kuva 1. Pinta-alan vääristymä prosentteina Mercatorin projektiolla Suomen kunnissa (Tilastokeskus 2015)

Varsinainen kotitehtävä oli esittää jotakin muuttujaa ja suhteuttaa se pinta-alaan. Valitsin väestötiheyden pinta-alaan suhteutettuna. Ensimmäisessä esimerkissä esitin väestötiheyttä Suomen kunnissa oikeapintaisella projektiolla (kuva 2). Tässä kuvassa siis Suomen väestötiheys pitäisi olla realistisesti kuvattuna.

Kuva 2. Väestötiheys Suomen kunnissa oikeapintaisella projektiolla esitettynä (Tilastokeskus 2015)

Kuvassa 3 on esitettynä Suomen väestötiheys Mercatorin projektiolla kuvattuna. Kuvia vertailemalla voi huomata, että Mercatorin projektio pienentää asukastiheyttä radikaalisti. Koska Mercatorin projektio kuvaa napa-alueet pinta-aloiltaan todellista kokoa suuremmaksi, on tuloksena pinta-alaan suhteutetun muuttujan vääristyminen pienemmäksi. Kuvissa 2 ja 3 luokat ovat samanarvoiset ja esitystapoihin on valittu sama väri vertailua helpottamaan.

Kuva 3. Väestötiheys Suomen kunnissa Mercatorin projektiolla kuvattuna (Tilastokeskus 2015)

Kurssikerran oppi on karttoja tarkastelemalla ilmeinen. Projektion valinnalla on todella suuri merkitys maantieteellisen tiedon esittämisessä. Tiina Aalto toteaa blogissaan osuvasti: “Erilaisia ilmiöitä kuvaavia karttoja näkee valtavasti, eikä ilman tiedostavaa kritiikkiä niiden antamaa, monesti vääristelevää kuvaa useinkaan huomaa” (Aalto 2020).

Kokonaan toisen blogipostauksen voisin tehdä kaikista ongelmista, joita kohtasin tehtäviä tehdessä. Tyydyn tässä kertomaan muutaman sellaisen. Kuten Matti Katajistolla, myös minulla oli aluksi ongelmia laskennallisen projektion muuttamisessa (Katajisto 2020). Huomasin myös kotitehtävää tehdessä pitkällisen ihmettelyn jälkeen, että tietokannan tallennusvaiheessa tallennusmuoto oli vaihtunut ESRI Shapefilesta GeoPackage muotoon, eivätkä näin tallennetut tietokannat toimineet toivotulla tavalla. Kolmas ongelma oli Suomen kuntaliitokset. Työstin aluksi Kunnat 2020 -aineistoa, mutta viimeiseen tehtävään tarvittiin tietoja vuoden 2015 aineistosta. Huomasin, että osa kunnista oli lakannut olemasta tässä välissä, joten pinta-alatiedot eivät täsmänneet. Päädyin siis työstämään pinta-aloja uudestaan vuoden 2015 aineistolla.

En ole myöskään täysin vakuuttunut siitä, sainko kaikkia pinta-aloja laskettua oikein. Vaikka suurin osa pinta-aloista oli yksi yhteen Googlen mukaan ja QGIS oikeapintaisella projektiolla laskettuna, huomasin, että esimerkiksi Helsingin ja Maarianhaminan pinta-aloissa oli heittoa. Esimerkiksi Helsingin pinta-ala (ilman merialueita) Googlen mukaan on 213,8km2, mutta QGIS ilmoitti oikeapintaisella projektiolla 263,63km2. Maarianhaminan pinta-ala (ilman merialueita) on Googlen mukaan 11,8km2, mutta QGIS näyttää 64,94km2. Kaikki sisämaan kunnat, jotka tarkastin, olivat sijainnista riippumatta kuitenkin oikein laskettu. Mietinkin voiko merellisellä sijainnilla olla jotain tekemistä pinta-alan heiton kanssa?

Koska ongelmia oli jonkin verran, tein tehtäviä useampaan otteeseen ja näin ollen toistoja tuli huomattavasti. QGIS-ohjelmiston tähän mennessä opitut perustoiminnot alkavat siis olla jo melko tuttuja. Huomasin myös, että ilman erillistä hiirtä tehtävien tekeminen kotona kannettavalla tietokoneella oli haastavaa, joten kävin viikonloppuna hiirikaupoilla. Nyt onkin hyvä jatkaa geoinformatiikan perusteiden harjoittelua uuden ulkoisen hiiren kanssa.

KIRJALLISUUS:

Katajisto (2020). Mies vastaan kone. 26.1.2020. https://blogs.helsinki.fi/mattikat/2020/01/24/mies-vastaan-kone/

Aalto (2020). Rajapinnalta pinta-alaksi. 26.1.2020. https://blogs.helsinki.fi/tidaalto/

Kurssikerta 1: Tutustumista QGIS-ohjelmistoon

Ensimmäisellä geoinformatiikan menetelmät 1 -kurssikerralla opimme perusteita QGIS-ohjelmistosta. QGIS-ohjelmisto oli nimeä lukuun ottamatta minulle uusi tuttavuus, joten huomasin nopeasti, että opittavaa on paljon. Opetuskerran aikana teimme ohjatun harjoituksen, jonka tarkoitus oli perehdyttää ohjelmiston käyttöön. Latasimme tausta-aineistot ohjelmaan, laskimme typen päästöjä prosenttiosuuksina ja visualisoimme lopputuloksen kartalle. Lopuksi lisäsimme vielä pohjoisnuolen, mittakaavan ja legendan kartalle. Vaikka toiminnot kuulostavat yksinkertaisilta, olisi niiden tekeminen ilman ohjeita todennäköisesti pysähtynyt omalla kohdallani jo käsiteltävän aineiston avaamisyritykseen. Saimme suullisen ohjauksen lisäksi vielä kirjalliset ohjeet, joihin oli helppo palata itsenäistä tehtävää kotona suorittaessa. Lopputuotoksena kurssikerralla syntyi Itämeren alueen maakohtaiset typpipäästöt koropleettikarttana (kuva 1).

Kuva 1. Itämeren alueen typpipäästöjen prosenttiosuudet maakohtaisesti

Kotitehtäväksi ensimmäiseltä kurssikerralta jäi laatia koropleettikartta valitsemasta muuttujasta Suomen kunnissa. Aluksi tarkastelin valmiita muuttujia ja päätin laskea saamenkielisten osuuksia Suomen kunnissa. Kohtasin kuitenkin ongelmia, sillä osuudet ovat hyvin pieniä. Hävitin lopputuotoksen tallentamatta tuotosta tai tuotoksen vaiheita. Myöhemmin kuitenkin huomasin, että esimerkiksi Tomi Kiviluoma oli tallentanut kokeilunsa, vaikkakin päätyi lopulta toisen muuttujan esittämiseen (Kiviluoma 2020). Seuraavilla kurssikerroilla aion taltioida blogiini myös omia kokeilujani, jotka eivät välttämättä päädy lopputuotokseen asti.

Lopulta päädyin visualisoimaan ruotsinkielisten osuuksia Suomen kunnissa (kuva 2). Toisin kuin saamenkielisten osuudet, ruotsinkielisten osuudet prosentteina oli valmiiksi aineistossa laskettuna, joten laskutoimitusta ei tällä kertaa tarvinnut itse suorittaa. Jakaumaksi valitsin luonnollisen jakauman, joka tunnistaa samankaltaisten arvojen esiintymäryppäät ja näin ollen kuvaa ilmiötä realistisesti.

Kuva 2. Ruotsinkielisten osuus prosentteina Suomen kunnissa vuoden 2015 kuntajaon mukaan

Mielestäni kuvan 2 koropleettikartta kuvaa hyvin ruotsinkielisten osuutta Suomen kunnissa. Kartasta voidaan päätellä, että suurimmassa osassa Suomen kunnista ruotsinkielisten osuus on hyvin vähäinen, vain 0-4%. Etelä-Suomessa rannikon tuntumassa ruotsinkielisiä asuu kohtalaisesti, mutta suurin ruotsinkielisten osuus Suomessa on Ahvenanmaalla ja Pohjanmaan rannikkoseuduilla.

Huomasin myöhemmin, että Vilma Koljonen oli esittänyt omassa blogissaan niin ikään ruotsinkielisten osuutta väestöstä Suomen kunnissa. Kuten hänkin totesi, luokkajaon valinta vaikuttaa merkittävästi lopputulokseen (Koljonen 2020). Vaikka olimme valinneet esitykseen eri määrän luokkia, mielestäni karttatulkintamme kuvaavat lähes samalla tavalla ruotsinkielisten osuutta. Huomasin, että olin itse käyttänyt viittä luokkaa, kun Koljonen oli käyttänyt kuutta. Suurin ero koropleettikartoissamme lienee olleen se, että omassa esityksessäni suurin luokka sai tummemman värin, jolloin ero toisiksi suurimpaan luokkaan vaikuttaa radikaalimmalta kun Koljosen tulkinnassa, vaikka luokkarajat ovat miltei samat.

Väri voisi esityksessä olla jokin muukin, esimerkiksi sininen tai vihreä, mutta valitsin tällä kertaa punaisen. Tummeneva väri kertoo ilmiön voimakkuudesta. Muutamia muutoksia kuitenkin tekisin, mikäli laatisin kartan uudelleen. Pienentäisin pohjoisnuolen, kääntäisin sivun vaaka-asennosta pystyasentoon ja lisäisin frekvenssin prosenttiosuuksien yhteyteen. Frekvenssistä selviäisi, kuinka monta kuntaa kuuluu kuhunkin luokkaan. Kartalta on nähtävillä, että suurin osa kunnista kuuluu ensimmäiseen arvoon, eli ruotsinkielisten osuus kunnissa on 0-4%, mutta tarkka kuntien määrä ei visuaalisesta esityksestä selviä.

KIRJALLISUUS

Kiviluoma (2020). Johdanto kurssille ja QGIS:in perusominaisuudet. 17.1.2020. https://blogs.helsinki.fi/tomingeoblogi/2020/01/16/johdanto-kurssille-ja-qgisin-perusominaisuudet/

Koljonen (2020). Ensikosketus QGIS:iin. 21.1.2020. https://blogs.helsinki.fi/vilmakol/