QGIS osa kaksi – syvemmälle kaninkoloon

Eläm… GIS on täyttä valintoja.

Näin lupaavasti alkaa toisen kurssikerran ohjeistus. Sitä se varmasti on. Maanantaisella lähiopetuskerralla asiat näyttävät aina yksinkertaisemmalta verrattuna tähän hetkeen kun istuu oman kotikoneen ääreen ja käynnistää QGIS:in. Valikot suorastaan huutavat ’Älä nyt ainakaan tähän koske!’. Pyritään siis vähän kerrassaan lähestymään asiaa.

Tätä pinta-alojen ja pituuksien muuttumista valitun projektion mukaan tehtiin jo tunnilla, mutta lähdetään siitä liikkeelle. Ehkä Exceliin koottu taulukko tekee asiasta helpommin havaittavan. Ensin Snapping-toiminta käyttöön, jotta mittausten pitäisi ainakin teoriassa tarttua tarkemmin alueiden rajoihin kiinni. Siis ainakin teoriassa. Ja teorian tasolle se jääkin. Piirsin kolmion Suomen halki suurin piirtein Oulun korkeudelta, eikä mittaus todellakaan napannut kiinni rajoihin. QGIS:in tuntien en ollut käynyt jostakin hämärän valikkorakenteen neljännestä välilehdestä laittamassa täppää kohtaan ”Do what user actually asks you to do”. Noh, näillä mennään.

Valitsin tuon TM35-projektion seuraksi Mercatorin, Winkel II:n, Pattersonin ja Robinsonin projektiot, niillä nuo lukemat ainakin olivat mukavan vaihtelevia. Havaitsin myös, että projektioita vaihdellessa ja lukuja talteen kirjatessa ei kannata epähuomiossa klikata karttaa, koska QGIS tietysti aloittaa uuden mittauksen ja saat tehdä kaiken uudestaan. Mukava tällainen interaktiivinen tutorial-ominaisuus, jonka avulla saa tätäkin työvaihetta harjoitella uudestaan.
Huomaa muuten, että QGIS:in lisäksi Excel on itselleni turhan tuntematon ohjelma. Jotenkin – jälleen kiitos paikallisen ATK-tukihenkilön – sain luotua seuraavanlaisen taulukon mittauksistani ja niiden eroista.

Taulukko eri projektioiden eroista tasaisella karttapinnalla mitattuna

Sikäli kun laskukaavat ovat oikein (todennäköisesti eivät ole) ja ymmärrän niitä (todennäköisesti en) voidaan huomata, että TM35-projektion ja muiden valittujen projektioiden välillä on selkeitä eroja. Jokainen muu projektio suurentaa sekä pinta-alaa että pituutta. Mercatorin ja Pattersonin projektioiden välillä pituuseroa ei juuri ollut, mutta pinta-alassa ero niiden välillä on huomattava. Verrattaessa tätä taulukkoa vaikkapa Jessika Isomeren (Isomeri, 2022) vastaavaan jään miettimään, että olisiko ollut syytä vielä jotakin muuta tilastoida. Hänellä tilastot on ilmoitettu hyvin tarkasti, itselläni noita prosentteja on siivottu pääosin tarkempaan muotoon.

Lainaus ohjeista: ”Koska kartan tai analyyseistä saatujen tulosten lukija ei juuri koskaan pääse näkemään tekoprosessia alusta asti, on syytä kiinnittää erityistä huomiota menetelmien oikeellisuuteen, jotta saadut tulokset olisivat luotettavia. Ja myös siksi, että tekijä aidosti tietäisi mitä tekee.” Viimeinen lause laittaa vähän hymyilyttämään. Tähän asti QGIS:in kanssa työskentely on ollut enemmän tyyliin ’älä mene rikki nyt’ suoritettua hyvin varovaista tunnustelua. Katsotaan mitä tämän harjoitteen myötä vastaan tulee.

Taulukoista kartan äärelle

Avataan siis aineisto. Tai siis, sehän on jo auki, koska sitä edellisessä työvaiheessa käytin. Tallenna aineisto uudella nimellä. Selvä. Tai siis… mitä? Ohjeissa kummittelee jokin kunnat2017-tietokanta ja QGIS:istä en tuollaista Save As…-valikkoa löydä. Ah, se on tuo Export-valikon Save Features As… Asia selvä. Ymmärrän, etteivät ohjeet voi olla laadittu kunkin QGIS-version mukaan, mutta kun niitä vielä aika orjallisesti joutuu seuraamaan, tuottavat tällaiset pienet yksityiskohdat ongelmia. Etenkin ohjelmalla, joka on – kuten todettua – ihmisvihamielinen. Ohjelma pitää sitten sulkea ja avata uudestaan, hieman erikoinen toimenpide, mutta mennään sillä. Oikeasta alakulmasta näen, että koordinaattijärjestelmä on se, mikä sen pitäisikin olla. Nyt vain toivon, että tuo EPSG: 3035 todella on oikein.

Jälleen helmitaulun ääreen, tämän työkalun onneksi löytää monesta paikasta. Create a new field, check. Nimetään sarake fiksusti, check. Valitse kentän tyypiksi Decimal number (real), Length 8, Precision 2. Saan tyypin valittua, mutta pituuden ja tarkkuuden valintakentät ovat harmaina, arvoina 0 ja 3. Mieleen juolahtaa muutama uusi kirosana. En voi kuin toivoa, että tästä huolimatta ohjelma tekee sen mitä tarkoitus olisi. Mites se menikään, ”että tekijä aidosti tietäisi mitä tekee”. Todellakin.

Pikaisella tarkastuksella arvot ovat ainakin sinne päin, heittoa ehkä neliökilometri tai kymmenen. Nyt sitä pitäisi verrata Mercatoriin. Eli alakulmasta projektio vaihtoon, eikö? Ehkä, ehkä ei. QGIS jaksaa yllättää. Nyt pitää valita kahden eri Mercator-vaihtoehdon välillä. Rahat vai kolmipyörä, rahat vai kolmipyörä. Valitsen ensimmäisen vaihtoehdon. Mercatorin mittayksikkö on metri, joten tulosten pitäisi olla verrattavissa. Koitetaan siis luoda tietokantaan sarake Mercatorin mittaamalle pinta-alalle. Tietysti pinta-alat ovat täsmälleen samat kuin edellisessä projektiossa, eli jotakin tein väärin. Yritetään tuon toisen työvaiheen kautta. No, siellä se onnistuu, mutta tulokset ovat tietysti metreissä.

Muutama yritys lisää ja nyt olen saanut tietokannasta muutettua myös aiemmin ihan kunnollisen PA_LAEA-sarakkeen luvut ihan toisiksi. Sisun EIKU-nappia tulee ikävä. Rollback-toiminto Current Edits-kohdasta tuhosi nyt koko PA_LAEA-kohdan, joten lasketaanpa se uudestaan. Uusi kirosana. Ai niin, unohdin että tämä oli osa QGIS:in interaktiivista tutoriaalia, koska nyt sarakkeen luominen sujui erittäin mallikkaasti. Vaihdan projektioksi taas Mercatorin ja koitan samalla työkalulla luoda sarakkeen sen pinta-alasta. Mutta ei, jo esikatselu näyttää, että se käyttää edelleen tuota LAEA-projektiota. Layer CRS? Ei auta. Project CRS? No nyt! Luvut niissä metreissä, mutta saisiko ne muutettua. Jos editoisi Field Calculatorissa saraketta kaavalla area_2 / 1000000? Ei, se oli iso virhe, nyt luvut ovat taas… en edes tiedä mitä niille tapahtui. Tuurilla, poppakonsteilla tai korkeimman johdatuksella saan kuitenkin luvut muutettua oikeaan muotoon.

Ensimmäinen elämys osaamisesta tuli vastaan, kun osasin luoda laskukaavan, jolla kahden eri sarakkeen välisten lukujen prosentuaalinen ero piti saada näkyviin. Saan jopa muokattua siitä ihan edustavannäköisen kartan, nyt vain sitten New Print Layout – jonne kartta tietysti ilmaantuu surkean pienenä. Tarkastettuani työtilasta kartan mittakaavan, voin kopioida sen tuohon työkaluun, jolloin se näyttäytyy sopivan kokoisena. Pientä säätöä, legendat kohdilleen ja voinee huokaista helpotuksesta?

Yllättävää kyllä, tämä piti paikkansa. Saan luotua kartan legendoineen, rotaation takia vinoine pohjoisnuolineen, mittakaavoineen ja kehyksineen. En tiedä saako kuvaa tuossa QGIS:in työskentelytilassa rajattua, joten sen sijaan että etsisin ja löytäisin ohjelmasta kohdan ’Remove everything user has worked on and saved today’-kohdan muokkaan kuvaa kuvankäsittelyohjelmalla.

LAEA- ja Mercator-projektioiden eroja havainnollistava kuva

Tämän kerran harjoitusten kolmostehtävä on Teletappi-tyyliin ”Tee se uudestaan”, mutta toistollahan tämä ohjelma alkaa tulla edes vähän tutummaksi. Otetaan projektioksi Two-point equidistant projection (Wikipedia, 2022). Hämmentävää kyllä, nyt työ sujuu huomattavasti sujuvammin. Hieman tuskastelen sen kanssa, että missä järjestyksessä kartan legendassa projektiot pitäisi ilmoittaa. Tässä hämää siis se, että toisessa projektiossa LAEA on pienempi ja toisessa suurempi. Noh, kuvat kuitenkin syntyivät ja ensimmäisen kuvan jälkeen tallennetun layoutin ansiosta ovat ehkä suurin piirtein samankaltaisia, legendaa ja itse karttakuvaa lukuun ottamatta. Karttojen vertailua helpottaa sama värimaailma ja legendan vaihteluväli. Ilmiselvästi prosentuaalisen eron sijainti etelä-pohjois-suunnassa on päinvastainen, mutta sen lisäksi voidaan huomata, että vaihtelun rajaviiva ei kulje aina täsmälleen samojen kuntien kohdalla. Lisäksi Mercatorissa vaihtelu on selkeämmin itä-länsi-suuntaista, siinä missä toisessa kartassa vaihtelu on enemmän luode-kaakkois-suuntaista. Tämä toki tulee hyvin esiin juuri tällä meille tutummalla karttaprojektiolla esitettynä.

LAEA-projektio verrattuna kahden pisteen samanpituiseen projektioon. Legendassa projektio ilmoitettu englanniksi QGIS:in käyttökielen mukaan

Oli mielenkiintoista huomata myös miten eri tavalla näitä legendoja voi otsikoida, vaikka samaa ilmiötä tutkittiin. Hanna Pelkonen (Pelkonen, 2022) oli ne otsikoinut varsin selkeän informatiivisesti kuntien pinta-alojen suhde projektio/projektio -muodossa ja siitä tykkäsin kyllä, vaikka omiini nyt jätinkin asian eri tavoin ilmoitettuna. Valitsemaani värimaailmaa myös mietin, etenkin peilattuna Salla Kärkkäisen pohdintaan sinisen värimaailman neutraalimmasta visuaalisesta ilmeestä (Kärkkäinen, 2022). On hyvä, että kurssilla kannustetaan myös seuraamaan toinen toistemme blogeja, niihin omien töidensä peilailu auttaa oppimaan paljon.

Mitkä ovat tunteeni QGIS:iä kohtaan? Pelonsekaiset. Olen lähes vakuuttunut, että QGIS kehittyy vielä Skynetiksi ja alkaa ensiluokkaisen paikkatietonsa avulla tuhoamaan ihmiskuntaa. Sitä odotellessa sen kanssa pitäisi ilmeisesti oppia tulemaan toimeen. Ei lienee kuitenkaan tarkoituskaan, että tämänkään kurssin jälkeen kaikki sen salat olisivat meille julki, mutta ehkä (!) sen kanssa oppii tulemaan toimeen. Vaikka se vihaakin ihmisiä.

 

Liitteet:

Jessika Isomeri (26.1.2022).  JESSIKAN GIS-HURVITTELUT
Matka geoinformatiikan saloihin. Viikko 2 – Projektiot ja QGIS-ystävyyden toinen taso. https://blogs-test.it.helsinki.fi/jessikangishurvittelut/ (Tieto haettu 27.1.2022)

Wikipedia. Two-point equidistant projection. https://en.wikipedia.org/wiki/Two-point_equidistant_projection (Tieto haettu 27.1.2022)

Hanna Pelkonen (26.1.2022). Hannan kurssiblogi: 2. viikko: Pinta-aloja ja erilaisia projektioita. https://blogs.helsinki.fi/pelkohan/ (Tieto haettu 27.1.2022)

Salla Kärkkäinen (26.1.2022). Sallan blogi: Viikko 2: Kuntien avainlukuja ja gissiä. https://blogs.helsinki.fi/karkkais/2022/01/26/viikko-2-kuntien-avainlukuja-ja-gissia/ (Tieto haettu 27.1.2022)

Kunnat2015 – eli kuinka opin jo lähes vihaamaan QGIS:iä

Alkuhöpinät

Geoinformatiikan mystiset menetelmät. Tarkoituksena olisi tuota mystiikkaa niistä hälventää ja oppia ja oivaltaa, että ei tämä mitään salatiedettä ehkä kuitenkaan ole. Maanantaisella lähiopetuskerralla sain ensimmäistä kertaa eteeni auki QGIS-ohjelman, jonka valikoiden ja toimintojen moninaisuuteen pääsimme tutustumaan. Varmasti ihan hyvä tapa aloittaa oli tuo, että seurasimme vain opettajan esimerkkiä. Aina kun videotykin välittämässä kuvassa näkyi opettajan auki klikkaama valikko, kuului kaikkialta luokasta lähes yhtäaikainen hiiren painikkeen kilahdus.
QGIS vaikutti (ja vaikuttaa yhä) lähes uhkaavan monipuoliselta. Pohdin että syntyykö itselläni sen kanssa samanlainen viha/viha -suhde kuin minkä aiheutti CorelDraw. Sen kanssa tosin ongelmia selitti paljolti erikoinen kurssien suoritusjärjestykseni – on aina hieman kyseenalaista mennä kurssille, jossa käytetään ohjelmaa, joka olisi pitänyt tulla tutuksi jo aiemmalla kurssilla. Mutta QGIS:n kanssa lupaan antaa sille mahdollisuuden.

Tästä se lähtee

Työn äärellä tuskastelua

Siispä työhön ja toimeen. QGIS asentui vaivatta kotikoneelle ja päätin fuksiläppärin sijaan asentaa sen tehokkaammalle pöytäkoneelleni, jossa pitäisi löytyä vääntöä enemmän ohjelman vaivattomampaan käyttöön. Moodlesta löytyi aineisto Suomen kunnista ja… niin, mihin suuntaan tästä nyt lähtisi liikkeelle? QGIS arpoi Suomen kuntakartalle kauniin sinapinruskean värin ja nyt pitäisi lähteä tutustumaan siihen, että minkälaista dataa karttaan kätkeytyykään. Siispä F6:lla komento Open Attribute Table ja samalla yritetään tallentaa aivojen käyttömuistiin tämäkin näppärä pikapainike.
Dataa on tarjolla erittäin paljon, mikä ei tällaisen aiheen äärellä ole yllättävää. Muilla kursseilla olen esimerkiksi Tilastokeskuksen kuntadataan jo päässyt tutustumaan ja tilastoimisen arvoisiksi nähtyjen asioiden määrä tuntui uuvuttavan runsaalta. Runsaasta datasta on toki myös sitten helppo valita se tarkasteltava asia – eikä tarkastelun kohteeksi välttämättä ole mielekästä ottaa edes koko Suomea, vaan jokin suppeampi alue. Siispä valitsen kohteiksi Päijät-Hämeen alueen ja sieltä Lahden rajanaapurikuntineen (Hollola, Orimattila ja Nastola). Tässä heti huomaa aineiston olevan vuodelta 2015, sillä vuoden 2016 alussa Nastola liittyi Lahteen ja toi Lahdelle rajanaapureiksi myös Asikkalan, Heinolan ja Iitin.

Alue on siis valittu, nyt vaan jokin sopiva muuttuja visualisoitavaksi. Paljon tilastoja väestöstä ja sen rakenteesta, elinkeinorakenteesta ynnä muusta. Tässä huomaa myös, että ilman tilaston metatietoja ei kaikista lyhenteistä osaa oikein arvata mitä missäkin sarakkeessa on tilastoitu. Vai mitähän voisi tarkoittaa kohta ’Tietoon_tu’ tai ’Kuntien_1’? Metatietoa ei kuitenkaan ilmeisesti ole tässä ohjelmassa tarjolla tai ainakaan helposti löydettävissä? Jos datan olisi itse hakenut esimerkiksi Tilastokeskuksen sivuilta, olisi voinut nämäkin asiat selvittää. Mutta koska tarkoituksena on tutustua enemmänkin QGIS:in käyttöön kuin tehdä syväluotaavaa analyysiä näistä kunnista, valitaan jokin yksinkertainen muuttuja visualisoitavaksi – väestönmäärä olkoon valintani.

Ohjeistuksen mukaan arvot tulee kuitenkin suhteuttaa, koska absoluuttisia arvoja ei tule tällä visualisointityylillä esittää. Lasketaan siis yhteen näiden neljän kunnan väkiluvut, jotta voimme visualisoida eri kuntien osuutta koko väkimäärästä. Tämäkin pieneltä tuntuva työvaihe kannattaa tehdä huolellisesti, koska näpyttelyvirhe korruptoi dataa ja siitä tehtäviä visualisointeja melkoisesti. Nyt saatiin kokonaisväkimääräksi 156824. Ohjeita seuraten yritän nyt siis jotenkin luoda tästä laskelmaa ja visualisointia. Huomaan kuitenkin vain tuijottavani tuota Field Calculator -työkalua ja päässäni jyskyttää ajatus: mitä hittoa tässä pitäisi nyt tehdä?

Yritän löytää sisäisen koodarini ja kirjoitan ohjeistuista mukailevan laskukaavan ”vaesto”/ 156824*100 ja painan uhkarohkeasti Ok. Ohjelma tietysti toimi niin kuin pitikin ja muutti tilastoon valittujen kuntien väkimääräksi ensinäkemältä hassun pienet luvut, mutta sitten ymmärrän: siellä ne prosentit nyt ovat. Ihan väärässä paikassa, koska ovat korvanneet alkuperäisestä datasta väkimäärät – ja tämä johtuu vain siitä, että skippasin edeltävän työvaiheen. Luetaan siis ohjeet huolella. Onneksi tehdyn virheen saa varsin helposti peruttua ja seuraamalla ohjeita saan ohjelman toimimaan kuten haluan – tai, ehkä mieluummin, osaan käyttää ohjelmaa kuten tarkoitus olisi.

Yksi monista mystisistä virheilmoituksista.

Sitten pitäisi osata suodattaa tietokannasta NULL-vaihtoehdot pois ja seinä nousee pystyyn. Ehkä maanantaisessa harjoittelusessiossa tämä tehtiin, mutta nyt en sitä osaa. Filter? Onko se tuo suppilon näköinen kuvake tuossa ominaisuustaulukon ylälaidassa? Tuo, jolla kokeiltuani onnistuin muuttamaan luomani vaesto%-kentän kohdalle tekstin NULL? Tuntuu, että ohjelma kaipaisi omaa EIKU-nappiaan. Lopulta kotitalouden IT-tukihenkilön käytyä painelemassa sattumanvaraisia nappeja, saatoin onnistua tietokannasta jättämään esille ainoastaan nuo neljä kuntaa, joiden kohdalla dataa löytyy.

Seurataan siis ohjeita: Mene seuraavaksi tason Style-välilehdelle ja valitse Graduated pudotusvalikosta. Mene siis minkä mihin ja valitse mitä? Tämäkin varmaan maanantaisella harjoituskerralla tehtiin, mutta mitään muistijälkeä ei jäänyt. Tuskastuttaa. Onkohan tämä muille yhtä hankalaa? Ei blogeissa vielä juurikaan ole tekstiä. Ahaa, kyseessä onkin kuvake Open the Layer Styling Panel, näppärästi pikanäppäimen F7 takana. No niin. Sillä sain koko kartan katoamaan. Mieleen juolahtaa muutama kirosana. Mutta lopulta pienellä näpräilyllä onnistuu. Muistan luoda kopiotason, jolla saan Suomen kuntakartan ilmaantumaan taas näkyviin, luon tekstit ja jopa puskuroin tekstin. Nyt vaan hienosäätö tulostusikkunassa ja tämän pitäisi olla valmis.

Oman työn tarkastelua

Omaa työtä tarkastellessani olen sinällään ihan tyytyväinen sen yleiseen visuaaliseen ilmeeseen. Kuvasta löytyvät legenda, mittakaava ja pohjoisnuoli. Sijaintikartta suhteessa koko maahan olisi voinut olla hyvä lisä. Värit ovat varsin toimivat, ehkä punaisen reunuksen sijaan olisi jokin toinenkin väri toiminut – miksi ei vaikka ihan mustakin. Informaation suhteen valittu sininen väri toimii hyvin, myös bufferoinnit tekstissä kuntien nimien kohdalla tekee tekstin lukemisesta helpompaa.

Onko tämä sitten kovin hyödyllinen visualisointi? Noh, ainakin siitä selviää se, että Lahti on ympäryskuntiensa keskellä selkeä keskus. Maantieteellisesti, ennen vuoden 2016 kuntaliitosta Nastolan kanssa, se on selkeästi pinta-alaltaan pienin kunta naapurikuntiensa joukossa, eli tästä voidaan jo päätellä asutuksen voimakasta tiivistymistä kunnan alueelle. Prosenttirajoja olisi voinut säätää, nyt ne heijastavat suoraan todellista dataa. Tietysti rajat valitaan aina jotenkin mielivaltaisesti, mutta nyt Nastola erottuu eri värillään Hollolasta ja Orimattilasta. Nastolan osuus kokonaisväkiluvusta oli 9,5 %, Orimattilan 10,4 %, Hollolan 14 % ja Lahden 66 %. On selvää, että Lahden tulee erottua omalla värillään, mutta nyt raja tuli asetettua Nastolan ja Orimattilan väliin. Niillä on eroa 0,9 %, siinä missä Orimattilan ja Hollolan välillä väliä olisi ollut 3,6 %. Miksi siis annoin QGIS:in asettaa rajat näin, vääristyykö informaatio jotenkin? Hyvä kysymys, jota tällaisia esityksiä tehdessään on hyvä miettiä.

Mitä opin, mitä en?

Ensiaskeleeni QGIS:in kanssa eivät olleet pelkästään onnelliset. Tunnistan ohjelmaan sisältyvän potentiaalin ja sen monipuolisuuden. Se tuntuu kuitenkin hieman anteeksiantamattomalta aloittelijalle, eikä sen parissa kannata soveltaa ’painanpa tuosta ja katson mitä tapahtuu’-metodia, koska pahimmillaan ainakin tuntuu siltä, että voisi saada aikaan melkoista tuhoa omalle projektilleen. Ajattelisin, että minulla ei näin suuria vaikeuksia tällaisen ohjelman käyttämisen kanssa olisi, olen kuitenkin koko ikäni tietokoneiden kanssa toiminut. On siis tavallaan myös ihan hyvä myöntää itselleen, että paljon opittavaa vielä riittää.

Muiden blogeista ei vielä tähän tehtävään varsinaista apua löytynyt, mutta niiden innoittamana toki liitän tuon tunnilla tehdyn harjoitustyön tähän postauksen loppuun. Siitä en nyt syvempää analyysiä tee, aika tekelehän tuo on.

Edit: Tässä välissä on muidenkin töitä ehtinyt blogeistaan lukea ja kyllähän nuo kartat paremmilta näyttivät. Erityisesti tykkäsin Johanna Enströmin päätöksestä jättää merialueen syvyyskäyrät merkitsemättä – ne kun eivät tuohon karttaan mitään erityistä informaatiota tuo. Järvet myös pienen pinta-alansa takia tuppaavat tosiaan olemaan, suurempia järviä lukuun ottamatta, reunaviivansa värisiä (Enström, 2022).

Harjoitustyökartta

Lähteet:

Enström, J. (23.2.2022). (Toinen) Ensimmäinen kurssikerta. https://blogs.helsinki.fi/joen/