Ensimmäisen viikon mietteitä

Geoinformatiikan menetelmät -kurssi on nyt polkaistu käyntiin, ja tässä kirjoituksessa pohdiskelen ensimmäisen viikon aikana opittua ja oivallettua. Blogien kirjoittelu tuntuu työskentelytapana vieraalta ja vaati vielä totuttelua, mutta toisaalta on hauskaa kerrankin päästä lukemaan muiden opiskelijoiden ajatuksia muutenkin kuin vertaisarvioitavien tehtävien kautta.

Typpipäästöjen kartoitusta

Kurssin ensimmäisenä aiheena oli yksinkertaisten koropleettikarttojen tekeminen. Lähiopetuskerralla kaikki työvaiheet käytiin yhdessä läpi, joten kartan tekeminen tuolloin tuntui todella vaivattomalta. Huomasin kuitenkin, että koska olin vain seurannut ohjeistusta sen enempiä miettimättä, eivät ohjelmat eri toiminnot löytyneetkään enää niin sujuvasti, kun jälkikäteen aloin viimeistelemään karttaa. Vaikka olen hieman käyttänyt QGIS:iä yhdellä aiemmallakin kurssilla, on siinä yksinkertaisesti niin paljon ominaisuuksia, että niiden painuminen muistiin vaatii aikaa ja toistoa. Tällä hetkellä tekemistä vielä jonkin verran hidastaa eri toimintojen etsiminen valikoiden alta, mutta ainakin kaikki yhdessä läpikäydyt asiat palasivat uudelleen mieleen ohjelmaa vähän aikaa räplätessä.

Kuva 1: Kartta typpipäästöistä HELCOM-alueella

Lopputuloksena syntyi kartta, joka esittää eri maiden osuuksia typpipäästöistä HELCOM-merialueella (kuva 1). Valmiissa kartassa rantaviivat ja etenkin järvet pistävät omaan silmääni pahasti, sillä ne ovat kartan mittakaavaan nähden turhan yksityiskohtaisia, ja näyttävät lähinnä epämääräiseltä suhrulta. Muuten olen ihan tyytyväinen kokonaisuuteen, ja sanoisin että kartta tuo esiin ne asiat, jotka sen on tarkoituskin tuoda. Syvyyskäyrien tarpeellisuutta jäin tosin pohtimaan, sillä ne eivät ainakaan selkeytä kokonaisuutta, enkä osaa oikein sanoa ovatko ne juuri tämän kartan kannalta kovin olennainen elementti.

Vili Rauhala esitti samaan karttaharjoitukseen liittyvässä blogikirjoituksessaan hyvän huomion liittyen luokittelun haasteisiin. Tässä aineistossa erot valtioiden suhteellisissa päästöissä ovat suurimmaksi osaksi kohtuullisia, mutta Puolan päästöt ovat verrattain todella suuret. Vaikka omassa kartassani on hieman erilainen luokittelu kuin Vilillä, molemmissa tapauksissa Puola on yksin omassa luokassaan, jonka alaraja on huomattavan paljon matalampi kuin maan todellinen osuus päästöistä. Kokeilin QGIS:ssä vielä erilaisten luokittelujen sopivuutta, mutta useissa ongelmana oli kokonaan tyhjän luokan syntyminen muiden maiden ja Puolan väliin. Päädyin lopulta alun perinkin käyttämiini luonnollisiin rajoihin.

Etätehtävä kunta-aineistosta

Etäharjoitusta varten selailin Sotkanetin indikaattoreita, ja päädyin valitsemaan tarkasteluun opiskelijoiden osuuden väestöstä. Luvut ovat vuodelta 2020, joten hain netistä myös vuoden 2020 kuntapohjan. Karsin Sotkanetistä ladattua taulukkoa ensin Excelissä, sillä siinä oli enemmän tietoa kuin tätä tehtävää varten tarvitsin; tallensin lopulliseen csv-tiedostoon ainoastaan kuntien nimet yksilöiväksi tiedoksi ja opiskelijoiden prosentuaaliset osuudet kuntien väestöstä. Tein tehtävän siis periaatteessa kakkosvaikeustasolla, mutta toisaalta tekemistä helpotti se, että aineiston luvut olivat jo valmiiksi suhteellisia osuuksia, eikä niillä tarvinnut koropleettikarttaa varten enää tehdä laskutoimituksia QGIS:issä.

Tuodessani csv-tiedoston QGIS:iin huomasin, ettei ohjelma suoraan tunnistanut prosenttiosuudet kertovaa saraketta lukuarvosarakkeeksi, vaan luokitteli sen tekstisarakkeeksi. Tämä ei ollut aineiston jatkokäsittelyn kannalta toivottavaa, mutta helppo ratkaisu ongelmaan onneksi löytyi nopealla googlauksella. Edellisen tehtävän jälkeen odotin sopivan luokittelun löytymisen aiheuttavan päänvaivaa, mutta QGIS:in histogrammiominaisuus onneksi helpotti elämää valtavasti. Opiskelija-aineistoista muodostui aika näppärästi luonnolliset luokkarajat (kuva 2), jotka ovat valmiissakin kartassa (kuva 3) käytössä.

Kuva 2: Histogrammi auttaa luokittelussa
Kuva 3: Opiskelijoiden suhteellinen määrä Suomen kunnissa

Kartasta näkee, että opiskelijoita on odotetusti eniten suurten kaupunkien läheisyydessä, sillä etenkin korkeakoulutus on pitkälti keskittynyt kyseisille alueille. Hieman yllättävää on, ettei Helsinki ole korkeimmassa luokassa, mutta se jääkin 8,4 % opiskelijaosuudellaan juuri luokkarajan alle. Vaikka molemmat pohja-aineistot ovat vuoden 2020 dataa, on niissä pientä yhteensopimattomuutta. Vuonna 2021 Kankaanpäähän yhdistynyt Honkajoen kunta löytyy kuntapohjasta, muttei opiskelijatilastoista. Kartalla kyseinen ex-kunta näkyy valkoisella värillä luokittelun ulkopuolella, mikä ei tietenkään ole ideaalitilanne, mutta päätin tyytyä tähän epätäydellisyysasteeseen.

Lopuksi

Näiden harjoitusten jälkeen tuntuu, että perusasiat alkavat olla hyvin hanskassa, mutta QGIS:issä kyllä riittää vielä nappulaa nappulan perään. Karttojen ja aineistojen pyörittely on onneksi ainakin omasta mielestäni sen verran hauskaa, että odotan innolla, mitä kaikkea ohjelmistolla kurssin aikana vielä opitaan tekemään. Tämän ensimmäisen blogitekstin aloittaminen sen sijaan oli aikamoisen henkisen kynnyksen takana, mutta lähti jo kirjoittamisen aikana sujumaan paremmin, joten eiköhän tässä vielä tule sekä QGIS että bloggaaminen hyvin tutuksi.

 

Lähteet:

Rauhala, Vili (27.1.2022). Viikko 1: Takaisin QGIS:n pariin. Sukelluksia paikkatiedon maailmaan. Haettu osoitteesta https://blogs.helsinki.fi/radvili/

Silver Spring Energy Consulting Ltd. Converting a String Field to a Numerical Field in QGIS. Haettu 27.1.2022 osoitteesta https://silverspringenergy.com/converting-a-string-field-to-a-numerical-field-in-qgis/

Tilastokeskus (2020). Kunnat 2020 (1:4 500 000) -aineisto. Haettu 27.1.2022 osoitteesta https://geo.stat.fi/geoserver/web/

Tilastokeskus (2020). Opiskelijat, % väestöstä (vuosi 2020 ennakkotieto). Sotkanet. Haettu 27.1.2022 osoitteesta https://sotkanet.fi/sotkanet/fi/index

Vastaa

Sähköpostiosoitettasi ei julkaista. Pakolliset kentät on merkitty *