Viikko 7: oma työ

Vikalla viikolla korona-altistumisen takia jäin varmuuden vuoksi kotiin tekemään hommia, mutta toivottavasti Moodlesta löytyneet ohjeet olivat riittävät enkä missannut mitään olennaista ohjeistusta.

Päätin tehdä muutaman kartan sarjan Counter Strike: Global Offensiven pelaajakannasta maittain. Etsin tarvittavat palapelin osat eri lähteistä netistä, ja koostin niistä haluamani .cvs-tiedostot. Maailman valtioiden kokonaisväestömäärät taisin lopulta kopioida suomenkielisestä Wikipediasta, sillä moni muu löytämäni taulukko käytti pilkkua tuhaterottimena. Ammattilaispelaajien lähtömaat poimin itse kasaamaani taulukkoon hltv.org-sivustolta. Kyseessä on Counter Striken ammattilaispuoleen keskittyvä uutis- ja tilastointisivu, jonka top-listat ovat piireissä kaikkein arvostetuimpia. Maailmankarttapohjan shapefilen latasin joltakin sivulta, jota google sattui minulle tarjoamaan ensiksi. 

Tiimissä on 5 pelaajan lisäksi valmentaja, ja osa organisaatioista pitää palkkalistoillaan myös varapelaajia. Listasin kuitenkin omaan Exceliini vain 28.2.2022 rankingin mukaisten top 20-listan tiimien vakituiset pelaajat. 

Yksi tyhmä moka, joka toistui tässä työn varrella oli se, että olin sotkenut jotenkin taulukoissani lukuarvoiksi tarkoittamani sarakkeet merkkijonoiksi. Ongelma on kuitenkin sekä helppo huomata että korjata, mutta ärsytti kuitenkin kun tekeminen takkusi noin hölmön asian takia.

 

Kuva 1. Hltv.org-sivuston CSGO-tiimien listauksen 20 parhaan tiimin pelaajien kotimaat. (28.2.2022)

 

Seuraavaksi vertasin ammattilaispelaajien lukumäärää kotimaidensa väestömäärään. Ilmaisin suhteen maittain pro-pelaajien määränä per miljoona asukasta. Tämä onnistui helposti laskemalla osuudet omiin sarakkeisiinsa calculatorilla. 

 

Kuvat 2 ja 3. Aiemman listauksen pelaajien määrä suhteessa kotimaidensa kokonaisväestöön.

Lisäksi tarkoituksenani oli tehdä kartta ei vain ammattilaispelaajista, vaan CSGO:n kokonaispelaajamääristä maittain, mutta jostain syystä siihen tarvittava data oli aikalailla maksu- tai rekisteröintimuurien takana. Sen sijaan tein kartan internetin saavutettavuudesta maailmalla. Löysin datan tätä karttaa varten data.worldbank.org -sivustolta. Sieltä lataamani taulukon valtioiden nimet olivat kirjattu hieman eriävällä tavalla maailmankartta-shapefileni kanssa, mikä tuotti päänvaivaa. Esimerkiksi Kongon demokraattisen tasavallan nimi oli toisessa taulukossa kirjattu nimellä Congo, Dem. Rep. ja toisessa Congo DR. Onneksi tällaisia tapauksia oli aika vähän ja korjasin ne manuaalisesti siten, että tietokantaliitos onnistui saumattomasti. 

Myöhemmin valittaessani tästä ongelmasta fiksummille kavereilleni sain kuulla, että tällaisten tilanteiden varalta kannattaisi tutustua Levensteinin etäisyyteen eli editointietäisyyteen. En itse ymmärrä juuri mitään merkkijonometriikasta ylipäänsä saati sitten sitä, miten Levenstainin etäisyyden algoritmi toimii, mutta konseptina asia kuitenkin vaikuttaa oikein kiehtovalta. Kyseessä on siis menetelmä, jossa vertaillaan eri merkkijonojen välisiä eroja sillä perusteella, miten monta merkkiä joudutaan poistamaan, lisäämään tai korvaamaan, jotta merkkijono saadaan muutettua toiseksi. Luonnollisesti mitä vähemmän muutoksia tehdään, sitä lähempänä jonot ovat toisiaan eli sitä lyhyempi niiden välinen etäisyys on. Tästä olisi ollut itselleni iloa valtionnimien kanssa tuskaillessa, sillä algoritmi olisi osannut puolestani etsiä mahdollisimman samankaltaiset nimet kummastakin taulukosta ja yhdistää ne pariksi. Mutta kuten sanottua, en ole matemaatikko enkä ymmärrä tätäkään menetelmää kuin erittäin pintapuolisesti.

Kuva 4. Internetin käyttöaste maailmalla, prosenttiosuutena valtioiden väestöstä. Vuodelta 2017.

 

Siinä tämä kurssi sitten oli! Voin viime vuoden etägimmi-veteraanina sanoa, että lähiopetuksena kurssia oli todella mukavaa työstää läpi, kun taas etänä tehtävien läpi kahlaaminen oli yksinäistä ja tuskallista touhua. Siksi kurssi jäikin viimeksi minulta kesken, mutta onneksi tänä vuonna päästiin jo palaamaan rakkaille Kumpulan tiluksille.  Se todella piristi pakkasten ja kaamoksen keskellä.

 

Lähteet:

https://www.igismap.com

https://data.worldbank.org/indicator/IT.NET.USER.ZS

https://www.hltv.org/ranking/teams/2022/february/28

https://xlinux.nist.gov/dads/HTML/Levenshtein.html

https://en.wikipedia.org/wiki/Levenshtein_distance

 

Viikko 6: hazardeja kaukomailla ja kantakaupungissa

Tämän viikon tehtävistä ensimmäinen piti sisällään ulko-ekskursion, josta en oikein blogin puolelle osaa muuta kertoa kuin että sää oli hirveä ja sukat kastuivat. Epicollect5 -sovellus oli aiemmin tullut tutuksi Maantieteelliset kohteet lähiympäristössä-kurssilta. 

Varsinainen kurssitehtävä käsitteli hazardeja, enkä nyt puhu ulkona riehuneesta lumimyrskystä vaan hieman suuremman skaalan ilmiöistä. Siihen liittyen Moodlessa oli annettu hyvät linkit sivuille, josta aineistoa voi ladata, mutta osassa portaaleista piti itse hieman karsia informaatiota pois latausvaiheessa. 

Tein ensiksi yhden kartan maalle pudonneista meteoriiteista. Latasin aineiston .csv:nä Nasan sivuilta, ja siirsin QGissiin. Mitään muuta varsinaisesti ei dataa tuodessa tarvinnut tehdä, mutta x- ja y-koordinaatit piti kommunikoida QGissille kertomalla ohjelmalle missä taulukon sarakkeissa sijaintitieto sijaitsi. Nolosti kyllä en muistanut kummin päin latitude ja longitude menivätkään, ja ensi yrittämällä pisteeni ilmestyivät kartalle pystysuorassa. Tekemällä oppii. Tässä valmis tuotos:

Kuva 1. Kirjattujen meteoriittien paino (kg). Data vuosilta 860-2013.

Halusin hahmottaa meteoriittien kokoa kartalle, joten laitoin pisteet väriskaalalle niiden painon mukaan. Taulukossa painot oli ilmoitettu grammoina, mutta jaoin ne calculatorissa tuhannella muuttaakseni luvut kilogrammoiksi.

Taulukon data kyllä herätti paikoin sekä ihmetystä että huvitusta. Osalle taulukkoon kirjatuista meteoriiteista oli annettu painoksi vain NULL, mikä on aivan ymmärrettävää jos dataa ei kaikista havainnoista ole. Sen lisäksi todella monelle havainnolle oli annettu painoksi 0 grammaa. Ehkä osa meteoriiteista todella oli alle gramman painoisia, mutta en usko kyseessä olevan vain mikään pyöristysvirhe, sillä useille objekteista oli kirjattu erittäin pieni mutta tarkka paino (esimerkiksi 3g.) Mietin, että voisikohan tässä olla kyse jostakin inhimillisestä virheestä, että joku Nasan dataharjoittelija on liimannut yhteen useampia taulukoita, joissa on keskenään merkitty eri tavalla tyhjät solut. Ainakin ohjelmoinnissa null-arvojen käyttö on ongelmallista siksi, että ne vaativat aina käsittelyä omana erikoistapauksenaan. Syötteen laskutoimitukset menevät sekaisin jos muuttujan arvo onkin null, ellei jokaisen laskutoimituksen yhteyteen erikseen kirjoita ehtolausetta joka kertoo, mitä tehdä jos arvoa ei ole. 

Oli syy mikä hyvänsä, niin nullien ja nollien lukuisa määrä taulukossa aiheuttaa sen, että kartallani hohtaa valtava määrä valkoisia pisteitä. Olisi ehkä kannattanut tiputtaa taulusta pois osa nollagrammaisista meteoriiteista, mutta tällä mennään nyt.

Inhimillinen virhe taulukon kasaajalta ei tunnu ollenkaan mahdottomuudelta, sillä taulukossa oli muitakin sangen kyseenalaisia merkintöjä. Esimerkiksi meteoriittien putoamisvuosi löytyi myös taulukosta. Vanhin merkintä oli peräti vuodelta 860, uusimman taas väitettiin olevan vuodelta 2101…  aivan.

Kuva 2. No se on sitten just niin.

Seuraavaksi siirryin toisenlaisten hazardien pariin. Latasin tulivuorien sijainneista ja maanjäristyksistä taulukot moodlelinkkien takaa, mutta maanjäristyksistä filtteröin mukaan vain yli 6 magnitudin havainnot. 

Kuva 3. Yli 6 magnitudin maanjäristykset vuodesta 2012. Myös aktiiviset kerrostulivuoret merkitty.

Kuvassa sekä aktiivisten tulivuorten että maanjäristyshavaintojen piirtämä viiva myötäilee lähes täydellisesti litosfäärilaattojen rajoja. Erityisen kauniisti näkyy hieman Japanista kaakkoon päin salmiakinmuotoinen alue, joka piirtyy kartalle Filippiienien laatan reunojen mukaisesti. Myös Karibian laatta ja Australian laatta (erityisesti sen koillisreunassa sijaitseva sarvi) erottuvat erittäin komeasti. 

Usein kuulee ihmisten puhuvan siitä, kuinka monella mantereella he ovat matkustelleet. Itse olen jo useita vuosia pitänyt litosfäärilaattoja kiinnostavampana matkailumittarina, ja ehkä hivenen epärealistisena tavoitteenani on vierailla jokaisella laatalla. Tähän mennessä olen tietääkseni käynyt niistä joko neljällä tai viidellä, eli vielä on matkaa jäljellä. Suosittelen muillekin mantsamatkaajille tätä tapaa kartoittaa reissujaan.

Kaiken kaikkiaan kurssikerran tehtävät olivat kivoja ja suht helppoja (tai ainakin vähemmän työläitä kuin viime viikolla.) Omien karttojeni visuaalipuolta jäin kyllä hinkkaamaan melko pitkäksi aikaa, erityisesti meteoriittikartassa vaihtelin palluroiden kokoa vaikka kuinka moneen otteeseen. Taisi muuten olla kurssin ensimmäinen kerta kun taustakarttana oli koko maailma. Mukavaa vaihtelua tehdä tuotoksia ihan eri skaalassa kuin aiemmin. 

 

Lähteet:

https://data.nasa.gov/Space-Science/Meteorite-Landings/gh4g-9sfh

https://ncedc.org/anss/catalog-search.html

https://www.ngdc.noaa.gov/nndc/struts/form?t=102557&s=5&d=5

Viikko 5: altaita ja melusaastetta

Tämän viikon harjoitustehtävässä laskettin sekä Helsinki-Vantaan että Malmin lentokenttien eri asteisten melualueiden laajuuksia ja alueiden sisällä asuvan väestön määrää. Lisäksi teimme muutaman harjoituksen juna-asemien saavutettavuudesta ympäröivillä alueilla asuvien ihmisten lukumäärän perusteella. Erilaisia lukuja ja muistiinpanoja tuosta työstä kertyikin huima määrä, sillä tehtävissä oli useita välivaihteita. Kirjoitan tätä 5. viikon blogitekstiä varsin myöhässä, joten ei ollut enää aivan tuoreessa muistissa mitä kaikki muistiin merkitsemäni hieroglyfit taas tarkoittivatkaan, mutta sain niistä kuitenkin koostettua tällaisen taulukon:

Kuva 1. Asutus pääkaupunkiseudulla lentokenttien läheisyydessä. Säteet tehtiin buffer-toiminnolla kenttien kiitorajoista.

 

Sitten tarkasteltiin hieman lähemmin Helsinki-Vantaan eri melualueista kärsiviä asuinalueita. Niistä syntyi allaoleva taulukko. 

Poikkeusreitillä tarkoitetaan normaalista lentosuunnasta eriävää koneiden laskeutumissuuntaa Tikkurilasta päin, jolloin tavallista suurempi määrä ihmisiä altistuu melusaasteelle. Poikkeavaa suuntaa on joskus käytetty huonon sään tai kentällä käynnissä olevien parannustöiden takia.

Kuva 2. Avainlukuja Helsinki-Vantaan lentokentän melusaasteelle altistuvista asuinalueista.
Kuva 3. Eri Helsinki-Vantaan kentän melualueet etäisyysbuffereilla kiitoradoista.

 

Lisäksi laskimme pääkaupunkiseudun juna-asemien saavutettavuudesta muutamia avainlukuja. Ensiksi laskettiin, kuinka suuri osuus aineiston väestöstä asui alle 500 metrin etäisyydellä jostakin juna-asemasta. Vastaus oli 111 758, joista työikäisiä 74 989. Koko kartan alueen väestöstä 21,7 prosenttia asui alle 500 metrin päässä jostakin juna-asemasta.

Kotona tein tehtävän uima-altaista pääkaupunkiseudulla. Suurin helpotus tehtävää tehdessä oli se, että jostain ihmeen syystä tällä kertaa sain pylväsdiagrammit näkymään vaivatta. Kolmosviikolla tulvatehtävän pylväät tuottivat melkoista päänvaivaa enkä lopulta saanut niitä ikinä toimimaan. En todellakaan tiedä, miksi tällä kertaa ongelmia ei ilmennyt, mutta hyvä niin.

Kuva 5. Uima-altaalliset asuinrakennukset pääkaupunkiseudulla pienalueittain.

Eniten lukumääräisesti altaita on Lauttasaaressa (53kpl), mikä ei sinänsä ole yllättävää: onhan kyseessä sentään onnellisten saari. Toiselle sijalle kiri hieman yllättävästi Länsi-Pakila 52:lla uima-altaalla. Jätin kokonaan kartasta pois alueet, joilla altaallisia asuinrakennuksia ei ole ollenkaan, sillä muuten kartasta olisi tullut aivan liian informaationtäytteinen. Jo nyt kaikkein tiheimpien alueiden lukuja erityisesti kantakaupungista on hieman hankala erottaa silmiä siristelemättä.

 

Viikko 4: miljoona ruutua

Viikolla 4 opeteltiin gridien käyttöä eli tietyn tutkimusalueen jakamista sellaisiin osiin, jotka ovat keskenään pinta-alaltaan samankokoisia ja siksi vertailukelpoisia toistensa kanssa. Käytännössä gridin luominen QGississä on varsin yksinkertaista, sillä alueen laajuuden voi piirtää manuaalisesti valitsemansa kokoiseksi ja gridien asetuksissa pitää tehdä vain muutama valinta koskie yksittäisten ruutujen kokoa sekä muotoa. 

Kurssiaineistossa oli kooltaan massiivinen taulukko pääkaupunkiseudun rakennuskannasta ja asukkaista. Taulukossa oli eritelty muun muassa rakennusten katuosoitteet ja asukkaiden ikäryhmät, mistä innostuneena päätin etsiä itseäni merkitsevän numeron vanhasta osoitteestani (data oli vuodelta 2015, jolloin asuin vielä lapsuudenkodissani). Ja löytyihän se! 

Taulukon pohjalta kuitenkin oli tarkoitus tehdä muutakin kuin etsiä arkaluontoisia tietoja muista ryhmäläisistä. Siirryinkin tekemään ensimmäistä tehtävää, jossa tarkastelin gridien avulla pääkaupunkiseudun ruotsinkielisen väestön määrää ja jakautumista. Vaikka tehtävää varten olisi voinut kokeilla jotakin jännittävää muotoa, kuten vaikka kuusikulmioita, valitsin kuitenkin ensimmäiseen tehtävään perinteisen neliöruudukon. 

Kuva 1. Ruotsinkielisen väestön lukumäärä pääkaupunkiseudulla.
Kuva 2. Ruotsinkielisen väestön osuus suhteessa koko väestöön (%).

Kuvassa 1 on merkitty absoluuttisina lukuina kussakin 1km x 1km ruudussa kirjoilla olevian ruotsinkielisten asukkaiden lukumäärä. Tämä kartta viittaisi siihen, että ruotsinkielisiä on eniten ydinkeskustassa, ja tasaisesti vähemmän mitä kauemmas poispäin keskustasta kuljetaan. 

Kuva 2 on mielenkiintoisempi, sillä siinä esitetään ruotsinkielisten osuus prosentteina suhteutettuna kunkin ruudun kokonaisväestöön. Se kertookin jo paljon enemmän, sillä toisin kuin kuvassa 1, tässä kartassa korostuu keskustan sijaan useita eri alueita. Mielenkiintoista oli myös havaita, että kartan aivan koillisreunassa täysin kirkkaanpunaisena loistavan gridin kaikki asukkaat olivat ruotsinkielisiä. 

Pieni virhe tosin minulla kävi ja unohdin Calculatorissa osuuksia laskiessani kertoa tuloksen sadalla, ja nyt prosenttilukujen sijasta legendassa näkyy desimaalilukuja. Osuudet ovat kuitenkin oikein, mutta tuollainen moka nyt kuitenkin jäi tänne roikkumaan. 🙁

 

Tein lisäksi kotona harjoituksen omakotitalojen määrästä pk-seudulla absoluuttisina lukuina. Valitsin huvikseni hunajakennoa muistuttavan kuusikulmio-gridin ja valitsin niille pienemmän koon kuin aiemmassa tehtävässä, 500m x 500m. Poistin myös kartalta pois ne alueet, joilla pientaloja ei ole. 

Kuva 3. Omakotitalojen lukumäärä pääkaupunkiseudulla 500 x 500m kuusikulmioissa,

 

Kartalla korostuvat Korson ja Rekolan kaltaiset juna-asemia ympäröivät asuinalueet Vantaalla. Erityisesti Korson alue loistaa kartalla, eikä ihme, sillä alue tunnetaan laajasta, iäkkäästä omakotitalokannastaan. Itä-Helsingissä silmään osuvat erityisesti Laajasalo ja Mellunmäen ympäristö. Tällä hetkellä Mellunmäen ja Rajakylän tuntumassa on rakenteilla useita uusia rivitalokohteita, siinä missä Mellunmäen vanha kerrostalokanta alkaa olla hintaluokaltaan Helsingin halvimpia alueita ikääntymisen ja suurten tulevien remonttien vuoksi. 

Espoon puolella eniten omakotitaloja näyttäisi olevan Laaksolahden ja Suur-Espoonlahden tienoilla. Kävin mielenkiinnosta katsomassa Oikotiestä Laaksolahden asuntomarkkinoita, ja yhteensä 43 myynnissä olevasta kohteesta 28 oli omakotitaloja. Kerrostalokohteita löytyi vain 7, loput olivat pari- tai omakotitaloja. 

Kävin tutkimassa hieman muiden kurssilaisten tekeleitä, ja löysin Nean tekemän kartan alle 10-vuotiaiden lapsien prosenttiosuuksista eri asuinalueilla. Kun olin jo hetken tuijotellut omaa pientalokarttaani, huomasin että Nean kartassa on yhtäläisyyksiä omaani siinä mielessä, että tietyt asuinalueet korostuvat kummassakin kartassa. Ei ihme, että alueet, joilla on paljon omakotitaloja, ovat myös suosittuja ja turvallisia alueita lapsiperheille. Koska lasten hankkiminen on suuri päätös ja kallis sijoitus, on se varmasti helpompi sitoumus tehdä silloin, kun elämä on jo taloudellisesti vakaata.

 

Lähteet:

Nea Tiainen, Melkein Gis-guru siis itsekin (https://blogs.helsinki.fi/tiainea/)
Viitattu 15.2.2022

Viikko 3

Kurssikerran pääteemana käsittelimme tietokantaliitoksia, jotka jostain syystä QGississä tuntuvat olevan hankalampia kuin missään muussa käyttämässäni paikkatieto-ohjelmassa (tai oikeastaan, olen käyttänyt QGissin lisäksi vain ArcGissiä, joten ei nyt liioitella). Itse säästyin liitoksia näpräillessäni ohjelman kaatumiselta, mutta samaa ei voi sanoa kaikista muista kurssitovereista.

Tehtävä 1.

Yhteisen osuuden aikana työstettiin kuvan 1. mukainen kartta Afrikan mantereen eräiden resurssien ja konfliktien sijainneista. Varsinaista legendan ja mittakaavan sisältävää tulostetta en ehtinyt tunnilla kyhätä, mutta muistin kuitenkin ottaa kuvakaappauksen kartasta ennen kotiinlähtöä. Joka tapauksessa, keltaiset pisteet merkitsevät konfliktialueita vuodesta 1951 eteenpäin, siniset pisteet timanttikaivoksia ja violetit alueet kaasu- ja öljykenttien sijaintia. 

Kuva 1.  Timanttikaivoksien, öljykenttien sekä konfliktien sijainnit Afrikan mantereella.

Täysin puhdasta syy-yhteyttä eri alueiden resurssien ja kofliktien määrän välillä ei ainakaan vain tämän kartan perusteella voi julistaa, mutta paikallisia mahdollisia yhteyksiä kyllä löytyy.  Esimerkiksi Länsi-Afrikassa Liberian ja Guinean tuntumassa näyttäisi olevan runsas määrä sekä konflikteja, että timanttikaivoksia. Harmillisesti en pääse kotikoneelta käsiksi kartan attribuuttitaulukoihin, sillä nyt jälkikäteen karttaa tutkiessani tekisi mieli katsoa, onko edes yhteys mahdollinen – voihan olla niinkin, että kaikki alueen konfliktit ovat olleet ohi jo ennen timanttien louhinnan alkamista.  Attribuuttitaulukosta tieto olisi helppo etsiä, sillä konfliktien ajankohdat sekä timanttikaivosten perustamisvuodet löytyvät omista sarakkeistaan.

Myös Ruandan kansanmurha näkyy ikävästi kartalla tiheänä keltaisena keskittymänä. Mieleni tekisi käydä tutkimassa myös sen alueen konfliktien vuosilukuja tarkemmin, joten voin päivittää blogiini mietintöjä kun käyn ensi kerran gis-luokassa tarkastelemassa taulukoita tarkemmalla silmällä. 

 

Tehtävä 2.

Tunnin lopuksi jäi vielä aikaa itsenäisen tehtävän tekoon. Onnistuimme vähin ongelmin tekemään yksinkertaisimman version tehtävästä, jossa ensin helmitaulutyökalulla laskettiin kunkin vesistön tulvaindeksi attribuuttitaulukosta jo löytyvien tietojen perusteella.

Kuva 2. Tulvaindeksi Suomen eri valuma-alueilla.

Ongelmia ei ilmaantunut ennen histogrammiosuutta, jossa tarkoituksena oli pylväsdiagrammein kuvata eri alueiden järvisyyttä. 

Järvisyysprosentti-taulukko löytyi kurssiaineistosta sellaisenaan eikä mitään tarvinnut laskea, vaan taulukko pyöräytettiin Excelissä .csv-muotoiseksi ja tuotiin QGissiin tietokantaliitosta varten. Tässä kohtaa törmäsin toistamiseen QGissin kryptoniittiin, ääkkösiin. Onneksi tällä kertaa Arttu osasi näyttää meille miten vika korjataan eikä tähän vaiheeseen jumituttu sen pidemmäksi aikaa. Tietokantaliitoksen jälkeen järvisyysprosentti piti visualisoida kartalle jotenkin, mutta se ei sitten ihan onnistunutkaan. Laitan alle esimerkkinä epäonnistuneen pylväskuvion, sillä olin kuitenkin ylpeä siitä, että sain kartalle edes jotain näkyviin – se oli jo itsessään saavutus. Nyt, taas jälkikäteen, luin sekä Jannen että Eemilin blogista, että yksi tapa saada data näkymään oikein on pistää data piirakkadiagrammiksi ja kuvata järvisyysprosenttia suhteessa maapinta-alaan. 

Kannattaa muuten käydä lukemassa Eemilin blogin puolelta enemmän tulvariskialueiden taustasta ja maankohoamisen vaikutuksesta ilmiöön. Olin itsekin mainitulla Suomen geomorfologia-kurssilla, joka oli oikein mielenkiintoinen ja jolle mahdollisuuden tullessa kannattaa ilmoittautua nopee : D

Kuva 3. Epäonnistunut yritys tuottaa millään tavalla järkeviä histogrammeja.

 

Lähteet:

Eemil Sillankorva: Eemilin mantsa-blogi, tieto haettu 8.2.2022 (https://blogs.helsinki.fi/sillanko/)

Janne Turunen: Geoinformatiikan mystiset menetelmät, tieto haettu 8.2.2022 (https://blogs.helsinki.fi/janneturunen/)

 

Viikko 2: projektioita ja projisointia

Toisella kurssikerralla pysyteltiin vielä melkolailla QGissin perusasioiden puolella. Kurssikerta eteni muuten omalta osaltani sujuvasti ja pysyin hyvin perässä jokaisella työvaiheella, mutta valitsemani kone alkoi reilun kolmen tunnin puurtamisen jälkeen temppuilla ja QGissini kaatui noin 7 kertaa peräkkäin. Kun se ei uudelleenkäynnistyksenkään myötä suostunut pelittämään, luovutin ja lähdin kotiin. Rumban vuoksi jouduin toistamaan työvaiheita aika moneen kertaan ja menetin myös kokonaan yhen lähes valmistuneen karttatuotoksen.

Kurssikerralla harjoiteltiin mm. erilaisten valintatyökalujen käyttöä. Simppelin Suomen kuntapohjakartan ollessa esimerkkinä lukuisat eri työkalut tuntuivat helppokäyttöisiltä, mutta voin kuvitella että laajemmissa ja pikkutarkemmissa kartoissa eri ominaisuuksia poimivat valintatyökalut voivat olla kullanarvoisia.

Valintatyökalujen lisäksi eri mittaustyökalujen käyttö käytiin läpi. Niiden kautta siirryttiin kurssin pääaiheeseen, eli eri projektioiden ja koordinaattijärjestelmien tuomaan virheeseen. Kaikkiin projektioihin ja esitystapoihin liittyy omat virheensä, ja olikin hauska nähdä, miten eri projektioissa virheen aste kasvoi.

Alla oleva taulukko kuvaa Pohjois-Lapissa vapaasti valitun etäisyyden pituuden muutosta eri projektioiden vallitessa. Muutamaan kertaan projektioiden välillä vaihdellessa klikkasin huti ja kadotin aiemmin piirretyn viivan, eli luvuissa on aivan varmasti mukana pieni määrä inhimillisen erehdyksen synnyttämää heittoa, sillä en luultavasti onnistunut piirtämään viivoja pikselintarkasti takaisin. Joka tapauksessa taulukossa yritän viestiä sitä, miten sama etäisyys muuttuu eri projektioiden vääristymän vuoksi.

Kuva 1. Valitun mitatun etäisyyden muutos eri projektioiden vääristäessä karttaa.

Lopuksi tunnilla oli tarkoitus tehdä eri projektioiden vääristymiä kuvaava karttasarja koko Suomen mittakaavassa. Vääristymää kuvattiin pinta-alan osuuksina TM35FIN-projektioon verrattuna, eli laskettiin ensiksi pinta-ala $area-komennolla TM35FIN-projektiota käyttäen, jonka jälkeen projektio muutettiin toiseksi, laskettiin pinta-ala uudestaan ja sitten jaettiin tämä toisen projektion tuottama pinta-ala alkuperäisillä arvoilla. Kuulostaa simppeliltä, ainakin näin jälkiviisaana, mutta matka oli kyllä mutkainen ainakin omalla kohdallani.

 

Kuva 2. Pinta-alan vääristymäkerroin Mercatorin projektiolla, verrattuna TM35-projektioon.

Mercator nyt yleisesti tunnetaan varsin harhaanjohtavana projektiona eikä sitä yleisesti enää tunnuta käyttävän muualla kuin ala-asteen kartoissa ja merenkulussa, mutta on silti yllättävää nähdä miten suuren virheen kartta tuottaa Suomen tapauksessa. Mercator venyttää alueita enemmän mitä kauemmas päiväntasaajalta kuljetaan, jolloin Pohjois-Suomessa pinta-alan vääristymä on yli 8-kertainen.

Kartan väriskaalan olisin voinut invertoida siten, että punainen merkitsisi suurimman vääristymän alueita ja sininen pienimmän. Se kuvaisi arvoja jonkin verran paremmin, mutta tajusin tämän vasta blogia kirjoittaessa eli tällä mennään nyt.

Ylläoleva Mercatorin vääristymää kuvaava graafi oli valitettavasti ainoa tunnilla valmiiksi saattamani lopullinen tuote. Olin lähes valmis vastaavan Winkel Tripel-kuvan kanssa, kun QGis taas vaihteeksi kaatui:

Kuva 3. Tämä näkymä tuli tutuksi tunnin aikana.

Myöhemmin keväällä kävin kuitenkin gis-luokassa vanhojen aikojen ratoksi tekemässä vielä vastaavan kartan Robinsonin projektiosta, sillä halusin blogitekstiini vähän lihaa luiden väliin.  Kyseessä on huomattavasti Mercatoria parempi  projektio Suomen todenmukaisessa kuvaamisessa, joten halusin siksi kokeilla Robinsonia. QGis pudotti joidenkin laskutoimitusten yhteydessä taulukostani dataa pois, enkä ihan osannut diagnosoida ongelman ydintä. Lopulta kuitenkin homma alkoi pelittää ja luulen Field Calculatorin ongelmien johtuneen siitä, että eri sarakkeissa olevat lukuni olivat hieman eri muodossa keskenään (eri määrä desimaaleja, tai jotain). 

Kuva 4. Pinta-alan vääristymäkerroin Robinsonin projektiolla, verrattuan TM35FIN-projektioon. Pohjoisnuoli unohtui, piirsiin uuden Paintilla.

GIM1: Round 2

Täällä sitä taas ollaan, tänä vuonna iloisena yllätyksenä lähiopetuksessa! Viime vuonna jäi itseltä tämä kurssi kesken lähes yksinomaan etäopetustoteutuksen ja kaamoksen takia. Tänä vuonna kuitenkin aion painaa kurssin läpi tuli mikä tuli. Kävin myös viime periodissa jatkokurssin GIM2:n, joten on ihan kiinnostavaa nähdä miltä ykköskurssi tuntuu sen jälkeen.

Kurssikerralla tehty yhteinen typpipäästökartta oli viime vuodelta jo tuttu enkä nyt aio mennä siihen sen syvemmin. Tässä kuitenkin liitteenä tuotokseni, olen ihan tyytyväinen värimaailmaan ja asetteluun.

Kuva 1. Typen päästöjen valtiokohtaiset prosenttiosuudet Itämeren ympärillä.

Pari päivää kurssikerran jälkeen siirryin kakkostehtävän pariin. Valitsin aluksi tehdä vaikeustaso kakkosen tehtävän, ja kävin selailemassa Tilastokeskuksen StatFin-tilastotietokannan kuntien avainlukuja. Päätin lyhyen selailun jälkeen valita tarkasteltavaksi pientaloissa (rivi- tai omakotitalo) asuvien osuutta kunnittain. Myöhemmin tehtävää tehdessä huomasin kuitenkin vastaavaa dataa löytyneen ihan tehtäväpaketin kunta-aineiston attribuuttitaulukosta. No jos jotakin, niin tulipahan kerrattua miten .cvs-muotoinen taulukko tuodaan QGissiin. Pudotusvalikon piilottama kuvan 2. valinta nimittäin meinasi jäädä minulta aluksi löytämättä.

Kuva 2. Tämä valinta oli se taikasana, jonka avulla toin pelkän taulukon QGissiin.

 

Seuraavaksi liitin Kunnat2015-attribuuttitaulukkoon juuri tuomani pientalotaulukon. Se onnistui vaivatta Join attributes by field value-työkalulla. Huomasin kuitenkin välittömästi ongelman liitoksessa: tuomani pientalotaulukon kuntanimien ääkköset olivat QGissille ongelma, minkä vuoksi peräti 83 kunnan tiedot putosivat taulukkoliitoksessa pois. Kokeilin huvikseni visualisoida kartan puutteellisilla tiedoilla, ja tulokseksi tuli seuraavanlainen tilkkutäkki:

Kuva 3. Voi ei! Suomineito on menettänyt toisenkin käsivartensa.

Ongelmahan johtui siis siitä, että tuomassani Tilastokeskuksen tilastossa ääkköset olivat QGissiin siirtäessä kadonneet datasta. Kun ääkkösiä sisältävät kunnannimet näkyvät vain kysymysmerkkeinä, ei tietenkään tietokantaliitos voi toimia, kun ääkkösiä sisältävät sarakkeet eivät löydä vastaparia liitettävästä attribuuttitaulusta ja kokonaiset sarakkeet putoavat liitoksen ulkopuolelle. Esimerkiksi kuvan 3. kartassa koko käsivarsi puuttuu siksi, että Enontekiön tiedot putosivat ö-kirjaimen takia pois.

Ongelmaa selvittääkseni kävin vaihtamassa QGissin localen asetuksista suomeksi, mutta se ei itsessään korjannut ongelmaa. Tarkistin myös, että taulukkoa tuodessa olin valinnut sopivan merkistöstandarin. Avasin taulukon myös Excelissä, jossa ääkköset näkyivät kuten kuuluukin, joten ongelman täytyy liittyä QGissiin eikä itse taulukkoon. En kuitenkaan jaksanut jäädä tappelemaan asian kanssa saati korjata jokaista virheellistä kunnannimeä manuaalisesti, joten sivuutin asian toistaiseksi ja etsin toisen tavan tehdä tehtävän.

                                                                                  

Kuva 4. Tältä attribuuttitaulukko näytti pahimmillaan.

 

Huomasin kuitenkin, että kuntadatapohjan sisältämissä tiedoissa oli myös ihan samaa dataa pientaloissa asuvien osuuksista. Data ei tosin ollut valmiiksi prosenttiosuuksina, toisin kuin StatFiniltä lataamani data, mutta värien viilausvaiheessa osuuksien esittämiseksi tieto esitettiin prosenttiosuuksina automaattisesti. Valitsin hajonnaksi Natural Breaksin, joka mielestäni toimi tässä tapauksessa oikein hyvin. Tässä siis valmis tuotokseni:

Kuva 5. Rivi- ja pientaloissa asuvien asuntokuntien prosenttiosuus. Tiedot vuodelta 2014, kuntajako vuoden 2015 mukainen.

Kuva 5. Rivi- ja pientaloissa asuvien asuntokuntien prosenttiosuus. Tiedot vuodelta 2014, kuntajako vuoden 2015 mukainen.

 

 

Lähteet:

Tilastokeskuksen tietokanta; kuntien avainluvut (https://pxnet2.stat.fi/PXWeb/pxweb/fi/?rxid=444223df-f91c-4479-891f-5dcd50b983d2)

 

 

3. kurssikerta: tulvia ja pulmia

Morjens!

Tällä kurssikerralla keskityimme qgissin datan- ja tilastonkäsittelyn ominaisuuksiin. Yhteisellä opetuskerralla läpikäydyt toiminnot ja niksit toistuivat itsenäisen tehtävän puolella, jossa pääsin itse luomaan karttaa Suomen alueellisista tulvariskeistä. Tein tehtävänannon yksinkertaisemman version, mikä osoittautuikin viimeistä kohtaa lukuunottamatta varsin mutkattomaksi tehtäväksi. Siitä lisää myöhemmin.

Kuva 1.  Suomen valuma-alueiden tulvaindeksi koropleettikartalla.

Ohjeiden avulla tietojen ja sarakkeiden yhdistely attribuuttitaulukoista toiseen onnistui varsin vaivattomasti. Kartan visuaalisen puolen tekeminen taasen on tullut jo rutiiniksi toiston myötä. Ilarin blogissa oli hyviä ideoita karttojen esteettisen puolen viilaamiseen. Näin Helsingin kuvataidelukion alumnina, eli siis käytännössä graafisen suunnittelun veteraanina, voin antaa Ilarille 5 pistettä ja papukaijamerkin hyvistä vinkkiviitosista.

Ekstratehtävä, jossa piti visualisoida järvisyyttä omilla diagrammeillaan, oli aikamoista säätöä omalta osaltani. Ensiksi en saanut mitään näkyviin, ja päädyin etsimään muista blogeista apua. Laurin blogiinsa linkkaaman italiankielisen ohjevideon katsottuani ajattelin itsevarmana, että tämähän onkin ihan helppo juttu. Sain joitakin palluroita ilmaantumaan omalle kartalleni, mutta ne eivät visualisoineet luokkien eroja mielestäni tarpeeksi selkeästi, joten päätin omin avuin koittaa improvisoida eri säätimien parissa palluroita paremman näköisiksi. Tämä oli kuitenkin ehkä huono idea, sillä jollain keinolla onnistuin ensiksi kadottamaan kaiken datan kartastani ja lopulta crashaamaan koko ohjelman. Task managerin kautta sitten pakotin qgissin sulkemaan ja päätin, että tämä perusversio saa tällä kertaa luvan kelvata.

1. kurssikerran jälkipyykki

Terve!

Ensimmäinen kurssikerta oli varsin hyvä paketti, jota jaksoi seurata neljän tunnin ajan jopa heti perjantai-aamusta. Alun info-osuuksien jälkeen päästiinkin pian itse QGIS-ohjelman pariin, mitä olinkin jo innolla odottanut. Moodlessa tai sähköpostilla oli tainnut tulla etukäteen meille kehotus ladata ohjelma omalle koneelle hyvissä ajoin, mutten itse ollut näin tajunnut tehdä. Ehdin kuitenkin saada ohjelman ladattua ennen varsinaiseen tehtäväosuuteen siirtymistä.

Kurssikerralla tuotettiin yhteisellä opastuksella kartta Itämeren ympäröivien valtioiden typpipäästöistä. Laitan oman karttani liitteeksi alle. Ohjeistusta oli selkeää seurata, ja yleisimpiin uuden käyttäjän kompastuskiviin kiinnitettiin huomiota jo ennen kuin niistä ehti kukaan erikseen kysyä. QGIS ei ainakaan ensivaikutelmaltaan vaikuttanut kovin intuitiiviselta, mutta tekemällähän sitä oppii. Ohjeistus eteni mukavan verkkaisesti, paikoitellen jopa liian hitaasti, mutta mieluummin niin päin.

Päällisin ajatukseni ensimmäisen kurssikerran jälkeen oli se, että ehkä nyt olisi viimeinkin aika hankkia kunnollinen kakkosnäyttö. Luennon seuraamisessa auttaisi huomattavasti se, että käytössä olisi yhden monitorin sijasta kaksi.

Kuva 1. Kartta Itämerta ympäröivien maiden typpipäästöistä.

Yhteinen karttatehtävä oli hyvä ensikosketus QGISsin perustoimintoihin. Alkaessani työstää itsenäistä tehtävää lähes viikko ensimmäisen kurssikerran jälkeen, huomasin kuitenkin nopeasti sen, ettei ohjelman käyttö ollutkaan enää lähimuistissa. Olisin varmaan päässyt helpommalla, jos olisin tehnyt tehtävän pian kurssikerran jälkeen, mutta joskus asiat pääsevät jäämään viimetippaan.

Suurella itsevarmuudella valitsin tehtävänannoista haastavimman. Ensiksi etsin Tilastokeskuksen tietokantasivulta itseäni kiinnostavia tietoja. Tilastokeskuksen sivuilla tiedon suodattaminen ja käsittely on jo tullut tutuksi muilla kursseilla. Data oli myös suhteellisen helppoa tuoda qgis-ohjelmaan, kunhan sen latasi .cvs-tiedostona. Tästä oli onneksi mainittu tehtävänannon yhteydessä. Itse kartan laatiminen sujui kohtalaisen helposti Zoomista muistiin jääneiden konstien ja kaverilta saamieni vinkkien pohjalta. 

Kuva 2. Kartta esittää vähintään toisen asteen tutkinnon suorittaineiden prosenttiosuutena, yli 15 vuotta täyttäneistä.

Näin jälkikäteen koropleettikartassani kaikkein huomiota herättävintä on tajuttoman kokoinen mittakaava-jana. Se olisi varmaankin ollu helppo korjata hieman järkevämmän kokoiseksi QGISsissä, mutta tässä vaiheessa en enää jaksa vaivautua tekemään sille mitään.

Valitsemani data ilmaisee vähintään toisen asteen tutkinnon suorittaneiden osuutta prosentteina eri kunnissa. Data on peräisin vuodelta 2019. Kartalla korostuvat, kuten arvata saattaa, suurimmat kaupunkikeskittymät: pääkaupunkiseutu, Tampere ja Oulu. Edellämainituissa kaupungeissa toimivat yliopistot ja korkeakoulut houkuttelevat koulutettua väestöä. Pienemmät yliopistokaupungit pomppaavat myös selkeästi esiin: Jyväskylä loistaa punaisempana kuin ympäröivät kunnat, samoin kuin Kuopion ja Joensuun seutu. Nämä kaupungit houkuttelevat toisen asteen suorittanutta nuorta väestöä kouluttautumaan lisää, ja moni myös jää opintojensa jälkeen asumaan opiskelukaupunkiinsa.

Kaikkiaan vähintään toisen asteen suorittaneet on joka kunnassa valtaosa väestöstä, vaikka valkoisesta punaiseen liukuva värigradientti antaakin hieman harhaanjohtavan mielikuvan. Ensisilmäyksellä karttaa katsoessa nimittäin näyttäisi siltä, että ero valkoisten ja punaisten kuntien välillä olisi merkittävä. Todellisuudessa kaikkein suurimman ja pienimmän luokan välinen ero on vain hieman yli 20 prosenttiyksikköä, ja kaikkein matalimmin koulutetussakin kunnassa toisen asteen suorittaneita on ainakin 56,5 prosenttia.

 

Lähteet:

Tilastokeskuksen tietokanta (https://pxnet2.stat.fi/PXWeb/pxweb/fi/?rxid=444223df-f91c-4479-891f-5dcd50b983d2)