Kurssikerta 7: oman kartan tuottamista ja tuskailua

Viimeisellä kurssikerralla tuotettiin oma kartta itse netistä kerättyjen aineistojen avulla. Olisin alun perin halunnut luoda visualisoinnin kotikaupungistani Vaasasta, ja latasinkin Vaasan peruskarttalehden, korkeuskäyrät ja paikannimet. Paikannnimiaineisto kattoi kuitenkin koko Suomen, eikä QGIS suostunut jökkäämättä avaamaan sitä, joten en myöskään päässyt käsittelemään kyseistä tietokantaa järkevästi esim. pienemmäksi, säästäen vain Vaasan paikannimet. Tutkimuskysymykseni ei ollut täysin selvä, mutta ideani oli verrata Vaasan kaupunginosia jonkin muuttujan suhteen toisiinsa. En kuitenkaan löytänyt kaupunginosa-aineistoa, ja totesin, että säästäkseni itseäni on paras valita jokin helpompi alue tarkasteluun.

Päädyin siis siihen vaihtoehtoon, että tarkastelen kotimaatamme, ja jotakin muuttujia kuntatasolla. Aikaisemmilla kursseilla on ollut esillä etenkin turvallisuuden tai turvattomuuden tunteen kokemukset Helsingissä ja sen eri kaupunginosissa. Alun perin ajatuksena oli etsiä aineistoa turvallisuuden/turvattomuuden kokemuksiin liittyen ja verrata tätä esimerkiksi rikosten määrään kuntatasolla. Sopivaa kuntason aineistoa turvallisuuteen liittyen en kuitenkaan löytynyt, joten jatkojalostin ideaani siihen suunntaan, että tarkastelen päihteiden käytön ja väkivaltarikosten välistä yhteyttä karttavisualisointien avulla.

Lähdin etsimään Suomen kuntakartta-aineistoa, ja sellaisen löysinkin maanmittauslaitoksen sivuilta. Kuten Riikka Matikaisella, törmäsin samaan ongelmaan, että kartta sisältää lisäksi merialueita, joita en halunnut karttaani näkyvillä. Riikan blogista sain hyvän vinkin siitä, millä hakusanoilla sopiva pohjakartta löytyi shapefile-muodossa ladattavaksi.

Seuraavaksi aloin etsimään aineistoa. Alkoholin käyttöön liittyvää aineistoa kuntatasolla löytyikin Terveyden ja hyvinvoinnin liiton Sotkanet.fi-sivustolta. Valitsin aineistoksi alkoholin kulutuksen (100 % etanoli) kutakin yli 15-vuotiasta kuntalaista kohden.

Päihteiden ja erityisesti huumeiden käytöstä en löytänyt sopivaa aineistoa: en sitä, miten suuri prosenttiosuus asukkaista käyttää tai on kokeillut jotakin huumeita. Tämän vuoksi valitsin huumeiden käyttöön liittyväksi aineistoksi Poliisin tietoon tulleet kaikki huumausainerikokset / 1 000 asukasta , joka antanee jonkinlaisen käsityksen huumeiden käytöstä kunnassa: mitä enemmän huumausaineiden käyttöä, sitä enemmän huumausianerikoksia. Joskin tämä teoria ei ole ihan aukoton, mutta paremman aineiston puutteessa tällä mennään. 

Väkivaltarikoksiin liittyvän aineiston löysin tilastokeskuksen tietokannoista. Etsin tietokannasta henkeen ja terveyteen kohdistuneiden rikosten määrän kunnittain.

Kaikki aineistot kerättiin vuodelta 2017, koska vuoden 2018 kaikkia aineistoja ei ollut vielä saatavilla. Oma oletukseni on, että huumausaineiden tai alkoholin lisääntynyt käyttö kunnassa näkyisi jotenkin myös kunnan väkivaltarikosten määrässä. Aineistot tallensin joko excelin kautta, ja laskin rikoksille suhteelliset osuudet jakamalla ne väestön määrillä. Tämän jälkeen tallensin tietokannat csv-tiedostoiksi, jonka jälkeen avasin ne QGISissä. Aineistojen tuonnin jälkeen tein tietokantaliitoksia kuntien nimien perusteella, jotta sain lopulta kaikki tiedot kerättyä yhteen attribuuttitaulukkoon. Kahdesta eri tietokannasta olleet tiedot eivät kuntien osalta olleet täysin yhteneväiset, ja osan kuntien tiedot jäivät puuttumaan, ja esiintyvät visualisoinneissa valkoisella.

aluksi ajattelin visualisoida samalla kartalla väkivaltarikosten määrää pylväsdiagrammien avulla ja alkoholin kulutusta koropleettikarttana (ja samalla lailla huumausainerikosten kanssa). mutta kokeiltuani tätä huomasin, kuinka epäselvältä pyvälsdiagrammit näyttävät, kun jokaiselle kunnalle on omansa. Kartasta tuli lukukelvotonta mössöä, ja päätin tuottaa erikseen kartat kaikista kolmesta eri muuttujasta kuntatasolla. (kuvat 1-3).

Kuva 1. Väkivaltarikokset Suomessa vuonna 2017.
Kuva 2. Alkoholin kulutus henkilöä kohden Suomessa vuonna 2017.
Kuva 3. Huumausainerikosten osuus Suomessa vuonna 2017.

 

Kuten kuvan 1 kartoista nähdään, yhteys alkoholin/huumeiden ja väkivaltarikosten välillä ei ole mitenkään selkeä. Testasin erilaisia luokitteluja, josko olisin saanut niiden avulla jonkinlaista yhteyttä paremmin näkyville, mutta ei onnistunut. Näiden visualisointien perusteella ei pystytä tekemään johtopäätöksiä muuttujien välisistä yhteyksistä, vaan kenties asian tutkimiseen soveltuisi paremmin erilaiset tilastolliset menetelmät. Esimerkiksi korrelaation avulla olisi voinut tutkia, lisääkö runsastuva alkoholin/huumeiden käyttö väkivaltarikoksia.

Vaikka kartat vastasivat huonosti tutkimuskysymykseeni, en enää jaksanut lähteä keksimään uutta kysymystä tai kasaamaan uutta aineistoa, kun olin jo uhrannut niin monta työtuntia tämänkin projektin tekemiseen. Ensi kerralla olisin viisaampi, ja valitsisin yksinkertaisemman kysymyksen, jonka pohjalta lähteä tuottamaan karttoja. Harjoitus toimi kuitenkin sikäli hyvin, että sai tuntumaa tiedonhakuun ja siihen, millaisia tietokantoja ja muita QGISin kanssa yhteensopivia aineistoja on tarjolla. Tehtävän aikana tuli myös kerrattua monipuolisesti kurssilla jo aiemmin opittuja taitoja, kuten pylväsdiagrammin tekoa, tietokantaliitoksia ja erilaisten aineistojen tuomista QGISiin.

Kaiken kaikkiaan kurssin päättymisestä on hyvät fiilikset. Aluksi QGISin käyttö tuntui epätoivoiselta, mutta nyt loppuvaiheessa luotto omiin kykyihin on kasvanut. Tilanteissa, joissa jäi taistelemaan jonkin asian kanssa, löytyi usein apua ihan googlettamalla ongelmiaan englanniksi, lisäksi QGIS-aiheisia youtube-videoita on tullut myös hyödynnettyä kurssin aikana. Harmittaa lähinnä, että oma aika on kevään aikana ollut kortilla, enkä pystynyt panostamaan kurssiin aivan niin paljon kuin olisin tahtonut.

Lähteet:

Riikka Matikaisen blogikirjoitus: Viikko 7 – Luovuuden tuskaa ja kiukuttelevat projektiot

Sotkanet.fi Tilastotietoja suomalaisten terveydestä ja hyvinvoinnista

Tilastokeskuksen Statfin-tietokanta

Kurssikerta 6 – aineiston tuottamista ja hasardeja

Kuudennella kurssikerralla luvassa oli reipasta ulkoilua. Alkuun lähdimme pareittain pihalle keräämään itse pistemuotoista dataa Epicollect5-sovelluksen avulla. Arvioitavana oli erilaisia tietoja Kumpulan ympäristössä olevista kohteista, joista kerätty data pystyttiin diirtämään QGISiin. Tarkastelimme kartalla olevaa dataa pistemuotoisena keskittyen alueen turvallisuuteen. Varsinainen kurssikerran harjoitus liittyi siis aineiston keruuseen, QGISiin tuomiseen, ja esittämiseen osittain valmiin aineiston kanssa. Kokeilimme myös pistemuotoisen datan interpolointia ja esittämistä kartalla.

Kurssikerran varsinaisena itsenäisharjoituksena oli tuottaa hasardeista kolme vapaavalintaista karttaa. Valitsin ensimmäisenä tarkasteluun maanjäristykset. Etsin maanjäristystietokannasta (ANSS Composite Catalog Search) tiedot kaikista yli 8 richterin järistyksistä maapallolla vuodesta 1900 vuoteen 2012. Tietokantojen tallentaminen .txt-muotoon ja siirto QGISiin ei sitten sujunutkaan ihan ongelmitta. Aikani tapeltuani asian kanssa ymmärsin siirtää datan muodon jo tietokannassa CSV-muotoon, jonka saikin sitten vietyä ongelmitta QGISiin ja esitettyä maanjäristykset pistemuodossa kartalla.
Kyseistä karttaa (kuva 1) voisi kouluopetuksessa käyttää juuri luonnonkatastrofien tai riskien tarkasteluun. 8 richterin järistykset ovat jo todella järisyttäviä, ja aiheuttavat mittavia vaurioita alueelle. Kartan perusteella voidaan kuitenkin todeta, että >8 richterin järistykset ovat melko harvinaisia, ja yli sadan vuoden aikana nitä on esiintynyt vain n. 30 kpl.

Kuva 1. Yli 8 richterin maanjäristykset maapallolla.

Toisena karttana tuotin visualisoinnin yli 6 richterin järistyksistä samalta aikaväliltä, ja liitin samaan karttaan myös tulivuorten sijainnin (Kuva 2). Tulivuorten sijainnit sain Volcano Location Database Search -tietokannasta, josta hain koko maapallon tulivuoria koskevan CSV-muotoisen pistemuotoisen sijaintidatan. Kyseisen kartan avulla voitaisiin yleisesti tarkastella yli 6 richterin järistysten sekä tulivuorien esiintymistä maapallolla, mutta kartasta näkyy mielestäni myös erityisen hyvin järistysten ja tulivuorten sijainnit näteissä riveissä mannerlaattojen rajalla. Karttaa voisi käyttää oppilaiden kanssa myös pohdintatehtävänä ja johdatteluna juuri mannerlaattojen liikkeisiin ja niiden vaikutuksiin.

Kuva 2. yli 6 richterin maanjäristykset ja tulivuoret maapallolla.

Viimeiseen karttaan halusin ottaa lisään myös muutakin haastetta kuin pelkkää datan tuomista QGISiin. Ajatuksena oli alun perin laatia interpoloinnin avulla kartta, joka kuvastaisi järistysten kannalta vaarallisimpia alueita maailman kartalla. Latasin järistystietokannasta kaikki 1900-luvun jälkeen sattuneet yli 5,5 richterin järistykset, sillä 5,5 richteriä voi jo aiheuttaa vaurioita rakennuksille ja siten vahingoittaa alueen infrastruktuuria (http://www.geo.mtu.edu/UPSeis/magnitude.html). Kokeilin interpolointia maanjäristysten magntudin suhteen eri etäisyyskertoimilla.
En kuitenkaan saanut näkyviin mitenkään selkeitä, isoja eroja hasardien suhteen, ja muutenkin kyeisen datan esittäminen kävi liian haastavaksi useastakin syystä. Koska interpolointidata tallentuu tasona tif-muodossa, ei alla oleva maailmankartta enää näkynytkään. Seuraavaksi olisi siis tarvinnut löytää shapefile-muotoista dataa esimerkiksi maailman valtioista, jonka olisi voinut asettaa interpolointikuvan päälle. Koska järistykset voivat sattua myös valtamerialueilla, myöskään merialueita kuvaavaa shapefileä ei olisi ollut järkeä ladata, koska silloin kartasta ei voisi  tarkastella esimerkiksi tsunamiherkkiä alueita lainkaan. Kumpulaesimerkissä meillä oli interpolointikartan päällä tie-ja rakennustasot, jolloin kartasta saattoi edelleen hahmottaa alueen, mutta maailmankartalla teiden tai rakennusten lisääminen ei enää onnistu.
Luovuin siis interpolointi-ideasta, ja hain inspiraatiota muiden kurssilaisten blogeista. Amelian blogissa oli kuvattu hienosti tulivuorten korkeutta, ja maanjäristysten magnitudia eri vristen pisteiden avulla. Interpolointikikkailujen jälkeen en kuitenkaan enää jaksanut alkaa pelailemaan tulivuoritietokannan kanssa, vaan tein viimeisen kartan sen sijaan 2000-luvun järistyksistä, jotka ovat riittävän isoja aiheuttamaan vaurioita infrastruktuuriin. Parannuksena kahteen edelliseen luokittelin vielä maanjäristyksen suuruudet eri luokkiin. Mitä punaisempi piste kartalla, sitä suurempi järistyksen magnitudi (kuva 3).
Pisteitä tähän sekä kuvan 2 karttaan tuli sen verran runsaasti, että aikaskaalaa tai magnitudia olisi voinut muuttaa, jolloin kartasta olisi tullut selkeämpi. Koska halusin nimenomaan esittää tuhoa aiheuttavien järistysten määrää, olisi aikaskaalaa voinut säätä pienemmäksi ja valita esim. 1 vuoden ajalta kaikki järistykset. Myös visualisointeja olisi voinut tässäja muissakin kartoissani huolitella, en ole hirveästi minkään kartan kohdalla lähtenyt kikkailemaan säästääkseni aikaa.

Kuva 3. Yli 5,5 richterin järistykset 2000-luvulla.

Opetuksessa karttaa voisi käyttää, kun katsotaan maanjäristysten yleisyyttä. Koska kartta kuvaa ainoastaan järistyksiä, joiden magnitudi on riittävä tuhon aiheuttamiseksi, voitaisiin luokassa myös pohdiskella maanjäristysten vaikutusta eri alueilla maapallolla, ja miten se voi vaikuttaa maiden kehitykseen. Mielenkiintoisena havaintona voitaisiin tarkastella myös esimerkiksi Japania, joka selvästi sijaitsee hotspot-alueella, ja jonka infrastruktuuri on kuitenkin korkea. Voitaisiin pohtia mitä järkeä on asua tällaisella alueella, ja miksi alueella kuitenkni sijaitsee Tokion kaltainen miljoonakaupunki, ja miten Tokio mahdollisesti on varautunut kovaan maanjäristykseen.

 

Lähteet:

Amelian blogikirjoitus: Viikko 6:Maastossa seikkailua ja luonnonhasardeja

Maanjäristystietokanta 1

Maanjäristystietokanta 2

Tulivuoritietokanta

UPseis – An educational site for budding seismologists: http://www.geo.mtu.edu/UPSeis/magnitude.html(Luettu 22.3.2019)

 

Viides kurssikerta – itsenäistymisen vaikeus

Viidennellä kurssikerralla jouduttiin ensimmäistä kertaa tosissaan itsenäisiin hommiin. Harjoittelimme yhdessä etenkin puskurien käyttöä ja kyselyiden tekemistä sekä erilaisten geometristen muotojen avulla laskentaa.

Itsenäistehtäviä ehdin jo aloittaa kurssikerralla ja luulin päässeeni pitkällekin, kunnes kotona huomasin Vilma Pylkön blogista, että olinkin poiminut ainoastaan rakennusten määrät, en kysyttyjä asuntojen määrä. Ei muuta kuin pari viikkoa myöhemmin hihat heilumaan ja uudestaan analyysejä suorittamaan. Tehokkaasti sitä oli ehtinyt jo unohtamaan kaiken kurssikerralla opitun.

Tästä ne ongelmat vasta alkoivat. Minulla oli ylitsepääsemättömiä vaikeuksia ladatessani kurssikerran tiedostoja onedrive-linkin kautta: joka kerta kansioon ilmestyi error-viesti siitä, että osa tiedostoista on liian suuria ladattavaksi. Myöskään puuttuva tiedosto kerrallaan lataaminen ei onnistunut, vaan esimerkiksi väestötieteokantojen attribuuttitaulukot sisälsivät ainoastaan tietoa pisteiden lukumäärästä, mutta ei mitään muuta. En lopulta saanut ongelmaa ratkaistua kotikoneella mitenkään. Koululla kävi samalla lailla, mutta löysin sentäs koulun tiedostoista pks_vaki.shp-tietokannan kaikkine informaatioineen. Käytin tätä myös 1. tehtävä ratkaisemiseen, sillä Vantaa-väki.shp:ta en vain saanut toimimaan. Sen vuoksi vastaukseni varmasti poikkeaa osittain  muiden vastauksista, sillä asukkaiden kokonaismäärä minun aineistosttani oli yli miljoonan, Vantaa-aineistossa väestön määrä jää n. puoleen miljoonaan.

  1. tehtävä

Ensimmäisessä tehtävän alussa tutkittiin Malmin lentokentän ja Helsinki-Vantaan ympäristössä asuvia. Harjoituksessa puskuri-työkalu tuli tutuksi, samoin spatial query ja statistics panelin käyttö. Analyysien suorittamisessa ei tässä kohtaa ollut suurempia ongelmia, ja puskurien tekeminen ja spatial query-toiminnan hyödyntäminen on (ainakin toistaiseksi) syöpynyt muistiin.  Päänvaivaa tuotti ainoastaan lentokoneiden laskusuunnan muutos -tehtävänanto. En ollut varma, oliko tarkoitus laskea vain puskurialueella asuvien, vai intersect-toiminnolla valita vielä nimenomaan Tikkurilan asukit, sillä mielestäni nykyisellään tuo puskurialue (kuva 1) edustaa kyllä suurimmilta osin jonkun muun alueen kuin Tikkurilan asukkeja. Päädyin kuitenkin siihen, että tehtävänannossa nimenomaan puskurialueen asukkaita kysyttiin.

Lentokenttiin liittyvät, kyselyiden perusteella saadut tulokset on koottu taulukkoon 1. Eroavaisuuksia on muiden, kuten esim. Juhon ja Vilman blogien arvoihin, mikä johtuu varmasti siitä, kuinka tarkasti lentokenttien kiitoradat on alueelle piirretty. Omalla kohdalla myös tuo pks.väki-aineiston käyttö voi tuottaa eroja, vaikka pisteet Vantaan kohdalla on lähestulkoon yhtenevät, mutta kok.väestön määrä yli kaksinkertainen

Taulukko 1. Malmin lentokentän ja Helsinki-Vantaan ympäristössä asuvat
henkilömäärä tai prosentti (%)
Malmin lentokentän kiitotiestä 2 km päässä asuvat 59189
Malmin lentokentän kiitotiestä 1 km päässä asuvat 9346
Helsinki-Vantaan lentokentän kiitotiestä 2 km päässä asuvat 12552
Helsinki-Vantaan pahimmalla melualueella asuvat 303 (3,2 % 2 km etäisyydellä asuvista)
Vähintään 55 dB alueella asuvat 11923
60 dB melun määrästä väliaikaisella laskeutumisreitillä kärsivät 12569

Myös asemien kohdalla puskurityökalun käyttö jatkui. Hetken päänvaivaa tuotti tuo prosenttilukumäärien ratkaiseminen, mutta lopulta suoritin sen luomalla attribuuttitaulukkoon uuden sarakkeen, johon loin lausekkeen, jonka avulla summasin kaikkien ASYHT-sarakkeen tiedot yhteen. Prosenttilaskut suoritin laskimen avulla, tähänkin  ehkä olisi QGISissä jokin parempi keino, mutta tälle aineistolle homma toimi näinkin hyvin. Asemiin liittyvät tiedot on kerätty taulukkon 2.

Taulukko 2. Asemien läheisyydessä asuvat                                                                          
500 m etäisyys asemilta 278052
prosenttiosuus kaikista asukkaista, 500 m etäisyys asemilta 24,8 %
joista työikäisten prosenttiosuus 70 %

2. tehtävä

Toisessa tehtävässä tutkittiin kouluiasten määriä taajamissa. Tässä harjoituksessa joutuikin käyttämään vähän enemmän mielikuvitusta, ja laskea attribuuttitaulukkoon uusia arvoja. Taajamien asukkaat pystyi edelleen helposti selvittämään kuten 1. tehtävässä, mutta kouluikäisten selvittämiseksi oli ensin luotava uusi sarake, johon kouluikäisten määrät (7-14-vuotiaat) laskettiin. Taajamien ulkopuolisten lasten määrän päädyin myös ratkaisemaan käänteisesti laskemalla attribuuttitaulukkoon uuden sarakkeen koululaisten kokonaismäärästä. Tämän jälkeen selvitin kyselyn avulla taajamissa asuvien määrä, ja vähensin tämän kouluikäisten kokonaismäärästä, jolloin sain lopputulokseksi taajamien ulkopuolella asuvien määrän. Nämä tulokset on esitetty taulukossa 3.

Taulukko 3. Taajamissa asuvien osuuksia kaikista asukkaista                               
prosenttia %
taajamien asukkaat kokonaisasukkaista 92 %
taajamissa asuvien koululaisten osuus kaikista koululaisista 6,92 %

Ylitsepääsemättömiä hankaluuksia tuotti ulkomaalaisten osuuksien selvittäminen taajamissa. Minun olisi tarvinnut siis saada uusi tietokanta, jossa yksittäisen taajaman sisällä olevien kaikkien rakennusten ominaisuustietosarakkeet olisi laskettuna yhteen ja sijoitettu attribuuttitaulukkon kunkin taajaman kohdalle. Yritin katsoa kurssikerran 5 yhteisestä osuudesta, aikaisempien kurssikertojen materiaaleista sekä yotubesta, mutta mistään en tuntunut löytävän juuri tarvitsemaani apua. Selailin myös muiden blogeja, ja huomasin, että monilta muiltakin tämä kohta uupui. Ne, joiden blogista tiedot löysin, eivät olleet kuvailleet sen tarkemmin, miten olivat saaneet tiedot selvitettyä, joten tämä kohta jäi ratkaisematta. Kokeilin Clip- ja intersect-työkalujen käyttöä, mutta en saanut aikaan haluamaani lopputulosta. Yksi vaihtoehto olisi voinut olla myös laskea attribuuttitaulukkoon uusi sarake, johon kirjoittaa ehtolausekkeen, mutta tässäkin tuli vastaan ongelma, ettei sarakkeeseen voi laskea uutta tietoa muiden attribuuttitaulukoiden tietojen avulla. Tietokantaliitosta ei myöskään suoraan pystynyt suorittamaan, sillä tietokannoissa ei ollut yhteneviä tietoja näiden osalta.

3. tehtävä

Kolmannessa ja viimeisessä itsenäistehtävässä tutkin koululaisten määriä Helsingin yhtenäiskoulun koulupiirissä. Tässäkin kohdassa päädyin käyttämään työkaluja, joiden tehokkuus isojen aineistojen kanssa ei olisi mahdollista. Esimerkiksi yhenäiskoulun koulupiirin rakennukset valitsin kyselyn sijaan manuaalisesti valintatyökalulla. Periaatteessa tämä olisi mielestäni pitänyt pystyä laskemaan spatial queryn avulla, kun oikea koulupiiri olisi valittuna, mutta jostakin syystä en saanut analyysiä toimimaan haluamallani tavalla. Valitsin siis pistetiedostot alueelta manuaalisesti, ja tallensin ne uudeksi, omaksi tietokannakseen. Sen jälkeen laskin uuteen sarakkeeseen jokaisen rakennuksen 6-vuotiaat (seuraavana vuonna koulun aloittavat) ja lopuksi niiden kokonaismäärän.
yläkouluikäisten määrän laskin vastaavalla tavalla (12-14-vuotiaat). Vastaukset tehtävään on koottuna taulukossa 4.

oppilasmäärät tai osuudet
seuraavana vuonna koulunsa aloittavien määrä 29
seuraavana vuonna yläkoulussa opiskelevien määrä (12-14-v.) 63
kouluikäisten osuus kaikist alueen asukkaista 7,3 %
muunkielisten kouluikäisten määrä 13

Tietoja selvitin siis lähinnä attribuuttitaulukkoon uusia sarakkeita luomalla. Mikäli tarkastelussa olisi ollut useita koulupiirejä, tämä laskentatapa kävisi kuitenkin äkkiä työlääksi. Mikäli olisin kyennyt ratkaisemaan 2. tehtävän ulkomaalaisten osuus-osion, olisin varmasti pystynyt hyödyntämään näitä taitoja myös tässä viimeisessä tehtävässä.

Hain uskonvahvistusta omille tuloksilleni myös muiden blogeista. Vaikka yläkoulun oppialiden määräksi sain lähestulkoon saman kuin Juuso, jostakin syystä kkoulun aloittavien määrä oli minun laskujen perusteella tuplat siitä mitä Juuson tai Sannin blogissa. tarkistin vielä määrät laskemalla 5-vuotiaiden määrät yhteen sekä 7-vuotiaiden määrät yhteen, mutta mistään en saanut tulokseksi 14:a, niinkuin Juuso ja Sanni ovat kummatkin saaneet.  Laskin vielä 6-vuotiaiden määrät lopuksi manuaalisesti, ja sain edelleen vastaukseksi 29. Tämä jäi nyt siis vähän mysteeriksi, mistä he ovat arvot saaneet.

Kaiken kaikkiaan itsenäistehtävissä riitti haastetta ainakin kun ne suoritti pari viikkoa kurssikerran jälkeen. Työkalujen hyödyntämisessä on vielä parantamisen varaa, etenkin suurten datamäärien laskennan kohdalla. Tämän kurssikerran analyysityökalujen sujuva käyttö olisi kyllä hyvä taito opetella, joten ehkä näihin pitää vielä perehtyä lisää.

 

Lähteet:

Sannin blogipostaus: Kurssikerta 5

Juuson blogipostaus: Kurssikerta 5- Bufferoidaan.

Vilma Pylkön blogipostaus: KK 5 – Bufferointia

Juhon blogipostaus: Kurssikerta 5

 

 

Neljäs kurssikerta

Neljännellä kurssikerralla harjoiteltiin tutustuttiin rasteriaineistoihin ja harjotieltiin ruudukon tekemistä ja ruutuaineiston tuottamista. Itsenäisenä harjoituksena tein visualisoinnin Helsingin seudun ruotsinkielisten osuudesta 1 km x 1 km kokoisissa ruuduissa (kuva 1). En halunnut esittää ruotsinkielisten absoluuttista määrää jokaisella ruudulla, sillä silloin ei saada informaatiota heidän suhteellisesta osuudesta koko ruudun väestöön verrattuna. Ruudukkoaineiston perusteella ei erotu selkeää ruotsinkielisten keskittymää missään päin pääkaupunkiseutua. Lännessä tosin ruotsinkielisten osuus on hieman itää suurempi. Ruutuaineiston lisäksi ruotsinkielisten osuutta olisi voinut tarkastella kaupunginosittain, tosin koska 1 km x 1km ruuduillakaan ei havaita selvää keskittymää missään, sitä tuskin olisi havaittu kaupunginosankaan kohdalla. Visuaalisesti kauniimpi versio samantyyppisestä kartasta löytyi Seetin blogista. Seeti oli poistanut ruudukon reunat ja lisännyt kuntarajat ja kuntien nimet, jolloin kartalta näkee paremmin, mihin ruotsinkieliset siellä sijoittuvat. Visualisointeihin ja karttojen paranteluun olisi itselläkin jatkossa panostettavaa.

Kuva 1. Ruotsinkielisten osuus pääkaupunkiseudulla.

Toisessa kurssikerran työssä harjoiteltiin rasteriaineistojen yhdistämistä, korkeuskäyrien ja rinnevarjostusten luomista. Rinnevarjostus luotiin Pornaisten alueelle, ja on esitetty kuvassa 2. Pohjakarttana käytettiin Pornaisten oeruskarttalehteä. Rinnevarjostuksen avulla pystyy visualisoimaan korkeuserot paljon perinteisiä korkeuskäyriä (kuva 3) paremmin.

Kuva 2. Rinnevarjostus Pornaisten alueella.

Itsenäistyönä latailin vielä Paitulista alueen peruskarttalehden korkeuskäyrineen. Kuvassa 3 on esitetty tämä peruskarttalehti sekä kurssikerralla piirretyt korkeuskäyrät. Kuten huomataan, korkeuskäyrät vastaavat toisiaan yleisesti ottaen melko hyvin. QGIS:n korkeuskäyrät ovat mutkittelevampia ja tarkempia, ja kuten Iina Rusanenkin blogissan pohti, peruskarttalehdeltä on karsittu tarkkuudesta, jotta kartan luettavuus säilyisi parempana. Pääpiirteet siellä on kuitenkin kuvattuna.

Kuva 3. Peruskarttalehden korkeuskäyrät ruskea) sekä QGISin avulla piirretyt korkeuskäyrät vihreä).

Lähteet:

Iina Rusasen blogikirjoitus: Ruututietokantoja ja rastereita

Kolmas kurssikerta – timanttia, öljyä, konflikteja Afrikassa sekä tulvia Suomessa

Kolmannella kurssikerralla tarkasteltiin Afrikkaa ja sen maihin liittyvää dataa. harjoittelimme erityisesti uuden datan tuottamista ja yhdistämistä olemassa olevista aineistoista. Tarkastelun alla oli erilaisia aineistoja liittyen timanttikaivosten, öljyn ja konfliktien esiintyvyyteen. Tällaisen datan avulla voidaan päätellä monenlaisia asioita. Esimerkiksi timanttien ja timanttikaivosten esiintymisen on todettu olevan yhteydessä erilaisten konfliktien syntyyn ja kestoon (Raleigh ja Hegre 2005). Koska timanteista saatava taloudellinen hyöty ei välttämättä Afrikan valtioissa koidu koko maan hyödyksi, vaan timanteista saatavat hyödyt valuvat harvojen valikoitujen taskuun , on konfliktien lisääntyminen timanttikaivosalueilla uskottava hypoteesi. Käytössä olevan datan avulla voitaisiin siis luoda esimerkiksi visualisointeja siitä, onko konfliktien määrä timanttikaivosalueilla suurempaa kuin muualla. Kun dataa on käytössä konfliktien tapahtumavuosista, datan avulla voitaisiin vielä tarkemmin tarkastella, mitkä tekijät vaikuttavat konfliktien esiintymiseen: alkaako konflikteja esiintyä esimerkiksi samana vuonna, kun kaivos löydetään, silloin kun kaivaukset alkaa, tai onko esimerkiksi timanttikaivoksen tuottavuudella vaikutusta konfliktien esiintyvyyteen. Yhtä lailla timanttien lisäksi voitaisiin tarkastella myös, onko öljykenttien ja konfliktien esiintymisellä samanlaisia yhteyksiä.

Internetkäyttäjien määrä maassa kertoneeluultavasti maan infrastruktuurista ja taloudellisen hyvinvoinnin lisääntymisestä jotakin. Jos käytössä olisi vielä dataa internetkäyttäjien lukumääristä eri vuosina, tämän avulla voitaisiin myöa tehdä päätelmiä siitä, onko timanteista tai öljystä saatu hyöty hyödyttänyt koko maata.

 

Kurssikerran toisena tehtävänä tuotettiin tulvaindeksikartta Suomesta (kuva 1). Kartassa näkyy tulvaindeksi. Tulvaindeksi on alueen keskiylivirtaaman määrä jaettuna alueen keskialivirtaaman määrällä. Keskiylivirtaamalla tarkoitetaan joen uoman läpi virtaavan veden määrää keskiarvoa tulva-aikoina, keskialivirtaama puolestaan veden määrän keskiarvoa kuivimpina aikoina. Indeksi kuvaa siten, kuinka moninkertainen ero veden määrässä on tulvahuippujen ja kuivimpien kausien välillä. Mitä surempi indeksi siis on, sitä enemmän vettä alueelle  on tullut, ainakin tiettynä ajanjaksona. Oman kartan perusteella nähdään, että tulvaindeksi on ollut suurin lähinnä läntisillä rannikkoseuduilla.  Pohjanmaalla tämän voisi ajatella johtuvan laakeasta maastosta ja vähäisistä pinnanvaihteluista, kuten Juhokin spekuloi blogissaan. Tulvaindeksin absoluuttinen arvo ei sinänsä kerro minulle mitään: kuinka suuri arvon on oltava, jotta ero on merkittävä? mitä seurauksia luonnolle on, mikäli tulvahuippujen ja kuivien kausien ero on merkittävä?

Tulvaindeksin ja järvisyyden yhteydestä ei sinänsä voi oman kuvani perusteella mielestäni suoraan päätellä mitään. Samaa sanoi Juho blogissaan, vaikka mielestäni Juhon viusalisoinnissa näyttäisi siltä, että alueilla, joissa tulvaindeksi on pieni, on myös suuri järvisyys ja toisinpäin, eli niiden välillä vallitsisi negatiivinen korrelaatio. Tämä käy myös järkeen, sillä järvet pystyvät myös varastoimaan esimerkiksi keväisin sulavan lumen aiheuttamia vesimassoja tehokkaasti, jolloin virtaamat joissa (ja sitä kautta myös tulvaindeksi) on pienemmät.

Kuva 1. Tulvaindeksit ja järvisyysprosentti Suomessa.

Lähteet:

Juhon kurssiblogi. Viikko numero kolme.

Raleigh, C., Hegre, H. Introducing ACLED: An Armed Conflict
Location and Event Dataset. Centre for the Study of Civil War. International Peace Research Institute, Oslo. 2005. Saatavissa kurssin moodle-alueella.

 

Toinen kurssikerta -Projektioiden vietävänä vai vietävän projektiot

Toisella kurssikerralla jatkoimme QGISiin perehtymistä kurssin vastuuhenkilön johdolla. Kädestä pitäen opastut tuntui edelleen hyvin tarpeelliselta, melko nopeasti sitä viikossa ehtikin unohtaa aiemmin opitun…

Kurssikerralla erilaisten QGIS-perustoimintojen harjoittelun lisäksi perehdyimme erilaisiin projektioihin ja niiden käyttöön. Kaikki projektiot ovat yritys kuvata pyöreää maapalloa tasossa, jonka vuoksi niissä esiintyy aina vääristymää johonkin suuntaan. Projektiota valittaessa kannattaakin miettiä tarkkaan sen käyttötarkoitusta. Yleisesti käytössä oleva Mercator-projektio esimerkiksi on oikeakulmainen, mutta vääristymä kasvaa mitä kauemmaksi kohti napoja liikutaan päiväntasaajalta. Siten Mercator ei ole paras mahdollinen projektio kuvaamaan Suomea, joka sijaitsee pohjoisessa, ja joka vääristymän vuoksi näyttää paljon suuremmalta kuin se todellisuudessa on. Tämän vuoksi esimerkiksi Suomessa on maastokartoissa ollut yleisesti käytössä ETRS-TM35FIN-tasokoordinaattijärjestelmä, joka on poikittainen Mercator-projektio. Siinä keskimeridiaani kulkee suurin piirtein Suomen keskeltä, eli vääristymät siinä ovat pienempiä, ja kasvavat siirryttäessä länteen ja itään. Kapeana maana vääristymät Suomen pohjoisimmilla tai itäisimmilläkään alueille ei pitäisi täten olla suuret verrattuna perinteiseen Mercator-projektioon. Näiden kahden projektion aiheuttamaa eroa pinta-aloissa visualisoitiin vielä luomalla Suomen kartta, jossa jokaiselle kunnalle laskettiin kahden eri projektion välinen erotus pinta-aloissa (kuva 1). Pinta-alaerot eri kunnille laskettiin porsentteina, ja luokiteltiin useampaan eri luokkaan luonnollisin luokitteluvälein. Kuten pinta-alojen erotusta kuvaava koropleettikartta näyttää, erot kasvavat sitä suuremmikisi, mitä kauemmaksi pohjoiseen mennään. Pohjoisessa klassisen Mercator-projektion kuntien pinta-alat ovat siis jopa yli 200% suuremmat kuin ETRS-ETRS-TM35FIN-koordinaattijärjestelmää käyttäen.

Kuva 1. Kahden eri projektion (Mercator ja ETRS-TM35FIN) välinen ero pinta-aloissa Suomen kunnissa. Koropleettikartta ilmoittaa eron luonnollisten luokkien avulla.

Tämän lisäksi laadittiin vielä koropleettikartat Suomen Natura-alueiden pinta-aloista suhteutettuna kyseisen kunnan pinta-alaan (kuva 2). Visualisoinnit laadittiin käyttäen samoja projektioita kuin ensimmäisessä tehtävässä. Luokittelussa käytettiin jälleen luonnollista luokitteluväliä. Natura-alueiden pinta-alat on poimittu valmiista datasta, joka on tuotettu tietyn koordinaattireferenssijärjestelmän mukaisesti. Tällöin suhteellinen pinta-ala voi olla oikea ainoastaan, jos sen laskemiseen käytetyt kuntien pinta-alat ovat samalla projektiolla, tai melko pientä vääristymää Suomen alueella aiheuttavalla projektiolla laskettu. Koska käytössä oli nyt kaksi eri koordinaatijärjestelmää, mutta suhteutuksessa käytettiin ainoastaan yhtä datasettiä Natura-alueiden pinta-aloista, tulee myös suhteellisista Natura-alueiden pinta-aloista melko erinäköiset. Mercator-projektiossa pistää äkkiä silmään, että Natura-alueiden suhteelliset pinta-alat ovat läpi Suomen hyvin pienet, korkeimmillaankin Lapin käsivarressa 10-19 % luokkaa. ETRS-TM35FIN-koordinaattijärjestelmää käyttäen Natura-alueiden suhteelliset alat ovat paljon suuremmat, ja Lapissa etenkin tavataan n. 20-98% suhteellisia suojelualueita. Myös muualla etenkin pohjoisessa suhteelliset alat ovat paljon suurempia verrattuna Mercator-projektioon. Tämä on järkeenjäypää, sillä Mercatorin aiheuttama vääristymä kasvattaa etenkin pohjoisten alueiden pinta-aloja, kuten näimme kuvassa 1, jolloin Natura-aluieiden suhteellinen ala pienenee.

 

Kuva 2. Natura-alueiden suhteelliset pinta-alat koko kunnan pinta-alasta koropleettikarttojen avulla esitettynä. Vasemmalla ETRS-TM35FIN-koordinaatistolle lasketut suhteelliset alat, oikealla Mercator-projektion avulla lasketut alat.

Projektion lisäksi karttojen erot visualisoinnissa voivat aiheutua käytetystä luokitteluvälistä. Itselläni on tässä käytössä luonnollinen luokitteluväli, mutta esimerkiksi Vilma Kaukavuoren blogissa luokitteluvälinä on käytetty ilmeisesti jotakin muuta luokittelua, jolloin projektioiden ja Natura-alueiden suhteelliset pinta-alat eivät näytä juurikaan erilaisilta.

Mielestäni värien käyttö visualisoinnissa on tärkeää huomioida. Esimerkiksi tällaisten jatkuvien muuttujien visualisointi on mielestäni järkevintä toteuttaa saman värin eri gradientteina, kuten omissa kartoissani, jolloin nähdään suoraan missä arvot ovat suurimmat (yleensä tummin väri), ja missä pienimmät (yleensä vaalea väri). Toki muitakin vaihtoehtoja on, kuten esimerkiksi Rami Heikkilän blogissa, jossa projektioiden välisen eron kuvaamiseen on käytetty jokaiselle luokalle toisestaan poikkeavaa värisävyä. Sinänsä kartta kyllä sisältää kaiken olennaisen informaation selitteessä, mutta vaatii tarkempaa lukemista, mitä eri värit kertovat, jotta kartta avautuu. Ramikin kyllä kuvailee lopputulosta hyvin seuraavin sanoin: “jonka visuaalinen anti vastaa pitkälle harjoituksen aiheuttamaa kärsimystä”, sekä etätyöskentely toki selittää. Ei ole QGIS:n opettelu niin helppoa. Onneksi on vielä edessä useita viikkoja QGIS:n mestaroinnin harjoitteluun ja tuotosten hiomiseen. 🙂 Ensi viikkoa odotellessa!

 

Lähteet:

Vilma Kaukavuoren blogikirjoitus “Uskomattomia pinta-ala vääristymiä”

Rami Heikkilän blogikirjoitus “Toinen kurssikerta etänä”

Ensimmäinen kurssikerta – johdatus QGISin ihmeelliseen maailmaan

Tämä blogi toimii kurssialustana Geoinformatiikan menetelmät -kurddin kurssiharjoitusten esittelylle. Ensimmäisellä kurssikerralla harjoittelimme paikkatiedon esittämiseen, muokkaamiseen, soveltamiseen, analysointiin ja tuottamiseen tarkoitetun QGIS-paikkatieto-ohjelman käyttöä. En ole aikaisemmin käyttänyt mitään GIS-pohjaista paikkatieto-ohjelmaa, joten opittavaa oli paljon, eivätkä odotukset olleet vielä kovin korkealla. Lähinnä peruskomentojen hallinta, miten tietoa tuodaan ja voidaan muokata, oli itsellä oppimistavoitteena ja ne saavutinkin.

Työskentelyn aloitimme työstämällä visualisointia itämeren typpipäästöistä sitä ympäröivien valtioiden osalta. Tuotos on esitelty kuvassa 1. Päästöt on visualisoitu siten, että tummempi sävy ilmaisee aina suurempaa osuutta Itämeren typpipäästöistä, ja luokitteluväliksi on valittu luonnollinen luokitteluväli. Visualisoinnin selkeyttämiseksi typpipäästöjen osalta olisi voinut käyttää jotakin muuta väriä, kuten esimerkiksi Riikka Matikaisen tuotoksessa, jossa päästöjen osuutta on kuvattu punaisen ja oranssin eri sävyin, jolloin se erottuu hyvin vedestä.

Kuva 1. Itämeren typpipäästöjen osuus valtioittain. Luokitteluvälinä käytetty luonnollista luokitteluväliä.

Mielestäni visualisointia olisi myös voinut parantaa huomioimalla esimerkiksi maan pinta-alan tai asukasmäärän, jolla on todennäköisesti yhteys typpipäästöjen suuruuteen. Esimerkiksi Venäjä on pinta-alaltaan hyvin suuri, todennäköisesti myös sen valuma-alue Itämereen on montaa ympäröivää pienempää valtiota suurempi, jolloin sen osuus voi näyttää suhteellisesti suuremmalta, sillä sitä ei ole suhteutettu maan valtavaan pinta-alaan (tai vaikka valuma-alueen pinta-alaan). Toisaalta tästä kartasta kuitenkin erottuu selkeästi, että melko pienen Puolan osuus kokonaispäästöistä on suuri. Tämä selittynee sillä, että Puolassa on paljon maataloutta, joka käyttää typpilainnoitteita.

Kaiken kaikkiaan tuntityöskentely onnistui hyvin ja pysyin mukana, mutta sen verran vieraalta ohjelman käyttö tuntui, että aika paljno mentiin kädestä pitäen opastuksella. Näin muutama päivä kurssikerran jälkeen en enää muista paljoa ohjelman toiminnasta, ja jopa tuon ensimmäisen tehtävän tekeminen itsenäisesti tuntui liian haastavalta.

Lähteet: Riikka Matikaisen blogikirjoitus Viikko 1 – Ensikosketus QGIS:iin ja paikkatieto-ohjelmiin