Ruudun takaa

Neljännellä kurssikerralla tutustuttiin ruutukarttoihin ja rasteriaineiston kanssa työskentelyyn. Edellisiin harjoituksiin nähden nyt täytyi olla jo tarkkana prosesseissa käytetyistä luvuista, komennoista ja aineiston rajaamisesta, sillä ruutuaineisto sisältää helposti tuhansia tietueita. Ensimmäistä kertaa oli jo hyvät mahdollisuudet saada ohjelma kaadettua.

Harjoituksen tuloksena sain aikaan kartan, joka esittää muunkielisten suhteellisia osuuksia pääkaupunkiseudun väestöstä (kuva 1). Muunkielisillä tarkoitetaan muuta kuin suomea tai ruotsia äidinkielenään puhuvia, tosin kuten ensimmäisen kurssikertani blogissa totesin, on määritelmä usein epäselvä. En tiedä käytetyn aineiston metatietoja, joten en tiedä kuuluvatko saamelaiset muunkielisiin vai eivät. Se ei kuitenkaan ole pääkaupunkiseudulla tilastollisesti merkitsevää.

Ruutuaineistoissa olennaisinta lie ruutukoko ja sen vaikutus ilmiöiden esitettävyyteen. Valitsin karttaani 500 x 500 metrin ruutumatriisin, joka tuntui sopivalta koko pääkaupunkiseutua esittävälle kartalle. Kilometrin ruutukoko olisi yleistänyt jo liikaa ja pelkäsin, että pienemmällä ruutukoolla aineisto olisi ollut liian raskas prosessoitavaksi. Kokeilinkin soveltaa ohjeiden mukaisen 1 km ruudun jälkeen heti 100 metrin ruutuja mielenkiinnosta kahteen kertaan, mutta molemmilla kerroilla ohjelma kaatui. Kolmannella kerralla prosessi olisi saattanutkin onnistua tai olisin voinut rajata aineiston koskemaan vain Helsinkiä tai jotakin suuralueista. Olisikin mielenkiintoista vertailla samaa muuttujaa samalla luokittelulla mutta huomattavasti pienemmällä ruutukoolla jollakin alueella, kuten suuralueella ja verrata sitä ison kartan arvoihin.

Kuva 1. Muunkielisten osuus väestöstä pääkaupunkiseudulla 500 x 500 metrin ruutuaineistolla.

Absoluuttisten arvojen esittäminen on ruutuaineistossa on toisinaan perusteltua, vaikkei sitä muissa tapauksissa suositellakaan. Ruutuaineistossa jokainen ruutu saa vain yhden arvon ja on jo itsessään yleistettyä tietoa. Siksi sillä onkin mielekästä esittää sellaisia muuttujia, jotka eivät ole pistemäisiä mutta eivät tasaisen jatkuviakaan, kuten koropleettikartat. Pistekarttaan verrattuna sijainnin tarkkuus on jonkin verran huonompi ruutukoosta riippuen, eivätkä ruudut noudata nimettyjen alueiden rajoja, kuten Pilvi Ahonenkin toteaa blogissaan Kurssikerta 4. Tässä tapauksessa absoluuttisten arvojen esittäminen tai ainakin esittävyyden kokeileminen olisi ollut näin jälkeen päin ajatellen järkevää, sillä nyt suuri osa korkeimman arvon saavista (100%) ruuduista on nyt sellaisia joissa asuu vain yksi asukas, joka sattuu olemaan muunkielinen. Toinen vaihtoehto olisi ollut poistaa kyseiset ruudut esityksestä, mikä toisaalta myös vääristää dataa. Alempien arvojen ruudut, kuten 10-50 prosentin muunkielisen väestön ruudut tuntuvat antavan paremmin kuvaa trendeistä: kantakaupunki ja muut keskukset erottuvat korkeammilla arvoillaan. Lisäarvoa olisi tuonut edes se, että tiedon selventämiseksi jokaisen luokan perään olisi merkitty kyseisten ruutujen lukumäärä sulkeissa.

Karttaa visuaalisesti ja sisällöllisesti tarkastellessa pääväylien muodostama verkosto hahmottelee pääkaupunkiseutua tuntevalle aluetta hieman mutta ei avaa esimerkiksi kuntien rajoja tai nimiä. Tuomalla suuralueiden nimet esitykseen yritin hieman helpottaa esittävyyttä, sillä pienalueiden nimistä olisi tullut liian pieniä. Espoon ja Vantaan kohdilla muutamat keskukset tulevat nimikoiduksi oikein ja oikeille kohdille, mutta Helsingin suuralueet (läntinen, eteläinen jne.) ovat hieman hämmentävät.

Kurssikerran lopuksi tutustuimme myös rasteriaineiston kanssa työskentelyyn. Rinnevarjostusta olin tehnyt ennenkin, mutta piirtäminen QGis:llä oli minulle jokseenkin uutta. Muistan piirtäneeni vain yksittäisiä viivoja, joten oli mielenkiintoista seurata miten omista piirtelyistä muodostui tietokanta.

 

Lähteet:

Ahonen, P.  (2019) Kurssikerta 4.  Blogiteksti.  https://blogs.helsinki.fi/piah/

Tietokantoja ja tulvia

Kolmannen kurssikerran alussa harjoiteltiin erilaisten tietokantojen tuomista QGis:iin sekä niiden yhdistämistä toisiinsa  relaatiotietokannaksi ja lopulta yhdeksi tietokannaksi. Olennaisinta on, että aineistoista löytyisi aina jokin kohteita yksilöivä tunnus. Tässä harjoituksessa esikäsittelimme tietokantaa niin, että jokaista aineiston maata koski vain yksi rivi päällekkäisyyksien välttämiseksi tulevissa sarakelisäyksissä eli yhdistimme alueita niin, että maan nimestä tuli yksilöivä tunnus..

Afrikan tietokantojen sisällöistä löytyy mielenkiintoisia yhdistelmiä, joiden korrelaatioita voidaan tarkastella. Luonnonvarojen käyttöönotto, kuten timanttikaivoksen tai öljykenttien löytäminen, aiheuttaa välttämättömästi muutoksia ympäristöön ja yhteiskuntaan. Tähän liittyy vahvasti esimerkiksi kysysmyksiä siitä, kuka luonnonvarat omistaa, kenellä on oikeus käyttää niitä sekä millaisia ympäristövaikutuksia niillä on.  Näin ollen konfliktien syttymiset saattavat johtua käynnistyneestä toiminnasta, mutta eivät luonnollisestikaan ole ainoa selittävä tekijä.  Kuitenkin esimerkiksi sellaisilla alueilla, joilla sijaitsee timanttikaivoksia, konfliktien on huomattu kestävän pidempään kuin muualla (Raleigh et al. 2010).

Volyymiltään riittävän kattavalla aineistolla voitaisiin esimerkiksi koittaa arvioida, sijoittuvatko konfliktien tapahtumisajankohdat heti kaivosten löytymisen aikaan vai vasta poraamisen aloittamiseen sekä toisaalta konfliktien mahdollista vaikutusta kaivosten tuottavuuteen. Lisäksi sellaisten alueiden kohdalla, joissa on ollut pitkään konflikteja voitaisiin arvioida tapahtumien vaikutuksia kehitykseen. Eräänä yhteiskunnan ja infrastruktuurin kehittyneisyyden mittarina voidaan käyttää internetin käyttöä, joka resusrssien keskittyessä konflikteihin ja niiden seurauksiin saattaa viivästyä. Kaikki esitetyt riippuvuudet ovat hyvin kapeakatseisia ja riittämättömiä tarkasteluun sellaisenaan, mutta ovat esimerkkejä mahdolisista analyyseistä.

Kurssikerralla tehtiin myös itsenäisesti Afrikka-harjoituksen oppien mukaisesti tietokanta- ja aineistoliitoksia niin, että saatiin aikaan kuvan 1 kaltainen karttaesitys Suomen valuma-alueiden tulvaherkkyyksistä eli tulvaindeksistä, joka laskettiin keskiylivirtaaman suhteella keskialivirtaamasta; suhteessa korkeampi keskiylivirtaama implikoi korkeaa tulvaherkkyyttä.

Kuva 1. Suomen valuma-alueiden tulvaherkkyysindeksit

Saatu kartta on puutteellinen, ja sen huomaisi kenties maallikkolukijakin, sillä legendassa on esitetty mystinen sininen merkki järsvisyysprosentista, jota kartasta ei löydy lainkaan. Internetistä etsittyänikään en löytänyt selitystä sille, miksi pylväsdiagrammini eivät näy kartassa, mutta vähintään kävin kuitenkin läpi diagrammien kaikki asetukset ja opin niistä paljon. Tähän toivottavasti palaan vielä myöhemmin.

Toisaalta karttaan on merkitty järvet ja siitä näkee jo melko helposti, että tulvaherkimmät alueet eivät sijaitse samoilla alueilla suurimpien järvien kanssa. Vaikka järvisyysprosentti onkin suhteellinen osuus valuma-alueesta ja järven koolla ei sinänsä ole merkitystä, varmistui tieto taulukkoa tarkkailtaessa. Vesa Eskelinen hyvin toteaa blogissaan, että järvet ovat vesivarastoja ja näin ollen säätelevät virtaamaa. Järvet siis saattavat hetkellisesti varastoida potentiaalisia tulvavesiä mutta järvien tilavuuden ollessa suurempi eivät vain hieman nousseet pinnat aiheuta vielä tulvatilannetta.

 

Lähteet:

Eskelinen, V. (2019) Kolmas kurssikerta: sekoilua tietokantojen kanssa. 
https://blogs.helsinki.fi/veesvees/

Raleigh, C., Linke, A., Hegre, H., & Karlsen, J. (2010). Introducing ACLED: an armed conflict location and event dataset: special data feature. Journal of peace research47(5), 651-660.

 

Projektiok(l)ikkailua

Toisen kerran tekstini palautus on auttamattoman myöhässä osiksi sen vuoksi, että jäin jumiin muutamaan tekniseen yksityiskohtaan projektioiden vaihtamisessa. Lopulta vika johtui ehkä ohjelmistoversiostani eikä toisella koneella ollut mitään ongelmia. Teen harjoituksia itsenäisesti enkä tietenkään kehdannut kysyä apua, sillä ”pitäis osata jo” (en ole ensimmäisen vuoden opiskelija). Ei jatkoon, kysykäämme kaikki rohkeasti apua!

Taulukko 1. Pinta-ala- ja viivamittausten tuloksia eri projektioilla.

Mittaustyökalujen avulla tehtyjen tulosten erot (taulukko 1) olivat hyvin linjassa odotusteni kanssa. Tyypillisimmin Suomessa käytetyissä projektioissa, kuten ETRS89/-TM35 ja Lambertin oikeapintaisessa, Euroopan komission suosittelemassa projektiossa sekä alueet että etäisyydet projisoituvat toisiinsa nähden yhdenmukaisesti. Sen sijaan Mercatorin oikeakulmainen projektio (tässä sphere Mercator) tunnetusti tietysti esittää pinta-alat todellisuutta suurempina erojen kasvaessa rajusti napoja lähestyttäessä. ”Suomi-neidon päälaki” sijaitsee jo lähes 70. leveyspiirillä ja mittaamani alan pinta-ala siellä on yli 800% suositusprojektioista. Mitatun suoran pituudessa ero ei ollut lainkaan yhtä suuri, ja Joonatanin sanojen mukaan harjoitus konkretisoi hyvin, miten Mercator vääristää nimenomaan pinta-alaa.

Robinsonin projektiot puolestaan ovat niin sanottuja komprimissiprijektioita, joissa mikään piirteistä (oikeapituisuus, -kulmaisuus ja -pintaisuus) ei ole täysin oikein muttei toisaalta liioittele mitään. Molemmissa mittauksilla Robinsonilla arvot tuplaantuivat, mutta ero Mercatoriin oli huima. Lisäksi kokeilin muutamaa satunnaisprojektiota, kuten taulukossa näkyvää Lambert 1 -projektiota, jossa koordinaatitkin muuttuivat täysin ja joka ei varmastikaan ole tarkoitettu käytettävästi Suomessa. Läksynä tästä se että kannattaa käyttää vain sellaisia projektioita ja koordinaattijärjestelmiä, jotka tietää.

Kuva 1. Suomen kuntien pinta-alat Mercatorin projektiossa verrattuna Lambertin oikeapintaiseen projektioon prosentteina.

Karttaesitykseni ovat vielä toistaiseksi vähäisiä, sillä nyt on korkeaakin korkeampi aika päästää ensimmäinen versioni tämän viikon kurssikerrasta maailmalle ja palata asiaan myöhemmin.

Lähteet:

Huhdanpää, J. Viikko 2: Uutta opittavaa. https://blogs.helsinki.fi/joonatah/

Ensimmäiset tuotokset

Ensimmäisellä kurssikerralla tutustuttiin QGis-ohjelman käyttöön perusteellisesti. Olen käyttänyt QGIS:iä ja muita paikkatieto-ohjelmia aikaisemminkin, mutta tämä peruskurssi on jäänyt tekemättä loppuun. Voinkin heti alkuun myöntää, että harjoitusohjeen yksityiskohtaiset selostukset eri toiminnoista tekivät hyvää hieman nurinkurisessa järjestyksessä muotoutuneelle gis-osaamiselleni. Se on ollut kuin päälaellaan oleva pyramidi, jonka perustukset kaipaavat tukea. Asiaan.

Kurssikerran aineistosta löytyi mielenkiintoinen tilasto Itämereen päätyvien typpipäästöjen määrästä, Laskettuani suhteelliset osuudet päästömääristä sain selville, että Puolan typpipäästöt Itämereen ovat HELCOMin mukaan kaikista suurimmat. Tämä tieto yllätti minut, sillä oletin luvun nousevan suurimmaksi Venäjän kohdalla. Toisaalta ravinnepäästöjä tarkastellessa on olennaista ottaa huomioon valuma-alueet ja niiden ihmistoiminta.  Tuuli Pfeifer arvioi blogissaan, että Venäjän kokonaispäästöt kaikkiin meriin olisivat näistä maista suurimmat. Tämä kuulostaa järkevältä siinäkin mielessä, että Venäjällä on suuria jokia, joiden valuma-alue kattaa lähes koko pohjoisen Euraasian. Sekä maatalousmaan osuus että väestöntiheys on alueella suurimmillaan Puolan ympäristössä (HELCOM 2018). Juurikin alueen ihmistoiminnan keskittyminen ja ympäröivien alueiden päästöjen kumuloituminen selittänevät sitä, että Oder- ja Veiksel-jokien päästöt olivat suurimmat.

Kuva 1. Itämeren ympärysvaltioiden typpipäästöt

Syntyneessä koropleettikartassa (kuva 1) on viisi luokkaa, jotka yritin jaotella jokseenkin järkeenkäyvästi ja välit ovat tasaiset viimeiseen luokkaan asti, joka on hieman suurempi väli jotta sain Puolan mahtumaan siihen. Toisaalta luokka 15-20 ei ole kartalla lainkaan edustettuna. Silmään pistää ainakin se, miten voimakas Puolan väri on muihin verrattuna ja englanninkieliset maiden nimitykset hämmentävät. Halusin kokeilla nimien tuomista ja ne olivat aineistossa englanniksi. Legendan tekeminen ja muokkaaminen sujui huomattavasti nopeammin kuin ennen! Lisähuomiona en ole aivan varma syvyyskäyrien informaatioarvosta tässä esityksessä mutta sisällytin ne kuitenkin karttaan.

Kuva 2. Muunkielisten osuus kunnittain vuonna 2015

Toisena esityksenä tein kartan, jossa käy ilmi muunkielisten osuus asukkaista kunnittain vuoden 2015 tietojen perusteella (kuva 2). En löytänyt ainakaan vielä täsmällistä määritelmää muunkielisille, mutta ainakin tämän aineiston perusteella olisi pääteltävissä, että saamenkieliset sisältyvät luokitukseen, mutta ruotsinkieliset eivät. Kaikista suurin osuus muunkielisiä oli Utsjoella, Enontekiöllä ja pääkaupunkiseudulla. Karttaesityksestä oli ainakin se hyöty, että muistutin itseäni suhteellisten osuuksien esitettävyydestä; Helsingissä muunkielisiä oli 70 000 ja Utsjoella saamenkielisiä 614. Aineistosta löytyi tässä yhteydessä pieni epäloogisuus, sillä esimerkiksi juuri Utsjoella muunkielisiksi määrällisesti oli luokiteltu vain 28 ihmistä, kun taas suhteellinen osuus viittasi siihen, että saamenkieliset sisältyvät määritelmään. Karttaesityksen aihe olisi voinut olla haastavampi ja ulkoasu viimeistellympi. Tee-se-itse -luokitteluni näyttää lukuina epämääräiseltä, mutta oli esitettävyyden kannalta järkevä valinta.

PS. Note to self: Voisi kirjoittaa myös vähemmän kuivasti  😀

 

Lähteet:

HELCOM (2018), The seven biggest rivers in the Baltic Sea region. Saatavissa: http://www.helcom.fi/Lists/Publications/BSEP163%20-%20Seven%20biggest%20rivers%20in%20the%20Baltic%20Sea%20region.pdf

Pfeifer, Tuuli. Kurssikerta 1 – QGIS:iin tutustumista. https://blogs.helsinki.fi/tpfeifer/ (luettu 28.1.2019)