Ruutuja ja tosi pieniä ruutuja (rastereita)

Neljäs kurssikerta alkoi ruutupohjaiseen tiedon esittämiseen tutustumisella. Kävimme pääkaupunkiseudun kartta-aineiston kimppuun. Tutkimme pistemuotoista väestötietokantaa, jossa oli esitetty tietoa pääkaupunkiseudun asukkaista talokohtaisesti. Kuinka ollakaan, aika moni lähti heti tutkimaan oman talonsa tietoja. (Minäkin löysin itseni ja neljä ikätoveriani kotitaloni kohdalta.) Tarkoitus oli kuitenkin saada tietoja niputettua yhteen sen verran, että aineiston esittäminen kartalla on mielekästä. Siispä loimme QGIS:llä ruudukon pääkaupunkiseudun ylle Vector Grid –työkalulla. Poistimme vielä ne ruudut, joissa ei ollut yhtään asukasta keventääksemme tulevia prosesseja, mikä tuntuikin erittäin järkevältä ottaen huomioon ohjelman alituisen kaatuilun. Rami Heikkilä pohtiikin blogissaan, mahtaako kukaan käyttää näin epävakaata ohjelmaa oikeasti työelämässä. Sama kysymys on pyörinyt itselläkin mielessä, mutta vastauksena todettakoon, että olen itse käyttänyt ohjelmaa Espoon kaupungilla työskennellessäni. Ja tämä oli kahdesta tarjolla olevasta ohjelmasta ymmärtääkseni parempi ja helpompi käyttää. Ohjelma ei töissä kaatunut – uskokaa tai älkää – kertaakaan! Syynä varmaan melko lailla kevyemmät prosessit ja pienemmät tietokannat.

Koin ensimmäisen onnistumisen tunteen, kun rupesimme laskemaan ruuduissa olevien asukkaiden määrää. Toiminto oli minulle tuttu, koska olin viitsinyt tehdä vähän ylimääräistä työtä edellisen kurssikerran itsenäisten tehtävien kanssa laskiessani itse järvisyysprosenttia. Jes! Tuotimme kurssilla kartan, jossa näkyy ruotsinkielisten osuus kussakin neliökilometrin kokoisessa ruudussa. Jos absoluuttiset määrät kiinnostavat, voi käydä kurkkaamassa kurssitoverini Saaga Laapotin blogia. Aika oletettavasti eniten ruotsinkielisiä asui siellä, missä ihmisiä muutenkin on eniten eli kantakaupungissa. Tekemässäni kartassa huomion kiinnittävät yksittäiset ruudut siellä täällä, joissa ruotsinkielisten osuus on huomattavan suuri, jopa 100%. Lähempi tarkastelu paljastaa, että suuressa osassa näitä ruutuja asukasmäärä jää vain muutamaan ihmiseen. Tämäkään tarkastelutapa ei siten oikeastaan tuo paljon kiinnostavaa tietoa. Pienemmillä ruuduilla ja keskittymällä pienempään alueeseen aiheesta voisi saada hauskan kartan, jossa ruotsinkielisten osuus vaihtelisi enemmän. Uskoisin, että esimerkiksi ruotsinkielisille suunnatut opiskelijatalot Toukolassa voisivat näkyä tällaisessa kartassa.

Ruotsinkielisten osuus pääkaupunkiseudulla on suurimmaksi osaksi pieni. Niissä ruuduissa, joissa osuus näyttää olevan suuri, asuu useimmiten vain muutama asukas, mikä vääristää tulkintaa

Uusien karttojen kanssa joutuu aina vähän pohtimaan, minkälaisia visuaalisia ratkaisuja kannattaa tehdä, jotta kartta on mahdollisimman helppolukuinen. QGIS tarjoaa paljon vaihtoehtoja, mutta toisaalta minulla on vain vähän taitoa osata kaivata erilaisia ratkaisuja ja toisaalta myös taitoni käyttää niitä ovat vasta kehittymässä. Onneksi ovat muut kurssilaiset. Heidän kurssiblogejaan lukiessa silmä kehittyy havaitsemaan onnistuneita ratkaisuja ja käyttämään itse niistä parhaita.  Iida Ahavan blogista nappasin idean esittää ruudukon väliviivat valkoisella värillä. Se rauhoittaa kartan informaatiotulvaa ja saa huomion pysymään paremmin olennaisessa.

Kurssikerran itsenäisenä tehtävänä oli tuottaa oma kartta jostakin aineistossa annetusta muuttujasta Pääkaupunkiseudulla samaan tapaan kuin yhdessä tehty tehtävä. Päätin kuitenkin itse toteuttaa toisenlaisen kartan, mikä vaati hieman esivalmisteluja. Samalla kurssikerran aiheet tulivat kerrattua. Päätin tutkia lasten lukumäärää eri puolilla Espoota. Valitsin tarkoituksella pienemmän ruutukoon 250m x 250m, jotta saan enemmän eroja näkyviin. Samalla rajasin alueen vain Espooseen valitsemalla vain ne talot, joiden kuntakoodi oli 049 ja tallentamalla ne omaksi tietokannakseen. Ajattelin, ettei näin pienellä ruutukoolla kartasta saa mitään selvää, jos jätän mukaan koko pääkaupunkiseudun ja toisaalta uskoin osaavani tulkita kotikuntani karttaa paremmin kuin naapurikuntia. Minulle aiheutti pientä päänvaivaa keksiä, miten saan laskettua yhteen eri ikäluokat, sillä attribuuttitaulukossa oli erikseen lueteltuna jokaisen ikäluokan tiedot. Lopulta sain summan yhteen sarakkeeseen ja pääsin toteuttamaan karttani. Rehellisyyden nimissä täytyy tunnustaa, että onnistuminen vaatii vielä jonkin verran kokeilemista ja uusia yrityksiä, kun en hahmota aina, mitä, minne ja miten päin ohjelma laskee asioita.

Yllätyin siitä, kuinka paljon Espoossa on alueita, joilla ei asu kukaan. Vielä enemmän oli tietysti alueita, joilla ei ole yhtään lapsia. Näitä, melko suuriakin alueita on myös ”tiheään asutussa” Etelä-Espoossa. Kartasta saisi enemmän irti kun siihen asettaisi taustalle jonkinlaisen Espoon pohjakartan, josta näkisi, asuvatko lapset keskusta-alueilla vai niiden ulkopuolella. Vaihtoehtoisesti lasten jakautumista voisi verrata vastaavaan, kaikista asukkaista tehtyyn karttaan, mutta sitäkään en nyt tässä tehnyt.

Lapsia asuu ympäri Espoota, mutta eniten Etelä-Espoossa muutamassa keskittymässä

Sen sijaan tein vielä vertailun vuoksi vastaavan kartan vanhusten sijoittumisesta Espooseen. Vanhukset/eläkeläiset, joiksi tässä määrittelin yli 65-vuotiaat, (vaikka kaikki eivät ole eläkkeellä) ovat voimakkaammin keskittyneet vain muutamaan paikkaan. Kartan ruutukoko on sen verran pieni, että yksittäiset ikääntyneille suunnatut asumisratkaisut näkyvät varmaankin kartalla. Suuri osa Espoosta on harvaan asuttua omakotitalovaltaista aluetta ja on oletettavaa, että ihmiset muuttavat näiltä alueilta pois ikääntyessään. Se selittää varmasti ainakin osaksi vanhusten keskittymistä tietyille alueille.

Olen melko tyytyväinen tuotoksiini. Sain karsittua varsinkin Espoon kartoista aika hyvin kaiken epäolennaisen tiedon niin että jäljelle jäin harmoninen kokonaisuus. Kätevintä olisi, jos päällekkäin saisi ruutukartat kaikkien espoolaisten, vanhusten ja lasten sijoittumisesta ja pohjalle taustakartan, jossa näkyisi vaikkapa suuralueet. QGIS:ssä näin voikin tehdä, mutta en tiedä mikä olisi paras tapa toteuttaa ajatus lukijalle.

 

Yli 65-vuotiaat ovat asettuneet Espooseen keskitetymmin kuin lapset

Rasterikartat

Toinen tehtävämme liittyi rasteriaineistoihin. Saimme korkeustietoa sisältävän rasteriaineiston, josta muokkasimme visuaalisesti paremman ja helppolukuisemman. Käytimme rinnevarjostusta saadaksemme korkeuserot näkymään paremmin, koska alkuperäisestä mustavalkokuvasta niitä ei hahmottanut.

Rinnevarjostus piirtää maiseman muodot esiin
Rinnevarjostus yhdistettynä korkeuskäyriin ja peruskarttaan

Lisäksi haimme saman alueen peruskarttalehden ilman korkeuskäyriä ja laskimme itse korkeuskäyrät. Vertasimme saamaamme tulosta peruskarttaan, jossa korkeuskäyrät olivat valmiina. Ohjelman laskemat korkeuskäyrät poikkesivat jonkin verran peruskarttaan piirretyistä. Pääpiirteet olivat tietysti samat, mikä näkyi erityisen hyvin isojen mäkien kohdalla, mutta osa maiseman hienopiirteisyydestä puuttui peruskartasta. Käyttäjän kannalta se on tietysti useimmiten hyvä, koska pieniä korkeusmuutoksia ei maastossa aina ole helppo havaita. Korkeuskäyrien asettuminen eri kohtaa voi riippua myös siitä, mistä korkeudesta laskeminen aloitetaan. pahimmillaan meidän laskemamme kartan käyrät asettuvat juuri peruskartan korkeuskäyrien väliin, jolloin heittoa olisi 2,5 metriä. En kuitenkaan tiedä, onko asia kartassani näin.

Aineistosta laskettuihin korkeuskäyriin verrattuna peruskartan käyrät ovat yksinkertaistettuja
Pääpiirteissään peruskartan korkeuskäyrät osuvat kuitenkin hyvin yhteen aineistosta laskettujen korkeuskäyrien kanssa.

 

Lähteet:

Iida Ahavan kurssiblogi, ..koska mun oli pakko saada se toimimaan… (luettu 11.2.2019)

https://blogs.helsinki.fi/iidahava/2019/02/10/koska-mun-oli-pakko-saada-se-toimimaan/

Rami heikkilän kurssiblogi: Kolmas kerta… (luettu 11.2.2019)

https://blogs.helsinki.fi/heirami/2019/02/08/kolmas-kerta/

Saaga Laapotin kurssiblogi, Rastereita ja taikuutta (luettu 11.2.2019)

https://blogs.helsinki.fi/saagalaa/2019/02/09/rastereita-ja-taikuutta/

Kuinka saada kaikki samaan paikkaan?

Kolmannen kurssikerran tavoitteet ja harjoitukset kuulostivat minusta äärimmäisen hyödyllisiltä: mitä tehdä, kun aineisto ei alun perin olekaan juuri sellainen kuin olisi tarkoitus? Tähän ongelmaan törmää jatkuvasti taiteillessaan eri ohjelmien ja tiedostomuotojen välillä ja olen erittäin iloinen, että aihetta käsiteltiin kurssilla. Tällä kertaa aineistona oli vähän vieraampi Afrikan kartta. On mielenkiintoista tuijotella välillä myös muita alueita kuin Suomea tai Eurooppaa. Aasian kartta olisi minulle vielä vieraampi, joten laitan sen toivelistalle odottamaan loppukurssia.

Innostus Afrikan kartasta vaihtui kuitenkin pieneen pettymykseen aika pian. Aineistoissa oli tilastotietoa Afrikan valtioista. Löytyi tietoa muun muassa valtioiden Internetin ja Facebookin käyttäjämääristä, konfliktien määristä, ajankohdista ja sijainneista sekä öljyvarannot ja timanttikaivokset ja näitä tietoja aloimme sitten yhdistellä ja vertailla. Voisiko Afrikan nähdä muittenkin ominaisuuksien kautta kuin epävakaana, kehittymättömänä (”eivät edes nettiä/facebookia käytä”) aarreaittana, jossa konfliktit jylläävät? Eikö voitaisi vahvistaa monipuolisempaa kuvaa Afrikasta, joka ainakin itselleni on vieras? Rakentavampia tai neutraalimpia lähestymistapoja voisivat olla esimerkiksi luontoaiheet (esimerkiksi endeemisten eläinlajien määrät, biomit tai ilmasto) tai kulttuurilliset aiheet (vaikkapa puhutut kielet). Tuntuu väärältä lähestyä aihetta konfliktien kautta, kun nämä aiheet ovat muutenkin paljon esillä.

Keräilimme attribuuttitaulukkoon erilaisia arvoja, joita työstimme harjoituksessa. Tutkimme ensin Facebookin ja internetin käytön läpäisevyyttä, eli kuinka suuri osuus ihmisistä käyttää niitä. Laskimme valtiokohtaiset konfliktimäärät sekä sen jälkeen, kuinka moni konflikteista tapahtui eri vuosina. Vertasimme saatuja lukuja silmämääräisesti timanttikaivosten lukumäärään ja öljykenttien määrään, mutta korrelaation laskemiseen jokin tilasto-ohjelma olisi varmaan parempi. Ehkä en ole vielä ihan saanut aivoja käännettyä oikeaan asentoon, koska kaiken kaikkiaan moniin analyyseihin tilastolliset menetelmät tuntuisivat sopivan paremmin. Olisi esimerkiksi kiinnostava nähdä, ovatko konfliktit yleisempiä juuri varantojen löytämisen jälkeen. Kartalla voisi kuvata esimerkiksi koropleettikartalla konfliktien määrää. En vain ole varma mihin se kannattaisi suhteuttaa. Asukaslukuun? Pinta-alaan? konfliktien kokonaismäärään? Kartalla kuitenkin näkyy ihan vain timanttikaivokset, öljykentät ja konfliktit läntättynä samaan karttaan. Ei kovin informatiivista, kun aikajänne on sen verran pitkä, mutta silti kaikki konfliktit ovat samalla välillä. Tästä voisikin tehdä ehkä kartan jossa eri vuosikymmenten konfliktit olisivat eri väreillä?

Konfliktit vuosina 1947-2008, timanttikaivokset ja öljykentät Afrikassa. (Klikkaa kuva suuremmaksi.)

Kokeilin eri vuosikymmenten konfliktien esittämistä eri väreillä, koska tajusin että sellainen on helppo ja nopea toteuttaa. (Edelleenkin tosin asteikon säätämisessä on pientä häiriötä eikä asteikko siksi ole aivan niin järkevä kuin kaavailin, mutta idea kartasta selviää silti.) Suuri osa konflikteista näyttää tapahtuneen viime vuosikymmenten aikana.

Silmämääräisesti katsoen konfliktit näyttäisivät yleistyneen viime vuosikymmeninä

Kartasta on mielenkiintoista huomata, että konflikteja ei silmämääräisesti näytä olevan eniten siellä, missä on paljon luonnonvaroja, vaikka niin olisi voinut olettaa. Alex Naumanen käy samaa pohdintaa kurssiblogissaan tehtävän äärellä ja ehdottaa, että monet konfliktit liittyvät muihin asioihin, kuten esimerkiksi Somaliassa rajakiistoihin ja klaanien välisiin erimielisyyksiin.

Tallentaminen?

Ihanteellisinta olisi tietysti tehdä aina vähintään yksi tehtäväkokonaisuus kerralla eikä orientoitua samaan tehtävään monena eri hetkenä. Aina se ei ole mahdollista. Erityisen ikävää tehtävien kesken jättäminen on silloin, kun ei oikein ymmärrä mitä, minne ja milloin pitäisi tallentaa niin että aloittaminen seuraavalla kerralla olisi mahdollisimman vaivatonta. QGIS:ssä tallennusvaihtoehtoja riittää. Koko projektin voi tallentaa ylävalikosta uudella nimellä tai ihan vain tallentaa. Ilmeisesti näille toiminnoille on myös omat nappulansa ylemmässä työkalupalkissa. Muutoksia voi tallentaa myös alemman työkalupalkin tallennuskuvakkeella. Lisäksi tasoja voi tallentaa nimellä, jolloin ne saa (kätevästi?) tuplaantumaan ja vanhat kannattaisi ottaa pois, mutta ei ennen, kun on tarkistanut, ettei tullut tehneeksi mitään tyhmää eikä varsinkaan silloin, jos ei ole ihan varma kumpi nyt kuuluikaan säilyttää. Lopuksi kun kaikkia mahdollisia tallennusnappuloita on hakattu varmasti ainakin kerran, on suljettava ohjelma ja toivottava, että vastassa on seuraavalla kerralla jotain muuta kuin kaaos. (Vaihtoehtoisesti voi vain siirtyä seuraavan kerran tehtäviin ja uuteen aineistoon, luoda uuden kansion ja jättää edellisen kerran sekamelskan oman onnensa nojaan…) Mutta tämä vaihtoehto onnistuu valitettavasti vain silloin kun valmista tulee kerralla.

Tulvaindeksi tutuksi

Itsenäinen kotitehtävä käsitteli Suomen valuma-alueita. Päätin tarttua härkää sarvista ja yrittää vaikeammaksi luokiteltua vaihtoehtoa. Valuma-alueiden järvisyysprosentit olivat tarjolla valmiina taulukkona, mutta ne pystyi myös itse laskemaan yhdistelemällä QGIS:n toimintoja ja eri tietokantoja. Selvitin sekä valuma-alueiden että järvien yhteenlasketun pinta-alan ja laskin reippaasti järvisyysprosentin. Ei ollut edes niin vaikeaa kuin pelkäsin! Viereen toin vertailun vuoksi valmiiksi lasketut prosentit. Heittoa oli jonkin verran, suurimmaksi osaksi korkeintaan pari prosenttiyksikköä. Jotain outoa prosenteissa silti oli. Muutamissa valuma-alueissa heittoa oli toistakymmentä prosenttiyksikköä, ja kahden valuma-alueen järvisyys näytti negatiivisia lukuja. En oikein ymmärrä, miten ohjelma on onnistunut laskemaan järvien yhteispinta-alaksi negatiivisen luvun… Periaatteessa tulokset näyttivät siis aika hyviltä, mutta katsoin paremmaksi toteuttaa kartan hyödyntäen valmista aineistoa.

Kaikeksi ”onneksi” ohjelma kaatui taas ja, taitava kun olen tallentamaan, menetin kaikki omituiset negatiiviset pinta-alat. Taulukkojen liittämisen yhteen alan sitä vastoin osata jo oikeasti aika taitavasti. Yritin vielä kerran järvisyyden laskemista itse ja se kävikin aika näppärästi. Mutta. Lähes kaikki täsmää melko hyvin paitsi Jänisjoen valuma-alueen järvisyys. Kai siellä sitten on yli nelikerroksiset järvet, kun järvisyysprosentti on yli 400. Myös Juustilanjoki ja Urpalanjoki ovat laskujeni mukaan yli kymmenen prosenttiyksikköä järvisempiä kuin valmiissa taulukossa. Kaikki edellä mainitut näyttävät yltävän Venäjän puolelle, joten selitys voisi liittyä siihen.

Seuraavaksi karttaan oli lisättävä tulvaindeksi, joka kertoo tulvahuippujen virtaaman keskiarvon suhteen kuivien kausien virtaaman keskiarvoon. Se siis kuvastaa virtaaman eroa kuivan kauden ja tulva-ajan välillä. Tässä vaiheessa tulvaindeksin laskeminen ei ollut enää vaikeaa. Pistelin menemään visuaalisen toteutuksen oletusasetuksilla ja hämmennyin. Arvot vaihtelivat kyllä nollasta yli tuhanteen, mutta koropleettikartta oli omituisen yksivärinen. Tarkemmalla tutkiskelulla pieniä eroavaisuuksia löytyi, kun vaihdoin väriskaalaa. Visuaalisesti ensimmäinen kartta ei ole erityisen informatiivinen, mutta halusin laittaa sen tähän vertailun vuoksi. Kartassa skaala on tasavälinen niin että jokainen väri esittää yhtä suurta tulvaindeksin vaihteluväliä. Eurajoen valuma-alue nousee tässä vertailussa ylivoimaiseksi ykköseksi 1100 tulvaindeksillään. Olin itse mieltänyt Pohjanmaan tulvaherkäksi alueeksi, mutta tässä kartassa se ei nouse esille etelärannikkoa pahemmaksi. Onko vika aineiston käsittelyssä vai ennakkokäsityksissäni? Kävin kurkkaamassa muiden kurssilaisten blogeja, ja samansuuntaisia tuloksia näkyi muillakin. Iida Ahava ja Elisa Aho näyttivät saaneen saman tyyppisiä tuloksia.

On aina hieman kyseenalaista muokata karttaa näyttämään asioita, joita haluaisi nähdä. Siksi pohdinkin, haluanko muokata luokkarajoja jotenkin. Sini-Maaria Ahtinen kertoo blogissaan käyttäneensä kvantiileja luokkarajoja, jolloin jokaisessa luokassa on yhtä monta aluetta. Tällä tavoin karttaan saa kivasti näkymään eri värejä. En kuitenkaan halunnut tehdä niin, joten tyydyin lisäämään luokkien määrän kymmeneen ja ottamaan käyttöön laajemman väriskaalan. Mutta kun ei niin ei. En mahda mitään sille, että tulvaindeksin vaihtelu on suurimmaksi osaksi pientä eikä siitä saa raflaavia karttoja valehtelematta kauheasti.

Olen sitä mieltä, että samaan karttaan ei enää mahtuisi enempää informaatiota, mutta jatkoin tehtävänannon mukaisesti kartan työstämistä. Kartasta tuli aivan liian sekava ja vaikka järvisyysprosentit ovat sinänsä ihan vertailukelpoisia keskenään, niin pylväsdiagrammien esittäminen ilman asteikkoa epäilyttää. kun vertailukohtana ovat vain toiset pylväät, katsojan on mahdotonta tietää, esittävätkö pylväät arvoja nollan ja yhden prosentin välillä vai esittävätkö suurimmat pylväät lähemmäs sadan prosentin järvisyyttä. Nähtävästi selitteeseen olisi saatavissa vertailupylväs, koska Sanni Laakso oli sellaisen saanut toteutettua, mutta minä en keksinyt miten. Mietityttää myös, kuinka järkevää näin erisuuruisia alueita on vertailla.  En haluaisi julkaista koko kuvaa täällä, mutta täytyyhän minun näyttää, että olen sen tehnyt. Saattaisi olla parempi tehdä järvisyydestä ihan oma karttansa, jonka asettaisi tulvakartan viereen.

Tuloksia voisin esitellä sen verran, että niillä valuma-alueilla, joilla on hyvin vähän järviä, tulvaindeksi on suurempi, kun taas runsasjärvisillä alueilla tulvaindeksi vaikuttaa olevan pienempi.

(Tekstiä muokattu 7.2. ja 8.12 ja kuvia lisätty 19.3. alkuperäisen postauksen jälkeen)

Elisa Ahon kurssiblogi, Suomessa ja ulkomailla (luettu 8.2.2019) https://blogs.helsinki.fi/elqaho/2019/02/06/36/

Iida Ahavan kurssiblogi, Eri tietokantojen yhdistely vektoritietokannan kylkeen. (luettu 8.2.2019) https://blogs.helsinki.fi/iidahava/2019/02/04/eri-tietokantojen-yhdistely-vektoritietokannan-kylkeen/

Sini-Maaria Ahtisen kurssiblogi, Kurssikerta 3 – tulvia ja järviä (luettu 8.2.2019) https://blogs.helsinki.fi/ahtisini/2019/01/30/kurssikerta-3/

Sanni Laaksosen kurssiblogi, kurssikerta 3 (luettu 8.2.)
https://blogs.helsinki.fi/sanlaaks/2019/02/03/kurssikerta-3/

Alex Naumasen kurssiblogi, vettä ja metallimusiikkia (luettu 8.2.2019)
https://blogs.helsinki.fi/alexnaum/2019/01/29/vetta-ja-metallimusiikkia/