Kuinka saada kaikki samaan paikkaan?

Kolmannen kurssikerran tavoitteet ja harjoitukset kuulostivat minusta äärimmäisen hyödyllisiltä: mitä tehdä, kun aineisto ei alun perin olekaan juuri sellainen kuin olisi tarkoitus? Tähän ongelmaan törmää jatkuvasti taiteillessaan eri ohjelmien ja tiedostomuotojen välillä ja olen erittäin iloinen, että aihetta käsiteltiin kurssilla. Tällä kertaa aineistona oli vähän vieraampi Afrikan kartta. On mielenkiintoista tuijotella välillä myös muita alueita kuin Suomea tai Eurooppaa. Aasian kartta olisi minulle vielä vieraampi, joten laitan sen toivelistalle odottamaan loppukurssia.

Innostus Afrikan kartasta vaihtui kuitenkin pieneen pettymykseen aika pian. Aineistoissa oli tilastotietoa Afrikan valtioista. Löytyi tietoa muun muassa valtioiden Internetin ja Facebookin käyttäjämääristä, konfliktien määristä, ajankohdista ja sijainneista sekä öljyvarannot ja timanttikaivokset ja näitä tietoja aloimme sitten yhdistellä ja vertailla. Voisiko Afrikan nähdä muittenkin ominaisuuksien kautta kuin epävakaana, kehittymättömänä (”eivät edes nettiä/facebookia käytä”) aarreaittana, jossa konfliktit jylläävät? Eikö voitaisi vahvistaa monipuolisempaa kuvaa Afrikasta, joka ainakin itselleni on vieras? Rakentavampia tai neutraalimpia lähestymistapoja voisivat olla esimerkiksi luontoaiheet (esimerkiksi endeemisten eläinlajien määrät, biomit tai ilmasto) tai kulttuurilliset aiheet (vaikkapa puhutut kielet). Tuntuu väärältä lähestyä aihetta konfliktien kautta, kun nämä aiheet ovat muutenkin paljon esillä.

Keräilimme attribuuttitaulukkoon erilaisia arvoja, joita työstimme harjoituksessa. Tutkimme ensin Facebookin ja internetin käytön läpäisevyyttä, eli kuinka suuri osuus ihmisistä käyttää niitä. Laskimme valtiokohtaiset konfliktimäärät sekä sen jälkeen, kuinka moni konflikteista tapahtui eri vuosina. Vertasimme saatuja lukuja silmämääräisesti timanttikaivosten lukumäärään ja öljykenttien määrään, mutta korrelaation laskemiseen jokin tilasto-ohjelma olisi varmaan parempi. Ehkä en ole vielä ihan saanut aivoja käännettyä oikeaan asentoon, koska kaiken kaikkiaan moniin analyyseihin tilastolliset menetelmät tuntuisivat sopivan paremmin. Olisi esimerkiksi kiinnostava nähdä, ovatko konfliktit yleisempiä juuri varantojen löytämisen jälkeen. Kartalla voisi kuvata esimerkiksi koropleettikartalla konfliktien määrää. En vain ole varma mihin se kannattaisi suhteuttaa. Asukaslukuun? Pinta-alaan? konfliktien kokonaismäärään? Kartalla kuitenkin näkyy ihan vain timanttikaivokset, öljykentät ja konfliktit läntättynä samaan karttaan. Ei kovin informatiivista, kun aikajänne on sen verran pitkä, mutta silti kaikki konfliktit ovat samalla välillä. Tästä voisikin tehdä ehkä kartan jossa eri vuosikymmenten konfliktit olisivat eri väreillä?

Konfliktit vuosina 1947-2008, timanttikaivokset ja öljykentät Afrikassa. (Klikkaa kuva suuremmaksi.)

Kokeilin eri vuosikymmenten konfliktien esittämistä eri väreillä, koska tajusin että sellainen on helppo ja nopea toteuttaa. (Edelleenkin tosin asteikon säätämisessä on pientä häiriötä eikä asteikko siksi ole aivan niin järkevä kuin kaavailin, mutta idea kartasta selviää silti.) Suuri osa konflikteista näyttää tapahtuneen viime vuosikymmenten aikana.

Silmämääräisesti katsoen konfliktit näyttäisivät yleistyneen viime vuosikymmeninä

Kartasta on mielenkiintoista huomata, että konflikteja ei silmämääräisesti näytä olevan eniten siellä, missä on paljon luonnonvaroja, vaikka niin olisi voinut olettaa. Alex Naumanen käy samaa pohdintaa kurssiblogissaan tehtävän äärellä ja ehdottaa, että monet konfliktit liittyvät muihin asioihin, kuten esimerkiksi Somaliassa rajakiistoihin ja klaanien välisiin erimielisyyksiin.

Tallentaminen?

Ihanteellisinta olisi tietysti tehdä aina vähintään yksi tehtäväkokonaisuus kerralla eikä orientoitua samaan tehtävään monena eri hetkenä. Aina se ei ole mahdollista. Erityisen ikävää tehtävien kesken jättäminen on silloin, kun ei oikein ymmärrä mitä, minne ja milloin pitäisi tallentaa niin että aloittaminen seuraavalla kerralla olisi mahdollisimman vaivatonta. QGIS:ssä tallennusvaihtoehtoja riittää. Koko projektin voi tallentaa ylävalikosta uudella nimellä tai ihan vain tallentaa. Ilmeisesti näille toiminnoille on myös omat nappulansa ylemmässä työkalupalkissa. Muutoksia voi tallentaa myös alemman työkalupalkin tallennuskuvakkeella. Lisäksi tasoja voi tallentaa nimellä, jolloin ne saa (kätevästi?) tuplaantumaan ja vanhat kannattaisi ottaa pois, mutta ei ennen, kun on tarkistanut, ettei tullut tehneeksi mitään tyhmää eikä varsinkaan silloin, jos ei ole ihan varma kumpi nyt kuuluikaan säilyttää. Lopuksi kun kaikkia mahdollisia tallennusnappuloita on hakattu varmasti ainakin kerran, on suljettava ohjelma ja toivottava, että vastassa on seuraavalla kerralla jotain muuta kuin kaaos. (Vaihtoehtoisesti voi vain siirtyä seuraavan kerran tehtäviin ja uuteen aineistoon, luoda uuden kansion ja jättää edellisen kerran sekamelskan oman onnensa nojaan…) Mutta tämä vaihtoehto onnistuu valitettavasti vain silloin kun valmista tulee kerralla.

Tulvaindeksi tutuksi

Itsenäinen kotitehtävä käsitteli Suomen valuma-alueita. Päätin tarttua härkää sarvista ja yrittää vaikeammaksi luokiteltua vaihtoehtoa. Valuma-alueiden järvisyysprosentit olivat tarjolla valmiina taulukkona, mutta ne pystyi myös itse laskemaan yhdistelemällä QGIS:n toimintoja ja eri tietokantoja. Selvitin sekä valuma-alueiden että järvien yhteenlasketun pinta-alan ja laskin reippaasti järvisyysprosentin. Ei ollut edes niin vaikeaa kuin pelkäsin! Viereen toin vertailun vuoksi valmiiksi lasketut prosentit. Heittoa oli jonkin verran, suurimmaksi osaksi korkeintaan pari prosenttiyksikköä. Jotain outoa prosenteissa silti oli. Muutamissa valuma-alueissa heittoa oli toistakymmentä prosenttiyksikköä, ja kahden valuma-alueen järvisyys näytti negatiivisia lukuja. En oikein ymmärrä, miten ohjelma on onnistunut laskemaan järvien yhteispinta-alaksi negatiivisen luvun… Periaatteessa tulokset näyttivät siis aika hyviltä, mutta katsoin paremmaksi toteuttaa kartan hyödyntäen valmista aineistoa.

Kaikeksi ”onneksi” ohjelma kaatui taas ja, taitava kun olen tallentamaan, menetin kaikki omituiset negatiiviset pinta-alat. Taulukkojen liittämisen yhteen alan sitä vastoin osata jo oikeasti aika taitavasti. Yritin vielä kerran järvisyyden laskemista itse ja se kävikin aika näppärästi. Mutta. Lähes kaikki täsmää melko hyvin paitsi Jänisjoen valuma-alueen järvisyys. Kai siellä sitten on yli nelikerroksiset järvet, kun järvisyysprosentti on yli 400. Myös Juustilanjoki ja Urpalanjoki ovat laskujeni mukaan yli kymmenen prosenttiyksikköä järvisempiä kuin valmiissa taulukossa. Kaikki edellä mainitut näyttävät yltävän Venäjän puolelle, joten selitys voisi liittyä siihen.

Seuraavaksi karttaan oli lisättävä tulvaindeksi, joka kertoo tulvahuippujen virtaaman keskiarvon suhteen kuivien kausien virtaaman keskiarvoon. Se siis kuvastaa virtaaman eroa kuivan kauden ja tulva-ajan välillä. Tässä vaiheessa tulvaindeksin laskeminen ei ollut enää vaikeaa. Pistelin menemään visuaalisen toteutuksen oletusasetuksilla ja hämmennyin. Arvot vaihtelivat kyllä nollasta yli tuhanteen, mutta koropleettikartta oli omituisen yksivärinen. Tarkemmalla tutkiskelulla pieniä eroavaisuuksia löytyi, kun vaihdoin väriskaalaa. Visuaalisesti ensimmäinen kartta ei ole erityisen informatiivinen, mutta halusin laittaa sen tähän vertailun vuoksi. Kartassa skaala on tasavälinen niin että jokainen väri esittää yhtä suurta tulvaindeksin vaihteluväliä. Eurajoen valuma-alue nousee tässä vertailussa ylivoimaiseksi ykköseksi 1100 tulvaindeksillään. Olin itse mieltänyt Pohjanmaan tulvaherkäksi alueeksi, mutta tässä kartassa se ei nouse esille etelärannikkoa pahemmaksi. Onko vika aineiston käsittelyssä vai ennakkokäsityksissäni? Kävin kurkkaamassa muiden kurssilaisten blogeja, ja samansuuntaisia tuloksia näkyi muillakin. Iida Ahava ja Elisa Aho näyttivät saaneen saman tyyppisiä tuloksia.

On aina hieman kyseenalaista muokata karttaa näyttämään asioita, joita haluaisi nähdä. Siksi pohdinkin, haluanko muokata luokkarajoja jotenkin. Sini-Maaria Ahtinen kertoo blogissaan käyttäneensä kvantiileja luokkarajoja, jolloin jokaisessa luokassa on yhtä monta aluetta. Tällä tavoin karttaan saa kivasti näkymään eri värejä. En kuitenkaan halunnut tehdä niin, joten tyydyin lisäämään luokkien määrän kymmeneen ja ottamaan käyttöön laajemman väriskaalan. Mutta kun ei niin ei. En mahda mitään sille, että tulvaindeksin vaihtelu on suurimmaksi osaksi pientä eikä siitä saa raflaavia karttoja valehtelematta kauheasti.

Olen sitä mieltä, että samaan karttaan ei enää mahtuisi enempää informaatiota, mutta jatkoin tehtävänannon mukaisesti kartan työstämistä. Kartasta tuli aivan liian sekava ja vaikka järvisyysprosentit ovat sinänsä ihan vertailukelpoisia keskenään, niin pylväsdiagrammien esittäminen ilman asteikkoa epäilyttää. kun vertailukohtana ovat vain toiset pylväät, katsojan on mahdotonta tietää, esittävätkö pylväät arvoja nollan ja yhden prosentin välillä vai esittävätkö suurimmat pylväät lähemmäs sadan prosentin järvisyyttä. Nähtävästi selitteeseen olisi saatavissa vertailupylväs, koska Sanni Laakso oli sellaisen saanut toteutettua, mutta minä en keksinyt miten. Mietityttää myös, kuinka järkevää näin erisuuruisia alueita on vertailla.  En haluaisi julkaista koko kuvaa täällä, mutta täytyyhän minun näyttää, että olen sen tehnyt. Saattaisi olla parempi tehdä järvisyydestä ihan oma karttansa, jonka asettaisi tulvakartan viereen.

Tuloksia voisin esitellä sen verran, että niillä valuma-alueilla, joilla on hyvin vähän järviä, tulvaindeksi on suurempi, kun taas runsasjärvisillä alueilla tulvaindeksi vaikuttaa olevan pienempi.

(Tekstiä muokattu 7.2. ja 8.12 ja kuvia lisätty 19.3. alkuperäisen postauksen jälkeen)

Elisa Ahon kurssiblogi, Suomessa ja ulkomailla (luettu 8.2.2019) https://blogs.helsinki.fi/elqaho/2019/02/06/36/

Iida Ahavan kurssiblogi, Eri tietokantojen yhdistely vektoritietokannan kylkeen. (luettu 8.2.2019) https://blogs.helsinki.fi/iidahava/2019/02/04/eri-tietokantojen-yhdistely-vektoritietokannan-kylkeen/

Sini-Maaria Ahtisen kurssiblogi, Kurssikerta 3 – tulvia ja järviä (luettu 8.2.2019) https://blogs.helsinki.fi/ahtisini/2019/01/30/kurssikerta-3/

Sanni Laaksosen kurssiblogi, kurssikerta 3 (luettu 8.2.)
https://blogs.helsinki.fi/sanlaaks/2019/02/03/kurssikerta-3/

Alex Naumasen kurssiblogi, vettä ja metallimusiikkia (luettu 8.2.2019)
https://blogs.helsinki.fi/alexnaum/2019/01/29/vetta-ja-metallimusiikkia/

Vastaa

Sähköpostiosoitettasi ei julkaista. Pakolliset kentät on merkitty *