POV: yritän pelastaa kurssin

Viikko 3 (kirjoitettu vain neljä (?) viikkoa myöhässä 🙂 


Myönnän minulla on useita ongelmia ja yksi niistä on tehtävien perässä pysyminen kun “varsinaisia” palautuksia ei ole. Pitäähän työt tehdä, mutta näin korona ajan opiskelijana mikään ei juuri tunnu todelliselta ja huomaan tarvitsevani Moodlen palautuskansion uhkaavalla aikamittarilla, jotta saan jotain tehtyä. 🙂 Lopetetaan kuitenkin selitykset ja aletaan Töihin! Toivotan Teidät arvon lukija (tässä vaiheessa varmaankin pelkästään Arttu) seuraamaan blogiputkea.

Viikon ensimmäisessä harjoituksessa harjoiteltiin tietokantojen hankintaa ulkoisista lähteistä, tässä tapauksessa Excelistä, ja tietokantojen yhdistämistä niin että tietoa ei menetetä ja voidaan yhdistää eri lähteiden tietoa selkeyden vuoksi yhteen taulukkoon.

Afrikka-tietokannassa jokaisen valtion jokainen maa-alue oli omalla rivillään, jolloin kaikki pienimmätkin saaret saivat oman rivinsä. Tämä olisi hyödyllistä, jos haluttaisiin tutkia ja tarkastella juuri näitä yksittäisiä saaria tai vaikka vertailla Afrikan valtioita saarisuuden perusteella, mutta tapauksessa jossa Afrikkaa halutaan tarkastella kokonaisena maanosana opettelimme, kuinka saaret liitetään osaksi emämaan pinta-alaa. Kun jokaisella valtiolla on vain yksi rivi taulukossa ja alueiden pinta-alat laskettu yhteen on eri valtioiden välinen vertailu mielekkäämpää.

Yhdistämiseen on QGIS:issä monia työkaluja ja nimensä puolesta “merge” tuntuisi toimivan aina, sehän tarkoittaa kahden asian yhteen sulattamista, mikä siinä voisi mennä pieleen? Merge kuitenkin tässä tapauksessa tarkoittaa, sitä että ensin joutuisi valitsemaan jokaisen valtion, jolla on saaria ensin valintatyökalulla ja sitten yhdistää pinta-alat varsinaisella mergellä yhteen. Tämä toimii jos on vain muutama kohde joita pitää yhdistää, mutta Afrikassa on muutama valtio liikaa jotta kukaan jaksaisi tehdä kaksivaiheista hommaa jokaisen valtion kohdalla.

Siispä kätevämpää yhdistää tietokantoja saraketiedon perusteella. Dissolve toiminta on siinä kätevämpi, työkalussa voi valita, millä perusteella haluaa sulauttaa tietoa yhteen. Afrikka-tietokannassa meillä on tieto rivien numeroista (id) se ei ole fiksu, sillä sen pointtina on olla jokaiselle yksilöllinen, joten sulauttaminen ei onnistu jos kaikilla on eri numero. Toisena olisi code, eli koodi, joka tarkoittaa valtioille yksilöllisiä kolmikirjaimisia koodeja (Suomessa FIN). Koodi on yleensä paras tapa jos halutaan yhdistää kahta valtiotietoa sisältävää tietokantaa yhdeksi tai useampaa saraketta joissa on tietoa samasta valtiosta, sillä koodilla on vain yksi oikea kirjoitusasu, toisin kun valtioiden nimillä, joka on Afrikka-tietokannan kolmas sarake. Valtioiden nimet saattavat olla eri muodoissa esimerkiksi jos tietokannat on tuotettu eri aikoina, jolloin valtiot ovat muuttaneet nimiään tai jos uusia valtioita on itsenäistynyt. Esimerkiksi Afrikasta tuotetut aineistot ennen vuotta 2011 eivät sisällä sinä vuonna itsenäistynyttä Etelä-Sudanin valtiota ja aineistot vuoden 2011 jälkeen sisältävät, joten on oltava tarkkana jos tällaisia tietokantoja haluaisi liittää yhteen.

Dissolve-työkalu toimii siis vain jos tietokannassa on joku yhdistävä tekijä, jonka perusteella valinta voidaan tehdä. Jos yhdistävä tekijä löytyy dissolve tuottaa uuden väliaikaisen tietokannan, eli alkuperäinen data ei muutu. Nakkisormille ja tahmatassuille kuten minä, tällainen on erittäin kätevää, koska mikään harvoin sujuu ensimmäisellä yrityksellä, jolloin on todella mukavaa, että koko homma ei lässähdä käsiin heti kättelyssä.

Tietokannan siivoamisen jälkeen siihen liitettiin Excel-tiedosto. Excel on pelottava vempele ja toivon aina, että dataa ei tarvitsisi esikäsitellä, koska pelkään kuollakseni että söhlään sen jotenkin. Koska simuloimme tunneilla melkein aina täydellisiä tilanteita niin tälläkään kerralla dataa ei tarvinnut itse etsiä tai tuottaa vaan se annettiin meille täydellisessä muodossa <3

Comma separated values on jonkun jumalan keksintö ja on ihanaa, että QGIS tunnistaa csv-tiedostojen lisäksi myös muila erottimilla erotettuja aineistoja, sillä jotkut käyttävät pilkun sijasta myös esim. tabia. Ennen kuin tiedostoa tuodaan QGIS:iin on myös loistavaa, että sitä voi esitarkastella ja voidaan etsiä geometriatietoja, eli lähinnä pituus- ja leveysasteita, jotka on merkitty koordinaatein. Pitänee varmaa harjoitella itse, miten tuottaa tällaisia taulukoita, koska niiden tuomineen QGIS:iin on niin yksinkertaista.

Excel-tiedosto yhdistyi siistittyyn Afrikka-tietokantaa yllättävän näppärästi Join-työkalulla, onnekseni QGIS ei tällä kertaa kaatunut toimintoa suorittaessa.

Kaikkien hauskojen liitosten ja uusien sarakkeiden luomisen jälkeen tulokseksi saadaan taulukko, jossa on Afrikan jokaisen valtion pinta-ala, väkiluku, internetin käyttötilastoja, timanttien, öljyvarojen ja konfliktien määrä, sekä luku ns. “uniikeista konflikteista”.

Taulukon kuvailemisen lisäksi todisteena siitä, että ainakin jotain tuli tehtyä esitän karttakuvan mantereen öljyvarannoista, timanttilöydöksistä ja konfliktien kohdista (kuva 1).

 

Kuva 1 – Afrikan menoa

Viikon tehtävän annossa koskien tätä tehtävää piti voitaisiin tehdä tai päätellä jos luomaamme tietokantaan liitettäisiin tietoa vielä esimerkiksi konfiktien alkamisvuosista tai laajuudesta.

Jos konfliktien alkamisvuosi olisi ajassa, jossa internet olisi käytössä, olisi mielenkiintoista saada tietää, kuinka moni internetin käyttäjistä haki tietoa konfliktista tai miten konfliktista ylipäätänsä tiedotettiin sähköisessä mediassa.

Pelkästään tarkemmista internetin käyttäjätilastoista voitaisiin saada väkilukuun verrattuna osviittaa, kuinka moni väestöstä on yhteydessä internettiin ja sähköön ylipäätänsä. Vakaa internetyhteys ja tasainen sähkön saanti ei ole normi kaikkialla ja internetkäyttäjien määrän tilastoimisella saataisiin kuitenkin jonkunlaista osviittaa.

Timanttikaivosten ja öljykenttien löytymisvuosien lisäämisellä tietokantaan voitaisiin päätellä, ovatko nämä luonnonvarat menneet samantein “tutkimusmatkailijoiden” [=siirtomaavalloittajien] taskuun vai vasta välikäsien kautta. Siirtomaavalta nimellisesti purkautui suurimmasta osasta Afrikan valtioista vuonna 1950- ja 1960-luvuilla, joten sen jälkeen perustetut timanttikaivokset ainakin periaatetasolla voisivat tuottaa jotain hyötyä valtiolle, jonka alueelta timantteja löydettiin.

Tämän pirteän pohdiskelun jälkeen siirryn viikon toisen tehtävän pariin.

Tulvaindeksikartan luominen onnistui lähes ongelmitta kun ensin oppi olla sekoittamatta kirjaimia M H Q ja N aivan sekaisin. Lopputuloksena sain kartan, jossa iloisesti näkyy järvisyys esitettynä koropleettikarttana, mutta järvisyysprosentin tuominen histogrammina karttaa näkyviin ei onnistunut, vaikka se kummitteleekin legendassa… :/ (kuva 2)

Vaikka itsenäinen työ ei sujunut aivan loppuun saakka olen silti tyytyäinen, että pysyin kärryillä edes tähän saakka 🙂

 

Leave a comment

Your email address will not be published. Required fields are marked *