Kolmas kurssikerta – Tietokantojen yhdistelyä

Kolmannella kurssikerralla keskityimme pääasiassa eri tietokantojen yhdistelyyn QGIS:n avulla. Aloitimme valmiilla tietokannalla Afrikan valtioista. Tietokantaa oli muokattava yksinkertaisemmaksi, jotta sitä olisi helpompi käsitellä. Tavoitteena oli liittää tietokantaan valtiopohjaista tietoa muista lähteistä. Alkuperäisessä tietokannassa etenkin rannikkovaltiot olivat jakaantuneet useampaan kohteeseen, joten yhdistimme ne yhdeksi kohteeksi “select features” ja “merge” -työkalujen avulla. Tämä mahdollisti myöhemmin muiden tietokantojen yhdistämisen alkuperäiseen tietokantaan valtioiden nimen perusteella. 

Täysin uusi asia olikin ulkoisen tiedon liittäminen haluttuun tietokantaan muista ohjelmista. Toimme uutta dataa muun muassa Afrikan öljyesiintymistä, timanttikaivoksista ja mantereella tapahtuneista konflikteista (kuva 1). Käsittelimme myös tietokantaa, joka sisälsi informaatiota internet ja Facebook käyttäjien määrästä Afrikassa eri vuosina. Yhdistimme tämän datan alkuperäiseen tietokantaan Afrikan valtioista ja laskimme kuinka monta prosenttia internetin käyttäjistä Afrikassa omistaa Facebook-käyttäjätilin. Voidaan sanoa, että tulos oli hieman erikoinen, sillä useissa tapauksissa väestöllä voitiin havaita olevan enemmän käyttäjätilejä verrattuna internetin käyttäjien määrään alueella (kuva 2). 

Kuva 1. Valmiiseen tietokantaan Afrikan valtioista on lisätty dataa muun muassa öljyesiintymistä, konflikteista ja timanttikaivoksista.

Laskeminen ei suinkaan loppunut vielä tähän. Määritimme kaivosten, öljyesiintymien ja konfliktien määrän valtioittain käyttäen eri kyselyjä. Sen jälkeen laskimme tietokantojen avulla uniikkien konfliktien määrän Afrikan eri valtioissa vuosien 1947-2008 välillä. Uniikit konfliktit kuvaavat kuinka monena eri vuonna tietyllä alueella on ollut konflikteja. Näiden tietojen avulla pystytään visuaalisen analyysin avulla tutkimaan eri muuttujia. Voidaan tutkia millä alueella on esiintynyt eniten konflikteja ja minkä pituisia konfliktit ovat mahdollisesti olleet. Voidaan tutkia myös miten konfliktit korreloivat timanttikaivosten tai öljyesiintymien kanssa. Kuten kuvasta 2 voidaan huomata, timanttikaivosten sijainti ei suoraan korreloi alueella tapahtuneiden konfliktien määrän kanssa. Esimerkiksi Etiopiassa on vuosien 1947-2008 välillä ollut 104 konfliktia (uniikkeja konflikteja 37) ja timanttikaivoksia alueella on nolla. 

Tietokannasta pystytään ominaisuustietojen avulla päättelemään myös paljon muuta. Kun tiedetään konfliktin laajuus, voidaan tutkia kuinka monen valtioon konflikti vaikuttaa ja ketkä ovat mahdollisesti konfliktissa osapuolina. Timanttikaivosten ja öljykenttien tuottavuusluokittelulla voitaisiin päätellä kuinka tärkeitä nämä sektorit ovat osana valtion taloutta ja elinkeinorakennetta. Voidaan myös tutkia missä valtiossa on eniten kaivoksia tai öljykenttiä ja kuinka moni niistä on toiminnassa. Aloitus- ja löytämisvuodet voisivat puolestaan korreloida erilaisten konfliktien ajankohtiin. Internetkäyttäjien lukumäärästä eri vuosina voidaan tutkia internetin leviämistä ilmiönä ja mahdollisesti ennustaa sen kehitystä alueella tulevaisuudessa.  

Kuva 2. Taulukko part 1. Tietoa Afrikan valtioista. 

Kuva 3. Taulukko part 2. Tietoa Afrikan valtioista. 

Itsenäisenä tehtävänä oli tarkoitus tutkia Suomen valuma-alueita ja laatia tulvaindeksi kartta. Tehtävä oli epäilyttävän helppo viime kurssikerran kamppailun jälkeen. Toisaalta tämä on varmaan moodlesta löytyvien perusteellisten ohjeiden ansiota, eikä merkki siitä että olen vihdoin sisäistänyt QGIS:n taidokkaan käytön. Ensin yhdistettiin tietokanta Suomen valuma-alueista, sekä tietokanta, joka sisälsi tietoa mm. niiden keskivirtaamista. Laskimme tämän avulla tulva-alttiit alueet.  Lisäksi järvisyys on esitettynä kartalla (kuva 4). Olisin voinut laskea järvisyyden itse, mutta päätin mennä matalimman aidan kautta ja käyttää valmista tietokantaa. 

Kuva 4. Suomen tulvaindeksi ja järvisyys. 

En itse tajunnut analysoida laatimaani karttaa, ennen kuin luin Miina Suutarin blogitekstin. Miina huomauttaa blogissaan, että suurimman järvisyyden ja korkeimman tulvaindeksin paikat eivät sijaitse samoilla alueilla. Miina perustelee väitettään seuraavasti: “Korkeimmat tulvaindeksit ovat rannikolla, missä joet laskevat Itämereen ja järvisimmät alueet ovat sisämaassa – etenkin Järvi-Suomessa, mikä ei ole yllättävää. Järvialtaat todennäköisesti tasaavat vuosittaisia tulvia mutta lisäksi mereen laskevat joet keräävät virtaavia vesiä laajalta alueelta.” Tämä näkyy selkeästi kurssilaisten tulvaindeksi kartoissa. Etelä- ja itärannikolla tulvaindeksi on suurimmillaan, kun taas muualla Suomessa se on melko alhainen. 

 

Lähteet

Suutari, M. (2.2.2020). Kerta 3 ja tallentamisen tärkeys. Blogikirjoitus. 

<https://blogs.helsinki.fi/smiina/>

Leave a Reply

Your email address will not be published. Required fields are marked *