Tietokantoja ja tulvia

Kolmannen kurssikerran alussa harjoiteltiin erilaisten tietokantojen tuomista QGis:iin sekä niiden yhdistämistä toisiinsa  relaatiotietokannaksi ja lopulta yhdeksi tietokannaksi. Olennaisinta on, että aineistoista löytyisi aina jokin kohteita yksilöivä tunnus. Tässä harjoituksessa esikäsittelimme tietokantaa niin, että jokaista aineiston maata koski vain yksi rivi päällekkäisyyksien välttämiseksi tulevissa sarakelisäyksissä eli yhdistimme alueita niin, että maan nimestä tuli yksilöivä tunnus.

Afrikan tietokantojen sisällöistä löytyy mielenkiintoisia yhdistelmiä, joiden korrelaatioita voidaan tarkastella. Luonnonvarojen käyttöönotto, kuten timanttikaivoksen tai öljykenttien löytäminen, aiheuttaa jonkinlaisia muutoksia ympäristöön ja yhteiskuntaan. Tähän liittyy vahvasti esimerkiksi kysysmyksiä siitä, kuka luonnonvarat omistaa, kenellä on oikeus käyttää niitä sekä millaisia ympäristövaikutuksia niillä on.  Näin ollen konfliktien syttymiset saattavat johtua käynnistyneestä toiminnasta, mutta eivät luonnollisestikaan ole ainoa selittävä tekijä.  Kuitenkin esimerkiksi sellaisilla alueilla, joilla sijaitsee timanttikaivoksia, konfliktien on huomattu kestävän pidempään kuin muualla (Raleigh et al. 2010).

Volyymiltään riittävän kattavalla aineistolla, joka sisältäisi käytetyn datan lisäksi muun muassa lisää temporaalista ulottuvuutta,  voitaisiin esimerkiksi koittaa arvioida, sijoittuvatko konfliktien tapahtumisajankohdat heti kaivosten löytymisen aikaan vai vasta poraamisen aloittamiseen sekä toisaalta konfliktien mahdollista vaikutusta kaivosten tuottavuuteen. Lisäksi sellaisten alueiden kohdalla, joissa on ollut pitkään konflikteja voitaisiin arvioida tapahtumien vaikutuksia kehitykseen. Eräänä modernin yhteiskunnan ja infrastruktuurin ’kehittyneisyyden’ mittarina voidaan käyttää internetin käyttöä, joka resurssien keskittyessä konflikteihin ja niiden seurauksiin saattaa viivästyä. Toisaalta taas hyvin tuottavat öljykentät ja timanttikaivokset saattavat kiihdyttää tätä kehitystä. Kaikki esitetyt riippuvuudet ovat hyvin kapeakatseisia ja riittämättömiä tarkasteluun sellaisenaan, mutta ovat esimerkkejä mahdolisista analyyseistä. Tästä saisi hienon interaktiivisen kartan, josta voisi tarkastella myös esimerkiksi yksittäisten konfliktien tapahtumavuosia klikkaamalla. Se kuitenkin oikaisisi esitettävyyteen liittyviä haasteita turhankin paljon.

Kurssikerralla tehtiin myös itsenäisesti Afrikka-harjoituksen oppien mukaisesti tietokanta- ja aineistoliitoksia niin, että saatiin aikaan kuvan 1 kaltainen karttaesitys Suomen valuma-alueiden tulvaherkkyyksistä eli tulvaindeksistä, joka laskettiin keskiylivirtaaman suhteella keskialivirtaamasta; suhteessa korkeampi keskiylivirtaama implikoi korkeaa tulvaherkkyyttä.

Kuva 1. Suomen valuma-alueiden tulvaherkkyysindeksit.

Saatu kartta on puutteellinen, ja sen huomaisi kenties maallikkolukijakin, sillä legendassa on esitetty mystinen sininen merkki järsvisyysprosentista, jota kartasta ei löydy lainkaan. Internetistä etsittyänikään en löytänyt selitystä sille, miksi pylväsdiagrammini eivät näy kartassa, mutta vähintään kävin kuitenkin läpi diagrammien kaikki asetukset ja opin niistä paljon. Tähän toivottavasti palaan vielä myöhemmin.

Toisaalta karttaan on merkitty järvet ja siitä näkee jo melko helposti, että tulvaherkimmät alueet eivät sijaitse samoilla alueilla suurimpien järvien kanssa. Vaikka järvisyysprosentti onkin suhteellinen osuus valuma-alueesta ja järven koolla ei sinänsä ole merkitystä, varmistui tieto taulukkoa tarkkailtaessa. Eskelinen (2019) hyvin toteaa blogissaan, että järvet ovat vesivarastoja ja näin ollen säätelevät virtaamaa. Järvet siis saattavat hetkellisesti varastoida potentiaalisia tulvavesiä mutta järvien tilavuuden ollessa suurempi eivät vain hieman nousseet pinnat aiheuta vielä tulvatilannetta. Samalla järvien esiintyminen viittaa paikallisesti suhteellisiin korkeuseroihin – epätasaisemmassa maastossa on myös painaumia, joihin järvet muodostuvat.

Kuva 2. Suomen valuma-alueiden tulvaherkkyysindeksit ja järvisyysprosentit, vaihtoehtoinen visualisointi.

Tehtävät uudelleen tehtyäni nyt kertausvuonna lisään ainakin hieman parannellun version edellisestä esityksestä. Kuvan 2 karttaesityksessä ovat nyt myös näkyvillä järvisyysprosentit, jotka siis kertovat kunkin valuma-alueen järvien osuuden kokonaispinta-alasta. Päädyin prosenttiosuuden mukaan skaalautuviin ympyrädiagrammeihin esitettävyyden vuoksi. Pylväiden kokoeroja (etenkin kapeina, jollaiseksi ne täytyi muokata erottuakseen toisistaan) oli vaikea nähdä – usein visualisoinneissa pinta-alaan nojaavat visualisoinnit antavat katsojalle nopeammin suuntaa-antavan kuvan ilmiöistä. Lisäksi ehdotettu maa-alan ja järvien osuuden suhdetta vertaileva ympyrädiagrammi, joka olisi toki antanut tarkemman kuvan todellisista prosenttiosuuksista, mutta diagrammien koon kanssa tuli ongelmia esitettävyyden kannalta. Lisäksi järvisyysprosentit vaihtelevat välillä 0-20, joten eroja on vaikea vertailla.

Tällä kertaa karttaesityksessä itse järvet eivät enää olekaan niin tärkeitä esitettäviä, joten olisin voinut jättää lisäämättä ne. Visualisointi ja moni muu asia on kaukana täydellisestä, mutta tarkoituksenani ei olekaan viettää tuntikausia jokaisen kartan ja blogiesityksen kanssa. Tavoitteena on vain kerrata aikaisemmin tekemääni ja oppia menetelmiä niin sanotusti kantapään kautta. Onneksi sisällöt eivät sinänsä tutnuneet hankalilta – tietokantaliitokset on aika perusjuttu tässä vaiheessa. Hauskaa kylläkin on se, että aina välillä joku kohta jää ruksimatta tai eksyn työskentelemään väärässä ohjelmistoversiossa ajatuksissani. Google on ystävä.

Lähteet:

Eskelinen, V. (2019) Kolmas kurssikerta: sekoilua tietokantojen kanssa.  https://blogs.helsinki.fi/veesvees/

Raleigh, C., Linke, A., Hegre, H., & Karlsen, J. (2010). Introducing ACLED: an armed conflict location and event dataset: special data feature. Journal of peace research47(5), 651-660.

 

Vastaa

Sähköpostiosoitettasi ei julkaista. Pakolliset kentät on merkitty *