Tietokantojen yhdistely – kaatumisia ja nousuja

Kuva 1. Afrikan merkittävät konfliktit, timanttikaivokset ja maalla sijaitsevat öljy- ja maakaasukentät toisen maailmansodan jälkeen vuoteen 2020. Lähde: PRIO (2020).

Tunnin yhteisenä harjoituksena toimi laaja, Afrikan valtiot sisältävä tietokanta, jolle harjoittelin tekemään erilaisia toimenpiteitä. Samassa tahdissa opettajan kanssa eteneminen oli mukavaa, vaikka siltikin välillä tipahdin kärryiltä huomioni herpaantuessa iltatunnilla johonkin muuhun. Vierustoverini on ollut onneksi korvaamaton apu näissä tilanteissa, ja olen varmasti kyllästymiseen asti pyytänyt häntä neuvomaan uudelleen juuri esitetyn asian. Kerta toisensa jälkeen hän on kuitenkin kärsivällisesti auttanut poloista ja väsynyttä muun työpäivän uuvuttamaa sivuainemantsalaista. Suurkiitos siis hänelle!😀 Muutenkin tiimityö toimii GIS:ssa. On itsellenikin palkitsevaa, jos omaksikin yllätyksekseni joskus huomaan muistavani työvaiheet ja valikot, joilla tietty toimenpide tehdään ja voin joskus vastavuoroisesti auttaa vieressä istuvia. QGIS:n kanssa on oltava myös kärsivällinen ja tarvitaan selkeästi myös ripaus korkeampaa voimaa, jotta työn saa kunnialla suoritettua maaliin asti. Tästä kohta lisää! 

Nyt kun olen ensin purkanut akuutin turhautumiseni QGIS-ohjelman käyttöön ja huonoon keskittymiskykyyni iltatunneilla, voisin taas palata itse asiaan eli tunnin tehtäviin. Opin yhdistelemään tunnilla tehdyn Afrikka-harjoituksen avulla tietokantoja yhteisen nimittäjän mukaan uudella työkalulla. Kaikissa liitettävissä tietokannoissa tulee siis olla jokin sarake, joka on sisällöltään sama kaikissa liitostietokannoissa, ja sen tulee sisältää kohteita identifioivaa tietoa. Lopputuloksena syntyy uusi, siistitympi ja helpommin hallittava tietokanta, mikä on tietysti kätevää aineiston analysoinnin kannalta. Uusi tietokanta kannattaa tallentaa pikimmiten ja nimetä se selkeästi, jotta se ei sekoitu vanhaan, sekavaan tietokantaan, kuten itselläni tietysti kävi. Ennen datan yhdistelyä on myöskin suotavaa tutkia yhdisteltäviä tietokantoja, jotta varmasti osaa huomata jos seremonian yhteydessä jotakin kallisarvoista hukkuukin. Samalla voi vielä tarkistaa, että yhdisteltävät aineistot tulivat varmasti “siivottua” huolella. On nimittäin aina lopputuloksen selkeyden kannalta vaaranpaikka, jos isossa aineistossa sama kohde onkin nimetty usealla eri tavalla, esimerkiksi Kongo / Kongon demokraattinen tasavalta. 

Tietokantojen yhdistelyssä on monta vaihetta ja nyt päästään jännittävimmän vaiheen äärelle: liitos ei nimittäin syystä tai toisesta onnistu noin 30 %:lla kerroista, vaan koko ohjelma kaatuu 🙂 Juuri ennen liitosta on siis loistava aika tallentaa tehty työ, jotta vältytään harmilta harmin päälle. Itselläni ohjelma kaatui tietysti ensi yrittämällä, vieläpä kaksi kertaa peräkkäin. Myöhemmin tunnilla tehdessäni itsenäistä tehtävää vasta neljäs kerta toden sanoi 😀 . Tietokantojen yhdistäminen taitaakin siis olla uskon asia, mutta itsehän en kuulu kirkkoon. Onneksi elämä (ja GIS) ei ole niin vakavaa, tai ainakaan itse en jaksa ottaa turhaa pulttia tehtävistä. 

Opin myös, että ennen Excel-tietokantojen tuontia QGIS:iin Excel-tiedosto on muutettava csv-muotoon ja tallennettava sellaisena. Tuodun tiedon pohjalta tein laskutoimituksia ja lisäsin siistittyyn, yhdistettyyn tietokantaan uusia sarakkeita. Lopputulemana sainkin ohjatusti aikaiseksi Afrikan mannerta kuvaavan teemakartan, jossa näkyy valtioittain timanttikaivokset, öljykentät sekä konfliktit (kuva 1). Taustalla vaikutti tietokanta, johon lisäsin ja yhdistelin mm. kussakin valtiossa sattuneiden kofliktien lukumäärät, ajanjakson, jonka aikanan konflitit olivat sattuneet, sekä öljy- ja timanttikaivosten lukumäärät valtioittain. 

Sitten seuraa ripaus konkretiaa ja maailman parantamista. Mitä Afrikka-tuotoksen avulla voisi päätellä, kun tietokantoihin on tallennettu ainakin tietoa (PRIO 2020):  

-konfliktin tapahtumavuodesta ja konfliktin laajuudesta 

-timanttikaivosten löytymisvuodesta sekä kaivausten aloitusvuodesta 

-timanttikaivosten tuottavuusluokittelusta 

-öljykenttien löytymis- ja poraamisvuosista 

-öljykenttien tuottavuusluokittelusta 

-internetkäyttäjien lukumäärästä eri vuosina 

Päättelyssä täytyy aina olla varovainen ja tulkita tuloksia, ei omaa maalaisjärjen ohjailemaa ajatusta siitä, että öljykentät ja timanttikaivosteollisuus varmastikin lisäävät köyhissä maissa levottomuuksia ja aseellisia konflikteja. Edellä mainittujen tietokantojen, ja oman Afrikka-teemakarttani (kuva 1) perusteella voidaan kuitenkin varovaisesti todeta, että timantti- ja öljykaivosten olemassaolo alueella näyttäisi korreloivan konfliktien kanssa. Konfliktien tapahtumavuosia ja kestoja pitäisi vielä laajemmin analysoida kaivosten löytymisvuosien ja kaivostoiminnan aloitusvuosien kera ja tutkia, kuinka merkitsevää tilastollisesti korrelaatio näiden muuttujien välillä on. Lisäksi tulisi huomioida muut taustalla vaikuttavat taustamuuttujat. Tällaisia ovat mm. väestön köyhyysaste, kaivostoiminnan tuottavuus, kaivokset kussakin tilanteessa omistava taho, sekä maan alueella toteutettavasta kaivostoiminnasta kansalaisille seurannut mahdollinen hyöty, mikä näkyy vaurastumisena, kuten internetkäyttäjien lisääntymisenä valtiossa.  

Tutkimuksen mukaan kaivostoiminnan lisääntyminen Saharan eteläpuolisessa Afrikassa näyttäisi lisäävän myös naisten kokemaa kotiväkivaltaa. Kaivostoiminta heijastuu koko alueen elinkeinorakenteeseen siten, että naiset siirtyvät maanviljelystöistä palvelusektorin töihin, mikä ei välttämättä ole yhteisön hyväksymää (Kotsadam ym. 2016). Lisäksi kaivostoiminta aiheuttaa laajempia konflikteja alueen yhteisöissä, mikä heijastuu myös perhe-elämän epävakautena ja kotiväkivaltana. 

Kuva 2. Tulvaindeksi eli tulvimisriski Suomen valuma-alueilla.

Tein myös itsenäisen työn tunnilla oppimieni taitojen avulla aiheena Suomen vesistöalueiden valuma-alueominaisuudet ja tulvaherkkyys (kuva 2). Yhdistelin taas useita aineistoja QGIS:lla ja tein tarvittavat laskutoimitukset sekä tuloksia kuvaavat uudet sarakkeet. Lopputulemana sain aikaan jonkinmoisen koropleettiteemakartan, josta ilmenee alueiden tulvaindeksi eli turvaherkkyys. Diagrammeja en alkanut enää pitkän illan jälkeen kotona tekemään yhtä ahkerasti ja onnistuneesti kuin vaikkapa Turunen (2022). Hänen blogiaan ja ohjeita lukiessani totesin kuvaajien olevan itselleni näillä tähänastisilla GIS-taidoillani mahdoton tehtävä. Blogitekstin ja kuvan perusteella sain kuitenkin hienon maistiaisen siitä, mitä olisi pitänyt tehdä. Onnistuneenkin tuotoksen taustalla oli kuitenkin nähtävästi pitkä ja kivinen tie 😛  

Tuottamastani Suomen valuma-alueiden tulvaindeksejä kuvaavasta koropleettisestä teemakartasta voi kuitenkin tulkita, että tulvaindeksi eli riski tulvimiselle on suurinta Suomenlahden ja Pohjanlahden rannikkoseuduilla. Kaikkein suurin tulvariski on Pohjanmaalla, mikä johtuu paitsi sijainnista rannikolla, myös alueen alavuudesta ja jokisuudesta. Lisäksi korkea tulvariski löytyy Varsinais-Suomesta Turun alueelta sekä Uudeltamaalta Helsingin alueelta. Järvi-Suomen runsasjärvisillä alueilla tulvariski on hieman yllättävästikin pienin mahdollinen. Lapissa indeksi taas on hieman suurempi oletettavasti suuremmista lumen sulamisvesistä johtuen, mutta kuitenkin selvästi pienempi kuin Suomenlahden ja Pohjanlahden rannikkoseuduilla (kuva 2). 

 

 

Lähteet: 

Kotsadam, A; Ostby, G; Aas Rustad, S. 2016. Stractural change and wife abuse: A disaggregated study of mineral minig and domestic violence in sub-Saharan Africa, 1999-2013. Political Geography 56 (2017) 53-65.  

Prio. Rauhaninstituutti. https://www.prio.org/. Luettu 31.1.2021. 

Turunen, Janne. Geoinformatiikan mystiset menetelmät -blogi. https://blogs.helsinki.fi/janneturunen/. Luettu 1.2.2022. 

2 Replies to “Tietokantojen yhdistely – kaatumisia ja nousuja”

Leave a Reply

Your email address will not be published. Required fields are marked *