KK3: Tuotosten taustoja

Tietojen hallinta ja analyysi

Kolmannella kurssikerralla tutustuttiin tarkemmin näkyvän kartan taustalla vaikuttavaan dataan ja sen hallintaan. Selkeällä ja seurattavalla ohjeistuksella monimutkainen prosessi saatiin suhteellisen vaivattomasti valmiiksi. Toisaalta koko tiedon työstämisen prosessi selkeytyi samalla, kun opin lisää yhteistyön ja tavallisen päättelyn merkityksestä kaiken sen statistiikan taustalla.

Tällä erää työstettävänä oli Afrikkaa koskevia tietokantoja, joita yhdisteltiin erilaisin keinoin saadaksemme niistä irti lisää tietoa, siis relevanttia sellaista. Tärkeäähän olisi tässä vaiheessa (myös) miettiä mitä haluamme tutkia tai esittää ja miten kyseisen ilmiön esiintuominen saattaa vaikuttaa katsojan mielikuvaan.

Työssä kaivelimme esiin tietoja Afrikan maissa tapahtuneista aseellisista konflikteista ja timanttikaivosten ja mantereisten öljynporausalueiden sijainneista, jotka kaikki näkyvät kartalla kuvassa 1. Jo tässä vaiheessa olisi helppo kuvitella niiden liittyvän erityisen vahvasti toisiinsa ja olettaa useiden konfliktien johtuvan timanteista ja öljystä. Tämä ajatus on kadotettava, tai sen olemassaolo ja syntysyy ymmärrettävä, jotta voisin tehdä järkevää analyysiä kartan antamista tiedoista ilman ennakko-olettamusta.

Kuva 1. Afrikan kartta, johon on merkitty kirjatut aseelliset konfliktit, timanttikaivokset ja öljynporausalueet mantereella.

Tässä kartassa sinisellä on merkitty timanttikaivostenpaikat, punaisella konfliktit ja oranssilla öljynporausalueet. Huomiona öljynporausalueista lisäisin vielä, että alueen koko kartalla ei kerro öljyesiintymän koosta, vaikka niin voisi helposti kuvitellakin. Tästä johtuen päätin kirjoittaa legendaankin oranssin kuvastavan nimenomaan öljynporausaluetta, ja toivon sen selkeyttävän tulkitsemista.

Kartalla konfliktit eivät näytä suoraan tai välttämättä ollenkaan korreloivan timanttikaivosten ja öljynporausalueiden kanssa, vaan niitä esiintyy runsaastikin kauempana kyseisistä alueista. Konfliktit ovat statistiikassa laskettu yksittäisinä ja erillisinä konflikteina, paitsi silloin, kun tietoja yhdistettiin niin, että saimme näkyviin uniikit konfliktit vuosittain. Se siisti tilastoa siten, että usean maan konflikteja sisältäneet vuodet olivat erittäin alhaiset ja toisissa konfliktivuosien määrä oli suuri. Silloin voitiin myös vertailla todenperäisemmin konfliktivuosia maassa sijaitsevien luonnonvarojen määriin, josta taas voitaisiin löytää jonkinasteinen yhteys. Jokunen maa, jossa on eniten öljynporausalueita ja timanttikaivoksia näkyi myös konfliktivuosien listan huipulla, näistä yksi oli Angola.

Kuten Taru Tornikoski huomauttaa oivaltavasti blogissaan, vaikuttavia tekijöitä konfliktien taustalla on paljon muitakin;

”Tällaisia ovat mm. väestön köyhyysaste, kaivostoiminnan tuottavuus, kaivokset kussakin tilanteessa omistava taho, sekä maan alueella toteutettavasta kaivostoiminnasta kansalaisille seurannut mahdollinen hyöty, mikä näkyy vaurastumisena, kuten internetkäyttäjien lisääntymisenä valtiossa.” (Geoinformatiikkaa tutkimassa- blogi, 1.2.2022)

Opitun soveltamista

Näillä datankäsittelyeväillä oli helppoa ja kivaa aloittaa muotoilemaan uutta karttaa, joka käsitteli Suomen alueen jokien valuma-alueita, niiden tulvaindeksiä ja järvisyyttä. Helppoa ja kivaa vielä, kun sitä teki opittujen asioiden ollessa vielä tuoreessa muistissa – niitä oli paljon. Tuon tietokantasokkelon muovailu on mielenkiintoista, erityisesti kun siinä onnistuu. Onnistuminen taas usein riippuu ihan pieneltä tuntuvasta asiasta tai vaan tuurista ja muistista. Erityisesti siitä, onko muistanut tallentaa työn, kun ohjelma yhtäkkisesti kaatuu.

Tein työtä luentokerralla ja vierustoverin vinkkien avulla pääsinkin aika pitkälle. Sain tehtyä kartan, jossa näkyy jokien valuma-alueet kuvattuna koropleettikartalle niiden tulvaindeksin mukaan, sain vielä siihen päälle laitettua pylväät, jotka kuvasivat kunkin alueen järvisyyttä. Pylväät eivät olleet selkeät tai hyvät, lisäksi ne olivat väärin päin. Päätin jatkaa työtä kotona, olihan pohja jo aika hyvä.

Kotona availin tiedostoja uudelleen QGIS-ohjelmassa, tai niin yritin tehdä. Se ei vaan onnistunut löytämään tiedostojen datalähteitä, joten työ ei ollut käyttö-, avaus- tai muokkauskelpoinen. Uudestaan vaan alusta ja ei kun kertaamaan opittua!

Kertaus teki hyvää sekä oppimiselleni että kartalleni, johon sain nyt jotain järkeä. Tulvaindeksin kuvaaminen valuma-alueilla oli helpompi toteutettava ja sen lopputuloskin on selkeä (kuva 2). Vaikeammaksi osuudeksi muotoutui järvisyyden kuvaaminen pylväsdiagrammina, kuten tunnillakin tehdyssä työssä. Esittämisen ongelma oli saada pylväät kuvaamaan täyttä sataa prosenttia, jotta järvisyyden todellinen osuus olisi selkeämmin luettavissa. Kuvassa 2 on tulos kartasta, jossa pylväät kuvaavat kyllä järvisyyden määrää toisiinsa verrattavissa olevassa muodossa, mutta absoluuttisesti niitä on tässä vaikeampi vertailla. Suurimman pylvään kun voisi olettaa kuvaavan sataa tai edes lähes sataa prosenttia, vaikka se on todellisuudessa hieman alle 20 %. Toisaalta kartta on melko selkeä ja tätäkin voisi jo käyttää – mikäli haluaa verrata valuma-alueiden järvisyysasteita toisiinsa nähden.

Kuva 2. Koropleettikartta, joka kuvaa Suomen alueen jokien valuma-alueita ja niiden tulvaindeksiä ja järvisyyttä.

Tämän version ongelmakohdaksi muodostui kuitenkin ainakin itseäni häiritsevä tyhjä ja loputtoman pitkä pylväs, jota en saanut korjattua. Se ilmeisesti johtuu Hirvijoen valuma-alueen järvisyysprosentista, joka on nolla (kuva 3). Tämän tietokannan tietojen mukaan se oli ainoa kunta, jossa prosentti oli pyöreä nolla, muissa se oli vähintään 0,1 %, joka ei tuottanut ongelmaa tiedon kuvaamisessa.

Kuva 3. Koropleettikartan osa, jossa näkyy keltaisella Hirvijoen valuma-alue ja sen päällä sen ongelmallinen tyhjä ja pitkä pylväs. Kartan päällä näkyy attribuuttitaulukon Hirvijoki-rivi ja sen tiedoista kenties tärkein valittuna -järvisyysprosentti (joka on 0).

Sain mielestäni hyvän idean, joka voisi ratkaista Hirvijoki-pylvään ongelman. Tekisin pylväät kaksiosaisiksi, pinotuiksi pylväiksi, jotka kaikki kokonaisuudessaan kuvaisivat sataa prosenttia, mutta josta värjätty osuus olisi todellinen järvisyysprosentti. Käytin hyväkseni valmista järvisyysprosenttitiedostoa excelissä, johon sai nopealla kaavalla laskettua kunkin valuma-alueen järvisyysprosentin erotuksen sadasta prosentista. Siitä tulisi pylväälle tausta, jonka voisi esittää mahdollisimman neutraalilla värillä tai läpinäkyvänä. Lopputuloksena sain suhteellisen siistin kartan, joka kuvastaa alueita juuri haluamallani tavalla – Hirvijoen alue mukaan luettuna (kuva 4). Edelleenkään en ole täysin tyytyväinen kartan informaatioarvoon, sillä sataprosenttiset pylväät jättävät kovin vähän visuaalista arvoa pienille järvisyysprosenteille (joista suurin oli siis alle 20 %).

Kuva 4. Koropleettikartta Suomen alueen jokien valuma-alueista niiden tulvaindeksien mukaan kuvattuina. Pylväillä on kuvattu valuma-alueen järvisyysprosentti harmaalla.

Lähteet:

Tornikoski, T. 1.2.2022. Tietokantojen yhdistely – kaatumisia ja nousuja. Geoinformatiikkaa tutkimassa 😊-blogi. https://blogs.helsinki.fi/tornitar/

Leave a Reply

Your email address will not be published. Required fields are marked *